случайное выключение SSD - ext4_find_entry , чтение каталога lblock0

Последние 2 недели у меня проблемы с SSD в GNU/Linux. Я думаю, что это не проблема устройства, но я не уверен. Время от времени (каждые 1-2 дня в последние дни) я теряю физический доступ к диску, как будто он отключен или выключен.

Ошибка:

EXT4-fs error (device: sda2): ext4_find_entry:1465: inode #1308161: comm NetworkManager: reading directory lblock 0

Я напечатал эту ошибку с фотографии, поэтому она может быть не совсем точной.

Примечания:

Устройство всегда одно и то же "sda2", не замечал ошибки с другим (большим домашним) разделом. Я постараюсь проверить это в следующий раз. Инод и имя процесса меняются, но NetworkManager довольно обычен. lblock всегда 0.

Оборудование:

Dell E7270 с SSD диском LITEON CV3-8D512-11 SATA 512GB

ПО:

Debian testing, ядро 4.11.

краткий вывод smartctl:

Device Model:     LITEON CV3-8D512-11 SATA 512GB
Serial Number:    TW0956WWLOH006CU022Z
LU WWN Device Id: 5 002303 100ce15e0                                                                                                                                         
Firmware Version: T89110D                                                                                                                                                    
User Capacity:    512,110,190,592 bytes [512 GB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    Solid State Device
Form Factor:      M.2
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   ATA8-ACS, ATA/ATAPI-7 T13/1532D revision 4a
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Wed Jul  5 12:32:39 2017 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

...

SMART Attributes Data Structure revision number: 1
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  5 Reallocated_Sector_Ct   0x0003   100   100   000    Pre-fail  Always       -       0
  9 Power_On_Hours          0x0002   100   100   000    Old_age   Always       -       327
 12 Power_Cycle_Count       0x0003   100   100   000    Pre-fail  Always       -       335
175 Program_Fail_Count_Chip 0x0003   100   100   000    Pre-fail  Always       -       0
176 Erase_Fail_Count_Chip   0x0003   100   100   000    Pre-fail  Always       -       0
177 Wear_Leveling_Count     0x0003   100   100   000    Pre-fail  Always       -       59
178 Used_Rsvd_Blk_Cnt_Chip  0x0003   100   100   000    Pre-fail  Always       -       0
179 Used_Rsvd_Blk_Cnt_Tot   0x0003   100   100   000    Pre-fail  Always       -       0
180 Unused_Rsvd_Blk_Cnt_Tot 0x0033   100   100   005    Pre-fail  Always       -       2688
181 Program_Fail_Cnt_Total  0x0003   100   100   000    Pre-fail  Always       -       0
182 Erase_Fail_Count_Total  0x0003   100   100   000    Pre-fail  Always       -       0
187 Reported_Uncorrect      0x0003   100   100   000    Pre-fail  Always       -       0
194 Temperature_Celsius     0x0003   100   100   000    Pre-fail  Always       -       76
195 Hardware_ECC_Recovered  0x0003   100   100   000    Pre-fail  Always       -       0
199 UDMA_CRC_Error_Count    0x0003   100   100   000    Pre-fail  Always       -       0
238 Unknown_Attribute       0x0003   097   100   000    Pre-fail  Always       -       3
241 Total_LBAs_Written      0x0003   100   100   000    Pre-fail  Always       -       4293005286
242 Total_LBAs_Read         0x0003   100   100   000    Pre-fail  Always       -       3510503294

SMART Error Log Version: 0
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed without error       00%       298         -
# 2  Short offline       Completed without error       00%       294         -
# 3  Offline             Interrupted (host reset)      80%       294         -
# 4  Offline             Interrupted (host reset)      10%       294         -
# 5  Short offline       Completed without error       00%       294         -
# 6  Short offline       Completed without error       00%         1         -
# 7  Short offline       Aborted by host               90%         1         -

Идеи:

  • запустить проверку плохих блоков
  • проверить соединения
0
05.07.2017, 14:34
1 ответ

Кажется, я исправил это, удалив SDD, продув воздух в разъем M.2 и вставив его обратно.

Когда я загрузился, чтобы спасти Debian с USB, я заметил более подробную информацию об отладке ядра. Во время поиска я заметил, что большинство решений заключалось в замене кабелей SATA. Подключение ноутбука M.2 не имеет кабелей.

Я публикую скринscreen

Некоторые наиболее важные тексты журналов:

exception Emask 0x10 SAct... SErr... action 0xe frozen
interface fatal error, PHY RDY changed
SError: { PHYRdyChg LinkSeq }
failed command: WRITE FPDMA QUEUED
Emask 0x10 (ATA bus error)
hard resetting link
0
28.01.2020, 04:44

Теги

Похожие вопросы