Felmerült már többször mostanában, hogy mire jó a S.M.A.R.T. és mit is jelentenek az értékei.
Főleg a leggyakrabban előforduló “Raw_Read_Error_Rate” (1) és a “Hardware_ECC_Recovered” (195) attributum.
Ha jól értelmezem az új HDD technológiákat és a S.M.A.R.T.-ot, akkor ezek nem “hibák” [nézőpont kérdése... én tiltakozom...].
Az egyik (nemrég cserélt) Seagate HDD-re a “smartctl -a” azt mondja, hogy:
Device Model: ST3500320AS
Serial Number: 9QM0BEJ3
Firmware Version: SD15
User Capacity: 500.107.862.016 bytes
—
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0×000f 117 099 006 Pre-fail Always - 157989864
3 Spin_Up_Time 0×0003 094 094 000 Pre-fail Always - 0
4 Start_Stop_Count 0×0032 100 100 020 Old_age Always - 44
5 Reallocated_Sector_Ct 0×0033 100 100 036 Pre-fail Always - 0
7 Seek_Error_Rate 0×000f 074 060 030 Pre-fail Always - 25943365226
9 Power_On_Hours 0×0032 099 099 000 Old_age Always - 1550
10 Spin_Retry_Count 0×0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0×0032 100 100 020 Old_age Always - 44
184 Unknown_Attribute 0×0032 100 100 099 Old_age Always - 0
187 Unknown_Attribute 0×0032 100 100 000 Old_age Always - 0
188 Unknown_Attribute 0×0032 100 100 000 Old_age Always - 0
189 Unknown_Attribute 0×003a 099 099 000 Old_age Always - 1
190 Temperature_Celsius 0×0022 055 048 045 Old_age Always - 807600173
194 Temperature_Celsius 0×0022 045 052 000 Old_age Always - 45 (Lifetime Min/Max 0/15)
195 Hardware_ECC_Recovered 0×001a 054 048 000 Old_age Always - 157989864
197 Current_Pending_Sector 0×0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0×0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0×003e 200 200 000 Old_age Always - 0
Meg persze a logot is teleírkálja a megfelelő entry-kkel.
Namármost a kék elméletileg nem gond.
Az aktuális HDD technológia ill. a S.M.A.R.T. elméletileg úgy működik, hogy:
Beolvassuk szektort. Sikerült, jó az adat? Igen –> Király, goto vége.
Ha nem sikerült, akkor a beolvasott adatból meg a szektor mellé olvasott ECC-ből össze tudjuk rakni, hogy minek kéne lennie a szektor tartalmának?
Ha igen, akkor a Raw_Read_Error_Rate (1) és/vagy Hardware_ECC_Recovered (195) változókat növeljük.
MInt látható, a fenti diszken van mindkettő, és minkettő ugyanannyi, 157 millió akárhány. Szerintem ez 1550 órára vetítve problémásan sok, de hát ez a csodás a S.M.A.R.T. technológiában, hogyha a gyártó úgy gondolja, hogy az nem probléma, akkor nem az…
Alább a Hitachinál csak Raw_Read_Error_Rate (1) van (bár itt “csak” 1.5 millió esemény történt 1548 óra alatt), még lejebb a Samsungnál van ugyan mindkét változó, de csak a Hardware_ECC_Recovered tükrözi az összes ECC-vel javitott (tehát hibásan is olvasott) esemény számot. Ez a másik csodás a S.M.A.R.T.-ban, a gyártók ízlésüknek megfelelő értéket tárolnak benne és szintén ők “találják ki”, hogy mi a hozzátartozó tűrésküszöb. Ami értelemszerűen akkorára van véve, hogy ne vigyék vissza minden második diszket a kedves végfelhasználók…
Szóval, ha viszont az ECC alapján sem sikerült a tartalmat visszaállítanunk, akkor bizony a hagyományos értelemben vett “bad sectorral” van dolgunk, ugyanis egyébként lehet, hogy jó lenne a szektor, ha újraírnánk, de ez kevéssé vígasztal minket, ha pont azon a szektoron fontos adatunk van, netán valami kriptográfiai fájlrendszerünk kulcsának egy része helyezkedik el rajta…
Ez S.M.A.R.T. ügyileg a - pirossal kiemelt - 197-es Current_Pending_Sector tartalmát fogja növelni.
A probléma itt kezdődik - leszámítva persze az egész új HDD technológia/S.M.A.R.T. kombót…
Device Model: Hitachi HDT725050VLA360
Serial Number: VFK401R41TPL8K
Firmware Version: V56OA7EA
User Capacity: 500.107.862.016 bytes
—
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0×000b 093 093 016 Pre-fail Always - 1572878
2 Throughput_Performance 0×0005 100 100 050 Pre-fail Offline - 0
3 Spin_Up_Time 0×0007 121 121 024 Pre-fail Always - 486 (Average 340)
4 Start_Stop_Count 0×0012 100 100 000 Old_age Always - 10
5 Reallocated_Sector_Ct 0×0033 100 100 005 Pre-fail Always - 0
7 Seek_Error_Rate 0×000b 100 100 067 Pre-fail Always - 0
8 Seek_Time_Performance 0×0005 100 100 020 Pre-fail Offline - 0
9 Power_On_Hours 0×0012 100 100 000 Old_age Always - 1548
10 Spin_Retry_Count 0×0013 100 100 060 Pre-fail Always - 0
12 Power_Cycle_Count 0×0032 100 100 000 Old_age Always - 10
192 Power-Off_Retract_Count 0×0032 100 100 000 Old_age Always - 74
193 Load_Cycle_Count 0×0012 100 100 000 Old_age Always - 74
194 Temperature_Celsius 0×0002 109 109 000 Old_age Always - 55 (Lifetime Min/Max 20/60)
196 Reallocated_Event_Count 0×0032 100 100 000 Old_age Always - 0
197 Current_Pending_Sector 0×0022 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0×0008 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0×000a 200 253 000 Old_age Always - 0
Model Family: SAMSUNG SpinPoint P80 SD series
Device Model: SAMSUNG HD120IJ
Serial Number: S0AEJ1ML200047
Firmware Version: ZL100-33
User Capacity: 120.034.123.776 bytes
—
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0×000f 100 100 051 Pre-fail Always - 36
3 Spin_Up_Time 0×0007 100 100 025 Pre-fail Always - 6336
4 Start_Stop_Count 0×0032 100 100 000 Old_age Always - 27
5 Reallocated_Sector_Ct 0×0033 253 253 010 Pre-fail Always - 0
7 Seek_Error_Rate 0×000f 253 253 051 Pre-fail Always - 0
8 Seek_Time_Performance 0×0025 253 253 015 Pre-fail Offline - 0
9 Power_On_Hours 0×0032 100 100 000 Old_age Always - 1903
10 Spin_Retry_Count 0×0033 253 253 051 Pre-fail Always - 0
11 Calibration_Retry_Count 0×0012 253 002 000 Old_age Always - 0
12 Power_Cycle_Count 0×0032 100 100 000 Old_age Always - 27
190 Temperature_Celsius 0×0022 094 088 000 Old_age Always - 48
194 Temperature_Celsius 0×0022 094 088 000 Old_age Always - 48
195 Hardware_ECC_Recovered 0×001a 100 100 000 Old_age Always - 152375033
196 Reallocated_Event_Count 0×0032 253 253 000 Old_age Always - 0
197 Current_Pending_Sector 0×0012 100 100 000 Old_age Always - 1
198 Offline_Uncorrectable 0×0030 253 253 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0×003e 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0×000a 100 100 000 Old_age Always - 0
201 Soft_Read_Error_Rate 0×000a 100 100 000 Old_age Always - 2
202 TA_Increase_Count 0×0032 253 253 000 Old_age Always - 0
Bocs a szétesett táblákért, a Wordpress is egy kalap szamóca, de persze lehet, hogy én nem értek hozzá… (Ehhez sem…)