Jak monitorować stan zdrowia dysków

    Wydajny dysk twardy to jeden z podstawowych elementów komputera. Warto monitorować jego stan, by w porę przygotować się na zakup nowego nośnika, gdy stary odmówi posłuszeństwa. Jak rozpoznać, że zbliża się ta chwila, dowiemy się z tego poradnika.

    Monitorowanie stanu dysków jest łatwe i wymaga poznania tylko kilku pojęć, które są niezbędne do wykonania samodzielnej analizy. Takie działanie pomaga na bieżąco kontrolować proces starzenia się dysku. Dzięki niemu wiemy, kiedy możemy spodziewać się, że dysk odmówi posłuszeństwa i przestanie nadawać się do użytku lub pojawi się wysokie ryzyko jego awarii. Oczywiście, warto pamiętać, że analiza na podstawie danych S.M.A.R.T. nie sprawi, że będziemy w stanie przewidzieć zdarzenia losowe, które mogą wpłynąć na uszkodzenie nośników. Dlatego bardzo ważne jest odpowiednie zabezpieczanie naszych najważniejszych danych na zapasowych dyskach lub w chmurze. Warto poświęcić czas na wykonywanie kopii bezpieczeństwa, bo może to oszczędzić nam wiele nerwów.

    Co to jest S.M.A.R.T.

    To technologia samomonitorowania, analizy i powiadamiania o błędach. Często używa się po prostu zapisu SMART. Jest to kluczowy system ostrzegawczy wprowadzony już dość dawno w dyskach IDE, które królowały przed nadejściem interfejsu SATA. Dzięki temu systemowi dysk ciągle sam analizuje swój stan i może ostrzec system oraz użytkownika o zbliżającej się awarii. Udaje się w ten sposób skutecznie przewidzieć do 50 procent awarii nośników. To bardzo dużo – warto więc nauczyć się poprawnie odczytywać dane, jakie monitoruje i podaje S.M.A.R.T.

    Ważne parametry S.M.A.R.T.

    Podane w poradniku oznaczenia parametrów odnajdziemy w programie CrystalDiskInfo w kolumnie ID w widoku dysku. Parametry te są różne dla dysków HDD oraz SSD. Nie musimy się stresować, jeśli program nie pokazuje na przykład parametru 04 dla dysku SSD, gdyż nie jest on obsługiwany.

    01 – (Raw) Read Error Rate (A)

    Atrybut ten zależy od liczby błędów odczytu i stanu powierzchni dysku. Wskazuje na częstość sprzętowych błędów odczytu, które wystąpiły podczas odczytu danych z powierzchni dysku. Niskie wartości wskazują na problem z powierzchnią dysku lub głowicami odczytu/zapisu. Jeśli wartość zbliża się do poziomu z kolumny Threshold (B), może oznaczać to problemy z dyskiem.

    0A – Spin Retry Count (C)

    Liczba ponownych prób rozpędzenia talerzy. Atrybut ten przechowuje łączną liczbę prób uruchomienia talerzy przed osiągnięciem pełnej szybkości obrotowej (pod warunkiem że pierwsza próba nie powiodła się). Wzrost tego atrybutu jest oznaką problemów z podsystemem mechanicznym dysku i może oznaczać zbliżające się uszkodzenie łożyska.

    Ważne dla SSD

    E7 – SSD Life Left (D)

    Przybliżona wartość stanu zużycia dysku – im wyższa, tym lepiej. Obniżenie do 10 oznacza konieczność wymiany nośnika, przy wartości 0 nie będzie można nagrywać danych na dysk.

    F1 – Lifetime Writes from Host (E)

    Liczba zapisanych danych w gigabajtach (najczęściej) od początku użytkowania dysku.

    F2 – Lifetime Reads from Host (F)

    Liczba odczytanych danych w gigabajtach (najczęściej) od początku użytkowania dysku.

    Wartości F1 i F2 mają duże znaczenie w przypadku gwarancji dysków SSD, często producenci podają zapisy typu 7 lat gwarancji lub 300 TBW, gdzie 300 TBW w skrócie najczęściej oznacza liczbę terabajtów zapisanych na dysku.

    CrystalDiskInfo

    Dzięki aplikacji CrystalDiskInfo będziemy mogli bardzo szybko sprawdzić stan zdrowia naszych dysków. Wystarczy ją uruchomić i po chwili pojawi się interfejs z informacjami o naszych dyskach. 

    Zmiana formatu wyświetlania danych

    Zanim zaczniemy analizę, warto zmienić format wyświetlania danych w kolumnie Raw Values. Domyślnie dane widoczne są jako HEX i nie są zbyt czytelne dla początkującego użytkownika.

     

    1. Klikamy na FunkcjeFunkcje zaawansowaneWartość Raw i na DEC [10].

    2. Teraz wartości są znacznie bardziej czytelne już na pierwszy rzut oka (nie wszystkie z widocznych danych będą nam potrzebne, niektóre mają znaczenie czysto diagnostyczne).

    Informacje szczegółowe o dysku

    W górnej części interfejsu znajdziemy obszerne informacje dotyczące nośników. Po lewej stronie znajduje się informacja na temat zdrowia dysku i jego aktualnej temperatury.

    Po prawej możemy sprawdzić numer seryjny dysku, obsługiwane interfejsy oraz własności. W przypadku dysków SSD warto sprawdzić, czy nasz noś­nik wspiera technologię TRIM. Pozwala ona na wydajniejszą pracę i mniejsze zużycie w dłuższym okresie użytkowania.

    Sprawdzamy, czy TRIM jest aktywny

    Jeśli nasz dysk obsługuje TRIM, musimy jeszcze upewnić się, czy system poprawnie go wykrył i aktywował obsługę tej funkcji.

    1. Wciskamy kombinację klawiszy Start+R, wpisujemy cmd i wciskamy Enter.

    2. Wpisujemy komendę fsutil behavior query disabledeletenotify i zatwierdzamy ją klawiszem Enter.

    3. Jeśli w pierwszej linijce pojawi się 0, to TRIM jest aktywny. Jeżeli zamiast tego zobaczymy 1 – nieaktywny.

    4. Aktywować funkcję TRIM możemy, korzystając z komendy fsutil behavior set disabledeletenotify 0, którą również zatwierdzamy klawiszem Enter.

    5. Druga linijka, zaczynająca się od ReFS, dotyczy obsługi TRIM dla dysków pracujących głównie z systemami Linux i nie dotyczy użytkowników Windows. Możemy ją również aktywować, korzystając z komendy fsutil behavior set disabledeletenotify ReFS 0 , którą zatwierdzamy klawiszem Enter. Ta komenda zadziała, gdy uruchomimy proces cmd jako administrator.

    5 parametrów,które najczęściej wskazują na nadchodzącą awarię

    05 Reallocated Sector Count

    Liczba relokowanych sektorów. Kiedy dysk napotyka błąd odczytu/zapisu, oznacza ten sektor jako relokowany i przenosi dane do specjalnego zarezerwowanego obszaru. To właśnie dlatego na nowoczesnych dyskach nie widzimy „bad bloków” podczas testów powierzchni. Im więcej relokowanych sektorów, tym większe ryzyko awarii. Są one widoczne w kolumnie Raw Values.

    BB Reported Uncorrectable Errors

    Liczba błędów, które nie mogą zostać naprawione przy wykorzystaniu sprzętowej technologii ECC.

    BC Command Timeout

    Liczba przerwanych operacji z powodu nieodpowiadania dysku na komendy. Normalnie ten parametr powinien wynosić 0. Jeśli jest inaczej, może to świadczyć o poważnych problemach z zasilaniem dysku, czasem jednak w laptopach zwiększona wartość tego parametru nie musi oznaczać kłopotów.

    C5 Current Pending Sector Count

    Liczba niestabilnych sektorów, które oczekują na relokowanie (remapowanie). Dysk co jakiś czas sprawdza te sektory i jeśli uda się je odczytać lub przenieść, wartość parametru zostaje zmniejszona.

    C6 Uncorrectable Sector Mount

    Liczba nienaprawialnych błędów. Wartość RAW tego atrybutu wskazuje łączną liczbę stałych błędów podczas odczytu/zapisu sektora. Wzrost wartości tego atrybutu wskazuje na ewidentne defekty powierzchni dysku i/lub problemy z podsystemem mechanicznym dysku. Jeśli ten parametr będzie inny niż 0, możemy spodziewać się nadchodzącej awarii.