S.M.A.R.T. - Diagnostyka dysku twardego

S.M.A.R.T. (Self-Monitoring, Analysis and Reporting Technology) jest systemem monitorującym i raportującym stan dysku twardego. Na podstawie określonych parametrów S.M.A.R.T. dokonuje analizy i pozwala na odpowiednio wczesne poinformowanie o możliwości wystąpienia awarii. Skuteczność działania systemu zapewniona jest na poziomie 30-40% występujących przypadków usterek.

Przyjmuje się, iż jest on spadkobiercą technologii zastosowanej w serwerach IBM na początku lat 90. Do prac nad systemem przyczyniły się także Saegate, Quantum, Compaq i Conner, które opracowały technologię IntelliSafe - jej zadanie polegało na monitorowaniu odpowiednich parametrów dysku i przesyłanie danych, które mogły być analizowane za pomocą specjalnego oprogramowania. O tym, które z parametrów podlegały analizie, każdy z producentów decydował niezależnie i takie rozwiązania implementował w produkowanych przez siebie urządzeniach. W 2005 roku organizacja Small Form Committee, na prośbę firmy Compaq, przystąpiła do prac na standaryzacją systemu, której efektem był omawiany S.M.A.R.T. Technologia ta wykorzystywana jest obecnie przez wszystkich wiodących producentów dysków twardych i SSD, wyposażonych w magistralę przesyłania danych ATA, SCSI oraz SATA.

S.M.A.R.T. poddaje monitoringowi wiele różnych parametrów związanych z prawidłową pracą dysku. Parametry analizowane w większości implementacji realizowanych przez producentów obejmują m.in.:

  • temperaturę pracy dysku
  • czas pracy dysku
  • liczbę cykli start/stop
  • liczbę naprawionych i nienaprawionych błędów ECC
  • liczbę błędów odczytu, zapisu i wyszukiwania
  • liczbę błędów transmisji
  • ilość realokowanych sektorów
  • liczbę błędnych sektorów
  • liczbę ponownych rozruchów w trakcie pracy dysku

Za parametry kluczowe (krytyczne) dla prawidłowej pracy dysku uznaje się:

  • 01 – częstotliwość błędów podczas odczytu (Read Error Rate) – jest to liczba błędów występujących w trakcie odczytu danych z powierzchni dysku. Ich pojawianie się wskazuje na problemy z talerzami dysku lub głowicą. W przypadku pewnych modeli w kategorii tej mieszczą się również dane wymagające dodatkowej interpretacji i wysoka wartość parametru nie świadczy bezpośrednio o liczbie błędów i poziomie zagrożenia.
  • 05 – liczba realokowanych sektorów (Reallocated Sector Count) – jest to ilość błędnych sektorów przeniesiona do specjalnie wydzielonego obszaru (obszaru rezerwowego). Uszkodzone sektory zastępowane są przez „zdrowe” i nie wpływają na pracę systemu. Nie pozostaje to jednak bez znaczenia dla pracy dysku. Wzrost wartości tego parametru wiąże się ze spadkiem jego wydajności.
  • 10 – 0A – liczba ponawianych prób rozpędzenia talerzy dysku (Spin Retry Count) – parametr ten przedstawia liczbę prób uruchomienia dysku w celu uzyskania pełnej szybkości wirowania (jeśli pierwsza próba zakończona była niepowodzeniem). Wysoka wartość parametru bądź jej wzrost świadczą o kłopotach z mechaniką dysku (np. zużyciem łożyska).
  • 184 – B8 – liczba błędów parzystości (End-to-End-error) – ilość błędów, które wystąpiły podczas przesyłania danych pomiędzy pamięcią podręczną a dyskiem (dane są porównywane po stronie kontrolera i dysku). Im niższa wartość parametru, tym lepiej.
  • 188 -BC – liczba operacji przerwana z powodu zbyt długiego oczekiwania na odpowiedź (Command Timeout) – jest to ilość przerwanych operacji związanych z brakiem reakcji dysku. Wartość parametru powyżej zera świadczy o problemach z zasilaniem dysku (zasilacz, kable).
  • 196 – C4 – liczba operacji realokacji (Realocation Event Count) – parametr podaje liczbę przeniesionych uszkodzonych sektorów (zarówno zakończonych powodzeniem, jak i nieudanych) i jest związany z atrybutem Reallocated Sector Count. Równa wartość obu parametrów świadczy o braku nieudanych operacji przeniesienia.
  • 197 – C5 – ilość sektorów czekających na realokację (Current Pending Sector Count) – parametr prezentuje liczbę sektorów oznaczonych jako niestabilne i czekających na operację przeniesienia. Sektor klasyfikowany jest jako niestabilny gdy próba odczytu zapisanych w nim danych nie powiedzie się. Gdy niemożliwy stanie się również zapis, sektor taki zostaje poddany realokacji.
  • 198 – C6 – ilość nienaprawialnych błędów (Uncorrectable Sector Count) – łączna ilość błędów występujących podczas zapisu i odczytu sektora. Wzrost wartości tego parametru oznacza zwiększenie ryzyka awarii związanej z powierzchnią dysku lub jego mechaniką.
  • 201 – C9 – ilość błędów opuszczenia ścieżki z danymi przez głowicę dysku (Soft Read Error Rate) – jeśli parametr jest większy od zera, zalecane jest wykonanie kopii bezpieczeństwa.

S.M.A.R.T. pozwala także na wykonanie testów dysku. W zależności od producenta oferowane są różne procedury testowe, wśród których najczęściej występują:

  • long (Extended Self Test) – najdłuższy i najbardziej szczegółowy pozwalający na wykrycie wszystkich problemów dysku raportowanych przez S.M.A.R.T.
  • short (Short Self Test) – krótki test wykrywający większość kłopotów generowanych przez dysk.
  • off-line (Immediate Offline Test) – najbardziej podstawowy test odsłaniający najpoważniejsze błędy urządzenia.

Dodatkowo producenci dysków umożliwiają często przeprowadzenie:

  • Conveyance Self Test – test nośnika magnetycznego mający za zadanie wykrycie ewentualnych uszkodzeń powstałych podczas transportu.
  • Select - test pozwalający na badanie części dysku, np. konkretnej partycji.

Testy mogą być wykonywane w trybie wyłączającym urządzenie z użycia (captive), oraz w trybie pracującego dysku (idle), co wiąże się jednak z obniżeniem jego wydajności.

Aby można było w pełni korzystać z możliwości oferowanych przez S.M.A.R.T. potrzebne jest odpowiednie oprogramowanie.

HD Tune

Jednym z najbardziej popularnych programów do analizy S.M.A.R.T. jest HD Tune, dostępny w dwóch wersjach: darmowej i płatnej PRO. W wersji free pozwala on na wykonanie podstawowych operacji diagnostycznych, przeskanowania dysku pod kątem występowania błędnych sektorów, sprawdzenia wydajności dysku (test benchmark) oraz odczytania głównych informacji na temat dysku, jak pojemność, wersja firmware, numer seryjny, wielkość pamięci podręcznej itp.

Crystal Disk Info

To jeden z darmowych programów, który obsługuje także niektóre dyski zewnętrzne. Jego podstawowym zadaniem jest oczywiście odczyt informacji S.M.A.R.T., pozwala on także na uzyskanie danych dotyczących posiadanego dysku twardego, monitorowanie urządzenia i powiadomienia jeśli wartości graniczne parametrów zostaną przekroczone.

HDDScan

Aplikacja ta oprócz podstawowych zadań diagnostycznych związanych z obsługą S.M.A.R.T. posiada także możliwość monitorowania temperatury, skanowania powierzchni dysku, zarządzania ustawieniami Automatic Acoustic Management (AAM) oraz Advanced Power Management (APM).

DiskSmartView

Prosty w obsłudze program zawierający dodatkowo informacje dotyczące modelu dysku, posiadanego firmware, a także różne przydatne funkcje, np. monitoring temperatury wewnętrznej dysku.

MHDD

To aplikacja dla bardziej zaawansowanych użytkowników – uruchomienie następuje z płyty CD po wcześniejszym nagraniu na nią pliku ISO programu jako obrazu.

Pakiet Smartmontools

W jego skład wchodzą dwa programy: smartctl, uniwersalne narzędzie do odczytywania danych o stanie dysku, konfiguracji i testów oraz smartd, odpowiadające za monitorowanie stanu dysku.

Zachęcamy użytkowników laptopów do przeprowadzania procedur testowych. Zmniejszają one ryzyko wystąpienia niespodziewanej awarii i dają czas na podjęcie ewentualnych działań serwisowych bez konsekwencji jakie pociąga za sobą uszkodzenie tak wrażliwego podzespołu.

Pavel Kroupka

Galeria