Self-Monitoring, Analysis and Reporting Technology, eller S.M.A.R.T., är ett system för att övervaka hårddiskar och andra lagringsenheter för att minska risken för fel. Tekniken samlar in ett antal hälsovärden från enheten och använder dem för att indikera när en enhet är på väg att fallera, så att data kan säkerhetskopieras och enheten bytas ut innan ett fullständigt haveri inträffar.

Hur fungerar S.M.A.R.T.?

  • S.M.A.R.T. läser kontinuerligt eller vid förfrågan ett antal attribut (mätvärden) från enheten. Varje attribut har ett normalt värde, ett råvärde och ofta en användardefinierad eller tillverkarbestämd tröskel.
  • Om ett attribut överskrider sin tröskel eller visar tydlig försämring kan enheten markera ett fel (t.ex. "SMART Status: FAILED") eller generera varningar.
  • Enheter kan även köra inbyggda självtester — korta eller långa — som söker efter läs-/skrivfel, sektorfel och andra problem.

Vanliga SMART-attribut

Attribut kan skilja sig mellan tillverkare, men några återkommande exempel är:

  • Reallocated Sectors Count (antal omallokerade sektorer) — antal dåliga sektorer som flyttats till reservområden.
  • Current Pending Sector Count — sektorer som väntar på omallokering på grund av läsproblem.
  • Raw Read Error Rate och Read Error Rate — antal läsfel.
  • Spin Retry Count — antal misslyckade uppstartsförsök (vanligt för roterande skivor).
  • Power-On Hours — totalt antal driftstimmar.
  • Temperature — enhetens temperatur; hög värme påverkar livslängden.
  • För SSD: Wear Leveling Count, Program/Erase Cycles och Remaining Life som visar NAND-slitage.
  • För NVMe finns motsvarande hälsoindikatorer i SMART/Health Information.

Självtester

  • Short self-test — snabb kontroll av de flesta funktioner, tar ofta några minuter.
  • Extended/Long self-test — grundligare test som kan ta timmar beroende på enhetens storlek.
  • Conveyance test — kort test av skador som kan uppstå under transport.
  • Resultat och loggar går att läsa ut med verktyg som smartctl (smartmontools), leverantörsverktyg eller grafiska program som CrystalDiskInfo.

Begränsningar

  • S.M.A.R.T. förutser inte alla fel — vissa plötsliga elektroniska eller mekaniska fel kan inträffa utan föregående varning. Tillförlitligheten varierar med enhetstyp och vilka attribut som övervakas.
  • Olika tillverkare använder egna attribut och skalor, vilket gör att tolkning kräver modellkunskap.
  • Vissa RAID-kontrollers abstrakterar underliggande diskar så att SMART-data inte alltid är tillgängliga utan särskilda drivrutiner eller verktyg.
  • S.M.A.R.T.-statusen (PASS/FAIL) är ett grovt mått — ett "PASS" betyder inte att en enhet är frisk för evigt, bara att inga kritiska trösklar har triggats.

Praktiska råd

  • Aktivera övervakning: Se till att S.M.A.R.T. är aktiverat i BIOS/UEFI och i operativsystemet om möjligt.
  • Övervaka regelbundet: Kör automatiska kontroller och testa enheter periodiskt (korta och långa självtester) och konfigurera varningar.
  • Tolka värden rätt: Lär dig vilka attribut som är kritiska för dina enheter. Ett ökande antal omallokerade sektorer eller en växande mängd pending sectors är ofta ett tydligt tecken på problem.
  • Säkerhetskopiera alltid: S.M.A.R.T. är ett verktyg för att minska risk, men ersätter inte regelbundna säkerhetskopior.
  • Byt ut tidigt: När SMART visar kraftig försämring eller misslyckade självtester, planera för att byta ut enheten snarast.
  • Var uppmärksam på temperatur: Håll enheter svala för att förlänga livslängden.

Sammantaget är S.M.A.R.T. ett värdefullt hjälpmedel för att få tidiga varningar om potentiella lagringsfel, men det fungerar bäst i kombination med proaktiv övervakning, regelbundna tester och bra rutiner för säkerhetskopiering.