This page has been robot translated, sorry for typos if any. Original content here.

SMART

S.M.A.R.T.

SMART (de l'anglais. Technologie d'autosurveillance, d'analyse et de reporting - technologie d'auto-surveillance, d'analyse et de reporting) - une technologie permettant d'évaluer l'état d'un disque dur avec un équipement d'auto-diagnostic intégré, ainsi qu'un mécanisme permettant de prédire le moment de sa défaillance.

Histoire de

Le premier disque dur doté d'un système d'autodiagnostic a été introduit en 1992 par IBM dans des matrices de disques IBM 9337 pour serveurs AS / 400 utilisant des disques IBM 0662 SCSI-2. La technologie s'appelait Predictive Failure Analysis (PFA). Plusieurs paramètres clés ont été mesurés, ils ont été évalués directement par le contrôleur de disque. Le résultat était limité à un bit: soit tout est en ordre, soit le disque risque de tomber en panne. Plus tard, Compaq, Seagate, Quantum et Conner ont développé une autre technologie appelée IntelliSafe. Il s’agissait d’un protocole général d’émission d’informations sur l’état du disque dur, mais les paramètres mesurés et leurs seuils étaient déterminés individuellement par chaque entreprise.

Au début de 1995, Compaq a proposé de standardiser la technologie. IBM, Seagate, Quantum, Conner et Western Digital (ce dernier n’avait pas de système de suivi de disque dur) ont soutenu cette idée. La base a été prise technologie IntelliSafe. La norme développée conjointement s'appelait SMART, la norme SMART I. Elle permettait de surveiller les paramètres de base et n'était lancée qu'après la commande.

Hitachi a participé au développement de SMART II, ​​offrant une méthode d'autodiagnostic complet du lecteur (autotest étendu), et une fonction de consignation des erreurs est également apparue. SMART III est doté d'une fonctionnalité permettant de détecter les défauts de surface et de les restaurer de manière transparente pour l'utilisateur.

Description

SMART surveille les caractéristiques principales du lecteur, qui reçoivent chacune une note. Les caractéristiques peuvent être divisées en deux groupes:

  • 1) paramètres reflétant le processus de vieillissement naturel du disque dur (vitesse de rotation, nombre de mouvements de la tête, nombre de cycles marche-arrêt);
  • 2) paramètres de lecteur actuels (hauteur des têtes au-dessus de la surface du disque, nombre de secteurs réaffectés, durée de la recherche et nombre d'erreurs de recherche).

Les données sont stockées sous forme hexadécimale, appelée valeur brute («valeurs brutes»), puis converties en une valeur, une valeur qui symbolise la fiabilité par rapport à une valeur de référence. En général, la valeur est comprise entre 0 et 100 (certains attributs ont une valeur comprise entre 0 et 200 et entre 0 et 253).

Un score élevé indique l'absence de changement dans ce paramètre ou sa lente détérioration. Faible - un échec possible dans un proche avenir.

Une valeur inférieure au minimum auquel le fabricant garantit le fonctionnement sans défaillance du lecteur signifie que le nœud tombe en panne.

La technologie SMART vous permet de:

  • 1) paramètres d'état de surveillance;
  • 2) balayage de surface;
  • 3) balayage de surface avec remplacement automatique des secteurs douteux par des secteurs fiables.

Il convient de noter que la technologie SMART vous permet de prédire la défaillance du périphérique à la suite de défaillances mécaniques, qui représentent environ 60% des causes d'une défaillance du disque dur. SMART ne peut prédire les effets d’une surtension ou d’un choc mécanique.

Il convient de noter que les lecteurs ne peuvent pas signaler leur état de manière indépendante à l'aide de la technologie SMART. Toutefois, il existe des programmes spéciaux pour cela. Ainsi, l’utilisation de la technologie SMART est impossible sans les deux composants suivants:

  • 1) logiciel intégré au contrôleur de stockage;
  • 2) Logiciel externe intégré à l'hôte.

Les programmes qui affichent l’état des attributs SMART fonctionnent selon l’algorithme suivant:

  • Vérifiez la présence de la technologie d'assistance au lecteur SMART;
  • Envoi d'une commande de requête SMART-tables;
  • Obtenir des tables dans le tampon d'application;
  • Décodage des structures de table, en extrayant le numéro d'attribut et sa valeur numérique;
  • Comparaison des numéros d'attributs normalisés avec leurs noms (parfois en fonction du type, du modèle ou du fabricant, comme dans le programme Victoria);
  • Afficher les valeurs numériques sous une forme facile à lire (par exemple, convertir des valeurs hexadécimales en valeurs décimales);
  • Extraction des indicateurs d'attribut des tables (attributs caractérisant l'attribution d'attribut dans un lecteur donné, par exemple, «vital» ou «compteur»);
  • Affiche l'état général du périphérique en fonction de toutes les tables, valeurs et indicateurs.

Attributs SMART

Le tableau d'attributs connus SMART se présente comme suit:

Non Hex Nom d'attribut Mieux si ... Description
01 01 Taux d'erreur de lecture brute
Moins
Le taux d'erreur lors de la lecture de données sur le disque, dont l'origine est due à la partie matérielle du disque.
Pour tous les disques Seagate, Samsung (F1 et plus récents) et Fujitsu 2.5? Il s’agit du nombre de corrections internes des données effectuées avant la sortie vers l’interface; il est donc possible de répondre calmement à des nombres effrayants.
02 02 Performance de débit
Plus
Performances globales du disque. Si la valeur de l'attribut diminue, il est probable que le disque pose des problèmes.
03 03 Temps de rotation
Moins
Temps de promotion du paquet de disques de l'état de repos à la vitesse de travail.
Il se développe lorsque la mécanique s'use (frottement accru dans le roulement, etc.), ce qui peut également indiquer une alimentation de mauvaise qualité (par exemple, une chute de tension au début d'un disque).
04 04 Nombre de départ / arrêt Le nombre total de cycles marche / arrêt de la broche. Certains fabricants de disques (Seagate, par exemple): compteur de mode de mise sous tension. Le champ de valeur brute stocke le nombre total de démarrages / arrêts du disque.
05 05 Nombre de secteurs réaffectés
Moins
Le nombre d'opérations de réaffectation de secteur. Lorsqu'un disque détecte une erreur de lecture / écriture, il marque le secteur comme «réaffecté» et transfère les données vers une zone de sauvegarde dédiée. C'est pourquoi il est impossible de voir les blocs défectueux sur les disques durs modernes - ils sont tous cachés dans des secteurs réaffectés. Ce processus s'appelle remappage et le secteur remappé est remappage. Plus la valeur est grande, plus les disques sont en mauvais état. Le champ de valeur brute contient le nombre total de secteurs réaffectés.
L'augmentation de la valeur de cet attribut peut indiquer une détérioration de l'état de surface du disque à crêpes.
06 06 Lire la marge de la chaîne Lecture du canal en stock. Le but de cet attribut n'est pas documenté. Dans les lecteurs modernes n'est pas utilisé.
07 07 Taux d'erreur de recherche
Moins
Taux d'erreur lors du positionnement de l'unité de têtes magnétiques. Plus ils sont nombreux, plus la mécanique et / ou la surface du disque dur sont en mauvais état. De plus, la valeur du paramètre peut être affectée par une surchauffe et des vibrations externes (provenant par exemple de disques adjacents dans le panier).
08 08 Recherche de performance temporelle
Plus
La performance moyenne de l'opération de positionnement des têtes magnétiques. Si la valeur de l'attribut diminue (ralentissement du positionnement), la probabilité de problèmes avec la partie mécanique de l'actionneur est élevée.
09 09 Compte de temps de mise en marche (heures de mise en marche )
Moins
Nombre d'heures (minutes, secondes - selon le fabricant) passées à l'état allumé. Le temps de passeport entre les échecs (MTBF - temps moyen entre les échecs) est choisi comme valeur seuil pour celui-ci.
10 0A Nombre d'essais en accélération
Moins
Nombre de tentatives répétées de rotation d'un disque à sa vitesse de fonctionnement en cas d'échec de la première tentative. Si la valeur de l'attribut augmente, la probabilité de problèmes avec la pièce mécanique est élevée.
11 0B Tentatives de recalibration
Moins
Nombre de tentatives de réétalonnage effectuées en cas d'échec de la première tentative. Si la valeur de l'attribut augmente, la probabilité de problèmes avec la pièce mécanique est élevée.
12 0C Nombre de cycles d'alimentation de l'appareil Nombre de cycles complets d’activation et de désactivation du disque.
13 0D Taux d'erreur de lecture souple
Moins
Le nombre d'erreurs de lecture dues à une erreur du logiciel qui n'a pas pu être corrigée. Toutes les erreurs ne sont pas de nature mécanique et indiquent uniquement le mauvais marquage / interaction avec les programmes sur disque ou le système d'exploitation.
184 B8 Erreur de bout en bout
Moins
Cet attribut - qui fait partie de la technologie HP SMART IV - signifie qu'après le transfert des données via le cache, la parité des données entre l'hôte et le disque dur ne correspond pas.
187 BB Erreurs UNC signalées
Moins
Erreurs ne pouvant pas être récupérées à l'aide de techniques de résolution des erreurs matérielles.
188 BC Délai d'expiration de la commande
Moins
Le nombre d'opérations interrompues en raison du délai d'attente du disque dur. Habituellement, cette valeur d'attribut doit être zéro et si la valeur est très supérieure à zéro, il y aura probablement de graves problèmes d'alimentation ou de câbles de données oxydés.
190 BE Température du flux d'air (WDC)
Moins
La température de l'air à l'intérieur du disque dur. Pour les disques Seagate, il est calculé à l'aide de la formule (température 100 - HDA). Pour les lecteurs Western Digital - (125-HDA).
191 Bf Taux d'erreur du sens G
Moins
Le nombre d'erreurs résultant de charges de choc. L'attribut stocke les lectures de l'accéléromètre intégré, qui enregistre tous les chocs, secousses, chutes et même une installation imprécise du disque dans le boîtier de l'ordinateur.
192 C0 Nombre de rétractations hors tension
Moins
Le nombre de cycles d'arrêt ou d'accidents (allumer / éteindre le lecteur).
193 C1 Cycle de chargement / déchargement
Moins
Le nombre de cycles de mouvement du bloc de têtes magnétiques dans la zone de stationnement / en position de travail.
194 C2 Température HDA
Moins
Les lectures du capteur thermique intégré pour la partie mécanique du disque - banques (HDA - Hard Disk Assembly) sont stockées ici. Les informations sont supprimées du capteur thermique intégré, qui est l'une des têtes magnétiques, généralement au bas de la banque. Les températures actuelle, minimale et maximale sont fixées dans les champs de bits d'attribut. Tous les programmes qui fonctionnent avec SMART n'analysent pas correctement ces champs, leur témoignage doit donc être traité de manière critique.
195 C3 Matériel ECC récupéré
Moins
Le nombre de disque matériel de correction d'erreur (lecture, positionnement, transmission sur l'interface externe). Sur les disques avec une interface SATA, la valeur augmente souvent à mesure que la fréquence du bus système augmente - SATA est très sensible à l'overclocking.
196 C4 Nombre d'événements de réaffectation
Moins
Le nombre d'opérations de réaffectation. Le champ «valeur brute» de l'attribut stocke le nombre total de tentatives de transfert d'informations des secteurs réaffectés vers la zone de réserve. Les tentatives réussies et non réussies sont comptées.
197 C5 Nombre actuel de secteurs en attente
Moins
Le nombre de secteurs candidats au remplacement. Ils n'ont pas encore été identifiés comme mauvais, mais leur lecture est différente de la lecture d'un secteur stable, ce sont les secteurs dits suspects ou instables. En cas de réussite de la lecture ultérieure du secteur, celui-ci est exclu du nombre de candidats. En cas de lectures erronées répétées, le lecteur essaie de le restaurer et effectue une opération de remappage.
L'augmentation de la valeur de cet attribut peut indiquer une dégradation physique du disque dur.
198 C6 Nombre de secteurs non corrigible
Moins
Le nombre de secteurs non réglables (disque). En cas d'augmentation du nombre d'erreurs, la probabilité de défauts de surface critiques et / ou de mécanique du lecteur est élevée.
199 C7 Nombre d'erreurs UltraDMA CRC
Moins
Nombre d'erreurs survenant lors de la transmission de données sur l'interface externe en mode UltraDMA (violations de l'intégrité des paquets, etc.). La croissance de cet attribut indique un mauvais câble (froissé, tordu) et de mauvais contacts. De plus, de telles erreurs apparaissent lors de l'overclocking du bus PCI, des pannes de courant, des capteurs électromagnétiques puissants et parfois du fait du pilote.
Peut-être la raison du panache de mauvaise qualité. Pour résoudre ce problème, essayez d’utiliser un câble sans boucle SATA avec une connexion étroite aux contacts du disque.
200 C8 Taux d'erreur d'écriture /
Taux d'erreur multizone
Moins
Affiche le nombre total d'erreurs survenant lors de l'écriture d'un secteur. Affiche le nombre total d'erreurs d'écriture sur le disque. Peut servir d’indicateur de qualité de surface et de mécanique d’entraînement.
201 C9 Taux d'erreur de lecture logicielle
Moins
La fréquence d'occurrence des erreurs "logiciel" lors de la lecture de données à partir du disque.

Ce paramètre indique la fréquence des erreurs dans les opérations de lecture de la surface du disque dues au logiciel plutôt qu'au matériel de l'unité.

202 CA Erreurs de marque d'adresse
Moins
Marquer (DAM) le numéro spécifique du vendeur de Data Address Marker (DAM).
203 CB À court terme annuler
Moins
Le nombre d'erreurs ECC.
204 CC Correction douce ECC
Moins
Nombre d'erreurs ECC corrigées par le logiciel.
205 CD Taux d'aspérité thermique (TAR)
Moins
Nombre d'erreurs d'asperité thermique.
206 CE Hauteur de vol La hauteur entre la tête et la surface du disque.
207 CF Spin haut courant
Moins
La magnitude du courant lors de la promotion du disque.
208 D0 Spin Buzz Nombre de routines de bourdonnement pour faire tourner le lecteur.
209 D1 Hors ligne chercher des performances Le lecteur recherche des performances lors des opérations hors ligne.
220 DC Décalage de disque
Moins
La distance de décalage du bloc de disque par rapport à la broche. Découle principalement d'un coup ou d'une chute. Unité de mesure inconnue. À mesure que l'attribut augmente, le disque devient rapidement inopérant.
221 DD Taux d'erreur G-Sense
Moins
Le nombre d'erreurs causées par des charges et des chocs externes. L'attribut stocke les lectures du capteur de choc intégré.
222 DE Heures chargées Temps passé par l'unité à têtes magnétiques entre le déchargement de l'aire de stationnement vers l'aire de travail du disque et le chargement de l'unité dans l'aire de stationnement.
223 Df Nombre de tentatives de chargement / déchargement Nombre de nouvelles tentatives de déchargement / chargement du bloc de têtes magnétiques vers / depuis l'aire de stationnement après une tentative infructueuse.
224 E0 Charge de frottement
Moins
L'ampleur de la force de friction des têtes magnétiques lors du déchargement de l'aire de stationnement.
225 E1 Nombre de cycles de charge
Moins
Le nombre de cycles pour déplacer le bloc de têtes magnétiques dans la zone de stationnement.
226 E2 Chargez dans le temps Temps nécessaire au lecteur pour décharger les têtes magnétiques du parking sur la surface de travail du disque.
227 E3 Compte d'amplification de couple
Moins
Le nombre de tentatives pour compenser le couple.
228 E4 Cycle de rétractation hors tension
Moins
Nombre de répétitions de stationnement automatique d'un bloc de têtes magnétiques à la suite d'une mise hors tension.
230 E6 Amplitude de la tête GMR L'amplitude de la "gigue" (la distance du mouvement répétitif du bloc de têtes magnétiques).
231 E7 La température
Moins
La température du disque dur.
240 F0 Heures de vol de la tête Durée totale en heures de fonctionnement de l'unité principale.
250 FA Taux d'erreur de relecture
Moins
Le nombre d'erreurs lors de la lecture d'un disque dur.

  • Plus - Une valeur de paramètre plus grande est préférable.
  • Moins - Une valeur de paramètre plus petite est préférable.
  • Paramètre critique - fond de ligne rouge