This page has been robot translated, sorry for typos if any. Original content here.

SMART

S.M.A.R.T.

SMART (technologie d'autosurveillance, d'analyse et de reporting) est une technologie permettant d'évaluer l'état d'un disque dur grâce à l'équipement d'autodiagnostic intégré, ainsi qu'un mécanisme permettant de prédire le moment de sa défaillance.

Histoire

Le premier disque dur avec un système d'auto-diagnostic a été introduit en 1992 par IBM dans les baies de disques IBM 9337 pour serveurs AS / 400 utilisant des disques IBM 0662 SCSI-2. La technologie s'appelait Predictive Failure Analysis (PFA). Plusieurs paramètres clés ont été mesurés, leur évaluation a été effectuée directement par le contrôleur de disque. Le résultat était limité à un seul bit: soit tout est en ordre, soit le disque pourrait bientôt échouer. Plus tard, Compaq, Seagate, Quantum et Conner ont développé une autre technologie appelée IntelliSafe. Il avait un protocole commun pour l'émission d'informations sur l'état du disque dur, mais mesuré les paramètres et leurs seuils, chaque société déterminée indépendamment.

Au début de 1995, Compaq a proposé de normaliser la technologie. IBM, Seagate, Quantum, Conner et Western Digital (ce dernier à l'époque n'avait pas encore de système de surveillance des paramètres du disque dur) soutenaient cette idée. La base a été prise technologie IntelliSafe. Une norme élaborée conjointement a été appelée SMART Standard SMART I pour le suivi des principaux paramètres et n'a été lancée qu'après la commande.

Dans le développement de SMART II, ​​Hitachi a participé, qui a offert une méthode d'auto-test complet du lecteur (auto-test étendu), et une fonction de journalisation des erreurs est apparue. SMART III dispose d'une fonction permettant de détecter les défauts de surface et de les rendre "transparents" à l'utilisateur.

Description

SMART surveille les principales caractéristiques du disque, dont chacune reçoit une estimation. Les caractéristiques peuvent être divisées en deux groupes:

  • 1) les paramètres reflétant le processus de vieillissement naturel du disque dur (vitesse de la broche, nombre de mouvements de la tête, nombre de cycles marche / arrêt);
  • 2) les paramètres actuels du lecteur (hauteur de la tête au-dessus de la surface du disque, nombre de secteurs réaffectés, temps de recherche de la piste et nombre d'erreurs de recherche).

Les données sont stockées sous une forme hexadécimale appelée valeur brute, puis converties en valeur, une valeur qui symbolise la fiabilité par rapport à une valeur de référence. Habituellement, la valeur est comprise entre 0 et 100 (certains attributs ont des valeurs de 0 à 200 et de 0 à 253).

Un score élevé indique qu'il n'y a pas de changement dans ce paramètre ou sa lente détérioration. Faible - à propos d'un dysfonctionnement possible dans un proche avenir.

Une valeur inférieure au minimum, à laquelle le fabricant garantit un fonctionnement sans problème du variateur, signifie la défaillance du nœud.

La technologie SMART vous permet de:

  • 1) surveillance des paramètres d'état;
  • 2) balayage de surface;
  • 3) Balayage de surface avec remplacement automatique des secteurs douteux par des secteurs fiables.

Il convient de noter que la technologie SMART vous permet de prédire la défaillance de l'appareil en raison de dysfonctionnements mécaniques, ce qui représente environ 60% des causes de défaillance du disque dur. Prédire les conséquences d'une surtension ou d'un choc mécanique SMART n'est pas capable.

Il convient de noter que les lecteurs ne peuvent pas signaler leur statut de manière indépendante via la technologie SMART, mais à cette fin, il existe des programmes spéciaux. Ainsi, l'utilisation de la technologie SMART est impossible sans les deux composants suivants:

  • 1) logiciel intégré dans le variateur de vitesse;
  • 2) Logiciel externe intégré dans l'hôte.

Les programmes affichant l'état des attributs SMART fonctionnent selon l'algorithme suivant:

  • Vérifiez la disponibilité du support pour le lecteur de la technologie SMART;
  • Envoyer une commande de requête SMART-table;
  • Obtention de tables dans le tampon d'application
  • Décoder des structures de table, extraire le numéro d'attribut et sa valeur numérique;
  • Comparaison des numéros d'attributs normalisés à leurs noms (parfois - selon le type, le modèle ou le fabricant, comme, par exemple, dans le programme Victoria);
  • Sortie de valeurs numériques sous une forme pratique pour la perception (par exemple, conversion de valeurs hexadécimales en valeurs décimales);
  • Extraction d'attributs à partir de tables attributaires (attributs caractérisant l'affectation d'un attribut dans un lecteur donné, par exemple, "vital" ou "compteur");
  • Sortie de l'état général du périphérique en fonction de toutes les tables, valeurs et fanions.

Attributs SMART

Une table des attributs SMART connus ressemble à ceci:

Non Hex Nom de l'attribut C'est mieux si ... Description
01 01 Taux d'erreur de lecture brut
Moins
La fréquence des erreurs lors de la lecture des données d'un disque, dont l'origine est due au matériel du disque.
Pour tous Seagate, Samsung (F1 et plus récent) et Fujitsu 2.5? c'est le nombre de corrections internes des données détenues avant d' émettre à l'interface, donc il est possible de réagir calmement à des chiffres effrayants.
02 02 Performance de débit
Plus d'infos
Performances globales du disque Si la valeur de l'attribut diminue, il y a une forte probabilité qu'il y ait des problèmes avec le disque.
03 03 Temps de spin-up
Moins
Temps pour dérouler le paquet de disques de l'état de repos à la vitesse de fonctionnement.
Il augmente avec l'usure de la mécanique (frottement accru dans le roulement, etc.), il peut également indiquer une alimentation de mauvaise qualité (par exemple, une chute de tension au démarrage du disque).
04 04 Démarrer / Arrêter le compte Le nombre total de cycles start-stop de la broche. Certains fabricants de disques (par exemple, Seagate) ont un compte à rebours d'économie d'énergie. Le champ de valeur brute stocke le nombre total de démarrages / arrêts du disque.
05 05 Nombre de secteurs réaffectés
Moins
Nombre d'opérations de remappage de secteur. Lorsqu'un disque détecte une erreur de lecture / écriture, il marque le secteur "remappé" et transfère les données vers une zone de réserve dédiée. C'est pourquoi sur les disques durs modernes, on ne peut pas voir de mauvais blocs - ils sont tous cachés dans les secteurs réaffectés. Ce processus est appelé remappage, et le secteur remappé est remappé. Plus la valeur est élevée, plus l'état de surface des disques est mauvais. Le champ de valeur brute contient le nombre total de secteurs réaffectés.
Une augmentation de la valeur de cet attribut peut indiquer une détérioration de l'état de la surface des crêpes du disque.
06 06 Lire la marge de la chaîne La réserve du canal de lecture. Le but de cet attribut n'est pas documenté. Dans les lecteurs modernes n'est pas utilisé.
07 07 Rechercher le taux d'erreur
Moins
Fréquence des erreurs lors du positionnement d'un bloc de têtes magnétiques. Le plus d'entre eux, le pire est l'état de la mécanique et / ou la surface du disque dur. En outre, la valeur du paramètre peut être affectée par la surchauffe et les vibrations externes (par exemple, des disques voisins dans le panier).
08 08 Rechercher des performances temporelles
Plus d'infos
La performance moyenne d'une opération de positionnement avec des têtes magnétiques. Si la valeur de l'attribut diminue (ralentissement du positionnement), alors la probabilité de problèmes avec la partie mécanique de l'entraînement des têtes est élevée.
09 09 Temps de mise sous tension (heures de mise sous tension)
Moins
Le nombre d'heures (minutes, secondes - selon le fabricant), effectué dans l'état activé. En tant que valeur de seuil pour lui, le MTBF est le temps moyen entre l'échec.
10 0A Spin-Up Retry Count
Moins
Le nombre de tentatives répétées de détordement des disques à la vitesse de travail dans le cas où la première tentative a échoué. Si la valeur de l'attribut augmente, alors la probabilité d'un dysfonctionnement de la partie mécanique est élevée.
11ème 0B Nouvelles tentatives de réétalonnage
Moins
Le nombre de répétitions de demandes de recalibrage dans le cas où la première tentative a échoué. Si la valeur de l'attribut augmente, alors la probabilité de problèmes avec la partie mécanique est élevée.
12ème 0C Nombre de cycles de puissance du périphérique Nombre de cycles complets de mise en marche et d'arrêt du disque.
13ème 0D Taux d'erreur de lecture douce
Moins
Le nombre d'erreurs de lecture, dues à la faute du logiciel, qui ne se prêtait pas à la correction. Toutes les erreurs ne sont pas de nature mécanique et indiquent uniquement un mauvais balisage / interaction avec le disque du programme ou du système d'exploitation.
184 B8 Erreur de bout en bout
Moins
Cet attribut - qui fait partie de la technologie HP SMART IV - signifie qu'après la transmission des données à travers la mémoire cache, la parité des données entre l'hôte et le disque dur ne correspond pas.
187 BB Erreurs UNC signalées
Moins
Erreurs qui n'ont pas pu être récupérées en utilisant des méthodes d'élimination des erreurs par matériel.
188 BC Délai d'expiration de la commande
Moins
Nombre d'opérations interrompues en raison du délai d'attente du disque dur. Habituellement, cette valeur d'attribut doit être zéro, et si la valeur est beaucoup plus élevée que zéro, alors il y aura probablement de sérieux problèmes d'alimentation ou des câbles oxydés pour le transfert de données.
190 BE Température de flux d'air (WDC)
Moins
Température de l'air à l'intérieur du boîtier du disque dur. Pour les disques Seagate est calculé par la formule (100 - température HDA). Pour les disques Western Digital - (125-HDA).
191 BF Taux d'erreur G-sense
Moins
Le nombre d'erreurs qui surviennent à la suite de charges d'impact. L'attribut stocke les lectures de l'accéléromètre intégré, qui enregistre tous les impacts, les secousses, les chutes et même l'installation inexacte du disque dans le boîtier de l'ordinateur.
192 C0 Compte de retrait de mise hors tension
Moins
Nombre de cycles d'arrêts ou de pannes d'urgence (mise sous / hors tension du variateur).
193 C1 Cycle de chargement / déchargement
Moins
Nombre de cycles de déplacement de l'unité de tête magnétique vers la zone de stationnement / dans la position de travail.
194 C2 Température HDA
Moins
Ici, les lectures du capteur thermique intégré pour la partie mécanique des banques de disques (HDA - Hard Disk Assembly) sont stockées. Les informations sont supprimées du capteur de température intégré, qui est l'une des têtes magnétiques, généralement la plus basse de la banque. Dans les champs de bits de l'attribut, les températures actuelles, minimales et maximales sont fixées. Tous les programmes travaillant avec SMART ne désassemblent pas correctement ces champs, de sorte que leurs indications doivent être traitées de manière critique.
195 C3 ECC matériel récupéré
Moins
Le nombre d'erreurs corrigées par le matériel du disque (lecture, positionnement, transmission via l'interface externe). Sur les disques SATA, la valeur se détériore souvent avec l'augmentation de la fréquence du bus système - SATA est très sensible à l'overclocking.
196 C4 Nombre d'événements de réallocation
Moins
Nombre d'opérations de réaffectation. Le champ "valeur brute" de l'attribut stocke le nombre total de tentatives de transfert d'informations des secteurs réaffectés vers la zone de réserve. Les tentatives réussies et infructueuses sont prises en compte.
197 C5 Nombre actuel de secteurs en attente
Moins
Nombre de secteurs candidats à un remplacement Ils n'ont pas encore été identifiés comme mauvais, mais lire d'eux est différent de la lecture d'un secteur stable, ce sont les secteurs dits suspects ou instables. En cas de lecture ultérieure réussie du secteur, il est exclu du nombre de candidats. En cas de lectures répétées erronées, le lecteur essaie de le restaurer et effectue une opération de remappage.
Une augmentation de la valeur de cet attribut peut indiquer une dégradation physique du disque dur.
198 C6 Nombre de secteurs incorrigible
Moins
Le nombre de secteurs qui ne peuvent pas être corrigés (par des moyens de disque). Dans le cas d'une augmentation du nombre d'erreurs, la probabilité de défauts de surface critiques et / ou de mécanique d'entraînement est élevée.
199 C7 Nombre d'erreurs UltraDMA CRC
Moins
Le nombre d'erreurs qui se produisent lorsque les données sont transférées sur une interface externe en mode UltraDMA (violations d'intégrité des paquets, etc.). La croissance de cet attribut indique un mauvais câble (menthe, torsadé) et de mauvais contacts. En outre, de telles erreurs apparaissent lors de l'overclocking du bus PCI, des pannes de courant, de fortes interférences électromagnétiques, et parfois de la faute du conducteur.
Probablement la raison est dans un sentier de faible qualité. Pour la correction, essayez d'utiliser un câble SATA sans verrous, qui a une connexion étroite avec les contacts du disque.
200 C8 Ecrire taux d'erreur /
Taux d'erreur multi-zone
Moins
Affiche le nombre total d'erreurs qui se produisent lors de l'écriture d'un secteur. Affiche le nombre total d'erreurs d'écriture par disque. Il peut servir d'indicateur de la qualité de la surface et de la mécanique du variateur.
201 C9 Taux d'erreur de lecture douce
Moins
Fréquence d'apparition d'erreurs "programme" lors de la lecture des données d'un disque.

Ce paramètre indique la fréquence des erreurs dans les opérations de lecture à partir de la surface du disque en raison d'une erreur logicielle, et non le matériel du lecteur.

202 CA Erreurs de repère d'adresse
Moins
Nombre d'erreurs de marque d'adresse de données (DAM) (ou) spécifique au fournisseur.
203 CB En panne d'annulation
Moins
Nombre d'erreurs ECC.
204 CC Correction ECC douce
Moins
Nombre d'erreurs ECC corrigées par programme.
205 Cd Taux d'aspérité thermique (TAR)
Moins
Nombre d'erreurs d'asperité thermique.
206 CE Hauteur de vol Hauteur entre la tête et la surface du disque.
207 CF Spin courant élevé
Moins
L'amplitude du courant lorsque le disque tourne.
208 D0 Spin buzz Nombre de routines de buzz pour faire tourner le lecteur.
209 D1 Performance de recherche hors connexion Les performances de la recherche lors d'opérations hors ligne (la recherche de performances de Drive lors d'opérations hors ligne).
220 DC Changement de disque
Moins
La distance du déplacement du bloc de disque par rapport à la broche. Principalement en raison de l'impact ou de tomber. L'unité de mesure est inconnue. Avec une augmentation de l'attribut, le disque devient rapidement inutilisable.
221 DD G-Sense Taux d'erreur
Moins
Le nombre d'erreurs dues aux charges et aux chocs externes. L'attribut enregistre les lectures du capteur de choc intégré.
222 DE Heures chargées Le temps passé par le bloc de têtes magnétiques entre le déchargement de la zone de stationnement à la zone de travail du disque et le chargement de l'unité dans la zone de stationnement.
223 DF Charger / Décharger nombre de tentatives Nombre de nouvelles tentatives de déchargement / chargement de l'unité de tête magnétique vers / depuis l'aire de stationnement après une tentative infructueuse.
224 E0 Charge de friction
Moins
L'ampleur de la force de frottement de l'unité de tête magnétique lorsqu'elle est déchargée de la zone de stationnement.
225 E1 Compte du cycle de charge
Moins
Nombre de cycles de déplacement de l'unité de tête magnétique vers la zone de stationnement.
226 E2 Charger 'In'-temps Le temps pendant lequel le lecteur décharge les têtes magnétiques de la zone de stationnement à la surface de travail du disque.
227 E3 Couple d'amplification du couple
Moins
Le nombre de tentatives pour compenser le couple.
228 E4 Cycle de retrait de mise hors tension
Moins
Le nombre de répétitions du stationnement automatique de l'unité de tête magnétique à la suite d'une mise hors tension.
230 E6 GMR Tête Amplitude Amplitude de "gigue" (la distance du mouvement répété du bloc de têtes magnétiques).
231 E7 Température
Moins
La température du disque dur.
240 F0 Heures de vol de tête Temps total de l'unité de tête en position de travail en heures.
250 FA Lire le taux de nouvelles tentatives
Moins
Le nombre d'erreurs pendant la lecture du disque dur.

Où:

  • Plus d'infos - Plus la valeur du paramètre est meilleure
  • Moins - Une valeur de paramètre plus petite est meilleure
  • Paramètre critique - arrière-plan de la ligne rouge