Технологія s.m.a.r.t.

Кутюгін Ігор

Доброго часу доби, шановні читачі. Ідея написати цю статтю з`явилася у мене після того, як мені дістався 10GB WesternDigital, сильно убитий (Windows 98 з нього завантажувався близько 10 хвилин, і постійно включалася перевірка диска при запуску комп`ютера). У власника цього HDD S.M.A.R.T. був відключений, і тому не з`являлося повідомлення про помилки. На моєму комп`ютері в кінці Post вискакувало повідомлення - "Один з атрибутів S.M.A.R.T. (Seek Time Performance, як потім з`ясувалося) перевищив порогове значення, рекомендується зробити резервну копію даних" (не пам`ятаю як це англійською). Далі комп`ютер не завантажувався. Завантаження тривала, коли S.M.A.R.T. був відключений в биосе. Після відрізання бедов диск все одно працював погано. Обнулення атрибутів ні до чого не привело, після 2ий перезавантаження спостерігалася та ж картина, ось і довелося з`ясовувати, що це за атрибут і з чим він пов`язаний.

У цій статті я постараюся описати технологію S.M.A.R.T. - Self-Monitoring, Analysis and Reporting Technology ( "Технологія Самодіагностики, Аналізу та Звіту") - в доступній для розуміння формі. Звичайно, повністю охопити всі її можливості не можливо, бо в даний час відсутня будь-яка повна документація по цьому питанню, та й виробники накопичувачів про свої продвижениях в цій області повідомляти не поспішають.

Що таке S.M.A.R.T.

Отже, S.M.A.R.T. дозволяє відстежувати і, найголовніше, прогнозувати виникнення помилок, пов`язаних з функціонуванням HDD, звідси з`являється можливість вчасно зробити резервну копію даних, тим самим уникнути морального і матеріального збитку від втрати інформації, обмежившись лише купівлею нового диска.

S.M.A.R.T. - це набір програм, вшитих в мікрокод вінчестера. Кожна фірма-виробник дисків веде свої розробки, звідси і різноманітність параметрів для різних дисків. Однак існують загальні параметри:

1.Атрібути, що відображають загальний стан диска (приблизно 30);

2.Внутренняя тести (self-tests);

3.Журнали S.M.A.R.T. (Помилок, загального стану, дефектних секторів і т.п.).

Повний обов`язковий перелік S.M.A.R.T атрибутів описаний в стандарті ATA / ATAPI-6.

Атрибути S.M.A.R.T.

Атрибути S.M.A.R.T. - особливі характеристики, які використовуються при аналізі стану та запасу продуктивності накопичувача. Вони вибираються виробником, грунтуючись на їх здатності передбачати погіршення робочих характеристик накопичувача або визначити його дефектність.

Значення атрибутів (value) Використовуються для подання відносної надійності окремого експлуатаційного або еталонного атрибута. Допустиме значення атрибута лежить в діапазоні від 1 до 255. Його високе значення говорить про те, що результат аналізу даної робочої характеристики вказує на низьку ймовірність її погіршення або виходу накопичувача з ладу. Відповідно, низьке значення атрибута говорить про те, що результат аналізу даної робочої характеристики вказує на високу ймовірність її погіршення або виходу накопичувача з ладу.

Кожен атрибут має власне граничне значення (threshold), Яке використовується для порівняння зі значенням атрибута (value) і вказує на погіршення робочих характеристик або дефектність накопичувача. Числове значення порогового атрибута визначається виробником через конструкційні особливості накопичувача і аналіз результатів випробувань на надійність. Граничне значення кожного атрибута вказує на його нижню допустиму межу, до якої накопичувач нормально функціонує.

Нижче наведено короткий опис основних атрибутів:

Raw Read Error Rate - Частота появи помилок при читанні даних з диска. Цей параметр показує частоту появи помилок при операціях читання з поверхні диска з вини апаратної частини накопичувача.

Throughput Performance - Середня продуктивність (пропускна здатність) диска. Зменшення значення value цього атрибута з великою ймовірністю вказує на проблеми в накопичувачі.

Spin Up Time- Час розкрутки шпинделя. Середній час розкрутки шпинделя диска від 0 RPM до робочої швидкості.

Start / Stop Count- Кількість циклів запуск / зупинка шпинделя. Зберігає загальна кількість включень / виключень диска.

Reallocated Sectors Count - Кількість перепризначених секторів. Коли жорсткий диск зустрічає помилку читання / запису / верифікації, він намагається перемістити дані в спеціальну резервну область (spare area) і, в разі успіху, позначає сектор як "перепризначений". Також, цей процес називають remapping, а перепризначений сектор - remap. Завдяки цій можливості, на сучасних жорстких дисках дуже рідко видно (при тестуванні поверхні) так звані bad block. Однак, при великій кількості ремапов, на графіку читання з поверхні будуть помітні "провали" - різке падіння швидкості читання (до 10% і більше).

Seek Error Rate - Частота появи помилок позиціонування МГ (магнітної головки). У разі збою в механічній системі позиціонування, пошкодження сервометок (servo), сильного термічного розширення дисків і т.п. виникають помилки позиціонування. Чим їх більше, тим гірше стан механіки і / або поверхні жорсткого диска.

Seek Time Performance - Середня продуктивність операцій позиціонування МГ. Цей параметр показує середню швидкість позиціонування приводу МР на вказаний сектор. Зниження значення цього атрибута говорить про неполадки в механіці приводу.

Power-On Hours - Кількість відпрацьованих годин у включеному стані. Значення value цього атрибута показує кількість годин (хвилин, секунд - в залежності від виробника), відпрацьованих жорстким диском. Зниження значення атрибута до критичного рівня (threshold) вказує на вироблення диском ресурсу. На практиці, навіть падіння цього атрибута до нульового значення не завжди вказує на реальне вичерпання ресурсу і накопичувач може продовжувати нормально функціонувати.

Spin Retry Count - Кількість повторів спроб старту шпинделя диска. Даний атрибут фіксує загальна кількість спроб розкрутки шпинделя і його виходу на робочу швидкість, за умови, що перша спроба була невдалою. Зниження значення цього атрибута говорить про неполадки в механіці приводу.

Recalibration Retries- Кількість повторів спроб рекалібровкі накопичувача. Даний атрибут фіксує загальна кількість спроб скидання стану накопичувача і установки головок на нульову доріжку, за умови, що перша спроба була невдалою. Зниження значення цього атрибута говорить про неполадки в механіці приводу.

Device Power Cycle Count - Кількість повних циклів запуску / зупинки жорсткого диска.

Soft Read Error Rate - Частота появи "програмних" помилок при читанні даних з диска. Цей параметр показує частоту появи помилок при операціях читання з поверхні диска з вини програмного забезпечення, а не апаратної частини накопичувача.

Load / Unload Cycle Count - Кількість циклів виведення МГ в спеціальну паркувальну зону / в робоче положення.

Temperature - Температура. Даний параметр відображає показання вбудованого температурного сенсора в градусах Цельсія.




Reallocation Event Count - Кількість операцій перепризначення (ремаппінга). Показує загальна кількість спроб перепризначення збійних секторів в резервну область, зроблених накопичувачем. При цьому, враховуються як успішні, так і невдалі операції.

Current Pending Sector Count - Поточне кількість нестабільних секторів. Показує загальна кількість секторів, які накопичувач в даний момент вважає претендентами на перепризначення в резервну область (remap). Якщо в подальшому якийсь із цих секторів буде прочитаний успішно, то він виключається зі списку претендентів. Якщо ж читання сектора буде супроводжуватися помилками, то накопичувач спробує відновити дані і перенести їх в резервну область, а сам сектор помітити як перепризначений (remapped).

Uncorrectable Sector Count - Кількість нескоректована помилок. Атрибут показує загальну кількість помилок, що виникли при читанні / запису сектора, які не вдалося скорегувати. Зростання значення в поле raw value цього атрибута вказує на явні дефекти поверхні і / або проблеми в роботі механіки накопичувача.

UltraDMA CRC Error Count - Загальна кількість помилок CRC в режимі UltraDMA, містить кількість помилок, що виникли в режимі передачі даних UltraDMA в контрольній сумі (ICRC - Interface CRC). У більшості випадків помилки CRC виникають при сильному завищенні частоти PCI (більше номінальних 33.3 MHz), сильно перекручений кабелі, а також - з вини драйверів ОС, які не дотримуються вимог до передачі / прийому даних в режимах UltraDMA.

Write Error Rate - Частота появи помилок при записі даних. Показує загальна кількість помилок, виявлених під час запису сектора. Чим нижче значення value, тим гірше стан поверхні диска і / або механіки приводу.

Disk Shift - Зрушення пакета дисків щодо осі шпинделя.

G-Sense Error Rate - Частота появи помилок в результаті ударних навантажень. Даний атрибут зберігає свідчення ударочувствітельного сенсора - загальна кількість помилок, що виникли в результаті отриманих накопичувачем зовнішніх ударних навантажень (при падінні, неправильного встановлення, і т.п.).

Тут наведено атрибути, за допомогою яких можна визначити надійність функціонування диска. Решта ж не уявляють практичної важливості.

Автономне сканування поверхні (off-line read scanning).

Більшість накопичувачів забезпечують підтримку автономного сканування поверхні, яке є однією з функцій підпрограми автономного збору даних про стан накопичувача (off-line data collection). При виконанні цієї функції, накопичувач виконує повне сканування поверхні шляхом читання кожного сектора з заміщенням ненадійних секторів на запасні з резервної області (spare area) для запобігання втрати призначених для користувача даних.

Примітка! Якщо під час виконання сканування накопичувач отримує команду по інтерфейсу, то процес сканування переривається і накопичувач приступає до обробки надійшла команди. При цьому гарантується максимальний час реагування на інформацію, що надійшла команду - до 2 секунд.

Вбудовані функції самоконтролю (self-test)

Практично з моменту появи стандарту S.M.A.R.T. II, в більшості накопичувачів з`явилася нова функція - внутрішня діагностика і самоконтроль, для поглибленого контролю стану механіки накопичувача, поверхні дисків і т.п. Для запуску цієї функції, в набір команд S.M.A.R.T. була введена нова команда - SMART EXECUTE OFF-LINE IMMEDIATE. Результат роботи зберігається або в спеціалізованих атрибутах, або окремим параметром серед інших даних в атрибутах

Після виконання тесту, накопичувач в обов`язковому порядку оновлює свідчення у всіх атрибутах і інших параметрах. Якщо під час виконання внутрішнього тесту накопичувач отримає по інтерфейсу нову команду, то виконання тесту переривається і накопичувач приступає до обробки надійшла команди.




Методи тестування.

Існує два способи запуску тестів S.M.A.R.T .: автономний (off-line) або монопольний (captive). Результат тесту завжди зберігається накопичувачем в даних S.M.A.R.T.

При автономному запуску накопичувач повідомляє про успішне завершення команди до її фактичного виконання і тільки після цього виконує тест. При цьому, по інтерфейсу прапор "зайнято" (busy) не виставляли і накопичувач в будь-який момент готовий приступити до виконання чергової інтерфейсної команди, припиняючи роботу тесту. Фактично, тест виконується в фоновому режимі.

При запуску тесту в монопольному режимі, по інтерфейсу виставляється прапор "зайнято" (busy) і накопичувач починає безпосереднє виконання тесту в режимі реального часу. Будь-яка інтерфейсна команда під час виконання цього тесту призведе до його переривання і зупинення, після чого накопичувач приступить до обробки надійшла команди.

Монітор параметрів S.M.A.R.T. програма SIGuardian.

Існує велика кількість програм, які контролюють SMART, це може бути спеціально спрямована програма (Drive Health, SIGuardian), або програма, що містить контроль параметрів SMART як додаткову функцію. На мій погляд, найбільш функціональною є SIGuardian (siguardian.ru). Програма надає можливість стежити за практично усіма атрибутами SMART, має приємний інтерфейс, і володіє великою кількістю налаштувань.

Загальні відомості про диски.

alt = "Монітор параметрів S.M.A.R.T. програма SIGuardian." width = "567" height = "358" / gt;

Відео: постановка цілей по моделі SMART

Мал. 1

alt = "Загальні відомості про диски" width = "567" height = "358" / gt;

Мал. 2

Закладка "Загальні" містить загальну інформацію про обраний жорсткому диску. У лівій половині вказані: технічні характеристики, такі як обсяг диска, кількість циліндрів, головок і т.п.- режим роботи диска зараз (PIO, multiword DMA, UDMA) - підтримувані режими роботи диска (тільки в Розширеному режимі). У правій половині показується логотип фірми-виробника жорсткого диска і нижче - загальна інформація про диск: модель диска, серійний номер диска, дата / ревізія прошивки мікропрограми.

Зверніть увагу, на рис. 1 відсутній показання температури. Диск досить старий і не володіє таким сенсором.

Загальні відомості S.M.A.R.T.

alt = "Загальні відомості S.M.A.R.T." width = "567" height = "358" border = "0" / gt;

Мал. 3.

Закладка "S.M.A.R.T." показує загальну інформацію про стан диска на основі S.M.A.R.T. атрибутів або S.M.A.R.T. - інформацію:

1.Дать початку моніторингу S.M.A.R.T. - тобто дату, коли ви почали контроль за станом диска за допомогою SIGuardian. Найчастіше, це дата першого запуску SIGuardian.

2. Найближчий прогнозовану дату T.E.C. (ThresholdExceedCondition) - тобто дату, коли за прогнозами SIGuardian один з S.M.A.R.T. атрибутів досягне порогового (критичного) значення.

S.M.A.R.T. детально

alt = "S.M.A.R.T. детально" width = "567" height = "358" / gt;

Рис.4.

Закладка "Детально" призначена для відображення повної інформації про S.M.A.R.T.-атрибутах диска. Вона показує:

1. Attribute name - Графічне відображення значення атрибута. При наведенні покажчика миші на нього показується у вікні підказки більш докладний текстовий опис змісту цього атрибута;

2.1 / month - швидкість падіння атрибута - на скільки пунктів в місяць впало значення атрибута. Цей коефіцієнт обчислюється автоматично при будь-якій зміні атрибутів S.M.A.R.T. для кожного атрибута окремо. Обчислення робиться щодня, тому ставитеся нормально до коливань цього показника, особливо відразу після зміни атрибута;

3.Value - значення атрибута - поточне значення даного атрибута S.M.A.R.T .;

4.Threshold - порогове (критичне) значення атрибута - значення, величину якого виробник жорсткого диска вважає критичною і при досягненні якого може мати місце вихід диска з ладу;

5.T.E.C. - Threshold Exceeds Condition - передбачувана дата, коли даний атрибут досягне порогового значення, інакше кажучи, дата можливого виходу з ладу диска. Прогноз цієї дати робиться на основі показника "швидкості падіння атрибута", тому не дивуйтеся сильних коливань дати відразу після зміни атрибутів S.M.A.R.T .;

6.Worst - найгірше значення атрибута - найгірше (мінімальне) значення, яке даний атрибут брав за весь час життя жорсткого диска. Може використовуватися чисто в ознайомлювальних цілях;

7.Raw - "чисте" значення атрибута - просто числове значення атрибута в чистому, необробленому вигляді.

налаштування

alt = "Налаштування" width = "567" height = "358" border = "0" / gt;

Відео: SMART. Технологія розумних цілей. Частина 1

Мал. 5.

Закладка "Налаштування" призначена для самостійного налаштування користувачем параметрів SIGuardian для роботи на комп`ютері. Якщо ви не вважаєте себе досвідченим користувачем, рекомендуємо скористатися "Майстром настройки" - він допоможе вам вибрати найбільш підходящі параметри роботи.

Основні і найбільш важливі настройки:

При завантаженні перевірка і вихід - відзначте цей режим, якщо ви хочете щоб SIGuardian перевіряв стан S.M.A.R.T. тільки при завантаженні операційної системи.

Загальні настройки для всіх дисків- SIGuardian буде використовувати загальні налаштування для всіх дисків в комп`ютері. Вони включають: контроль S.M.A.R.T., період опитування S.M.A.R.T. та адресу електронної пошти для повідомлень. Ви можете встановити загальні або індивідуальні для кожного диска параметри.

Включити контроль S.M.A.R.T.- при виключенні цього режиму SIGuardian не перевірятиме цей диск (або все диски) на значення атрибутів S.M.A.R.T.

Режим роботи - Звичайний або Розширений - Звичайний режим - основний для користувачів. В цьому режимі SIGuardian показує значення атрибута, порогове значення і T.E.C., швидкість падіння атрибута. На закладці "Загальне" Ви не побачите інформації про підтримувані диском режимах роботи (передачі даних). У розширеному режимі додатково показують Найгірше і Чисте (Raw) значення атрибута і повну інформацію про диск на закладці "Загальне".

Опитування S.M.A.R.T. - встановіть тут період опитування S.M.A.R.T. при роботі SIGuardian фоном.

Звіти на e-mail - введіть тут адресу електронної пошти, на який SIGuardian повинен посилати повідомлення. Ви не повинні бачити ніяких повідомлень при роботі в цьому випадку.

WiseControl - інформація тільки про значні зміни (погіршення) параметрів S.M.A.R.T.

Відео: Що таке Smart TV

Hibernate on overheat temperature- якщо температура HDD перевищує встановлене значення, комп`ютер переходить в режим hibernate.

Поділися в соціальних мережах:

Схожі
Перевірка включений чи jаvascriptПеревірка включений чи jаvascript
Код помилки 0x000000ed: unmountable_boot_volumeКод помилки 0x000000ed: unmountable_boot_volume
Як позбутися від повідомлення: "деякі файли, необхідні для роботи тулбару, не знайдені"Як позбутися від повідомлення: "деякі файли, необхідні для роботи тулбару, не знайдені"
Чи не працює клавіатура в безпечному режиміЧи не працює клавіатура в безпечному режимі
Помилка при включенні комп`ютера "cmos battery low. Cmos date / time not set "Помилка при включенні комп`ютера "cmos battery low. Cmos date / time not set "
Команда attribКоманда attrib
Як виконати тест оперативної пам`яті?Як виконати тест оперативної пам`яті?
Створення завантажувальних дисківСтворення завантажувальних дисків
Установка windows 7 другий системою після windows xpУстановка windows 7 другий системою після windows xp
Як встановити windows xp на новий жорсткий дискЯк встановити windows xp на новий жорсткий диск
» » Технологія s.m.a.r.t.