Как сделать смарт жесткого диска

Добавил пользователь Владимир З.
Обновлено: 05.10.2024

Во всех современных накопителях последних лет абсолютно любого производителя присутствует система SMART (self-monitoring, analysis and reporting technology - технология предупреждения, анализа и самопроверки) жесткого диска, очень тесно связанная с функционированием накопителя.

Современные технологии SMART осуществляют: мониторинг различных параметров состояния диска, сканирование поверхности жесткого диска с дальнейшей автоматической заменой нечитаемых секторов и занесение их в error-log, т.н. список, где номера этих секторов хранятся в виде таблицы, периодическое повторное сканирование "ненадежных" секторов из error-log и, если система определяет, что данный сектор исправен - то исключает его из данного списка и он становится доступен на поверхности для пользовательской информации (но также помечается для дальнейшей перепроверки при следующем сканировании поверхности), либо, если сектор не прочитывается несколько раз подряд, не переписывается, то он отправляется в следующий дефект-лист,именуемый у разных производителей по-разному, но имеющий одинаковое предназначение - этот лист является как бы посредником между error-log таблицей и финальным G-листом, где дефект уже будет занесен в G-лист навсегда, станет отображаться в SMART, в строке current pending sectors/offline UNC sectors.

Из статуса current pending поврежденный сектор после очередной перепроверки на "живучесть", если не прошел чтение/запись, то окончательно отправляется в статус переназначенных и там уже остается. Диск в дальнейшей работе его уже не использует, не тестирует повторно на чтение/запись.

В строке reallocated sector count изменяется значение с N на N+1.

SMART ВЫГЛЯДИТ ТАК:



Выводится в виде таблицы со следующими столбцами:

ID – ИДЕНТИФИКАЦИОННЫЙ НОМЕР ПАРАМЕТРА

Name – выводимое программой имя параметра

VAL – НОРМАЛИЗОВАННОЕ ЗНАЧЕНИЕ ПАРАМЕТРА (НОРМАЛИЗОВАННОЕ ЗНАЧИТ, В ДАННОМ СЛУЧАЕ, ЧТО ВНУТРЕННЕЕ (RAW) ЗНАЧЕНИЕ ПАРАМЕТРА ПРЕОБРАЗОВАНО ПО ОПРЕДЕЛЁННОМУ АЛГОРИТМУ ДЛЯ БОЛЕЕ УДОБНОГО И ПОНЯТНОГО ПРОСМОТРА ЗНАЧЕНИЯ. НАПРИМЕР, ВНУТРЕННИЙ ПАРАМЕТР ВСЕГДА УВЕЛИЧИВАЕТСЯ И МОЖЕТ ПРИНИМАТЬ ЗНАЧЕНИЕ В НЕСКОЛЬКО ТЫСЯЧ ЕДИНИЦ, А ВЫВОДИМОЕ ЗНАЧЕНИЕ ИЗМЕНЯЕТСЯ ОТ 100 ДО 0 И ОТОБРАЖЕНИЕ ВНУТРЕННЕГО ДИАПАЗОНА ИЗМЕНЕНИЯ ПАРАМЕТРА НА ВЫВОДИМЫЙ И ЕСТЬ, В ДАННОМ СЛУЧАЕ, НОРМАЛИЗАЦИЯ)

Wrst – худшее значение параметра за отрезок времени время

Thresh – пороговое значение, при достижении которого диск рекомендуется заменить

РАССМОТРИМ, КАКИЕ СУЩЕСТВУЮТ ПАРАМЕТРЫ В СИСТЕМЕ SMART. НАБОР ОТСЛЕЖИВАЕМЫХ ПАРАМЕТРОВ ЗАВИСИТ ОТ ПРОИЗВОДИТЕЛЯ ДИСКА И НЕ ВСЕ ИЗ ПЕРЕЧИСЛЕННЫХ БУДУТ ПРИСУТСТВОВАТЬ В ВАШЕМ СЛУЧАЕ.

Атрибуты SMART:

1 Raw read error rate - количество ошибок при считывании секторов с пластин.

2 Throughput Performance - общая производительность диска в относительных единицах.

3 Spin-up time - время раскрутки пластин от нуля до номинальной скорости вращения в миллисекундах

4 Number of spin-up times - количество циклов раскрутки/остановки пластин; отражает механический ресурс диска из-за ограниченного количества циклов запуска/останова.

5 Reallocated sector count - параметр отражает количество запасных секторов; когда диск находит ошибку чтения/записи/проверки, он переназначает плохой сектор на хороший из запасной зоны; нормализованное значение атрибута уменьшается по мере убывания запасных секторов; RAW-значение показывает количество преназначенных секторов, которое в норме должно быть ноль; на SSDRAW значение показывает количество неисправных блоков флеш-памяти.

6 Read Channel Margin - данный атрибут не используется в современных накопителях.

7 Seek error rate - количество ошибок позиционирования магнитных головок.

8 Seek Time Performance - средняя скорость позиционирования привода магнитных головок на указанный сектор; в SSDпараметр не используется

9 Power-on time - ожидаемое время жизни диска, основанное на времени, проведённом во включённом состоянии; нормализованное значение уменьшается со 100 до 0, связано с ресурсом диска; уменьшение этого параметра косвенно говорит о состоянии механики диска

10 Spin-up retries - количество попыток раскруток пластин при условии, что первая попытка была неудачная; считается с момента начала использования; на SSD не используется

12 Start/stop count - ожидаемое время жизни, основанное на количестве пусков/остановов пластин; каждый диск имеет ограниченное количество пусков/остановов, параметр уменьшается со 100 до 0; RAW значение показывает число включений/выключений

13 Soft Read Error Rate — у одних производителей этот параметр описывается, как указывающий на количество ошибок, не восстановленных ECC, а у других наоборот - восстановленных

100 Erase/Program Cycles - общее количество циклов чтения/записи для всей флеш-памяти за весь срок службы; SSD имеет ограничение на количество циклов чтения/записи, конкретное значение зависит от типа и производителя микросхем флеш-памяти

103 Translation Table Rebuild - количество событий перестроения внутренней таблицы адресов блоков при её повреждении и восстановлении; RAW значение показывает актуальное количество данных событий

170 Reserved Block Count - описывает состояние пула резервных блоков в SSD, показывает процент оставшихся блоков; RAW значение иногда показывает количество использованных резервных блоков

171 Program Fail Count - количество случаев неудавшейся записи блока флеш-памяти

172 Erase Fail Count - количество случаев неудавшейся операции стирания блока флеш-памяти

173 Wear Leveller Worst Case Erase Count - максимальное количество операций стирания, произведённых над блоком флеш-памяти

178 Used Reserved Block Count - описывает состояние пула резервных блоков в SSD, показывает процент оставшихся блоков; RAW значение иногда показывает количество использованных резервных блоков

180 Unused Reserved Block Count - описывает состояние пула резервных блоков в SSD, показывает процент оставшихся блоков; RAW значение иногда показывает количество неиспользованных резервных блоков

183 SATA Downshifts - показывает, как часто требовалось понизить скорость передачи по SATA (с 6Гб/c до 3Гб/с или 1.5Гб/с) для успешной передачи данных, при уменьшении значения атрибута следует заменить кабель

184 End-to-End error - количество ошибок, возникших в буфере диска; часть технологии HP SMART IV; может свидетельствовать о неисправности RAM-буффера диска

185 Head Stability - по атрибуту нет достоверной информации

186 Induced Op-Vibration Detection - по атрибуту нет достоверной информации

187 Reported UNC error - количество нескорректированных ошибок чтения

188 Command timeout - количество невыполненных диском команд из-за истечения времени ожидания

189 High Fly writes - количество ошибок записи, вызванных неправильной высотой полёта магнитной головки над поверхностью

190 Airflow temperature - температура воздуха внутри гермоблока HDD

191 G-Sense Errors - указывает сколько раз диск прерывал работу из-за ударов или вибрации

192 power-off retract cycles - количество неожиданных пропаданий питания, когда оно пропадало прежде, чем была получена команда на отключение диска; у hdd срок службы при неожиданном отключении значительно меньше, чем при нормальном; у ssd есть риск потери таблицы внутреннего состояния при неожиданном пропадании питания

193 load/unload cycles - количество перемещений бмг между зоной парковки и зоной данных; значение уменьшается от 100 до 0, raw содержит актуальное количество перемещений

194 hda temperature- температура блока магнитных головок

195 hardware ecc recovered- количество ошибок чтения, скорректированных кодом коррекции ошибок

196 reallocation events - общее количество переназначений секторов, включает и off-line сканирование и обычную работу

197 current pending sectors- количество нестабильных секторов, ожидающих перепроверки и, возможно, переназначения

198 offline scan unc sectors- количество плохих секторов, найденных диском при фоновом самосканировании; ухудшение этого параметра говорит о быстрой деградации поверхности

199 ultra dma crc errors- количество ошибок при передаче данных между диском и материнской платой; при ухудшении этого параметра стоит заменить кабель

200 write error rate - частота возникновения ошибок при записи

202 data address mark errors - количество ошибок при поиске запрошенного сектора

203 run out cancel - количество ошибок, вызванных неверной контрольной суммой при попытке коррекции ошибки

204 soft ecc corrections - количество ошибок, скорректированных кодом коррекции

206 flying height - девиация высоты полёта головки над поверхностью относительно оптимального значения; если головка слишком низко, она может повредить поверхность, если слишком высоко - увеличивается количество ошибок чтения

207 spin high current - величина тока, требуемая для раскрутки пластин

209 offline seek performance - производительность подсистемы поиска при выполнении off-line сканирования

220 disk shift - расстояние, на которое сместился пакет пластин относительно теоретического положения в результате механического повреждения или перегрева

227 torque amplification count - показывает сколько раз требовалось подавать увеличенный ток для раскрутки пластин

230 gmr head amplitude - амплитуда колебаний головок бмг

233 media wearout indicator - остаток ресурса памяти в ssd

240 head flying hours- время, проведённое головками в зоне пользовательских данных; значение уменьшается, обычно от 100 до 0

241 total lbas written - количество 512-и байтных блоков, записанных за всю жизнь устройства

242 total lbas read - количество 512-и байтных блоков, считанных за всю жизнь устройства

250 read error retry rate

Сложность интерпретации значений smart состоит в том, что ни на количество, ни на тип, ни на значения, ни на единицы измерения отслеживаемых параметров нет единого стандарта. поэтому реализация smart всегда зависит от конкретного производителя. нормализацию raw-значений в показатели атрибутов все делают по-своему, а результатом является статус проверки smart good или bad. поэтому достоверный вывод о состоянии диска можно сделать только проверив его поверхность какой-либо диагностической программой. но если нужно быстро оценить состояние диска и возможные проблемы, нужно обратить внимание на несколько основных, самых информативных атрибутов.

Наиболее важные аттрибуты smart:

5 reallocated sectors count - количество переназначенных секторов; рост значения этого атрибута свидетельствует об ухудшении состояния поверхности диска

7 seek error rate - частота ошибок позиционирования бмг (блока магнитных головок); чем больше, тем хуже состояние механики и поверхности жёсткого диска

11 recalibration retries - количество неудачных попыток калибровки бмг;

184 end-to-end error - количество ошибок возникших в буфере диска

187 reported unc errors - количество нескорректированных ошибок чтения

191 g-sense error rate - количество ударов диска во время работы

196 reallocation event count - общее количество переназначенных секторов

197 current pending sector count - количество нестабильных секторов, кандидаты в бэды, чем больше, тем хуже диск

198 uncorrectable sector count - количество плохих секторов, найденных при off-line сканировании, чем их больше, тем хуже поверхность

199 ultradma crc error count - количество ошибок передачи между диском и компьютером, при увеличении или отличном от нуля параметре стоит заменить кабель

S.M.A.R.T. – это технология самодиагностики современных жёстких дисков, призванная информировать о важных для их жизнеспособности технических характеристиках. В первую очередь с целью предотвращения потери данных при скором выходе из строя устройств. S.M.A.R.T. также используется в качестве доказательства для возврата продавцу приобретённого бракованного носителя информации. Ещё показатели технологии являются своего рода актом пригодности устройств при их купле-продаже на вторичном рынке.

Продавая подержанный HDD или SSD , можно сколь-угодно писать в объявлении о его хорошем состоянии, но больше слов об этом скажет приложенный скриншот S.M.A.R.T. Для отображения характеристик технологии самодиагностики необходимо использовать специальный софт - менеджеры дисков, программы для комплексной диагностики комплектующих компьютера или профильной диагностики сугубо жёстких дисков. Какой конкретно программой лучше всего проверить S.M.A.R.T.? Рассмотрим ниже несколько программ из числа диагностов жёстких дисков.

1. HDDScan

HDDScan

В отдельном окошке получим результаты S.M.A.R.T. Программа реализует диагностику в базовом формате – в таблице с отображением ID и названий атрибутов S.M.A.R.T. , относительных и конкретных значений атрибутов. Последние показываются в шестнадцатеричной системе счисления. Из оценочных возможностей HDDScan увидим только задание атрибутам маркеров состояния: зелёный – хорошо, жёлтый – тревога, красный – плохо.

S.M.A.R.T.

2. HDTune

HDTune

Failed

3. CrystalDiskInfo

Бесплатная CrystalDiskInfo – это портативная программа, она отображает характеристики носителей информации компьютера, показывает их диагностику S.M.A.R.T. , измеряет температуру, может управлять шумом и т.п. Результаты диагностики вместе с общей оценкой здоровья жёсткого диска будем видеть прямо в главном окне программы. Если дисков несколько, необходимо просто переключиться на нужный вверху окна.

CrystalDiskInfo

Техсостояние

Если состояние хотя бы одного из дисков компьютера оценивается как тревожное или плохое, при запуске CrystalDiskInfo подаст звуковое оповещение. Так что для профилактического отслеживания показателей S.M.A.R.T. можно использовать именно эту программу и, например, с помощью планировщика Windows назначить её еженедельный или ежемесячный автозапуск.

4. R.tester

R.tester

Кроме базовых граф с ID , названием атрибутов и их относительными значениями, R.tester в таблице диагностики отображает ещё и конкретные значения – отдельно в шестнадцатеричном счислении, отдельно в числах и показателях. Так, например, по атрибуту температуры мы увидим градусные показатели относительных значений. А по атрибуту переназначенных секторов их конкретное число.

У R.tester маркированная оценка атрибутов: графы с чёрным шрифтом – хорошо, с оранжевым – тревога, с красным – плохо. Программа поддерживает русский язык, но названия атрибутов S.M.A.R.T. отображает на английском, не предусматривает оценку общего состояния дисков.

5. Victoria

Victoria

Get SMART

Если у вас есть жесткий диск, состояние которого вызывает у вас подозрения, то первое, что нужно сделать, это проверить данные технологии S.M.A.R.T. Данная технология предназначена для сбора информации о состоянии жесткого диска и проведения процедуры самодиагностики. С помощью S.M.A.R.T можно быстро оценить, в каком состоянии находится жесткий диск, есть ли риск потери данных и что нужно делать для дальнейшей диагностики и ремонта компьютера.

CrystalDiskInfo — программа для получения информации о диске

Технология S.M.A.R.T появилась в жестких дисках еще в 1992 году. Тогда первым накопителем с этой системой стал дисковый массив от компании IBM. С тех пор S.M.A.R.T получила широкое применение и сейчас используется абсолютно во всех HDD и большинстве SSD дисков.

Интерфейс программы CrystalDiskInfo очень прост и будет понятен даже начинающим пользователям. В верхней части окна находится список дисков, которые подключены к компьютеру. После выбора жесткого диска в нижней части окна появится вся информация, которая доступна для данного HDD.

список жестких дисков

Чуть ниже расположен блок основной информации о выбранном накопителе. Здесь можно узнать название диска, версию его прошивки, серийный номер, используемый интерфейс, скорость вращения шпинделя, число включений, общее время работы, а также другую информацию.

основная информация о жестком диске

число включений и время работы жесткого диска

Ближе к левой части окна есть еще два важных параметра. Это оценка технического состояния жесткого диска и его температура. Оценка технического состояния жесткого диска – это общая оценка, которую программа присваивает на основе данных технологии S.M.A.R.T. Данная оценка может принимать одно из трех значений:

  • Хорошо – с диском все в порядке, никакие действия не требуются.
  • Тревога – у диска есть некоторые проблемы, стоит проверить наличие резервных копий, диск желательно заменить.
  • Плохо – у диска есть значительные неисправности, диск необходимо заменить.

Температура жесткого диска не имеет прямого отношения к его состоянию. Нормальной температурой для HDD считается от 20 до 45 градусов Цельсия. Если температура превышает 45 градусов, то это говорит о плохом охлаждении корпуса компьютера.

оценка состояния и температура жесткого диска

Проверка состояния жесткого диска с помощью S.M.A.R.T

Самая полезная информация о состоянии жесткого диска находится в нижней части окна программы. Здесь расположен список параметров, которые отслеживает технология S.M.A.R.T, а также присвоенные им значения. Используя эту информацию, можно быстро оценить состояние HDD и принять решение о дальнейших действиях.

список параметров SMART

RAW-значения параметров SMART

Список параметров, отслеживаемых технологией S.M.A.R.T, достаточно большой, но далеко не все из них имеют критическое значение для состояния жесткого диска. Ниже мы рассмотрим только самые важные из них.

  • 03 – Время раскрутки (Spin-Up Time) – время, которое требуется на раскрутку диска из выключенного состояния до рабочей скорости. Данное значение увеличивается при износе механической части накопителя, также большое время раскрутки может свидетельствовать о просадке напряжения при запуске диска.
  • 05 – Переназначенные сектора (Reallocated Sectors Count) – количество секторов, которые были признаны неисправными и были переназначены в резервную область. Наличие переназначенных секторов указывает на проблемы с поверхностью диска.
  • 0A – Повторные попытки раскрутки (Spin-Up Retry Count) – количество повторных попыток раскрутки диска. Данное значение увеличивается при износе механической части накопителя.
  • BB – Неисправимые ошибки (Reported UNC Errors) – количество ошибок, которые не получилось устранить аппаратными средствами накопителя.
  • BC – Таймаут команды (Command Timeout) – количество операций, которые были прерваны из-за таймаута. Увеличение данного параметра может свидетельствовать о проблемах с питанием диска или кабелями.
  • C4 – Попытки переназначения секторов (Reallocation Event Count) – количество попыток выполнить операцию переназначения сектора. Учитываются как удачные, так и не удачные попытки переназначения секторов. Наличие попыток переназначения указывает на проблемы с поверхностью диска.
  • C5 – Нестабильные сектора (Current Pending Sector Count) – количество подозрительных секторов, которые могут быть переназначены в будущем. Наличие нестабильных секторов указывает на проблемы с поверхностью диска.
  • C6 – Неисправимые ошибки секторов (Uncorrectable Sector Count) – количество секторов, которые не могут быть исправлены средствами жесткого диска. Наличие неисправимых ошибок указывает на проблемы с поверхностью или механической частью диска.

Если RAW-значения для всех указанных выше параметров равняются нулю, то это указывает на то, что жесткий диск находится в отличном состоянии. Никаких проблем технология S.M.A.R.T не выявила. Если же некоторые параметры имеют значение больше нуля, то состояние HDD стоит проверить более тщательно, возможно, такой диск потребует скорой замены.

самые важные параметры SMART

Поэтому при обнаружении переназначенных секторов необходимо проверить наличие резервных копий всех важных данных, которые хранятся на таком диске. Если резервных копий нет, то их нужно срочно сделать, иначе вы рискуете потерять данные.

Фигня, куча дисков с неисправимыми и переназначенными секторами. Ни один из строя не вышел. Важную инфу на них только не хранить и все норм.

date

26.05.2021

user

itpro

directory

PowerShell, Windows 10, Windows Server 2016

comments

комментариев 7

Современные версии Windows собирают информацию о состоянии жестких дисках компьютера через SMART и могут оповестить пользователя о наличии проблем. Рассмотрим, как выглядит уведомление Windows о физических проблемах с жестким диском и как с помощью PowerShell и командной строки получить SMART информацию о здоровье ваших дисков через встроенные WMI классы.

Большинство современных жестких дисков (в том числе HDD, SSD, NVMe SSD) поддерживает технологию базового самотестирования и анализа состояния S.M.A.R.T (Self-Monitoring, Analysis and Reporting Technology). Контроллер диска оценивает состояние физических характеристик диска, и Windows может получить доступ к этим данным через WMI.

Информация SMART доступна только для локальных физических дисков (ATA /SATA устройств). Внешние LUN, подключенных через Fiber Channel, iSCSI, RAID или сетевые диски в основном не сообщают статус SMART.

Ошибка “Windows обнаружила неполадки жесткого диска”

ошибка - Windows обнаружила неполадки жесткого диска

Статус Predictive Failure говорит о том, что одна из характеристик диска (например, механический износ) не соответствует эталонным значениям и велика вероятность отказа этого диска в будущем.

В этом случае рекомендуется выполнить резервное копирование данных с этого диска на отдельный носитель. Затем выполните проверку диска с помощью штатной SMART утилиты от производителя (или универсальными утилитами типа CrystalDiskInfo), проверьте носитель с помощью chkdsk.

Чаще всего для получения информации о состоянии дисков в Windows используют сторонни программы (например, CrystalDiskInfo, HDTune и т.д.). Такие программы, действительно позволяют получить много информации о дисках.

информация об SSD диске smart с помощью crystaldiskinfo

Например, я могу узнать оставшийся ресурс SSD. Текущее значение Total Host Writes – 507 Gb. Производитель гарантирует максимальный ресурс записи (TBW)для этой модели SSD 300 Тб. Значит диск изношен менее чем на 0.2%. Срок использования диска всего 108 часов.

Получение SMART параметров жесткого диска через WMI класс

В Windows вы можете получить доступ к данным SMART дисков с помощью встроенных средств.

Информацию о состоянии дисков компьютера можно посмотреть через панель управления Control Panel\System and Security\Security and Maintenance (в этом же разделе есть информацию о состоянии службы Windows Error Reporting).

В моем случае с дисками все ОК, т.к. в разделе Drive Status указано: OK, All drives are working properly .

информация о состоянии диска в windows

Как мы уже говорили выше, Windows собирает информацию SMART с дисков и позволяет получать к ней доступ через WMI.

Откройте командную строку с правами администратора и выполните следующую команду чтобы получить состояние всех дисков:

wmic diskdrive get status

wmic diskdrive get status - получить информацию о здоровье дисков через WMI

В данном случае с дисками все хорошо. Если нет – будет статус bad, unknown или caution.

Получить информацию о вероятном отказе жесткого диска можно через WMI класс MSStorageDriver_FailurePredictStatus:

wmic /namespace:\\root\wmi path MSStorageDriver_FailurePredictStatus

wmi класс MSStorageDriver_FailurePredictStatus

Если контроллер диска не видит проблем с диском, значение PredictFailure должно быть равно FALSE.

Этот же класс можно опросить с помощью PowerShell:

Get-WmiObject -namespace root\wmi –class MSStorageDriver_FailurePredictStatus

Значения некоторых счетчиков надежности дисков можно получить с помощью следующего кода PowerShell:

Get-StorageReliabilityCounter информация о состоянии дисков в powershell

Можно вывести информацию только об определенных характеристиках:

Get-PhysicalDisk | Get-StorageReliabilityCounter | Select-Object -Property DeviceID, Wear, ReadErrorsTotal, ReadErrorsCorrected, WriteErrorsTotal, WriteErrorsUncorrected, Temperature, TemperatureMax | FT

Также можно вывести общую информацию о дисках через Get-PhysicalDisk:

$(Get-PhysicalDisk | Select *)[0]

 Get-PhysicalDisk

Ранее мы показывали как с помощью Get-PhysicalDisk получить информацию о неисправном диске в Windows Server S2D и заменить его:

С помощью данных WMI классов и командлетов PowerShell можно настроить сбор данных о состоянии дисков на компьютерах пользователей для проактивного мониторинга. Можно создать алерты для вашей системы мониторинга (например, zabbix, nagios, icinga и т.д.), compliance отчет SCCM через Configuration Baseline для или PowerShell Desired State Configuration (DSC), опрашивать состояние SMART на удаленных компьютерах скриптом через PowerShell Remoting (командлет Invoke-Command) или использовать что-то свое.

Читайте также: