S.M.A.R.T. (Self-Monitoring, Analysis and Reporting Technology - технология самотестирования, анализа и отчетности) - это промышленный стандарт, описывающий методы предсказания появления ошибок жесткого диска.
Для повышения надежности большинство производителей применяют в жестких дисках различные технологии в том числе и варианты технологии S.M.A.R.T Обычно предусматривается автоматическая проверка целостности данных, состояния поверхности пластин, перенос информации с критических участков на нормальные и другие операции без участия пользователя. В случае нарастания фатальных ошибок программа своевременно выдаст сообщение о необходимости принятия срочных мер по спасению данных. Основные положения S.MA.R.T. были согласованы несколько лет назад с участием всех крупных производителей дисков и компьютеров. Для анализа надежности жесткого диска используются две группы параметров. Первая характеризует параметры естественного старения жесткого диска:
- число циклов включения/выключения диска;
- накопленное число оборотов двигателя за время работы;
- количество перемещений головок
Вторая группа параметров характеризует текущее состояние накопителя:
- высота головки над поверхностью диска;
- скорость обмена данными между дисками и буфером (кэш-памятью);
- количество переназначений плохих секторов (когда вместо испорченного сектора подставляется свободный исправный);
- количество ошибок поиска;
- количество операций перекалибровки;
- скорость поиска данных на диске и др.
Обычно вся информация записывается на служебных дорожках, недоступных аппаратным и программным средствам общего применения.
При активизации системы S.M.A.R.T. жесткий диск начинает отслеживать определенные параметры, чувствительные к неисправностям накопителя или указывающие на них. На основе отслеживаемых параметров можно предсказать сбои в работе накопителя. Если на основе отслеживаемых параметров вероятность появления ошибки возрастает, S.M.A.R.T. генерирует для BIOS или драйвера операционной системы отчет о возникшей неполадке, который указывает пользователю на необходимость немедленного резервного копирования данных до того момента, когда произойдет сбой в накопителе.
На основе отслеживаемых параметров S.M.A.R.T. пытается определить тип ошибки. По данным фирмы Seagate, 60% ошибок представляют собой механические проблемы. Именно этот тип ошибок и предсказывается S.M.A.R.T. Естественно не все ошибки можно предсказать, например появление статического электричества, внезапная встряска или удар, термические перегрузки и т.д.
S.M.A.R.T. впервые была разработана в 1992 году фирмой IBM. В этом же году IBM выпустила жесткий диск формата 3,5 дюйма с модулем Predictive Failure Analysis (PFA), который измерял некоторые параметры накопителя и в случае их критического изменения генерировал предупреждающее сообщение. Фирма IBM передала на рассмотрение организации ANSI спецификацию технологии предсказания ошибок накопителя, и в результате появился ANSI-стандарт - протокол S.M.A.R.T. для SCSI-устройств (документ ХЗТ10/94-190).
Для накопителей с интерфейсом IDE/A ТА технология S.M.A.R.T. была реализована лишь в 1995 году. В разработке этого стандарта принимали участие следующие фирмы: Seagate Technology, Conner Peripherals (в настоящее время эта фирма является подразделением Seagate), Fujitsu, Hewlett-Packard, Maxtor, Quantum и Western Digital. В результате работы этой группы фирм была опубликована спецификация S.M.A.R.T. для накопителей на жестких дисках с интерфейсом IDE/ATA и SCSI, и они сразу же появились на рынке.
В накопителях на жестких дисках с интерфейсом IDE/ATA и SCSI реализация S.M.A.R.T. подобна, за исключением отчетной информации. В накопителях с интерфейсом IDE/ATA . драйвер программного обеспечения интерпретирует предупреждающий сигнал накопителя, генерируемый командой S.M.A.R.T. report status. Драйвер запрашивает у накопителя статус этой команды. Если ее статус интерпретируется как приближающийся крах жесткого диска, то операционной системе посылается предупреждающее сообщение, а та, в свою очередь, информирует об ошибке пользователя. Такая структура в будущем может дополняться новыми свойствами. Операционная система может интерпретировать атрибуты, которые передаются с помощью расширенной команды report status. В накопителях с интерфейсом SCSI S.M.A.R.T. информирует пользователя только о двух состояниях накопителя - о нормальной работе и об ошибке.
Для функционирования S.M.A.R.T. необходима поддержка этой технологии на уровне BIOS или драйвера жесткого диска операционной системы (и, естественно, накопитель на жестких дисках, который поддерживает эту технологию). S.M.A.R.T. поддерживается несколькими программами, например Norton Smart Doctor фирмы Symantec, EZ фирмы Micro-house International или Data Advisor фирмы Ontrack Data International.
Традиционные программы диагностики диска, например Scandisk и Norton Disk Doctor, работают с секторами данных на поверхности диска и не отслеживают всех функций накопителя в целом. В некоторых современных накопителях на жестких дисках резервируются секторы, которые в будущем используются вместо дефектных. Как только использован один из резервных секторов, S.M.A.R.T. информирует об этом пользователя, в то время как программы диагностики диска не сообщают о каких-либо проблемах.
Каждый производитель накопителей на жестких дисках по-своему реализует параметры монитора S.M.A.R.T., причем большинство из них реализовали собственный набор параметров. В некоторых накопителях отслеживается высота "полета" головок над поверхностью диска. Если эта величина уменьшается до некоторого критического значения, то накопитель генерирует ошибку. В других накопителях выполняется мониторинг кодов коррекции ошибок, который показывает количество ошибок чтения и записи на диск.
В большинстве дисков реализована регистрация следующих параметров:
- высота "полета" головки на диском;
- скорость передачи данных;
- количество переназначенных секторов;
- производительность времени поиска;.
- количество повторов процесса калибровки накопителя.
Каждый параметр имеет пороговое значение, которое используется для определения того, появилась ли ошибка. Это пороговое значение определяется производителем накопителя и не может быть изменено.
Если S.M.A.R.T. в процессе мониторинга накопителя обнаруживает несоответствие параметров, то драйверу диска отправляется предупреждающее сообщение, а драйвер информирует о "ситуации" операционную систему. Операционная система оповещает пользователя о необходимости немедленного резервного копирования данных. В этом предупреждающем сообщении может также содержаться информация о типе, производителе, номере накопителя.
Нельзя игнорировать подобное предупреждающее сообщение и нужно немедленно выполнить резервное копирование данных. А после этого выяснить и устранить причину появления предупреждающего сообщения (например, если накопитель на жестких дисках перегрелся, то надо попробовать выключить на некоторое время компьютер, а затем включить снова, а если же причина более сложная накопителя, то лучше обратиться к специалистам службы технической поддержки.