S.M.A.R.T. status bad が表示されたら
2007/08/17(UPDATE) 2007/07/20 2004/10/13
Primary Master Hard Disk S.M.A.R.T. Status Bad
WARNING: Immediate back-up your date and replace
your hard diskdrive A failure may be imminent.
パソコンを起動すると。上記メッセージが表示されるようになってしまいました。
どうも、「ハードディスクのS.M.A.R.T.の値が悪くなったから、早めにデータのバックアップを取ってハードディスクを交換しなさい!。」と言ってるみたいです。
調べてみると、ハードディスクの自己診断機能の略称で、
S.M.A.R.T.(スマート:Self-Monitoring, Analysis and Reporting Technology System)
と言います。
このメッセージがでたら、指示どおりにデータをバックアップしてハードディスクを新しい物に交換するのが得策と言われています。(診断はかなり信頼性があるとの事)
実際この「S.M.A.R.T.」が、情報として書きだしているデータを見れないものかと調べてみたら、下記のツールがありました。
-
smartmontoolsがあります。このソフトはLinuxやWindowsでも動き詳しい情報を表示してくれます。
- HDD Health
S.M.A.R.T.情報からHDDが壊れる日を予想してくれるソフトです。(2004/10/14:HDD
Health v2.1 Build 159)
- HDD TuneS.M.A.R.T.情報表示や速度テスト、エラースキャンを行なってくれます。
インストール関係では、
- @ITの
「ハードディスクのS.M.A.R.T.情報を表示するには」
- HDD
Health インストール ガイド
- スタックアスタリスク
Linux向けハードディスク監視/設定アプリケーションの紹介
が、あります。
さて、メッセージを出したハードディスクの情報は…。
BIOSでエラーを表示したHDD
値の判断の読み方(仕方)
Value、Worst、Threshord、に書かれている数値(値)を下記基準で判断します。
Value: 「得点」のようなもの
Worst: もっとも小さかった値。温度の場合はもっとも高かった値。
Threshold: 境界点の値 Valueがこれ以上悪くなる(小さくなる)と危険である値。
判断としては、
Worst <= Threshold になった場合は異常と判断する。
(ただし、温度は当てはまらない)
このHDDは Off-Line Scan Uncorrectable Sector Countの値が
200 <= 1
って事で、正に寿命を迎えたHDDでした。
(Off-Line Scan Uncorrectable Sector Count:オフラインスキャン時に訂正できなかったセクタ数)
(2007/08/17)上の判断は値の読み方と判断のしかたを間違っていました。
Thresholdが「0」の場合は境界点の値が無いもの、つまり値を比較して判断できない数値ではないか?。
これに当てはまるのが、温度などです。Off-Line Scan Uncorrectable Sector Countも訂正できなかったセクタ数なので大きくなるほどHDDにとってはダメージに、つながると考えるのが正しいような気がします。
改めて、エラーがでたHDDの値を眺めて見ると、これといった危険な値は見つけられません。
温度のValue118がWorstで253を記録しているので、これが原因かもしれません。
この場合の判断は Value < Worst という事になります。
BIOSでエラーが表示されてないHDD。
なんか、赤字で表示されているのでこっちのHDDの方が危ない気がしたのですが?…。(危険=赤ではなかった)
S.M.A.R.T.の出力結果の意味
(間違った解釈をしている場合は、是非教えて下さい)
- Raw Read Error Rate : データの読み込みエラー率。(リードエラーの発生率)
- Throughput Performance : データの転送能力。
- Spin Up Time : ディスクのスピンアップ(回転開始)の時間。
- Start/Stop Count : スタート・ストップ回数
- Reallocated Sector Count : (不良セクタがある等で)再度割り当てたしたセクタ。
- Seek Error Rate : シーク(移動)のエラー率。
- Seek Time Performance : シーク(移動)の能力。
- Power-On Hours Count : 使用時間/通電時間
- Spin Retry Count : ディスクの回転をやり直した回数。
- Power Cycle Count : 電源入切回数
- Power Off Retract Count : HDDをソフト的に停止させず電源を直に切ってヘッドが緊急退避(ダメージ大)をした回数
- Load/Unload Cycle Count : ロード・アンロード回数
- Temperature : 温度
- Reallocation Event Count : 代替セクタ処理が発生した回数
- Current Pending Sector Count : 現在異常があるセクタ数
- Off-Line Scan Uncorrectable Sector Count : オフラインスキャン時に訂正できなかったセクタ数
- Ultra DMA CRC Error Count : デバイス・ホスト間のIDE転送でエラーが発生した回数
- Gsense Error Rate : 衝撃センサーが感知した加速度(この項目があるものもある)
|