检测磁盘驱动的健康程度SMART

本文发布时间: 2019-Mar-22
在服务器中,所有组件中一般最容易坏掉的就是磁盘。所以一般采取RAID来保证系统的稳定性,通过冗余磁盘的方式防止磁盘故障。现代硬件驱动器一般支持SMART(自我监测分析和报告技术),它能够监视整个硬盘驱动器的健康状况,并且当硬盘驱动器即将故障的时候会发出警告。一般硬件厂商提供的磁盘工具,是在系统重启后检查磁盘驱动的健康状况,而SMART可以不用重启系统就可以检查硬盘驱动器的健康程度。在linux中,工具包的名字为smartmontools在centos中可以使用 yum install smartmontools来安装工具首先通过smartctl -i /dev/sda 来检查一下硬盘是否具有 SMART 特性下面是smart工具的说明文档,里面有详细的说明http://smartmontools.sourceforge.net/smartmontools_scsi.html这个是我在虚拟机中测试的不支持这个是我在真服务器中测试的,支持 SMART support 是 Disabled 状态的话,需要开启 SMART 的支持:smartctl -s on /dev/sda然后使用smartctl -H /dev/sda来检测磁盘的健康状况查看/dev/sda当前整体监控状态。PASSED表示健康,否则意味着磁盘已经故障,或很快就会发生故障。使用smartctl -t short /dev/sda做一个快速自检smartctl -l selftest /dev/sda查看自检的进度和结果使用smartctl -t long /dev/sda 做长时间自检,这个很耗时,一般放在凌晨使用smartctl -l error /dev/sda查看出错日志在这里,我的读、写都没有发生错误,在Non-medium error count 中出现错误6。我一直没有搞懂(非媒介错误计数)这个是什么意思,在官方文档查了一下,出现如下:non-medium error counter (only a single number displayed). This represents the number of recoverable events other than write, read or verify errors.我大致理解了一下,是除了read,write,verify errors的错误,可恢复事件的数量查看所有信息打印/dev/sda所有的SMART信息。smartctl -a /dev/sda相当于依次执行:smartctl –i /dev/sda smartctl -c /dev/sda smartctl -A /dev/sda smartctl -l error /dev/sdasmartctl -l selftest /dev/sdasmartctl -l selective /dev/sda开/关SMART功能打开或关闭/dev/sda 的SMART功能。smartctl -s on/off /dev/sda查看当前SMART功能是否开启,可以使用 –i 参数。smartctl -i /dev/sda离线测试对/dev/sda进行离线测试,它的结果主要用来更新SMART 属性。smartctl -t offline /dev/sda观察测试进度通过-c 参数,可以观察到测试的进度:smartctl -c /dev/sdasmartctl参数帮助-h 帮助信息-V 版本信息-i 打印基本信息(磁盘设备号、序列号、固件版本…)-a 打印磁盘所有的SMART信息 运行时行为 参数:-q TYPE 指定输出的安静模式。TYPE可以有3种选择: eorsonly 只打印错误日志。 slent 有任何打印。 nserial 不打印序列号 -d TYPE 指定磁盘的类型。如果没有指定,smartctl会根据磁盘的名字来猜测磁盘类型。-T TYPE 指定当发生错误时,smartctl的容忍程度,是否继续运行。 TYPE可以有4种选择: conservative 一有错就会退出 normal 如果必须支持的SMART命令失败,则退出 permissive 忽略一次必须支持的SMART命令失败 verypermissive 忽略所有必须支持的SMART命令失败-b TYPE 指定当发生校验错误时,smartctl的动作。 TYPE有3种选择: warn 发出警告,继续执行 exit 退出smartctl ignore 不发出告警,继续执行 -r TYPE smartmontools开发人员相关。-n POWERMODE 指定当磁盘处于节能模式时,smartctl是否继续检查,默认是不检查。POWERMODE有4种选择: never 检查 sleep 除了sleep模式,检查。 standby 除了sleep或standby模式,检查。 idle 除了sleep或standby或idle模式,见车。SMART功能开关 参数:-s on/off 打开或关闭磁盘的SMART功能-o on/off 打开或关闭SMART自动离线检测,该功能每4小时就会自动扫描磁盘是否有缺陷。-S on/off 打开或关闭“自动保存厂商指定属性”功能。SMART 读和显示数据 参数-H 报告磁盘的是否健康。如果报告不健康,则说明磁盘已经损坏或会在24小时内损坏。-c 显示磁盘支持的普通SMART功能,以及这些功能当前的状态。-A 显示磁盘支持的厂商指定SMART特性。这些特性的编号从1-253,并且有指定的名字。-l TYPE 指定显示的log类型。 TYPE有4种选择: error 只显示error log。 selftest 只显示selftest log selective 只显示selective self-test log directory 只显示Log Directory -v N,OPTION 显示厂商指定SMART特性N时,使用厂商相关的显示方式。-F TYPE 设置smartctl的行为,当出现一些已知但还没有解决的硬件或软件bug时,smartctl应该怎么做。-P TYPE 设置smartctl是否对磁盘使用数据库中已有的参数。SMART 离线测试、自测试 参数-t TEST 立刻执行测试,可以和-C参数一起使用。 TEST可以有以下几个选择: offline 离线测试。可以在挂载文件系统的磁盘上使用 short 短时间测试。可以在挂载文件系统的磁盘上使用。 long 长时间测试。可以在挂载文件系统的磁盘上使用。 conveyance [ATA only]传输zi测试。可以在挂载文件系统的磁盘上使用。 select, N-M select, N+SIZE [ATA only]有选择性测试,测试磁盘的部分LBA。N表示LBA编号,M表示结束LBA编号,SIZE表示测试的LBA范围。-C 在captive模式下运行测试。注意:(1)-C必须配合-t一起使用,但如果是-t offline,则-C不生效。 (2)-C会使得磁盘很忙,所以最好是在没有挂载文件系统的磁盘上使用。-X 中断no-captive模式下运行的测试。


(以上内容不代表本站观点。)
---------------------------------
本网站以及域名有仲裁协议。
本網站以及域名有仲裁協議。

2024-Mar-04 02:10pm
栏目列表