WEB开发网
开发学院服务器存储技术 解决存储错误管理的困境 阅读

解决存储错误管理的困境

 2008-08-20 11:57:37 来源:WEB开发网   
核心提示: 当然,说起来容易做起来难,解决存储错误管理的困境(2),磁带错误统计数据是依赖于驱动器的,你必须做到的就是能够发送一个叫做pass-through的特殊SCSI(小型计算机系统接口)命令到驱动器,但是你对此毫无所知,因为所有这些都是由RAID控制器来完成和管理的,这是一个低层次的驱动器命令

当然,说起来容易做起来难。磁带错误统计数据是依赖于驱动器的。你必须做到的就是能够发送一个叫做pass-through的特殊SCSI(小型计算机系统接口)命令到驱动器。这是一个低层次的驱动器命令,从而使得驱动器可以在SCSI pass-through命令下将你所要求的错误信息报告给你。当搜集信息时,无论是驱动器的错误信息,还是驱动器磁带盒的错误信息都可以被搜集到,因此一个LTO(线性开放协议)驱动器的错误以及搜集错误统计数据的命令可能会不同于一个Sun T10000磁带驱动器。

这确实相当复杂,对于一些磁带驱动器和磁带库来说,这种情况没有显示在文档上,而有些时候你必须有一个保密协议才能理解其含义并得到磁带驱动器和磁带库的不同错误的地址。很显然,对于软件产品来说,这是一个机遇,而且很多厂商都已经推出一些产品来搜集并显示不同磁带库和磁带机中的这类数据。这些产品各有不同的功能以及显示方式。其中一些产品在大型环境下能够比其他同类产品更好地扩展,但是你有很多选择。这些产品能够极大地帮助你理解环境中的软错误,而且它们还可以帮助你积极主动地解决磁带、驱动器以及磁带机中的这些软错误,以防止它们变成硬错误。在大型环境中使用这些产品是非常重要的。

那么这里会存在什么问题吗?这些产品是否能够整合到环境中其他部分的错误管理框架中去?和SNMP警告不同,让数据融入单一的管理框架并不是一件简单的事。

磁盘

在磁盘硬件监测上,你也有类似的问题。磁盘存在一个通用的错误值集合,这些错误值由SMART技术予以定义并加以搜集。如果你有JBOD(简单磁盘捆绑)或者低端的RAID(独立磁盘冗余阵列),那么你可以购买一个软件包来帮助你搜集SMART数据。

那么对于我们这些拥有来自大型厂商的大型RAID系统的用户来说又会怎样呢?所有这些厂商都会监测SMART统计数据,并根据它们所搜集的来自驱动器厂商的信息、历年来所搜集的统计信息,以及某些情况下的性能要求,来主动地停止驱动器的运作,比如一些厂商会选择替换驱动器而不是选择重试低性能的驱动器。对于一些使用SATA(串行ATA)驱动器的厂商来说,尤其如此。所有这些都很好,但是你对此毫无所知,因为所有这些都是由RAID控制器来完成和管理的,你根本就看不到它们。

Tags:解决 存储 错误

编辑录入:爽爽 [复制链接] [打 印]
赞助商链接