WEB开发网
开发学院服务器存储技术 数据存储技 倍增储存容量的COS技术(一) 阅读

数据存储技 倍增储存容量的COS技术(一)

 2007-08-11 11:52:09 来源:WEB开发网   
核心提示:透过整体压缩技术,COS能大幅缩减数据占用的储存空间,数据存储技 倍增储存容量的COS技术(一),从而提高实体磁盘的储存效率,Data Domain的储存容量最佳化技术(COS,重复的Segment将会被去除,剩余Segment则成为基本元素,Capacity Optimized Storage)透过压缩的原理,藉由拆

透过整体压缩技术,COS能大幅缩减数据占用的储存空间,从而提高实体磁盘的储存效率。

Data Domain的储存容量最佳化技术(COS,Capacity Optimized Storage)透过压缩的原理,藉由拆解与比对数据内容,可大幅缩减备份媒体所需的容量。

COS会将数据切割为Segment(数据区段),透过Data Domain专利的算法分析各Segment数据的特征值,并与已有数据的特征值比对,只储存新增或更动的数据,从而大幅降低数据对储存空间的需求。

COS的原理

COS 是一项针对硬盘的备份储存解决方案,其关键在于Data Domain所谓的「整体压缩(Global Compression)」技术。整体压缩的原理与传统的无失真数据压缩技术相似,都是针对数据中的重复部分,透过特定的算法去除数据中因重复而造成的冗余,用较少的容量来表示与原始信息等价的讯息内容。

一般的数据压缩在消除冗余重复数据的作用方面都是离散的,去除冗余数据的效果只及于该次压缩的数据。举例来说,若对某硬盘中的数据每日均以压缩方式进行备份,虽然每次压缩都能去除数据中的冗余部分,但考虑到一般环境下储存系统的数据异动量并不大,所以两次压缩的数据内容之间仍会有许多重复之处。

而整体压缩的特殊之处在于其压缩效果可扩及「整体」,不像传统压缩技术只针对该次压缩的数据进行演算。其运作步骤如下:

(1)分解数据,求出特征值

先把数据分解成4~16kB大小的Segment,对每个Segment以特殊的算法求出其特征值。

(2)分析、比对数据特征值

透过特征值的比对即可判定哪些Segment的数据为重复,哪些没有重复,重复的Segment将会被去除,剩余Segment则成为基本元素。另外并生成一个索引以记载原先各Segment数据的组成结构。

1 2 3  下一页

Tags:数据 存储 倍增

编辑录入:爽爽 [复制链接] [打 印]
赞助商链接