SQL Server 2008集成服务详解
2008-05-27 09:55:28 来源:WEB开发网核心提示: 3.2.3 SSIS和数据质量SSIS的一个主要特性,以及它的集成数据的能力,SQL Server 2008集成服务详解(9),是它集成不同技术来操纵数据的能力,这使得SSIS包含了创新的基于“模糊逻辑”的数据清理组件,然后它就可以在数据流中很容易地进行操纵,这个对
3.2.3 SSIS和数据质量
SSIS的一个主要特性,以及它的集成数据的能力,是它集成不同技术来操纵数据的能力。这使得SSIS包含了创新的基于“模糊逻辑”的数据清理组件。Microsoft研究实验室开发了这些组件,并且他们展示了在这个领域的最新研究。采用的方法是一个独立的域而且不依赖于任何特定的域数据,例如地址/邮编参考数据。这使得你可以将这些转换用于清理大多数类型的数据,而不仅仅是地址数据。
SSIS与分析服务的数据挖掘功能深度集成。数据挖掘抽取了数据集的格式并将它们封装到一个挖掘模型里。然后你可以使用这个挖掘模型来预测一个数据集包含什么数据以及什么数据是反常的。这样你就可以将数据挖掘作为一个实现数据质量的工具。
在SSIS中对复杂数据路由的支持不仅帮助你确认异常数据,而且还可以自动修改并用更好的值来替代它。这使得“闭环”清理场景可用。图6显示了一个闭环清理数据流的例子。
图6
除了它的内置数据质量特性,SSIS还可以扩展为与第三方数据清理解决方案紧密协作。
3.2.4 超出传统ETL的SSIS应用程序
数据流管道操纵几乎任何类型数据的能力、与分析服务的深度集成、对使用许多数据操纵技术对它进行扩展的支持,以及包含了一个丰富的工作流引擎,这些使得SSIS可以用在很多不是传统的ETL场景中。
服务面向架构
SSIS包括对数据流管道中源XML数据的支持,包括从磁盘上文件中获得的数据以及通过HTTP的URL。XML数据是“粉碎”放到表格数据中的,然后它就可以在数据流中很容易地进行操纵。这个对XML的支持可以与对Web services 的支持一起使用。SSIS可以与控制流中的Web services进行交互以捕捉XML数据。
- ››sql server自动生成批量执行SQL脚本的批处理
- ››sql server 2008亿万数据性能优化
- ››SQL Server 2008清空数据库日志方法
- ››sqlserver安装和简单的使用
- ››SQL Sever 2008 R2 数据库管理
- ››SQL SERVER无法安装成功,sqlstp.log文件提示[未发...
- ››Sql Server中通过父记录查找出所有关联的子记录
- ››SqlServer触发器、存储过程和函数
- ››SQL Server 中的事务(含义,属性,管理)
- ››Sqlite数据库插入和读取图片数据
- ››Sql server 2005拒绝了对对象 'xx表' (数...
- ››Sql server 2005拒绝了对对象 'xx表' (数...
更多精彩
赞助商链接