SQL Server 2008集成服务详解
2008-05-27 09:55:28 来源:WEB开发网• 它们需要清理和删除重复数据,否则就加强数据质量。
• 逐渐增加的全球调整性需求要求公司维护清晰的审查跟踪。只维护可靠数据是不够的;还需要跟踪和验证数据。
2. 数据集成的挑战
某一层面上,在我们实际场景中数据集成的问题是非常简单的。从多个数据源获取数据、清理和转化数据、并将这些数据加载进适当的数据存储以用于分析和生成报表。不幸的是,在一个典型的数据仓库或商业智能项目中,企业在数据集成方面花费了60–80%的可用资源。为什么它这么困难呢?
2.1 技术挑战
技术挑战始于源系统。我们正从在事务上收集数据(用户提交以获得、购买或获取某些东西)转移到在事务之前收集数据(使用像Web点击或RFID标签之类的机制跟踪客户意愿)。现在数据不只是通过传统的源和格式获得——例如数据库和文本文件,还逐渐地可从多种不同的格式(从私有文件到Microsoft Office文档到基于XML文档)以及从基于网络来源——例如Web services和RSS流中获得。最相关的挑战是:
• 不同格式的多种来源。
• 结构化的,半结构化的,以及非结构化的数据。
• 从不同来源系统而来的数据到达的时间不同。
• 数据量巨大。
在理想情况下,不管你怎样管理以获得一次所需的所有数据,都会要面临新的挑战,包括:
• 数据质量。
• 使用不同的数据格式。
• 将数据转换为业务分析可用的格式。
假设你可以神奇地获得你需要的所有数据,并且你可以将这些数据清理、转化并匹配成一个有用的格式。还有另一种从传统数据移动和集成的方法。那就是从固定长度的面向批量处理转到可变长度和更短的按需处理。大多数公司在用户没有对系统有大需求的“当机”期间执行面向批量处理。这通常是在晚上认为没有人在办公室的时候,执行一个预定义的批量窗口,大概要6-8小时。随着全球商业的规模和类型的不断增加,这不再成为可能了。现在全球有些地方几乎没有当机时间,而且办公室里总是有人。
- ››sql server自动生成批量执行SQL脚本的批处理
- ››sql server 2008亿万数据性能优化
- ››SQL Server 2008清空数据库日志方法
- ››sqlserver安装和简单的使用
- ››SQL Sever 2008 R2 数据库管理
- ››SQL SERVER无法安装成功,sqlstp.log文件提示[未发...
- ››Sql Server中通过父记录查找出所有关联的子记录
- ››SqlServer触发器、存储过程和函数
- ››SQL Server 中的事务(含义,属性,管理)
- ››Sqlite数据库插入和读取图片数据
- ››Sql server 2005拒绝了对对象 'xx表' (数...
- ››Sql server 2005拒绝了对对象 'xx表' (数...
更多精彩
赞助商链接