WEB开发网
开发学院数据库MSSQL Server 使用SQL Server 2008 集成服务 阅读

使用SQL Server 2008 集成服务

 2009-04-17 10:26:30 来源:WEB开发网   
核心提示:在传统的以ETL为中心的数据集成中,标准的数据源仍然是大多数数据仓库的核心,使用SQL Server 2008 集成服务,然而,包括更加多样化的数据源、法规要求以及全球和在线业务在内的各种需求,一个单一的数据流管道能够集成各种不同来源的数据,并且能够执行任何复杂的操作,正迅速地改变着对数据集成的传统要求,在这个快速发展

在传统的以ETL为中心的数据集成中,标准的数据源仍然是大多数数据仓库的核心。然而,包括更加多样化的数据源、法规要求以及全球和在线业务在内的各种需求,正迅速地改变着对数据集成的传统要求。在这个快速发展及不断变化的背景下,从数据提取价值的需要和对这种需要的依赖能力变得比以往更加重要。有效的数据集成已成为制定有效决策的基础。SQL Server Integration Services 提供了一个灵活、快速及可扩展的体系结构,能够对当前业务环境的数据进行有效集成。

在本文中,我们将探讨 SQL Server Integration Services (SSIS)如何成为一个有效的工具包,如何能在满足传统的 ETL 操作需求的同时满足多方面数据集成不断变化的需求。我们还将讨论 SSIS 与主要的 ETL 提供商所提供的工具和解决方案的根本区别。SSIS 能够极好地满足全球企业(从最大的企业到最小的企业)不断变化的需求。

SSIS体系结构

任务流和数据流引擎

SSIS 既包含一个面向操作的任务流引擎,也包含一个可扩展的快速数据流引擎。数据流存在于一个总体任务流的环境中。任务流引擎为数据流引擎提供运行时资源和操作支持。任务流和数据流的这种组合,使 SSIS 能够有效地作用于传统的 ETL 或数据仓库(DW)应用场景以及许多其他扩展的应用场景(如数据中心操作)。在本文中,我们将主要关注与数据流相关的应用场景。SSIS 用于面向数据中心的工作流时,是另外一个单独的主题。

管道体系结构

SSIS 的核心是数据转换管道。这个管道有一个面向缓冲区的体系结构,一旦数据被加载到内存中,该体系结构能够异常快速地操纵数据行集。方法是,在一次单一操作中执行 ETL 进程中的所有数据转换,而不是分段处理数据,尽管存在特定的转换或操作需求,或者硬件也可能会成为障碍。为了获得最佳性能,该体系结构需要避免分段处理数据。SSIS 甚至尽量避免从内存中复制数据。相比之下,传统的 ETL 工具往往需要在入库和集成进程的几乎每个步骤都分段处理。不分段操纵数据的能力超越了对关系数据和平面文件数据的传统处理能力,也超越了传统的 ETL 转换功能。SSIS 能将所有类型的数据(结构化、非结构化和 XML 等)在被加载到其缓冲区之前转换为一种表格结构(列和行)。能够应用于表格数据的任何数据操作,也能够应用于数据流管道中任何步骤的数据。这意味着,一个单一的数据流管道能够集成各种不同来源的数据,并且能够执行任何复杂的操作,而不必分段处理数据。

1 2 3 4 5 6  下一页

Tags:使用 SQL Server

编辑录入:爽爽 [复制链接] [打 印]
赞助商链接