灵活有效的数据仓库解决方案,第3部分:设计并实现仓库ETL过程
2010-05-14 15:00:27 来源:WEB开发网导入元数据
您还可以导入对象定义,以便在 Data Warehouse Center 系统中使用。
在导入元数据时,所有对象都分配给标记语言文件中指定的安全分组。如果没有指定安全分组,那么所有对象都将分配给默认的安全分组。
您可以导入下列类型的元数据:
标记语言文件
公共仓库元模型(Common Warehouse Metamodel)元数据
ERwin
IBM MQSeries
Trillium
提示:
如果您将标记语言文件从一个系统移至另一系统,则必须移动与之相关的所有文件(例如:源文件),它们必须位于在同一目录中。
如果导出具有未链接的捷径的过程,然后导入另一控制数据库作为 .tag 文件,那么未链接的捷径数据将导致错误 DWC3142:“<dirID> was not found in the Data Warehouse Center control database。”该错误显示在未链接的捷径 dirIDs 没有进行转换时,它们会回到初始的控制数据库。
导出和导入元数据的提示:
因为仓库的导入和导出格式取决于版本,所以无法使用来自前面版本的导出文件从一个版本的 Data Warehouse Center 迁移到另一个版本的 Data Warehouse Center。
导出和导入过程都使用大量系统资源。当您导出对象定义时,可能需要限制其他程序的使用。当您进行大型导出操作时,可能需要将仓库数据库的 DB2 应用程序堆数大小增加到 8192。
与仓库数据源、目标和代理相关的服务器名和用户名都要导出到标签文件中,而且在导入到新系统之后,需要对这些信息进行更新。不过,不用导出密码,因此您需要提供密码信息,以访问仓库数据源、目标和代理。
设置原型
一旦实现了数据仓库项目业务域领域的第一个分组,您就应设置仓库实现原型,以验证:
所使用的技术
设计和实现
项目业务需求
仓库性能
技术质量保证
当开始与用户一起验证设计时,实地体验(hands-on)测试是最好的方法。让用户尝试通过对测试目标的操作来回答问题。记录测试目标无法提供所需数据的所有领域。必须与终端用户一起执行建议解决方案的功能性验证。这通常导致终端用户暂时使用所构造的解决方案,让他们有机会使用本地解决方案中(可能是数据集市中)已经可用的信息。此外,本地解决方案然后可能集成到更大业务范围的数据仓库架构中,包括所生成的数据模型。
除了测试之外,要与用户一起检查在设计阶段产生的模型添加和修改,以确保它们是可以理解的。与模型的验证步骤一样,要将起作用的东西传递到实现阶段。将不起作用的返回给需求阶段,以便澄清和重新进入建模。
更多精彩
赞助商链接