灵活有效的数据仓库解决方案: 第 1 部分:客户互动和项目计划
2008-12-15 16:37:58 来源:WEB开发网核心提示: 数据问题可能在客户的操作数据源中存在多年,在很多情形下,灵活有效的数据仓库解决方案: 第 1 部分:客户互动和项目计划(9),问题是在源数据的早期分析中或稍后在数据转换过程的设计和实现中发现的,请确保通知您的客户, 理解客户问题的主题领域, 向客户给予他们将需要提供的资源或支持的评估,以便
数据问题可能在客户的操作数据源中存在多年。在很多情形下,问题是在源数据的早期分析中或稍后在数据转换过程的设计和实现中发现的。请确保通知您的客户,以便他们可以准备处理计划。
检查数据质量并非是一项普通工作;它同时需要数据建模和商业领域的知识。最可能的是,您将需要一些终端用户参与该任务。在某些情况下,您可能无法访问敏感的业务数据。如果是这样,您应尽力获得一些随机的业务数据样品,并允许客户修改一些数据值,且不影响数据质量。
您需要尽可能多地知道项目有关数据的情况。下面是您需要详细回答的问题(不仅是在高层次上):
有多少数据源与项目相关,它们位于何处?
数据仓库是否直接访问数据源?支持何种类型的数据连接?
数据仓库是否需要客户企业网(intranet)外部的数据?如何可以访问哪些数据?
所有数据源中每天生成多少新数据?
数据仓库中数据更新的期望频率是多少?
是否有共享数据?如果有,哪一个是主数据源呢?
数据质量如何?如果可能,您应该检查所有可用的数据字段。
如果有丢失数据或脏(dirty)数据,您的客户是否可以在数据源中进行纠正呢?
客户是否可以保证将来已纠正数据字段的数据质量呢?如果不能,谁将负责进行数据清理?
如果无法在客户的数据源中纠正丢失的数据或脏数据,什么业务规则将用于纠正数据呢?
差异分析
在收集业务需求并研究业务和数据环境之后,您就可以执行差异分析了。差异分析将检查您所具有的信息,并确定需要哪些资源和工作来满足客户要求。差异分析的目的是:
理解客户的业务难题。
理解客户问题的主题领域。
向客户给予他们将需要提供的资源或支持的评估,以及为了根据客户需求交付解决方案您这一方所需要的开发工作的评估。
更多精彩
赞助商链接