确保数据质量的基本步骤
2010-06-16 00:00:00 来源:WEB开发网诸如 IBM InfoSphere Business Glossary 的工具可能在这个阶段很有用,它能够提供数据定义知识库和一个简单的用于输入、搜索和浏览词汇表和定义的用户界面。一个企业词汇表有助于保证这些定义在不同项目之间保持一致,支持业务和 IT 之间、不同业务部门之间的协作,并且有助于创建通用的词汇表和数据理解。
评估和分析
下一个步是基于业务和技术团队所建立的标准评估实际数据。这里,诸如 IBM InfoSphere Information Analyzer 的软件会被用于分析这些数据。在分析过程中,需要在字段、表和跨表级别上检查数据,以便评估它对于已知或预期使用方式的完整性、有效性和一致性。如果数据的业务定义已经建立完备,那么这些规则就可以输入到 InfoSphere Information Analyzer,它将使用这些规则验证数据。
InfoSphere Information Analyzer 也提供了一个中央业务规则知识库,它能够实现不同项目和实现之间的重用和一致性,并且与 InfoSphere Business Glossary 共享一个元数据知识库,这可以简化数据共享和实现。其他的质量工作使它能够根据数据质量执行高级的自动化数据分析和验证需求(见侧边栏,“参考资料”)。
在评估后,所得的结构应该交由技术和业务团队共同审核,以便完全理解数据。下一步就是要确定应该对报告结果采取什么操作。有时,操作可能是技术性的,如修改一个数据模型或用户界面。除此之外,这个操作可能是引入一个业务过程或修改策略,如提醒负责修改和输入数据的人员。
从评估到项目
到这一步,这个组织至少已经理解它的部分数据环境的要求是什么,以及它的业务目标是什么。下一步就是要创建一个数据质量过程使组织从当前的状态转变到预期的状态。
如何创建这个项目已经超出了本文范围,但是一个数据质量项目应该有三个重要的元素。首先,它会不断地使用数据质量评估中所定义的数据结构来定期检查数据质量。其次,它需要指派管理员不断地监控数据质量。最后,它需要提供一个过程来开发处理监控过程发现的数据质量问题的操作计划。
现在,许多组织只有在数据质量影响到他们的业务时才发现数据质量问题 — 通常是负面影响。通过主动评估和监控数据质量,组织应该能够顺利地确定数据问题和在它们造成问题之前将问题解决。通过创建重复过程和可重复的条件,这些组织就能够掌握一个实际项目的数据质量抽象概念,并使用它降低风险和产生业务价值。
更多精彩
赞助商链接