WEB开发网
开发学院数据库DB2 数据架构师: 当数据不再受欢迎 阅读

数据架构师: 当数据不再受欢迎

 2010-06-16 00:00:00 来源:WEB开发网   
核心提示:数据快速增长可能是一个好消息,也可能是个坏消息,数据架构师: 当数据不再受欢迎,一方面,如果一个越来越大的数据库反映了公司业务的增长,这样就可能导致页访问(以及因此造成的 SQL 语句执行的 CPU 开销)增加,因为现在 DB2 必须搜索更多的页才能查询到相同数量的热数据(而且要记住,那就是一件好事:更多销售、更多客户

数据快速增长可能是一个好消息,也可能是个坏消息。一方面,如果一个越来越大的数据库反映了公司业务的增长,那就是一件好事:更多销售、更多客户、更多潜在客户。另一方面,如果数据容量所增加的是进入数据库而从不取出的数据,那么数据库变大就不是好事了。

有时一个表 — 特别是记录诸如销售事务或保险索赔或股票交易等业务事件的表 — 中的旧记录只是消耗空间。但是极少被应用请求,这样它们几乎没有价值。您所需要做的就是将它们清除出数据库(不一定需要完全删除它们;即时完成)。如果您仍然保留它们,它们将让您付出 — 严重代价。

保留老旧的冷数据的高成本

有时我会认为数据库中的记录是有温度的。那些经常被用户或应用查询或更新的数据就是热的。那些从不或极少被查询或修改的数据是冷的。一般来说,数据越旧,它就越冷(那些本质上非常静态的所谓代码或参照表不符合这个规则)。在您的数据库中形成冷数据可能在以下几方面使您付出高昂的代价:

更昂贵的 SQL (第 1 部分): 一个 IBM DB2 应用负载的 CPU 开销的最主要决定因素是处理负载过程中 DB2 需要访问的页的数量(这些访问在 z/OS 环境中的 DB2 上被称为 GETPAGE,在 Linux、UNIX 和 Windows 环境中被称为逻辑读)。如果一个表中的数据是没有按日期集簇的—例如,如果它是按客户 ID 或订单号集簇的—而老记录没有定期从数据库移除,那么每个页上相对冷的记录比例会不断地增加。这样就可能导致页访问(以及因此造成的 SQL 语句执行的 CPU 开销)增加,因为现在 DB2 必须搜索更多的页才能查询到相同数量的热数据(而且要记住,这些记录是最常被用户请求的。)

1 2 3 4  下一页

Tags:数据 架构 数据

编辑录入:爽爽 [复制链接] [打 印]
赞助商链接