WEB开发网
开发学院数据库DB2 在 DB2 Database Partitioning Feature 环境中选择... 阅读

在 DB2 Database Partitioning Feature 环境中选择分区键

 2010-09-09 00:00:00 来源:WEB开发网   
核心提示: 为了查看使用新的分区键是否能很好地均衡数据,可以使用 下载 部分提供的 ESTIMATE_NEW_DATA_SKEW 例程,在 DB2 Database Partitioning Feature 环境中选择分区键(8),这个例程用新的分区键创建了现有表的一个副本并用来自原始表的数据对它进行部分或

为了查看使用新的分区键是否能很好地均衡数据,可以使用 下载 部分提供的 ESTIMATE_NEW_DATA_SKEW 例程。这个例程用新的分区键创建了现有表的一个副本并用来自原始表的数据对它进行部分或全部加载。例程然后会为了进行现有数据倾斜的估计运行相同的报告并且最后还会丢弃这个副本表。请注意包含原始表的表空间必须能够保存来自原始表最少 1% 的数据,因为复制版本是在相同的表空间内创建的。

示例 3

这个示例测试的是分区键从 S_NATIONKEY 更改为 S_ID 的场景中的数据倾斜。这个例子使用了样本中 100% 的数据。正如这个示例所展示的,新的分区键带来了极少的数据倾斜,因此比示例 1 中的原始 S_NATIONAL 键好很多。

清单 5. 评估新分区键的数据倾斜

$ db2 "set serveroutput on" 
$ db2 "CALL estimate_new_data_skew('TPCD', 'SUPPLIER', 'S_ID', 100)" 
CALL estimate_new_data_skew('TPCD', 'SUPPLIER', 'S_ID ', 100) 
 
 Return Status = 0 
 
DATA SKEW ESTIMATION REPORT FOR TABLE: TPCD.SUPPLIER 
This report is based on the new partitioning key: S_NATIONKEY 
Accuracy is based on 100% sample of data 
------------------------------------------------------------------------ 
TPCD.SUPPLIER 
Estimated total number of records in the table: : 20,000,000 
Estimated average number of records per partition : 2,500,000 
 
Row count at partition 1 : 2,498,411 (Skew: 0.06%) 
Row count at partition 2 : 2,498,837 (Skew: 0.04%) 
Row count at partition 3 : 2,500,996 (Skew: 0.03%) 
Row count at partition 4 : 2,500,170 (Skew: 0.00%) 
Row count at partition 5 : 2,501,254 (Skew: 0.05%) 
Row count at partition 6 : 2,499,654 (Skew: 0.01%) 
Row count at partition 7 : 2,501,429 (Skew: 0.05%) 
Row count at partition 8 : 2,499,249 (Skew: 0.03%) 
 
Number of partitions: 8 (1, 2, 3, 4, 5, 6, 7, 8) 
------------------------------------------------------------------------ 
 
Total execution time: 20 seconds 

上一页  3 4 5 6 7 8 9 10  下一页

Tags:DB Database Partitioning

编辑录入:爽爽 [复制链接] [打 印]
赞助商链接