MySQL中Join算法实现原理分析
2009-04-04 11:18:13 来源:WEB开发网我们可以看出,MySQL Query Optimizer 选择了 user_group 作为驱动表,首先利用我们传入的条件 user_id 通过 该表上面的索引 user_group_uid_ind 来进行 const 条件的索引 ref 查找,然后以 user_group 表中过滤出来的结果集的 group_id 字段作为查询条件,对 group_message 循环查询,然后再通过 user_group 和 group_message 两个表的结果集中的 group_message 的 id 作为条件 与 group_message_content 的 group_msg_id 比较进行循环查询,才得到最终的结果。没啥特别的,后一个引用前一个的结果集作为条件,实现过程可以通过下图表示:
下面的我们调整一下 group_message_content 去掉上面的 idx_group_message_content_msg_id 这个索引,然后再看看会是什么效果:
1 sky@localhost : example 11:25:36> drop index idx_group_message_content_msg_id on group_message_content;
2
3 Query OK, 96 rows affected (0.11 sec)
4
5 sky@localhost : example 10:21:06> explain
6
7 -> select m.subject msg_subject, c.content msg_content
8
9 -> from user_group g,group_message m,group_message_content c
10
11 -> where g.user_id = 1
12
13 -> and m.group_id = g.group_id
14
15 -> and c.group_msg_id = m.idG
16
17 *************************** 1. row ***************************
18
19 id: 1
20
21 select_type: SIMPLE
22
23 table: g
24
25 type: ref
26
27 possible_keys: idx_user_group_uid
28
29 key: idx_user_group_uid
30
31 key_len: 4
32
33 ref: const
34
35 rows: 2
36
37 Extra:
38
39 *************************** 2. row ***************************
40
41 id: 1
42
43 select_type: SIMPLE
44
45 table: m
46
47 type: ref
48
49 possible_keys: PRIMARY,idx_group_message_gid_uid
50
51 key: idx_group_message_gid_uid
52
53 key_len: 4
54
55 ref: example.g.group_id
56
57 rows: 3
58
59 Extra:
60
61 *************************** 3. row ***************************
62
63 id: 1
64
65 select_type: SIMPLE
66
67 table: c
68
69 type: ALL
70
71 possible_keys: NULL
72
73 key: NULL
74
75 key_len: NULL
76
77 ref: NULL
78
79 rows: 96
80
81 Extra: Using where; Using join buffer
我们看到不仅仅 group_message_content 表的访问从 ref 变成了 ALL,此外,在最后一行的 Extra信息从没有任何内容变成为 Using where; Using join buffer,也就是说,对于从 ref 变成 ALL 很容易理解,没有可以使用的索引的索引了嘛,当然得进行全表扫描了,Using where 也是因为变成全表扫描之后,我们需要取得的 content 字段只能通过对表中的数据进行 where 过滤才能取得,但是后面出现的 Using join buffer 是一个啥呢?
我们知道,MySQL 中有一个供我们设置的参数 join_buffer_size ,这里实际上就是使用到了通过该参数所设置的 Buffer 区域。那为啥之前的执行计划中没有用到呢?
实际上,Join Buffer 只有当我们的 Join 类型为 ALL(如示例中),index,rang 或者是 index_merge 的时候 才能够使用,所以,在我们去掉 group_message_content 表的 group_msg_id 字段的索引之前,由于 Join 是 ref 类型的,所以我们的执行计划中并没有看到有使用 Join Buffer。
当我们使用了 Join Buffer 之后,我们可以通过下面的这张图片来表示 Join 完成过程:
更多精彩
赞助商链接