MySQL Explain详解,添加索引sql优化

EXPLAIN语法(获取SELECT相关信息)

EXPLAIN tbl_name

或:

EXPLAIN [EXTENDED] SELECT select_options

当我们使用select查询时发现很慢,所有通过我们常常用到explain这个命令来查看一个这些SQL语句的执行计划,查看该SQL语句有没有使用上了索引,有没有做全表扫描,这都可以通过explain命令来查看。

EXPLAIN为用于SELECT语句中的每个表返回一行信息。表以它们在处理查询过程中将被MySQL读入的顺序被列出。MySQL用一遍扫描多次联接(single-sweep multi-join)的方式解决所有联接。这意味着MySQL从第一个表中读一行,然后找到在第二个表中的一个匹配行,然后在第3个表中等等。当所有的表处理完后,它输出选中的列并且返回表清单直到找到一个有更多的匹配行的表。从该表读入下一行并继续处理下一个表。

/*实际SQL,查找用户名为小米的员工*/SELECT * FROM a WHERE NAME ='小米';-- 查看SQL是否使用索引,前面加上explain即可EXPLAIN SELECT * FROM a WHERE NAME ='小米';

EXPLAIN出来的信息有10列,分别是id、select_type、table、partitions ,type、possible_keys、key、key_len、ref、rows、filtered,Extra

EXPLAIN的每个输出行提供一个表的相关信息,并且每个行包括下面的列:

1>> id

SELECT识别符。这是SELECT的查询序列号。

2>> select_type

SELECT类型,可以为以下任何一种:

  • SIMPLE

简单SELECT(不使用UNION或子查询)

  • PRIMARY

最外面的SELECT

  • UNION

UNION中的第二个或后面的SELECT语句

  • DEPENDENT UNION

UNION中的第二个或后面的SELECT语句,取决于外面的查询

  • UNION RESULT

UNION的结果。

  • SUBQUERY

子查询中的第一个SELECT

  • DEPENDENT SUBQUERY

子查询中的第一个SELECT,取决于外面的查询

  • DERIVED

导出表的SELECT(FROM子句的子查询)

3>> table

输出的行所引用的表。

4>> type

联接类型。下面给出各种联接类型,按照从最佳类型到最坏类型进行排序:

system>const>eq_ref>ref>ref_or_null>index_merge>unique_subquery>index_subquery>range>index>ALL

  • system

表仅有一行(=系统表)。这是const联接类型的一个特例。

  • const

表最多有一个匹配行,它将在查询开始时被读取。因为仅有一行,在这行的列值可被优化器剩余部分认为是常数。const表很快,因为它们只读取一次!

const用于用常数值比较PRIMARY KEY或UNIQUE索引的所有部分时。在下面的查询中,tbl_name可以用于const表:

SELECT * from tbl_name WHERE primary_key=1; SELECT * from tbl_nameWHERE primary_key_part1=1和 primary_key_part2=2;
EXPLAIN SELECT * FROM a WHERE id=4;
  • eq_ref

对于每个来自于前面的表的行组合,从该表中读取一行。这可能是最好的联接类型,除了const类型。它用在一个索引的所有部分被联接使用并且索引是UNIQUE或PRIMARY KEY。

eq_ref可以用于使用= 操作符比较的带索引的列。比较值可以为常量或一个使用在该表前面所读取的表的列的表达式。

在下面的例子中,MySQL可以使用eq_ref联接来处理ref_tables

SELECT * FROM ref_table,other_table WHERE ref_table.key_column=other_table.column; SELECT * FROM ref_table,other_table WHERE ref_table.key_column_part1=other_table.column AND ref_table.key_column_part2=1;
  • ref

对于每个来自于前面的表的行组合,所有有匹配索引值的行将从这张表中读取。如果联接只使用键的最左边的前缀,或如果键不是UNIQUE或PRIMARY KEY(换句话说,如果联接不能基于关键字选择单个行的话),则使用ref。如果使用的键仅仅匹配少量行,该联接类型是不错的。

ref可以用于使用=或<=>操作符的带索引的列。

在下面的例子中,MySQL可以使用ref联接来处理ref_tables

SELECT * FROM ref_table WHERE key_column=expr; SELECT * FROM ref_table,other_table WHERE ref_table.key_column=other_table.column; SELECT * FROM ref_table,other_table WHERE ref_table.key_column_part1=other_table.column AND ref_table.key_column_part2=1;
  • ref_or_null

该联接类型如同ref,但是添加了MySQL可以专门搜索包含NULL值的行。在解决子查询中经常使用该联接类型的优化。

在下面的例子中,MySQL可以使用ref_or_null联接来处理ref_tables

SELECT * FROM ref_tableWHERE key_column=expr OR key_column IS NULL;
  • index_merge

该联接类型表示使用了索引合并优化方法。在这种情况下,key列包含了使用的索引的清单,key_len包含了使用的索引的最长的关键元素。详细信息参见7.2.6节,“索引合并优化”。

  • unique_subquery

该类型替换了下面形式的IN子查询的ref:

value IN (SELECT primary_key FROM single_table WHERE some_expr)

unique_subquery是一个索引查找函数,可以完全替换子查询,效率更高。

  • index_subquery

该联接类型类似于unique_subquery。可以替换IN子查询,但只适合下列形式的子查询中的非唯一索引:

value IN (SELECT key_column FROM single_table WHERE some_expr)
  • range

只检索给定范围的行,使用一个索引来选择行。key列显示使用了哪个索引。key_len包含所使用索引的最长关键元素。在该类型中ref列为NULL。

当使用=、<>、>、>=、<、<=、IS NULL、<=>、BETWEEN或者IN操作符,用常量比较关键字列时,可以使用range:

SELECT * FROM tbl_nameWHERE key_column = 10; SELECT * FROM tbl_nameWHERE key_column BETWEEN 10 and 20; SELECT * FROM tbl_nameWHERE key_column IN (10,20,30); SELECT * FROM tbl_nameWHERE key_part1= 10 AND key_part2 IN (10,20,30);
  • index

该联接类型与ALL相同,除了只有索引树被扫描。这通常比ALL快,因为索引文件通常比数据文件小。

当查询只使用作为单索引一部分的列时,MySQL可以使用该联接类型。

  • ALL

对于每个来自于先前的表的行组合,进行完整的表扫描。如果表是第一个没标记const的表,这通常不好,并且通常在它情况下差。通常可以增加更多的索引而不要使用ALL,使得行能基于前面的表中的常数值或列值被检索出。

5>> possible_keys

possible_keys列指出MySQL能使用哪个索引在该表中找到行。注意,该列完全独立于EXPLAIN输出所示的表的次序。这意味着在possible_keys中的某些键实际上不能按生成的表次序使用。如果该列是NULL,则没有相关的索引。在这种情况下,可以通过检查WHERE子句看是否它引用某些列或适合索引的列来提高你的查询性能。如果是这样,创造一个适当的索引并且再次用

6>> key

key列显示MySQL实际决定使用的键(索引)。如果没有选择索引,键是NULL。要想强制MySQL使用或忽视possible_keys列中的索引,在查询中使用FORCE INDEX、USE INDEX或者IGNORE INDEX

7>> key_len

key_len列显示MySQL决定使用的键长度。如果键是NULL,则长度为NULL。注意通过key_len值我们可以确定MySQL将实际使用一个多部关键字的几个部分。

8>> ref

ref列显示使用哪个列或常数与key一起从表中选择行。

9>> rows

rows列显示MySQL认为它执行查询时必须检查的行数。

10>> Extra

该列包含MySQL解决查询的详细信息。下面解释了该列可以显示的不同的文本字符串:

  • Distinct

MySQL发现第1个匹配行后,停止为当前的行组合搜索更多的行。

  • Not exists

MySQL能够对查询进行LEFT JOIN优化,发现1个匹配LEFT JOIN标准的行后,不再为前面的的行组合在该表内检查更多的行。

下面是一个可以这样优化的查询类型的例子:

SELECT * 从t1 LEFT JOIN t2 ON t1.id=t2.id WHERE t2.id IS NULL;

假定t2.id定义为NOT NULL。在这种情况下,MySQL使用t1.id的值扫描t1并查找t2中的行。如果MySQL在t2中发现一个匹配的行,它知道t2.id绝不会为NULL,并且不再扫描t2内有相同的id值的行。换句话说,对于t1的每个行,MySQL只需要在t2中查找一次,无论t2内实际有多少匹配的行。

  • range checked for each record (index map: #)

MySQL没有发现好的可以使用的索引,但发现如果来自前面的表的列值已知,可能部分索引可以使用。对前面的表的每个行组合,MySQL检查是否可以使用range或index_merge访问方法来索取行。

  • Using filesort

MySQL需要额外的一次传递,以找出如何按排序顺序检索行。通过根据联接类型浏览所有行并为所有匹配WHERE子句的行保存排序关键字和行的指针来完成排序。然后关键字被排序,并按排序顺序检索行。

  • Using index

从只使用索引树中的信息而不需要进一步搜索读取实际的行来检索表中的列信息。当查询只使用作为单一索引一部分的列时,可以使用该策略。

  • Using temporary

为了解决查询,MySQL需要创建一个临时表来容纳结果。典型情况如查询包含可以按不同情况列出列的GROUP BY和ORDER BY子句时。

  • Using where

WHERE子句用于限制哪一个行匹配下一个表或发送到客户。除非你专门从表中索取或检查所有行,如果Extra值不为Using where并且表联接类型为ALL或index,查询可能会有一些错误。

  • Using sort_union(...), Using union(...), Using intersect(...)

这些函数说明如何为index_merge联接类型合并索引扫描。详细信息参见7.2.6节,“索引合并优化”。

  • Using index for group-by

类似于访问表的Using index方式,Using index for group-by表示MySQL发现了一个索引,可以用来查询GROUP BY或DISTINCT查询的所有列,而不要额外搜索硬盘访问实际的表。并且,按最有效的方式使用索引,以便对于每个组,只读取少量索引条目。

通过相乘EXPLAIN输出的rows列的所有值,你能得到一个关于一个联接如何的提示。这应该粗略地告诉你MySQL必须检查多少行以执行查询。当你使用max_join_size变量限制查询时,也用这个乘积来确定执行哪个多表SELECT语句。

例子说明:

添加索引优化器更高效率地执行语句

假设我们有两个数据表a和b,每个有20行,包含的值从1到20。下面的查询查找出两个表中姓名相同的行

表a的结构

表a的数据:

a表

表b的表结构

表b的数据

下面我们查询a b表姓名相同的行

代码:

SELECT a.`NAME`, b.`NAME` FROM a, b WHERE a.`NAME` = b.`NAME`;

两个表都没有索引的时候,EXPLAIN产生下面的结果:

EXPLAIN SELECT a.`NAME`, b.`NAME` FROM a, b WHERE a.`NAME` = b.`NAME`;

类型列中的ALL表明要进行检查所有数据行的全表扫描。可能键列中的NULL表明没有找到用于提高查询速度的备选索引(键、键长度和参考列都是NULL也是因为缺少合适的索引)。Using where表明使用WHERE子句中的信息来识别合格的数据行。 这段信息告诉我们,优化器没有为提高执行查询的效率找到任何有用的信息:

它将对a表进行全表扫描。

对于a中的每一行,它将执行b的全表扫描,使用WHERE子句中的信息识别出合格的行。

行数值显示了优化器估计的每个阶段查询需要检查的行数。a的估计值是18,因为b可以完成全表扫描。相似地,b的估计值也是20,但是这个值是对于a的每一行的。换句话说,优化器所估计的处理该查询所需要检查的数据行组合的数量是18×20,也就是360。这会造成很大的浪费 ,因为实际上只有20个组合符合WHERE子句的条件。

为了使这个查询的效率更高,给其中一个联结列添加索引 并重新执行EXPLAIN语句:

/*把b表name添加索引*/ ALTER TABLE b ADD INDEX (NAME);

然后回来查看

/*查询两张表没有索引的情况下,EXPLAIN的值*/EXPLAIN SELECT a.`NAME`, b.`NAME` FROM a, b WHERE a.`NAME` = b.`NAME`;

我们可以看到性能提高了。a的输出没有改变(表明还是需要进行全表扫描),但是优化器处理b表的方式就有所不同了:

类型从ALL改变为ref,意味着可以使用参考值(来自a的值)来执行索引查找,定位b中合格的数据行。

参考值在参考(ref)字段中给出了:springboot.a.name。

数值从20降低到了1,显示出优化器相信对于a中的每一行,它只需要检查b中的1行(实际上,在a中只有一行与 b中数据行匹配。我们在后面会看到如何帮助优化器改善这个估计值)。数据行组合的全部估计值使18×1=18。它比前面的没有索引的时候估 计出来的好多了。

对a进行索引有价值吗?实际上,对于这个特定的联结操作,扫描一张表是必要的,因此没有必要对a建立索引。如果你想看到效果,可以索引a.name并再次运行EXPLAIN:

a表的name添加索引

然后回来查看

/*查询两张表没有索引的情况下,EXPLAIN的值*/EXPLAIN SELECT a.`NAME`, b.`NAME` FROM a, b WHERE a.`NAME` = b.`NAME`;

上面的输出与前面的EXPLAIN的输出相似,但是添加索引对a表的输出有一些改变。类型从NULL改成了index,附加(Extra)从空的改成了 Using index。这些改变表明,尽管对索引的值仍然需要执行全表扫描,但是优化器还是可以直接从索引文件中读取值,根据不需要使用数据文件。在这种情况下优化器可以单独使用索引中的信息而不用搜索数据行。

谢谢阅读,自己关注哦

(0)

相关推荐

  • 神奇的 SQL 之 MySQL 执行计划 → EXPLAIN,让我们了解 SQL 的执行过程!

    前言 开心一刻 某人养了一头猪,烦了想放生,可是猪认识回家的路,放生几次它都自己回来了.一日,这个人想了个狠办法,开车带着猪转了好多路进山区放生,放生后又各种打转,然后掏出电话给家里人打了个电话,问道 ...

  • MySQL 语句优化方法

    MySQL 语句优化方法

  • 性能调优-MySQL索引数据结构详解与索引优化

    本篇文章主要学习了MySQL的索引的数据结构的认识,做一个大概的了解即可. 一.索引 在关系数据库中,索引是一种单独的.物理的对数据库表中一列或多列的值进行排序的一种存储数据结构,它是某个表中一列或若 ...

  • 头条二面: 详解一条 SQL 的执行过程

    前言 天天和数据库打交道,一天能写上几十条 SQL 语句,但你知道我们的系统是如何和数据库交互的吗?MySQL 如何帮我们存储数据.又是如何帮我们管理事务?....是不是感觉真的除了写几个 「sele ...

  • SQL执行效率优化:效率提升几万倍的操作详解

                              本文介绍的是SQL执行效率优化的详细操作,相关内容请点击:SQL执行效率的优化.我用的数据库是MySQL5.6,下面简单的介绍下场景场景本文介绍的是 ...

  • Flink SQL 性能优化:multiple input 详解

    简介: 在 Flink 1.12 中,针对目前 operator chaining 无法覆盖的场景,推出了 multiple input operator 与 source chaining 优化.该 ...

  • MySQL索引底层:B+树详解

    前言 当我们发现SQL执行很慢的时候,自然而然想到的就是加索引.对于范围查询,索引的底层结构就是B+树.今天我们一起来学习一下B+树哈~ 公众号:「捡田螺的小男孩」 树简介.树种类 B-树.B+树简介 ...

  • MySQL的执行计划和索引详解

    使用explain关键字可以模拟优化器执行sql语句,从而知道mysql是如何处理sql语句的,分析你的查询语句或者是结构性能. 我们通过几张表来使用explain的例子: 在select语句之前增加 ...

  • 中考数学【等腰三角形】常用辅助线添加方法,附经典考题详解

    众所周知,等腰三角形.等边三角形是几何考题里最常见的考试元素之一,尤其是等腰三角形,它是初中数学里的一个重点,和等腰三角形有关的考试题型,各种变式题也特别多. 那么,如何快速解决好等腰三角形问题,做到 ...

  • MySQL Router 8 详解

    wzy0623 2019-09-03 15:35:32 版权 目录 一.功能介绍 1. 透明路由 2. 元数据缓存 3. 简单重定向 4. MySQL Router 8.0的新特性 二.安装与启动 1 ...

  • 什么是真-假-处理过——宝石优化处理详解

    当想买珠宝的时候, 你或许一定会问, 这是真的么? 这玩意儿处理过么? 这东西戴着对人没害吧? -- 但你是否想过, 每个人对于真假的定义. 对于处理的定义 都是不一样的. 作为一名前珠宝人, 每当七 ...