MySQL
MySQL 是我们日常开发中用到的最多的关系型数据库,该篇总结 MySQL 的常用知识点 。
目录
使用 EXPLAIN 可以帮助分析自己写的 SQL 语句,看看我们是否用到了索引。
CREATE TABLE `demo` (
`ID` int(11) unsigned NOT NULL AUTO_INCREMENT COMMENT '主键',
`name` varchar(64) COLLATE utf8mb4_general_ci NOT NULL COMMENT 'demo name',
`author` varchar(64) COLLATE utf8mb4_general_ci NOT NULL COMMENT 'demo author',
PRIMARY KEY (`ID`),
KEY `IX_name` (`name`)
) ENGINE=InnoDB AUTO_INCREMENT=4 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_general_ci;
CREATE TABLE `demo_details` (
`ID` int(11) unsigned NOT NULL AUTO_INCREMENT COMMENT '主键',
`demoId` int(11) unsigned NOT NULL COMMENT 'demo id',
`url` varchar(128) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NOT NULL COMMENT 'demo author',
PRIMARY KEY (`ID`),
KEY `FIX_demoId_ID` (`demoId`),
CONSTRAINT `demo_details_ibfk_1` FOREIGN KEY (`demoId`) REFERENCES `demo` (`ID`)
) ENGINE=InnoDB AUTO_INCREMENT=2 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_general_ci;
mysql> EXPLAIN SELECT * FROM demo WHERE ID = 1\G
执行结果:
id: 1
select_type: SIMPLE
table: demo
partitions: NULL
type: const
possible_keys: PRIMARY
key: PRIMARY
key_len: 4
ref: const
rows: 1
filtered: 100.00
Extra: NULL
1 row in set, 1 warning (0.00 sec)
以上执行结果各行表示的含义:
- id: SELECT 查询的标识符,每个 SELECT 都会自动分配一个唯一的标识符
- select_type: SELECT 查询的类型
- table: 查询的是哪个表
- partitions: 匹配的分区
- type: join 类型
- possible_keys: 此次查询中可能选用的索引
- key: 此次查询中确切使用到的索引
- ref: 哪个字段或常数与 key 一起被使用
- rows: 显示此查询一共扫描了多少行,这个是一个估计值
- filtered: 表示此查询条件所过滤的数据的百分比
- extra: 额外的信息
select_type
表示了查询的类型, 它的常用取值有:- SIMPLE: 表示此查询不包含 UNION 查询或子查询
- PRIMARY: 表示此查询是最外层的查询
- UNION: 表示此查询是 UNION 的第二或随后的查询
- DEPENDENT UNION: UNION 中的第二个或后面的查询语句, 取决于外面的查询
- UNION RESULT: UNION 的结果
- SUBQUERY: 子查询中的第一个 SELECT
- DEPENDENT SUBQUERY: 子查询中的第一个 SELECT, 取决于外面的查询. 即子查询依赖于外层查询的结果
最常见的应该是 SIMPLE,当我们的查询 SQL 里面没有 UNION 查询或者子查询的时候,那么通常就是 SIMPLE 类型。
type
字段比较重要,它提供了判断查询是否高效的重要依据。通过 type 字段,我们可以判断此次查询是全表扫描,还是索引扫描等。type
常用取值有:- system表中只有一条数据,这个类型是特殊的 const 类型。
- const针对主键或唯一索引的等值查询扫描,最多只返回一行数据,const 查询速度非常快,因为它仅仅读取一次即可。
- eq_ref此类型通常出现在多表的 join 查询,表示对于前表的每一个结果,都只能匹配到后表的一行结果,并且查询的比较操作通常是 =,查询效率较高。 demo 如下:mysql>EXPLAIN select * from demo,demo_details where demo.ID = demo_details.demoId\G;*************************** 1. row ***************************id: 1select_type: SIMPLEtable: demo_detailspartitions: NULLtype: ALLpossible_keys: FIX_demoId_IDkey: NULLkey_len: NULLref: NULLrows: 1filtered: 100.00Extra: NULL*************************** 2. row ***************************id: 1select_type: SIMPLEtable: demopartitions: NULLtype: eq_refpossible_keys: PRIMARYkey: PRIMARYkey_len: 4ref: springdemo.demo_details.demoIdrows: 1filtered: 100.00Extra: NULL2 rows in set, 1 warning (0.00 sec)
- ref此类型通常出现在多表的 join 查询,针对于非唯一或非主键索引,或者是使用了最左前缀规则索引的查询。mysql> EXPLAIN select * from demo where name='tommy'\G;*************************** 1. row ***************************id: 1select_type: SIMPLEtable: demopartitions: NULLtype: refpossible_keys: IX_namekey: IX_namekey_len: 258ref: constrows: 1filtered: 100.00Extra: NULL1 row in set, 1 warning (0.00 sec)
- range表示使用索引范围查询,通过索引字段范围获取表中部分数据记录,这个类型通常出现在 =、 <>、 >、 >=、 <、 <=、 IS NULL、 <=>、 BETWEEN、 IN 操作中。 当 type 是 range 时,那么 EXPLAIN 输出的 ref 字段为 NULL, 并且 key_len 字段是此次查询中使用到的索引的最长的那个。 demo 如下:mysql> EXPLAIN select * from demo where id between 1 and 2\G;*************************** 1. row ***************************id: 1select_type: SIMPLEtable: demopartitions: NULLtype: rangepossible_keys: PRIMARYkey: PRIMARYkey_len: 4ref: NULLrows: 2filtered: 100.00Extra: Using where1 row in set, 1 warning (0.00 sec)
- index表示全索引扫描(full index scan),和 ALL 类型类似,只不过 ALL 类型是全表扫描,而 index 类型则仅仅扫描所有的索引,而不扫描数据。 index 类型通常出现在:所要查询的数据直接在索引树中就可以获取到,而不需要扫描数据。当是这种情况时,Extra 字段 会显示 Using index。 demo 如下:mysql> EXPLAIN select name from demo\G;*************************** 1. row ***************************id: 1select_type: SIMPLEtable: demopartitions: NULLtype: indexpossible_keys: NULLkey: IX_namekey_len: 258ref: NULLrows: 2filtered: 100.00Extra: Using index1 row in set, 1 warning (0.00 sec)
- ALL表示全表扫描,这个类型的查询是性能最差的查询之一。通常来说,我们的查询不应该出现 ALL 类型的查询,因为这样的查询在数据量大的情况下,对数据库的性能是巨大的灾难。 如一个查询是 ALL 类型查询,那么一般来说可以对相应的字段添加索引来避免。 demo 如下:mysql> EXPLAIN select * from demo\G;*************************** 1. row ***************************id: 1select_type: SIMPLEtable: demopartitions: NULLtype: ALLpossible_keys: NULLkey: NULLkey_len: NULLref: NULLrows: 2filtered: 100.00Extra: NULL1 row in set, 1 warning (0.00 sec)
通常来说, 不同的 type 类型的性能关系如下:
ALL < index < range < index_merge < ref < eq_ref < const < system
ALL 类型因为是全表扫描,因此在相同的查询条件下,它是速度最慢的。 而 index 类型的查询虽然不是全表扫描,但是它扫描了所有的索引,因此比 ALL 类型的稍快。 后面的几种类型都是利用了索引来查询数据,因此可以过滤部分或大部分数据,因此查询效率就比较高了。
possible_key
表示 MySQL 在查询时,可能使用到的索引。即使有些索引出现在 possible_key 中,但是并不表示此索引一定会被 MySQL 使用到。MySQL 在查询时具体使用到那些索引,与 key 和你写的 SQL 有关。此字段表示 MySQL 在当前查询时所真正会使用到的索引。
表示查询优化器使用了索引的字节数。这个字段可以评估组合索引是否完全被使用,或只有最左部分字段被使用到。 key_len 的计算规则如下:
- 字符串
- char(n):n 字节长度
- varchar(n):如果是 utf8 编码,则是 3n + 2字节;如果是 utf8mb4 编码,则是 4n + 2 字节。
- 数值类型
- TINYINT: 1字节
- SMALLINT: 2字节
- MEDIUMINT: 3字节
- INT: 4字节
- BIGINT: 8字节
- 时间类型
- DATE:3字节
- TIMESTAMP:4字节
- DATETIME:8字节
- 字段属性 NULL 属性 占用一个字节。如果一个字段是 NOT NULL 的,则没有此属性。
rows 也是一个重要的字段。MySQL 查询优化器根据统计信息,估算 SQL 要查找到结果集需要扫描读取的数据行数。这个值非常直观显示 SQL 的效率好坏,原则上 rows 越少越好。
EXPLAIN 中的很多额外的信息会在 Extra 字段显示,常见的有以下几种内容:
- Using filesort当 Extra 中有 Using filesort 时,表示 MySQL 需额外的排序操作,不能通过索引顺序达到排序效果。一般有 Using filesort,都建议优化去掉,因为这样的查询 CPU 资源消耗大。 demo 如下:mysql> EXPLAIN select * from demo order by name\G;*************************** 1. row ***************************id: 1select_type: SIMPLEtable: demopartitions: NULLtype: ALLpossible_keys: NULLkey: NULLkey_len: NULLref: NULLrows: 2filtered: 100.00Extra: Using filesort1 row in set, 1 warning (0.00 sec)
- Using index覆盖索引扫描,表示查询在索引树中就可查找所需数据,不用扫描表数据文件,往往说明性能不错。 demo 如下:mysql> EXPLAIN select * from demo order by id desc\G;*************************** 1. row ***************************id: 1select_type: SIMPLEtable: demopartitions: NULLtype: indexpossible_keys: NULLkey: PRIMARYkey_len: 4ref: NULLrows: 2filtered: 100.00Extra: Backward index scan1 row in set, 1 warning (0.00 sec)
- Using temporary查询有使用临时表,一般出现于排序,分组和多表 join 的情况,查询效率不高,建议优化。
- Using where列数据是从仅仅使用了索引中的信息而没有读取实际行的表返回的,这发生在对表的全部的请求列都是同一个索引的部分的时候,表示 MySQL 服务器将在存储引擎检索行后再进行过滤。
- 只返回必要的列:最好不要使用 SELECT * 语句。
- 只返回必要的行:使用 LIMIT 语句来限制返回的数据。
- 最有效的方式是使用索引来覆盖查询。
- 缓存重复查询的数据:使用缓存可以避免在数据库中进行查询,特别在要查询的数据经常被重复查询时,缓存带来的查询性能提升将会是非常明显的。
一个大查询如果一次性执行的话,可能一次锁住很多数据、占满整个事务日志、耗尽系统资源、阻塞很多小的但重要的查询。
DELETE FROM messages WHERE create < DATE_SUB(NOW(), INTERVAL 12 MONTH);
rows_affected = 0
do {
rows_affected = do_query(
"DELETE FROM messages WHERE create < DATE_SUB(NOW(), INTERVAL 12 MONTH) LIMIT 5000")
} while rows_affected > 0