您当前的位置:首页 > 电脑百科 > 数据库 > MYSQL

MySQL核心:索引结构原理

时间:2019-05-07 13:54:04  来源:  作者:

数据库的索引就像一本书的目录一样,它可以快速定位你所需要的信息。下面来详细说一下MySQL的索引结构。

常见索引类型

Hash 索引

Hash索引的底层实现是由Hash表来实现的,非常适合以 key-value 的形式查询,也就是单个key 查询,或者说是等值查询。其结构如下所示:

MySQL核心:索引结构原理

 

从上面结构可以看出,Hash 索引可以比较方便的提供等值查询的场景。但是对于范围查询的话,就需要进行全表扫描了。

B+ 索引

Hash结构的索引比较适合缓存的存储。对于使用关系型数据库而言,笔者更多的使用的是B+ 索引。当然对于MySQL 我们最常用的存储引擎就是InnoDB 了,对于B+ 索引后面将详细介绍一下。

InnoDB 的索引结构

首先先创建一个简单的表,结构如下:

CREATE TABLE `t_user` (
 `id` bigint(20) NOT NULL COMMENT '主键ID',
 `age` int(10) DEFAULT NULL COMMENT '年龄',
 PRIMARY KEY (`id`),
 KEY `idx_age` (`age`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8
INSERT INTO `t_user` VALUES ('100', '10'), ('200', '20'), ('300', '30'), ('500', '50'), ('600', '60');

上面表和数据的存储结构大致如下所示:

MySQL核心:索引结构原理

 

从上图可以看出,有 2 个索引结构:主键ID 索引和普通索引。主键索引的叶子节点存储的是行数据的内容(聚簇索引),普通索引的叶子节点存储的是主键的值(非聚簇索引/二级索引)。

主键索引和普通索引的区别

当我们使用主键索引查询记录时,查询语句如下所示。此时只需要一次主键索引树的查找即可返回数据行。

SELECT * FROM t_user WHERE id = 100;

如果使用普通索引,idx_age 查询记录,如下所示。此时就会查找2 个索引树的结构。首先根据idx_age 查找到记录的主键值为 100,然后再根据主键索引树查找到对应的记录行,这个过程称为回表。

SELECT * FROM t_user WHERE age = 10;

索引维护

B+ 树为了维持索引的有序性,在新插入记录时需要有一定的开销。如上图所示,如果需要再插入一个id = 700 的记录行,此时只需要在 User5 后面新增一条记录即可。但是如果需要新增一个 id = 400 的记录行时,此时就需要移动数据了,这个和有序数组的插入类似。

比较极端的一种场景是,此时User5 所在的数据页已经满了。此时如果再插入一条记录,就需要移动部分数据行到新页上面去。这种情况下,性能会受到一定的影响。除此之外,页分裂还存在着空间利用率的问题。

当然,有页分裂就有数据页的合并,当空间利用率低到一定程度的时候,就会触发分页数据的合并。

主键ID自增

从上面的描述我们可以看出,主键ID的乱序插入或者删除可能对性能造成很大的影响。这就是为什么,我们在大多数场景下对于主键都是自增的。这样一来,就可以充分的利用分页数据块的空间了,也不会对性能造成影响。

覆盖索引

上面我们已经提到了 回表的概念了,也就是普通索引的查询,可能会再到主键索引上面再搜索一遍。但是如果我们执行如下语句:

SELECT id FROM t_user WHERE age = 10;

此时,普通索引 idx_age 的叶子节点上面,就已经包含了id 的value值了,此时就不需要回表了,这个就称之为“覆盖索引”(覆盖索引是一种优化查询的方式,不是索引的分类)。

联合索引

我们创建索引时,也会经常创建如 idx_name_age (name, age) 这样的索引结构。并且还知道 WHERE 条件中 name = ? AND age = ? 和 name = ? 都可以使用到这个联合索引。下面我们来看一下其结构,看一下为什么是可以做到这一点的。

MySQL核心:索引结构原理

 

从上面结构可以看出,数据是按照 联合索引 从左到右的顺序进行排序的。由此看来,不论使用 name AND age 或者name 来查询,不论等值或者 左前缀模糊查询,都可以用到复合索引。这里面需要注意的是,只有左前缀的模糊匹配才可以使用此联合索引。因为从索引结构看来,符合左前缀的顺序排序。

索引下推

前面的部分我们知道,左前缀的模糊查询可以使用索引。还是上面的例子,索引(name, age) ,当我们 WHERE条件中使用 name LIKE '张%' AND age = 10 时。MySQL 5.6 及以后的版本可以对查询做下推的优化,如下图所示:

MySQL核心:索引结构原理

 

MySQL核心:索引结构原理

 

从上图可以看出,当做了下推优化后,MySQL会隔断一些不满足条件的记录 进行回表操作,从一定程度上有了性能的提升。
 



Tags:MySQL   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
MySQL 核心模块揭秘
server 层会创建一个 SAVEPOINT 对象,用于存放 savepoint 信息。binlog 会把 binlog offset 写入 server 层为它分配的一块 8 字节的内存里。 InnoDB 会维护自己的 savepoint...【详细内容】
2024-04-03  Search: MySQL  点击:(10)  评论:(0)  加入收藏
MySQL 核心模块揭秘,你看明白了吗?
为了提升分配 undo 段的效率,事务提交过程中,InnoDB 会缓存一些 undo 段。只要同时满足两个条件,insert undo 段或 update undo 段就能被缓存。1. 关于缓存 undo 段为了提升分...【详细内容】
2024-03-27  Search: MySQL  点击:(17)  评论:(0)  加入收藏
MySQL:BUG导致DDL语句无谓的索引重建
对于5.7.23之前的版本在评估类似DDL操作的时候需要谨慎,可能评估为瞬间操作,但是实际上线的时候跑了很久,这个就容易导致超过维护窗口,甚至更大的故障。一、问题模拟使用5.7.22...【详细内容】
2024-03-26  Search: MySQL  点击:(14)  评论:(0)  加入收藏
从 MySQL 到 ByteHouse,抖音精准推荐存储架构重构解读
ByteHouse是一款OLAP引擎,具备查询效率高的特点,在硬件需求上相对较低,且具有良好的水平扩展性,如果数据量进一步增长,可以通过增加服务器数量来提升处理能力。本文将从兴趣圈层...【详细内容】
2024-03-22  Search: MySQL  点击:(29)  评论:(0)  加入收藏
MySQL自增主键一定是连续的吗?
测试环境:MySQL版本:8.0数据库表:T (主键id,唯一索引c,普通字段d)如果你的业务设计依赖于自增主键的连续性,这个设计假设自增主键是连续的。但实际上,这样的假设是错的,因为自增主键不...【详细内容】
2024-03-10  Search: MySQL  点击:(14)  评论:(0)  加入收藏
准线上事故之MySQL优化器索引选错
1 背景最近组里来了许多新的小伙伴,大家在一起聊聊技术,有小兄弟提到了MySQL的优化器的内部策略,想起了之前在公司出现的一个线上问题,今天借着这个机会,在这里分享下过程和结论...【详细内容】
2024-03-07  Search: MySQL  点击:(32)  评论:(0)  加入收藏
MySQL数据恢复,你会吗?
今天分享一下binlog2sql,它是一款比较常用的数据恢复工具,可以通过它从MySQL binlog解析出你要的SQL,并根据不同选项,可以得到原始SQL、回滚SQL、去除主键的INSERT SQL等。主要...【详细内容】
2024-02-22  Search: MySQL  点击:(54)  评论:(0)  加入收藏
如何在MySQL中实现数据的版本管理和回滚操作?
实现数据的版本管理和回滚操作在MySQL中可以通过以下几种方式实现,包括使用事务、备份恢复、日志和版本控制工具等。下面将详细介绍这些方法。1.使用事务:MySQL支持事务操作,可...【详细内容】
2024-02-20  Search: MySQL  点击:(54)  评论:(0)  加入收藏
为什么高性能场景选用Postgres SQL 而不是 MySQL
一、 数据库简介 TLDR;1.1 MySQL MySQL声称自己是最流行的开源数据库,它属于最流行的RDBMS (Relational Database Management System,关系数据库管理系统)应用软件之一。LAMP...【详细内容】
2024-02-19  Search: MySQL  点击:(39)  评论:(0)  加入收藏
MySQL数据库如何生成分组排序的序号
经常进行数据分析的小伙伴经常会需要生成序号或进行数据分组排序并生成序号。在MySQL8.0中可以使用窗口函数来实现,可以参考历史文章有了这些函数,统计分析事半功倍进行了解。...【详细内容】
2024-01-30  Search: MySQL  点击:(55)  评论:(0)  加入收藏
▌简易百科推荐
MySQL 核心模块揭秘
server 层会创建一个 SAVEPOINT 对象,用于存放 savepoint 信息。binlog 会把 binlog offset 写入 server 层为它分配的一块 8 字节的内存里。 InnoDB 会维护自己的 savepoint...【详细内容】
2024-04-03  爱可生开源社区    Tags:MySQL   点击:(10)  评论:(0)  加入收藏
MySQL 核心模块揭秘,你看明白了吗?
为了提升分配 undo 段的效率,事务提交过程中,InnoDB 会缓存一些 undo 段。只要同时满足两个条件,insert undo 段或 update undo 段就能被缓存。1. 关于缓存 undo 段为了提升分...【详细内容】
2024-03-27  爱可生开源社区  微信公众号  Tags:MySQL   点击:(17)  评论:(0)  加入收藏
MySQL:BUG导致DDL语句无谓的索引重建
对于5.7.23之前的版本在评估类似DDL操作的时候需要谨慎,可能评估为瞬间操作,但是实际上线的时候跑了很久,这个就容易导致超过维护窗口,甚至更大的故障。一、问题模拟使用5.7.22...【详细内容】
2024-03-26  MySQL学习  微信公众号  Tags:MySQL   点击:(14)  评论:(0)  加入收藏
从 MySQL 到 ByteHouse,抖音精准推荐存储架构重构解读
ByteHouse是一款OLAP引擎,具备查询效率高的特点,在硬件需求上相对较低,且具有良好的水平扩展性,如果数据量进一步增长,可以通过增加服务器数量来提升处理能力。本文将从兴趣圈层...【详细内容】
2024-03-22  字节跳动技术团队    Tags:ByteHouse   点击:(29)  评论:(0)  加入收藏
MySQL自增主键一定是连续的吗?
测试环境:MySQL版本:8.0数据库表:T (主键id,唯一索引c,普通字段d)如果你的业务设计依赖于自增主键的连续性,这个设计假设自增主键是连续的。但实际上,这样的假设是错的,因为自增主键不...【详细内容】
2024-03-10    dbaplus社群  Tags:MySQL   点击:(14)  评论:(0)  加入收藏
准线上事故之MySQL优化器索引选错
1 背景最近组里来了许多新的小伙伴,大家在一起聊聊技术,有小兄弟提到了MySQL的优化器的内部策略,想起了之前在公司出现的一个线上问题,今天借着这个机会,在这里分享下过程和结论...【详细内容】
2024-03-07  转转技术  微信公众号  Tags:MySQL   点击:(32)  评论:(0)  加入收藏
MySQL数据恢复,你会吗?
今天分享一下binlog2sql,它是一款比较常用的数据恢复工具,可以通过它从MySQL binlog解析出你要的SQL,并根据不同选项,可以得到原始SQL、回滚SQL、去除主键的INSERT SQL等。主要...【详细内容】
2024-02-22  数据库干货铺  微信公众号  Tags:MySQL   点击:(54)  评论:(0)  加入收藏
如何在MySQL中实现数据的版本管理和回滚操作?
实现数据的版本管理和回滚操作在MySQL中可以通过以下几种方式实现,包括使用事务、备份恢复、日志和版本控制工具等。下面将详细介绍这些方法。1.使用事务:MySQL支持事务操作,可...【详细内容】
2024-02-20  编程技术汇    Tags:MySQL   点击:(54)  评论:(0)  加入收藏
MySQL数据库如何生成分组排序的序号
经常进行数据分析的小伙伴经常会需要生成序号或进行数据分组排序并生成序号。在MySQL8.0中可以使用窗口函数来实现,可以参考历史文章有了这些函数,统计分析事半功倍进行了解。...【详细内容】
2024-01-30  数据库干货铺  微信公众号  Tags:MySQL   点击:(55)  评论:(0)  加入收藏
mysql索引失效的场景
MySQL中索引失效是指数据库查询时无法有效利用索引,这可能导致查询性能显著下降。以下是一些常见的MySQL索引失效的场景:1.使用非前导列进行查询: 假设有一个复合索引 (A, B)。...【详细内容】
2024-01-15  小王爱编程  今日头条  Tags:mysql索引   点击:(88)  评论:(0)  加入收藏
站内最新
站内热门
站内头条