高性能的MySQL(5)索引策略一聚簇索引

本文涉及的产品
云数据库 RDS MySQL Serverless,0.5-2RCU 50GB
简介:

聚簇索引,并不是一种单独的索引类型,而是一种数据存储方式。InnoDB的聚簇索引实际上在同一个结构中保存了B-Tree索引和数据行信息。

因为无法把数据行存放在两个不同的地方,所以一个表只能有一个聚簇索引(不过可以通过覆盖索引来模拟,稍后再介绍)。

这里主要讨论InnoDB引擎,InnoDB通过主键聚集数据,如果没有主键会选择一个非空的唯一索引,如果还没有,InnoDB会隐式定义一个主键来作为聚簇索引。

聚簇索引是一把双刃剑,要仔细考虑。

优点:

1、可以把相关数据保存在一起,例如实现电子邮件时,根据用户ID来聚集数据,这样只需要从磁盘都去少量数据页就可以获取某个用户的全部邮件,如果没有聚簇索引,则每封邮件都可能导致一次I/O

2、数据访问更快。因为索引和数据都在一个B-Tree中。

3、使用聚簇索引的查询,可以直接使用页节点中的主键值。

缺点:

1、聚簇索引最大限度的提高了I/O密集型应用的性能,如果数据都放在内存中了,优势就没了。

2、插入速度严重依赖于插入顺序,按照主键的顺序插入到数据表中速度是最快的。如果不是,插入完数据之后最好使用OPTIMIZE TABLE命令组织一下。

3、更新聚簇索引列的代价很高,因为需要移动新的数据。

4、在插入新行,或者主键更新需要移动行的时候,可能导致页分裂,从而导致占用更多的磁盘空间。

5、二级索引(非聚簇)可能比想象的要大,因为二级索引的叶子节点中包含了引用行的主键列。

6、二级索引访问需要2次索引查找,而不是一次,因为二级索引保存的不是行的物理位置,而是主键值。


InnoDB和MyISAM数据分布对比。

1
2
3
4
5
6
CREATE  TABLE  `layout_test` (
   `col1`  int (11)  NOT  NULL ,
   `col2`  int (11)  NOT  NULL ,
   PRIMARY  KEY  (`col1`),
   KEY  `col2` (`col2`)
);

主键不是递增的,随机顺序插入,col2随即复制,重复的很多。

MyISAM比较简单,他按照数据插入的顺序存储在磁盘上。

161656641.png

col2索引没有什么区别。

InnoDB支持聚簇索引,所以存储方式非常不同

162133965.png

会发现,该图显示了整个表,而不是只有索引。因为InnoDB中,聚簇索引“就是”表,所以不会像MyISAM那样需要独立的行存储。

即使主键是一个前缀索引,聚簇索引也会包含完整的主键列和其他列。

还有一点和MyISAM不同,InnoDB的二级索引和聚簇索引很不相同,InnoDB二级索引的叶子节点中存储的不是行指针,而是主键值,这样就减少了移动数据或者页分裂时对二级索引的维护工作。使用主键占用的空间更多,但是无需更新二级索引。

164728177.png


下图更直接的展示了两者的区别。

164947761.png


如果在使用InnoDB表,并且没有数据需要聚集,那么可以定义一个和应用无关的主键,按主键顺序插入行,最好使用AUTO_INCREMENT,避免使用随机并且范围很大的聚簇索引,这会使聚簇索引的插入变得完全随机,不仅花费时间更长,而且索引占用空间也会更大。


对于高并发的工作负载,在InnoDB中按主键顺序插入可能造成明显的争用,主键的上界会成为“热点”,因为插入都发生在这里,造成锁竞争,另一个热点可能是AUTO_INCREMENT锁机制,对于比较新的版本更改innodb_autoinc_lock_mode配置,可能会工作的更好。




















本文转自shayang8851CTO博客,原文链接:http://blog.51cto.com/janephp/1310976,如需转载请自行联系原作者

相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
3天前
|
存储 关系型数据库 MySQL
《MySQL 简易速速上手小册》第3章:性能优化策略(2024 最新版)
《MySQL 简易速速上手小册》第3章:性能优化策略(2024 最新版)
26 2
|
13天前
|
关系型数据库 MySQL 索引
mysql 分析5语句的优化--索引添加删除
mysql 分析5语句的优化--索引添加删除
12 0
|
19天前
|
存储 关系型数据库 MySQL
轻松入门MySQL:优化进销存管理,掌握MySQL索引,提升系统效率(11)
轻松入门MySQL:优化进销存管理,掌握MySQL索引,提升系统效率(11)
|
13天前
|
SQL 缓存 关系型数据库
mysql性能优化-慢查询分析、优化索引和配置
mysql性能优化-慢查询分析、优化索引和配置
79 1
|
6天前
|
存储 运维 关系型数据库
高性能 MySQL 第四版(GPT 重译)(四)(2)
高性能 MySQL 第四版(GPT 重译)(四)
40 4
|
6天前
|
存储 缓存 关系型数据库
高性能 MySQL 第四版(GPT 重译)(三)(1)
高性能 MySQL 第四版(GPT 重译)(三)
49 4
|
10天前
|
存储 关系型数据库 MySQL
【MySQL实战笔记】 04 | 深入浅出索引(上)-02
【4月更文挑战第9天】InnoDB数据库使用B+树作为索引模型,其中主键索引的叶子节点存储完整行数据,非主键索引则存储主键值。主键查询只需搜索一棵树,而非主键查询需两次搜索,因此推荐使用主键查询以提高效率。在插入新值时,B+树需要维护有序性,可能导致数据页分裂影响性能。自增主键在插入时可避免数据挪动和页分裂,且占用存储空间小,通常更为理想。然而,如果场景仅需唯一索引,可直接设为主键以减少查询步骤。
13 1
【MySQL实战笔记】 04 | 深入浅出索引(上)-02
|
12天前
|
关系型数据库 MySQL 数据库
6. 了解过Mysql的索引嘛 ?
了解MySQL的索引类型,包括单列索引(普通、唯一、主键和全文索引)和组合索引。单列索引用于一列,如普通索引允许重复值,唯一索引和主键索引不允许,后者不允许空值。全文索引适用于特定文本字段。组合索引是多列的,遵循左前缀原则,通常推荐用于提高查询效率,除非是主键。
12 0
|
15天前
|
关系型数据库 MySQL 数据库
mysql卸载、下载、安装(window版本)
mysql卸载、下载、安装(window版本)
|
1月前
|
关系型数据库 MySQL 数据库
rds安装数据库客户端工具
安装阿里云RDS的数据库客户端涉及在本地安装对应类型(如MySQL、PostgreSQL)的客户端工具。对于MySQL,可选择MySQL Command-Line Client或图形化工具如Navicat,安装后输入RDS实例的连接参数进行连接。对于PostgreSQL,可以使用`psql`命令行工具或图形化客户端如PgAdmin。首先从阿里云控制台获取连接信息,然后按照官方文档安装客户端,最后配置客户端连接以确保遵循安全指引。
82 1