为什么mysql innodDB中组合索引中范围查询后的条件索引会失效?
一、mysql innodDB中组合索引中范围查询后的条件索引会失效的原因
表建立联合索引(a,b,c),查询条件a=1,b>2,c=3,此时c条件的索引会失效。简单点来说,该组合索引是一个以a字段排序而b与c相对有序的B+树,引擎可以通过二分查找定位到a=1的数据,b在a=1确定得情况下是有序的(所以b的有序是相对的),依然可以通过二分查找取出所有b大于2的数据,但这些数据的b字段可能有很多个不同的值,所以c字段是无序的,无法用二分查找来查询c=3的数据,故c用不到索引。
当进行范围查询操作时,MySQL需要对组合索引中的非范围查询条件逐个进行检查,以过滤掉不符合要求的记录,直至扫描到范围查询条件时,由于范围查询操作具有不连续的特点,因此这个范围查询条件之后的记录数据量会变得非常大,通常会超过MySQL的最大行数限制,这就导致了MySQL放弃使用这个组合索引,而改为全表扫描(full table scan)来获取结果。这也是为什么范围查询操作容易导致MySQL查询性能降低的原因之一。
例如存在索引数据如:(a=1,b=3,c=3),(a=1,b=4,c=0),(a=1,b=4,c=3),(a=1,b=4,c=0)。上述数据均满足a=1&b>2,但是c的数据却不是连续的,所以没有办法通过c索引进行过滤,所以字段c并不能够参与到索引刷选中。
二、组合索引
1、组合索引的使用
本文中组合索引的定义为(MySQL):
ALTER TABLE table_name ADD INDEX (col1,col2,col3);
2、组合索引的本质
当创建(col1,col2,col3)组合索引时,相当于创建了(col)单列索引,(clo1,clo2)组合索引以及(col1,col2,col3)组合索引想要索引生效,只能使用col1和col1,col2和col1,col2,col3三种组合;当然,col1,col3组合也可以,但实际上只用到了col1的索引,col3并没有用到。
3、示例
组合索引相当于一个按照姓氏——名字的一个电话簿,只能先确定姓氏才可以命中索引,下列可以正确命中组合索引的语句( = 和IN直接的字段都可以乱序,MySQL的查询优化器可以优化成索引识别的形式)
使用到索引的情况如下:
col_a = "some value"col_a = "some value" and col_b = "some value"col_a = "some value" and col_c = "some value"col_a = "some value" and col_b = "some value" and col_c = "some value"col_a = "some value" and col_c = "some value" and col_b = "some value"col_b = "some value" and col_a = "some value" and col_c = "some value"col_b = "some value" and col_c = "some value" and col_a = "some value"col_c = "some value" and col_a = "some value" and col_b = "some value"col_c = "some value" and col_b = "some value" and col_a = "some value"
未使用索引的情况:
col_b = "some value"col_c = "some value"col_b = "some value" and col_c = "some value"col_c = "some value" and col_b = "some value"
总结,组合索引从最左开始组合,只要包含名列前茅列的查询都会用到该组合索引。
4、为什么要使用组合索引
减少开销:建一个联合索引(col1,col2,col3),实际相当于建了(col1),(col1,col2),(col1,col2,col3)三个索引。每多一个索引,都会增加写操作的开销和磁盘空间的开销。对于大量数据的表,使用组合索引会大大的减少开销。覆盖索引:对组合索引(col1,col2,col3),如果有如下的sql: select col1,col2,col3 from test where col1=1 and col2=2。那么MySQL可以直接通过遍历索引取得数据,而无需回表,这减少了很多的随机io操作。减少io操作,特别的随机io其实是dba主要的优化策略。所以,在真正的实际应用中,覆盖索引是主要的提升性能的优化手段之一。效率高:索引列越多,通过索引筛选出的数据越少。5、SQL中组合索引和普通索引区别
组合索引中列的顺序非常重要,从左原则:a,ab,ba,abc。
单个索引:一个一个起作用,也就是说有三个单个索引,哪个条件查询在前哪个起作用,其他不起作用。
结论:
一般来说,列表搜索需要多个列查询,此时就可以使用联合索引,都是and的关系。什么时候需要创建索引:
where条件会经常出现的,并且当前表的数量比较大。where条件中是用and而非or的时候。组合索引比单个索引更适合,因为索引占用一定磁盘空间,也就说明有一定的开销,如果多个单个索引比较多,那么多资源的浪费也比较多,组合索引相当于对多个列建索引,并且只建一次,and条件下非常适合。延伸阅读1:MySQL简介
MySQL是一个关系型数据库管理系统,由瑞典MySQL AB 公司开发,属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一,在 WEB 应用方面,MySQL是较好的 RDBMS (Relational Database Management System,关系数据库管理系统) 应用软件之一。

相关推荐HOT
更多>>
为什么TDD是敏捷的核心实践?
一、提高软件质量TDD的核心思想是在编写功能代码之前,先编写测试代码,并通过测试代码来驱动功能代码的编写。这种测试驱动的开发方式有助于提...详情>>
2023-10-15 22:30:43
什么是Android逆向?
一、Android逆向的概念Android逆向指的是对Android应用进行逆向分析、破解和修改的过程。逆向工程是通过分析应用程序的二进制代码、数据和文件...详情>>
2023-10-15 17:31:51
MySQL文档说`decimal` 的最大位数是 `65`,什么意思?
一、MySQL文档说decimal 的最大位数是 65,什么意思DECIMAL从MySQL 5.1引入,列的声明语法是DECIMAL (M,D)。NUMERIC与DECIMAL同义,如果字段类...详情>>
2023-10-15 16:14:32
Oracle数据库运行越来越慢,应该怎么优化?
一、Oracle数据库运行越来越慢的优化方法1、应用层优化应用程序的设计和开发中,可以采用合理的数据查询语句来减少数据库的 I/O 操作次数,例如...详情>>
2023-10-15 15:48:10热门推荐
为什么公司内同级别的管理岗要比技术岗收入高?
沸Prince2跟pmp有什么区别?
热JAVA为什么要用多态,什么是多态?
热为什么TDD是敏捷的核心实践?
新番茄工作法的优点和缺陷都有哪些?
Go语言标准库中最常用的标识符是什么?
C语言和其他高级语言的最大区别是什么?
为什么大数据系统会部分取代关系型数据库?
怎么利用hadoop搭建自己的云计算?
MYSQL的幻读和我们平常说的幻读有什么区别?
BIOS、UEFI、MBR、GPT、GRUB是什么?
在sql语言中,数据操纵与数据控制有何区别?
gzip解压NR库的时候,报错格式违法怎么办?
什么是Android逆向?
技术干货






