如何实现一个高效的Mysql分页

Mysql的优化是非常重要的。其他最常用也最需要优化的就是limit。Mysql的limit给分页带来了极大的方便,但数据量一大的时候,limit的性能就急剧下降。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

mysql> EXPLAIN SELECT * FROM user ORDER BY id DESC LIMIT 10000, 20;
+----+-------------+-------+-------+---------------+---------+---------+------+-------+-------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+-------------+-------+-------+---------------+---------+---------+------+-------+-------+
| 1 | SIMPLE | user | index | NULL | PRIMARY | 4 | NULL | 10020 | NULL |
+----+-------------+-------+-------+---------------+---------+---------+------+-------+-------+
1 row in set (0.00 sec)

mysql> explain select id,nickname,username,password from user where id > 2500000 order by id limit 10;
+----+-------------+-------+-------+---------------+---------+---------+------+---------+-----------------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+-------------+-------+-------+---------------+---------+---------+------+---------+-----------------------+
| 1 | SIMPLE | user | range | PRIMARY | PRIMARY | 4 | NULL | 2450824 | Using index condition |
+----+-------------+-------+-------+---------------+---------+---------+------+---------+-----------------------+
1 row in set (0.00 sec)

limit 10000,20的意思扫描满足条件的10020行,扔掉前面的10000行,返回最后的20行,问题就在这里,如果是limit 100000,100,需要扫描100100行,在一个高并发的应用里,每次查询需要扫描超过10W行,性能肯定大打折扣。文中还提到limit n性能是没问题的,因为只扫描n行。

有一种叫”clue”的做法,给翻页提供一些”线索”,比如还是SELECT * FROM user ORDER BY id DESC,按id降序分页,每页20条,当前是第10页,当前页条目id最大的是9527,最小的是9500,如果我们只提供”上一页”、”下一页”这样的跳转(不提供到第N页的跳转),那么在处理”上一页”的时候SQL语句可以是:

1
SELECT * FROM user WHERE id > 2500000 ORDER BY id ASC LIMIT 20;

处理”下一页”的时候SQL语句可以是:

1
SELECT * FROM user WHERE id < 9500 ORDER BY id DESC LIMIT 20;

不管翻多少页,每次查询只扫描20行。

缺点是只能提供”上一页”、”下一页”的链接形式,但是我们的产品经理非常喜欢”<上一页 1 2 3 4 5 6 7 8 9 下一页>”这样的链接方式,怎么办呢?

如果LIMIT m,n不可避免的话,要优化效率,只有尽可能的让m小一下,我们扩展前面的”clue”做法,还是SELECT * FROM user ORDER BY id DESC,按id降序分页,每页20条,当前是第10页,当前页条目id最大的是9527,最小的是9500,比如要跳到第8页,我看的SQL语句可以这样写:

1
SELECT * FROM user WHERE id > 9527 ORDER BY id ASC LIMIT 20,20;

跳转到第13页:

1
SELECT * FROM user WHERE id < 9500 ORDER BY id DESC LIMIT 40,20;

原理还是一样,记录住当前页id的最大值和最小值,计算跳转页面和当前页相对偏移,由于页面相近,这个偏移量不会很大,这样的话m值相对较小,大大减少扫描的行数。其实传统的limit m,n,相对的偏移一直是第一页,这样的话越翻到后面,效率越差,而上面给出的方法就没有这样的问题。

注意SQL语句里面的ASC和DESC,如果是ASC取出来的结果,显示的时候记得倒置一下。