MySQL的分頁查詢通常通過limit來實現。limit接收1或2個整數型參數,如果是2個參數,第一個是指定第一個返回記錄行的偏移量,第二個是返回記錄行的最大數目。初始記錄行的偏移量是0。為了與PostgreSQL兼容,limit也支持limit # offset #。
問題:
對于小的偏移量,直接使用limit來查詢沒有什么問題,但隨著數據量的增大,越往后分頁,limit語句的偏移量就會越大,速度也會明顯變慢。
優化思想:避免數據量大時掃描過多的記錄
解決:子查詢的分頁方式或者JOIN分頁方式。JOIN分頁和子查詢分頁的效率基本在一個等級上,消耗的時間也基本一致。
下面舉個例子。一般MySQL的主鍵是自增的數字類型,這種情況下可以使用下面的方式進行優化。
以真實的生產環境的6萬條數據的一張表為例,比較一下優化前后的查詢耗時:
-- 傳統limit,文件掃描[SQL]SELECT * FROM tableName ORDER BY id LIMIT 50000,2;受影響的行: 0時間: 0.171s-- 子查詢方式,索引掃描[SQL]SELECT * FROM tableNameWHERE id >= (SELECT id FROM tableName ORDER BY id LIMIT 50000 , 1)LIMIT 2;受影響的行: 0時間: 0.035s-- JOIN分頁方式[SQL]SELECT * FROM tableName AS t1JOIN (SELECT id FROM tableName ORDER BY id LIMIT 50000, 1) AS t2WHERE t1.id <= t2.id ORDER BY t1.id LIMIT 2;受影響的行: 0時間: 0.036s
可以看到經過優化性能提高了很多倍。
優化原理:
子查詢是在索引上完成的,而普通的查詢時在數據文件上完成的。通常來說,索引文件要比數據文件小得多,所以操作起來也會更有效率。因為要取出所有字段內容,第一種需要跨越大量數據塊并取出,而第二種基本通過直接根據索引字段定位后,才取出相應內容,效率自然大大提升。因此,對limit的優化,不是直接使用limit,而是首先獲取到offset的id,然后直接使用limit size來獲取數據。
在實際項目使用,可以利用類似策略模式的方式去處理分頁。例如,每頁100條數據,判斷如果是100頁以內,就使用最基本的分頁方式;如果大于100,則使用子查詢的分頁方式。
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持武林網。
新聞熱點
疑難解答