本文給大家分享的是個人在對mysql數據進行刷新的時候遇到的一個效率非常低下的問題的解決全過程,主要是針對sql語句來進行優化,有查找問題的方法,有解決方法,非常的詳細,小伙伴可以參考下。
引言
今天(August 5, 2015 5:34 PM)在給數據庫中一張表的結構做一次調整,添加了幾個字段,后面對之前的數據進行刷新,刷新的內容是:對其中的一個已有字段url進行匹配,然后更新新加的字段type和typeid。后來就寫了個shell腳本來刷數據,結果運行shell腳本后我就懵了,怎么這么慢~~~
情景再現
- CREATE TABLE `fuckSpeed` (
- `uin` bigint(20) unsigned NOT NULL DEFAULT 0,
- `id` int(11) unsigned NOT NULL DEFAULT 0,
- `url` varchar(255) NOT NULL DEFAULT '',
- `type` int(11) unsigned NOT NULL DEFAULT 0,
- `typeid` varchar(64) NOT NULL DEFAULT '',
- ......
- KEY `uin_id` (`uin`,`id`)
- ) ENGINE=InnoDB DEFAULT CHARSET=utf8;
表結構大概是上面這樣的(省略了好多字段),表中只有一個聯合索引uin_id,而我在更新的時候是下面的思路:
首先根據一個id范圍獲取到一定數量的數據
- select id,url from funkSpeed where id>=101 and id<=200;
遍歷所有的數據,對每一條數據進行更新
#首先對數據進行處理,匹配獲取type和typeid
- update fuckSpeed set type=[type],typeid=[typeid] where id=[id]
按照上面的思路搞了之后,發現更新特別的慢,平均每秒鐘3~5個左右,我也是醉了,我看看要更新的數據,總共有32w+條,這樣更新下來大概需要24h+,也就是1天還要多,額~~哭了,想想肯定是哪里出問題了。
發現問題
首先我想到的是是不是因為只有一個進程在更新,導致很慢,我啟動了5個進程,將id分段了,就像下面這樣
- ./update_url.sh 0 10000 &
- ./update_url.sh 10000 20001 &
- ./update_url.sh 20001 30001 &
- ./update_url.sh 30002 40002 &
- ./update_url.sh 40003 50003 &
運行之后發現還是那樣,速度沒有提升多少,還是每秒鐘更新3~5個左右,想想也是啊,時間不可能花費在插入數據之前的那些步驟(匹配、組裝sql語句、。。。),應該是插入的時候有問題
再來看看我的sql語句select id,url from funkSpeed where id>=101 and id<=200;,這里,試著在命令行執行了下,結果如下
- mysql> select id,url from funkSpeed where id>=0 and id<=200;
- Empty set (0.18 sec)
竟然花了0.18秒,這個時候我猜恍然大悟,聯合索引我沒有使用到,聯合索引生效的條件是——必須要有左邊的字段,用explain驗證下,果然是這樣:
- mysql> explain id,url from funkSpeed where id>=0 and id<=200;
- +-------------+------+---------------+------+---------+------+--------+-------------+
- | table | type | possible_keys | key | key_len | ref | rows | Extra |
- +-------------+------+---------------+------+---------+------+--------+-------------+
- | funkSpeed | ALL | NULL | NULL | NULL | NULL | 324746 | Using where |
- +-------------+------+---------------+------+---------+------+--------+-------------+
- 1 row in set (0.00 sec)
然后使用聯合索引:
- mysql> select uin,id from funkSpeed where uin=10023 and id=162;
- +------------+----------+
- | uin | id |
- +------------+----------+
- | 10023 | 162 |
- +------------+----------+
- 1 row in set (0.00 sec)
- mysql> explain select uin,id from funkSpeed where uin=10023 and id=162;
- +-------------+------+---------------+----------+---------+-------------+------+-------------+
- | table | type | possible_keys | key | key_len | ref | rows | Extra |
- +-------------+------+---------------+----------+---------+-------------+------+-------------+
- | funkSpeed | ref | uin_id | uin_id | 12 | const,const | 4 | Using index |
- +-------------+------+---------------+----------+---------+-------------+------+-------------+
- 1 row in set (0.00 sec)
可以看到幾乎是秒查,這個時候基本可以斷定問題是出現在索引這個地方了
我select的時候次數比較少,每兩個select之間id相差10000,所以這里可以忽略掉,而且這里沒辦法優化,除非在id上面添加索引。
問題發生在update fuckSpeed set type=[type],typeid=[typeid] where id=[id],這里在更新的時候也是會用到查詢的,我的mysql版本是5.5,不能explain update,不然肯定可以驗證我所說的,這里要更新32w+條數據,每條數據都會去更新,每條數據0.2s左右,這太嚇人了~~
解決問題
問題找到了,解決起來就容易多了~~
select的時候加了一個字段uin,改為下面這樣select uin,id,url from funkSpeed where id>=101 and id<=200;,然后更新的時候使用update fuckSpeed set type=[type],typeid=[typeid] where uin=[uin] id=[id],這樣一來索引就是用上了。
三下五除二改好了代碼,試著啟動了一個進程,看看效果如何,果然,效果提升的不是一點點,平均30+次/s,這樣大概3個小時左右就可以完成所有的更新了。
總結Mysql語句級優化:
1. 性能查的讀語句,在innodb中統計行數,建議另外弄一張統計表,采用myisam,定期做統計.一般的對統計的數據不會要求太精準的情況下適用。
2. 盡量不要在數據庫中做運算。
3. 避免負向查詢和%前綴模糊查詢。
4. 不在索引列做運算或者使用函數。
5. 不要在生產環境程序中使用select * from 的形式查詢數據。只查詢需要使用的列。
6. 查詢盡可能使用limit減少返回的行數,減少數據傳輸時間和帶寬浪費。
7. where子句盡可能對查詢列使用函數,因為對查詢列使用函數用不到索引。
8. 避免隱式類型轉換,例如字符型一定要用'',數字型一定不要使用''。
9. 所有的SQL關鍵詞用大寫,養成良好的習慣,避免SQL語句重復編譯造成系統資源的浪費。
10. 聯表查詢的時候,記得把小結果集放在前面,遵循小結果集驅動大結果集的原則。
11. 開啟慢查詢,定期用explain優化慢查詢中的SQL語句。
新聞熱點
疑難解答