亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 數據庫 > MongoDB > 正文

關于MongoDB謹防索引seek的效率問題詳析

2020-10-29 18:41:02
字體:
來源:轉載
供稿:網友

背景

最近線上的一個工單分析服務一直不大穩定,監控平臺時不時發出數據庫操作超時的告警。

運維兄弟溝通后,發現在每天凌晨1點都會出現若干次的業務操作失敗,而數據庫監控上并沒有發現明顯的異常。

在該分析服務的日志中發現了某個數據庫操作產生了 SocketTimeoutException。

開發同學一開始希望通過調整 MongoDB Java Driver 的超時參數來規避這個問題。
但經過詳細分析之后,這樣是無法根治問題的,而且超時配置應該如何調整也難以評估。

下面是關于對這個問題的分析、調優的過程。

初步分析

從出錯的信息上看,是數據庫的操作響應超時了,此時客戶端配置的 SocketReadTimeout 為 60s。
那么,是什么操作會導致數據庫 60s 還沒能返回呢?

業務操作

左邊的數據庫是一個工單數據表(t_work_order),其中記錄了每張工單的信息,包括工單編號(oid)、最后修改時間(lastModifiedTime)

分析服務是Java實現的一個應用程序,在每天凌晨1:00 會拉取出前一天修改的工單信息(要求按工單號排序)進行處理。

由于工單表非常大(千萬級),所以在處理時會采用分頁的做法(每次取1000條),使用按工單號翻頁的方式:

第一次拉取

db.t_work_order.find({  "lastModifiedTime":{   $gt: new Date("2019-04-09T09:44:57.106Z"),   $lt: new Date("2019-04-09T10:44:57.106Z")},   "oid": {$exists: true}})  .sort({"oid":1}).limit(1000)

第二次拉取,以第一次拉取的最后一條記錄的工單號作為起點

db.t_work_order.find({  "lastModifiedTime":{   $gt: new Date("2019-04-09T09:44:57.106Z"),   $lt: new Date("2019-04-09T10:44:57.106Z")},   "oid": {$exists: true, $gt: "VXZ190"}})  .sort({"oid":1}).limit(1000)..

根據這樣的查詢,開發人員給數據表使用的索引如下:

db.t_work_order.ensureIndexes({  "oid" : 1,  "lastModifiedTime" : -1})

盡管該索引與查詢字段基本是匹配的,但在實際執行時卻表現出很低的效率:
第一次拉取時間非常的長,經常超過60s導致報錯,而后面的拉取時間則會快一些

為了精確的模擬該場景,我們在測試環境中預置了小部分數據,對拉取記錄的SQL執行Explain:

db.t_work_order.find({  "lastModifiedTime":{   $gt: new Date("2019-04-09T09:44:57.106Z"),   $lt: new Date("2019-04-09T10:44:57.106Z")}  "oid": {$exists: true}})  .sort({"oid":1}).limit(1000)  .explain("executionStats")

輸出結果如下

"nReturned" : 1000,
"executionTimeMillis" : 589,
"totalKeysExamined" : 136661,
"totalDocsExamined" : 1000,

...

"indexBounds" : {
    "oid" : [
        "[MinKey, MaxKey]"
    ],
    "lastModifiedTime" : [
        "(new Date(1554806697106), new Date(1554803097106))"
    ]
},
"keysExamined" : 136661,
"seeks" : 135662,

在執行過程中發現,檢索1000條記錄,居然需要掃描 13.6 W條索引項!

其中,幾乎所有的開銷都花費在了 一個seeks操作上了。

索引seeks的原因

官方文檔對于 seeks 的解釋如下:

The number of times that we had to seek the index cursor to a new position in order to complete the index scan.

翻譯過來就是:

seeks 是指為了完成索引掃描(stage),執行器必須將游標定位到新位置的次數。

我們都知道 MongoDB 的索引是B+樹的實現(3.x以上),對于連續的葉子節點掃描來說是非??斓?只需要一次尋址),那么seeks操作太多則表示整個掃描過程中出現了大量的尋址(跳過非目標節點)。
而且,這個seeks指標是在3.4版本支持的,因此可以推測該操作對性能是存在影響的。

為了探究 seeks 是怎么產生的,我們對查詢語句嘗試做了一些變更:

去掉 exists 條件

exists 條件的存在是因為歷史問題(一些舊記錄并不包含工單號的字段),為了檢查exists查詢是否為關鍵問題,修改如下:

db.t_work_order.find({  "lastModifiedTime":{   $gt: new Date("2019-04-09T09:44:57.106Z"),   $lt: new Date("2019-04-09T10:44:57.106Z")}  })  .sort({"oid":1}).limit(1000)  .explain("executionStats")

執行后的結果為:

"nReturned" : 1000,
"executionTimeMillis" : 1533,
"totalKeysExamined" : 272322,
"totalDocsExamined" : 272322,
 
...

"inputStage" : {
  "stage" : "FETCH",
  "filter" : {
      "$and" : [
          {
              "lastModifiedTime" : {
                  "$lt" : ISODate("2019-04-09T10:44:57.106Z")
              }
          },
          {
              "lastModifiedTime" : {
                  "$gt" : ISODate("2019-04-09T09:44:57.106Z")
              }
          }
      ]
},

...

"indexBounds" : {
    "oid" : [
        "[MinKey, MaxKey]"
    ],
    "lastModifiedTime" : [
        "[MaxKey, MinKey]"
    ]
},
"keysExamined" : 272322,
"seeks" : 1,

這里發現,去掉 exists 之后,seeks 變成了1次,但整個查詢掃描了 27.2W 條索引項! 剛好是去掉之前的2倍。

seeks 變為1次說明已經使用了葉節點順序掃描的方式,然而由于掃描范圍非常大,為了找到目標記錄,會執行順序掃描并過濾大量不符合條件的記錄。

在 FETCH 階段出現了 filter可說明這一點。與此同時,我們檢查了數據表的特征:同一個工單號是存在兩條記錄的!于是可以說明:

在存在exists查詢條件時,執行器會選擇按工單號進行seeks跳躍式檢索,如下圖:


在不存在exists條件的情況下,執行器選擇了葉節點順序掃描的方式,如下圖:


gt 條件和反序

除了第一次查詢之外,我們對后續的分頁查詢也進行了分析,如下:

db.t_work_order.find({  "lastModifiedTime":{   $gt: new Date("2019-04-09T09:44:57.106Z"),   $lt: new Date("2019-04-09T10:44:57.106Z")},   "oid": {$exists: true, $gt: "VXZ190"}})  .sort({"oid":1}).limit(1000)  .explain("executionStats")

上面的語句中,主要是增加了$gt: "VXZ190"這一個條件,執行過程如下:

"nReturned" : 1000,"executionTimeMillis" : 6,"totalKeysExamined" : 1004,"totalDocsExamined" : 1000,..."indexBounds" : {  "oid" : [     "(/"VXZ190/", {})"  ],  "lastModifiedTime" : [     "(new Date(1554806697106), new Date(1554803097106))"  ]},"keysExamined" : 1004,"seeks" : 5,

可以發現,seeks的數量非常少,而且檢索過程只掃描了1004條記錄,效率是很高的。

那么,是不是意味著在后面的數據中,滿足查詢的條件的記錄非常密集呢?

為了驗證這一點,我們將一開始第一次分頁的查詢做一下調整,改為按工單號降序的方式(從后往前掃描):

db.t_work_order.find({  "lastModifiedTime":{   $gt: new Date("2019-04-09T09:44:57.106Z"),   $lt: new Date("2019-04-09T10:44:57.106Z")},   "oid": {$exists: true}})  .sort({"oid":-1}).limit(1000)  .explain("executionStats")

新的"反序查詢語句"的執行過程如下:

"nReturned" : 1000,"executionTimeMillis" : 6,"totalKeysExamined" : 1001,"totalDocsExamined" : 1000,..."direction" : "backward","indexBounds" : {  "oid" : [     "[MaxKey, MinKey]"  ],  "lastModifiedTime" : [     "(new Date(1554803097106), new Date(1554806697106))"  ]},"keysExamined" : 1001,"seeks" : 2,

可以看到,執行的效率更高了,幾乎不需要什么 seeks 操作!

經過一番確認后,我們獲知了在所有數據的分布中,工單號越大的記錄其更新時間值也越大,基本上我們想查詢的目標數據都集中在尾端。

于是就會出現一開始提到的,第一次查詢非常慢甚至超時,而后面的查詢就快了。

上面提到的兩個查詢執行路線如圖所示:

加入$gt 條件,從中間開始檢索


反序,從后面開始檢索


優化思路

通過分析,我們知道了問題的癥結在于索引的掃描范圍過大,那么如何優化,以避免掃描大量記錄呢?

從現有的索引及條件來看,由于同時存在gt、exists以及葉子節點的時間范圍限定,不可避免的會產生seeks操作,
而且查詢的性能是不穩定的,跟數據分布、具體查詢條件都有很大的關系。

于是一開始所提到的僅僅是增加 socketTimeout 的閾值可能只是治標不治本,一旦數據的索引值分布變化或者數據量持續增大,可能會發生更嚴重的事情。

回到一開始的需求場景,定時器要求讀取每天更新的工單(按工單號排序),再進行分批處理。

那么,按照化零為整的思路,新增一個lastModifiedDay字段,這個存儲的就是lastModifiedTime對應的日期值(低位取整),這樣在同一天內更新的工單記錄都有同樣的值。

建立組合索引 {lastModifiedDay:1, oid:1},相應的查詢條件改為:

{ "lastModifiedDay": new Date("2019-04-09 00:00:00.000"), "oid": {$gt: "VXZ190"}} -- limit 1000

執行結果如下:

"nReturned" : 1000,
"executionTimeMillis" : 6,
"totalKeysExamined" : 1000,
"totalDocsExamined" : 1000,

...

"indexBounds" : {
    "lastModifiedDay" : [
        "(new Date(1554803000000), new Date(1554803000000))"
    ],
    "oid" : [
        "(/"VXZ190/", {})"
    ]
},
"keysExamined" : 1000,
"seeks" : 1,

這樣優化之后,每次查詢最多只掃描1000條記錄,查詢速度是非??斓?!

小結

本質上,這就是一種空間換時間的方法,即通過存儲一個額外的索引字段來加速查詢,通過增加少量的存儲開銷提升了整體的效能。

在對于許多問題進行優化時,經常是需要從應用場景觸發,適當的轉換思路。

比如在本文的問題中,是不是一定要增加字段呢?如果業務上可以接受不按工單號排序進行讀取,那么僅使用更新時間字段進行分頁拉取也是可以達到效果的,具體還是要由業務場景來定。

總結

以上就是這篇文章的全部內容了,希望本文的內容對大家的學習或者工作具有一定的參考學習價值,謝謝大家對武林網的支持。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb
91麻豆国产语对白在线观看| 精品国产欧美一区二区三区成人| 欧美插天视频在线播放| 国产成人精品在线视频| 日韩成人在线播放| 亚洲精品国偷自产在线99热| 亚洲欧美一区二区精品久久久| 国产成人一区二区在线| 欧美野外wwwxxx| 国产日韩精品一区二区| 亚洲成av人影院在线观看| 91av在线精品| 国产精品视频播放| 成人夜晚看av| 欧美与黑人午夜性猛交久久久| 精品国产乱码久久久久久婷婷| 欧美精品国产精品日韩精品| 成人久久精品视频| 欧美国产欧美亚洲国产日韩mv天天看完整| 精品国产欧美一区二区五十路| 国产日韩在线看| 国内精品400部情侣激情| 亚洲国产精品va在线| 亚洲欧美一区二区三区情侣bbw| 国产精品私拍pans大尺度在线| 在线精品高清中文字幕| 国产成人精品a视频一区www| 久久免费福利视频| 亚洲精品一区av在线播放| 亚洲人成在线播放| 亚洲成人激情图| 国产一区二区av| 国产一区二区在线免费视频| 亚洲韩国欧洲国产日产av| 国产一区二区三区毛片| 91色在线视频| 日韩在线视频观看正片免费网站| 57pao成人国产永久免费| 福利视频第一区| 日本成人精品在线| 欧洲午夜精品久久久| 国产69精品久久久久9| 亚洲三级免费看| 91人人爽人人爽人人精88v| 久久人人爽国产| 在线观看日韩www视频免费| 国产91精品久久久久| 久久精品成人一区二区三区| 91视频-88av| 欧美电影免费观看网站| 国产精品草莓在线免费观看| 日日噜噜噜夜夜爽亚洲精品| 国产亚洲欧洲高清一区| 久久久久久久久91| 国产成一区二区| 国产成人av在线| 亚洲国产精彩中文乱码av在线播放| 久久香蕉国产线看观看网| 日韩性xxxx爱| 国产精品久久久久久久久久99| 日韩在线视频观看正片免费网站| 欧美另类交人妖| 日韩人体视频一二区| 亚洲系列中文字幕| 久久男人的天堂| 欧美国产日韩中文字幕在线| 高清欧美性猛交| 狠狠躁天天躁日日躁欧美| 91探花福利精品国产自产在线| 精品自拍视频在线观看| 久久久噜噜噜久久久| 国产亚洲精品综合一区91| 国产欧美日韩专区发布| 国产精品极品美女粉嫩高清在线| 国产又爽又黄的激情精品视频| 欧美激情在线观看视频| 在线成人激情黄色| 精品久久久久久国产| 最近日韩中文字幕中文| 欧美激情久久久久| 97视频色精品| 久久频这里精品99香蕉| 一本色道久久综合狠狠躁篇怎么玩| 81精品国产乱码久久久久久| 美女福利视频一区| 最近中文字幕mv在线一区二区三区四区| 久久久久久午夜| 亚洲天堂av在线免费| 91在线视频精品| 91精品国产综合久久久久久蜜臀| 国产99久久精品一区二区 夜夜躁日日躁| 日韩av在线导航| 久久视频国产精品免费视频在线| 最好看的2019年中文视频| 中文字幕日韩视频| 精品欧美激情精品一区| 国产精品视频在线播放| 51精品国产黑色丝袜高跟鞋| 欧美日韩免费网站| 久久综合亚洲社区| 亚洲国产古装精品网站| 日韩在线高清视频| 欧美理论电影在线播放| 2020欧美日韩在线视频| 国产一区二区日韩精品欧美精品| 欧美一级电影久久| 日韩电影中文字幕| 18一19gay欧美视频网站| 亚洲日本中文字幕| 欧美激情奇米色| 热草久综合在线| 亚洲精品美女免费| 久久久久久噜噜噜久久久精品| 国产精品视频午夜| 亚洲大胆人体av| 伊人一区二区三区久久精品| 国产精品扒开腿爽爽爽视频| 亚洲精品久久久久久久久久久久| 日韩大陆欧美高清视频区| 亚洲天堂av电影| 国产一区在线播放| 日韩电影中文 亚洲精品乱码| 国产精品欧美在线| 91成人福利在线| 亚洲视频一区二区| 日韩欧美精品网址| 国产不卡一区二区在线播放| 一本一道久久a久久精品逆3p| 国产日韩av在线播放| 国产精品美女主播在线观看纯欲| 国产一区私人高清影院| 国产精品一区二区三区免费视频| 全色精品综合影院| 97精品伊人久久久大香线蕉| 超碰精品一区二区三区乱码| 欧美激情免费看| 久久精品亚洲一区| 欧美日韩国产成人在线| 欧美人交a欧美精品| 国产精品视频专区| 在线精品国产欧美| 亚洲色图综合久久| 久久久久国产视频| 最新国产成人av网站网址麻豆| 日韩高清电影免费观看完整版| 美女啪啪无遮挡免费久久网站| 日本韩国欧美精品大片卡二| 91免费视频国产| 午夜精品久久久久久久99热浪潮| 亚洲美女性生活视频| 日韩av在线一区二区| 久久成人免费视频| 欧美国产高跟鞋裸体秀xxxhd| 91成人精品网站| 色噜噜久久综合伊人一本| 色在人av网站天堂精品| 6080yy精品一区二区三区| 欧美孕妇性xx| 国产一区二区三区在线播放免费观看| 国产精品久久久久久av| 91在线观看欧美日韩| 色多多国产成人永久免费网站| 中文字幕在线视频日韩| 国产精品视频26uuu|