我如何調優SQL Server查詢

2024-08-31 00:54:08

字體：大中小

來源：轉載

供稿：網友

我如何調優SQL Server查詢

我是個懶人，我只想干盡可能少的活。當我干活的時候我不想太多。是，你沒看錯，這看起來很糟糕，作為一個DBA這很不合格。但在今天的文章里，我想給你展示下，當你想對特定查詢創建索引設計時，你如何把你的工作和思考過程傳達給查詢優化器。聽起來很有意思？嗯，那就進入我的索引調優世界吧！

有問題的查詢

我們來看下列查詢：

 1 DECLARE @i INT = 999 2 SELECT 3     SalesOrderID,  4     SalesOrderDetailID, 5     CarrierTrackingNumber,  6     OrderQty,  7     LineTotal 8 FROM Sales.SalesOrderDetail 9 WHERE PRoductID < @i10  ORDER BY CarrierTrackingNumber11  GO

如你所見，這里用了一個本地變量與一個不等于謂語來從Sales.SalesOrderDetail表來獲取一些記錄。當你執行那個查詢，看它的執行計劃時，你會發現它有一些嚴重的問題：

SQL Server需要掃描Sales.SalesOrderDetail表的整個非聚集索引，因為沒有支持的非聚集索引。對這個掃描，查詢需要1382個邏輯讀，運行時間近800毫秒。
查詢優化器在查詢計劃里引入了篩選器（Filter）運算符，它進行逐行比較用來檢查符合的行（ProductID < @i）
因為ORDER BY CarrierTrackingNumber，在執行計劃里一個排序（Sort）運算符被引入。
排序運算符蔓延到了TempDb，因為不正確的基數計算（Cardinality Estimation）。用了帶了本地變量與不等于謂語的組合，SQL Server從表的基數硬碼估計30%的行。在我們的情況里估計行數是36395（121317 * 30%）。實際上查詢返回120621行，這意味這排序（Sort）運算符必須蔓延到TempDb，因為請求的內存授予太小了。

現在我問你——你能改善這個查詢么？你的建議是什么？休息下，想個幾分鐘。不修改查詢本身，你如何改善這個查詢？

我們來調試查詢！

當然，我們要做索引相關的調整來改善。沒有支持的非聚集索引，那只能是查詢優化器唯一可以使用計劃來運行我們的查詢。但對這個指定查詢，什么是好的非聚集索引呢？一般來說，我通過看搜索謂語來考慮可能的非聚集索引。在我們的例子里，搜索謂語如下：

WHERE ProductID < @i

我們請求在ProductID列過濾的行。因此我們想在那個列創建支持的非聚集索引。我們建立索引：

1 CREATE NONCLUSTERED INDEX idx_Test ON Sales.SalesOrderDetail(ProductID)2 GO

在非聚集索引創建后，我們需要驗證下改變，因此我們再次執行剛才的查詢代碼。結果如何捏？查詢優化器并沒有使用我們剛創建的非聚集索引！我們在搜索謂語上創建了支持的非聚集索引，查詢優化器沒有引用它？通常人們對此就無轍了。其實我們可以提示查詢優化器來使用非聚集索引，來更好的理解“為什么”查詢優化器沒有自動選擇索引：

 1 DECLARE @i INT = 999 2  3 SELECT 4     SalesOrderID,  5     SalesOrderDetailID, 6     CarrierTrackingNumber,  7     OrderQty,  8     LineTotal 9 FROM Sales.SalesOrderDetail WITH (INDEX(idx_Test))10 WHERE ProductID < @i11  ORDER BY CarrierTrackingNumber12  GO

當你現在看執行計劃時，你會看到下列的野性——一個并行計劃：

查詢花費了370109個邏輯讀！運行時間基本和剛才的一樣。這里到底發生了什么？當你仔細看執行計劃，你會發現查詢優化器引入了書簽查找，因為剛才創建的非聚集索引，對于查詢來說，不是一個覆蓋非聚集索引。查詢越過了所謂的臨界點（Tipping Point），因為我們用當前的搜索謂語來獲得幾乎所有行。因此用非聚集索引和書簽查找來組合沒有意義。

不去想為什么查詢優化器不選擇剛才創建的非聚集索引，我們已經把自己的思路表達給了查詢優化器本身，通過查詢提示進行了詢問了查詢優化器，為什么非聚集索引沒被自動選擇。如我剛開始說的：我不想考慮太多。

使用非聚集索引解決這個問題，在非聚集索引的葉子層，我們必須對從SELECT列表的請求的額外列進行包含。你可以再次看下書簽查找來看下在葉子層哪些列當前丟失：

CarrierTrackingNumber
OrderQty
UnitPrice
UnitDiscountPrice

我們重建那個非聚集索引：

1 CREATE NONCLUSTERED INDEX idx_Test ON Sales.SalesOrderDetail(ProductID)2 INCLUDE (CarrierTrackingNumber, OrderQty, UnitPrice, UnitPriceDiscount)3 WITH4 (5     DROP_EXISTING = ON6 )7 GO

我們已經做出了另1個改變，因此我們可以重新運行了查詢來驗證下。但是這次我們不加查詢提示，因為現在查詢優化器會自動選擇非聚集索引。結果如何捏？當你看執行計劃時，索引現在已被選擇。

SQL Server現在在非聚集索引上進行了查找操作，但在執行計劃里我們還有排序（Sort）運算符。因為基數計算30%的硬編碼，排序（Sort）還是要蔓延到TempDb。偶滴神！我們的邏輯讀已經降到了757，但運行時間還是近800毫秒。你現在應該怎么做？

現在我們可以嘗試在非聚集索引的導航結構直接包含CarrierTrackingNumber列。這是SQL Server進行排序運算符的列。當我們在非聚集索引直接加了這列（作為主鍵），我們就物理排序了那列，因此排序（Sort）運算符應該會消失。作為積極的副作用，也不會蔓延到TempDb。在執行計劃里，現在也沒有運算符關心錯誤的基數計算。因此我們嘗試那個假設，再次重建非聚集索引：

1 CREATE NONCLUSTERED INDEX idx_Test ON Sales.SalesOrderDetail(CarrierTrackingNumber, ProductID)2 INCLUDE (OrderQty, UnitPrice, UnitPriceDiscount)3 WITH4 (5     DROP_EXISTING = ON6 )7 GO

從索引定義可以看到，現在我們已經對CarrierTrackingNumber和ProductID列的數據物理預排序。當你再次重新執行查詢，在你查看執行計劃時，你會看到排序（Sort）運算符已經消失，SQL Server掃描了非聚集索引的整個葉子層（使用剩余謂語（residual predicate）作為搜索謂語）。

這個執行計劃并不壞！我們只需要763個邏輯讀，現在的運行時間已經降至600毫秒。和剛才的相比已經有25%的改善！但是：查詢優化器建議我們一個更好的非聚集索引，通過缺少索引建議（Missing Index Recommendations）！暫且相信下，我們創建建議的非聚集索引：

1 CREATE NONCLUSTERED INDEX [SQL Server doesn't care about names, why I should care about names?]2 ON [Sales].[SalesOrderDetail] ([ProductID])3 INCLUDE ([SalesOrderID],[SalesOrderDetailID],[CarrierTrackingNumber],[OrderQty],[LineTotal])4 GO

當你現在重新執行最初的查詢，你會發現令人驚訝的事情：查詢優化器使用“我們”剛才創建的非聚集索引，缺少索引建議已經消失！