亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 數據庫 > SQL Server > 正文

SQL Server索引的原理深入解析

2024-08-31 01:05:23
字體:
來源:轉載
供稿:網友

前言

此文是我之前的筆記整理而來,以索引為入口進行探討相關數據庫知識(又做了修改以讓人更好消化)。SQL Server接觸不久的朋友可以只看以下藍色字體字,簡單有用節省時間;如果是數據庫基礎不錯的朋友,可以全看,歡迎探討。

索引的概念

索引的用途:我們對數據查詢及處理速度已成為衡量應用系統成敗的標準,而采用索引來加快數據處理速度通常是最普遍采用的優化方法。

索引是什么:數據庫中的索引類似于一本書的目錄,在一本書中使用目錄可以快速找到你想要的信息,而不需要讀完全書。在數據庫中,數據庫程序使用索引可以重啊到表中的數據,而不必掃描整個表。書中的目錄是一個字詞以及各字詞所在的頁碼列表,數據庫中的索引是表中的值以及各值存儲位置的列表。

索引的利弊:查詢執行的大部分開銷是I/O,使用索引提高性能的一個主要目標是避免全表掃描,因為全表掃描需要從磁盤上讀取表的每一個數據頁,如果有索引指向數據值,則查詢只需要讀少數次的磁盤就行啦。所以合理的使用索引能加速數據的查詢。但是索引并不總是提高系統的性能,帶索引的表需要在數據庫中占用更多的存儲空間,同樣用來增刪數據的命令運行時間以及維護索引所需的處理時間會更長。所以我們要合理使用索引,及時更新去除次優索引。

1.聚集索引和非聚集索引

索引分為聚集索引和非聚集索引

1.1 聚集索引

表的數據是存儲在數據頁中(數據頁的PageType標記為1),SqlServer一頁是8k,存滿一頁就開辟下一頁存儲。如果表有聚集索引,那么一筆一筆物理數據就是按聚集索引字段的大小升/降排序存儲在頁中。當對聚集索引字段更新或中間插入/刪除數據時,都會導致表數據移動(造成性能一定影響),因為它要保持升/降排序。

注意,主鍵只是默認是聚集索引,它也可以設置為非聚集索引,也可以在非主鍵字段上設置為聚集索引,全表只能有一個聚集索引。

一個優秀的聚集索引字段一般包含以下4個特性:

(A).自增長

總是在末尾增加記錄,減少分頁和索引碎片。

(B).不被更改

減少數據移動。

(C).唯一性

唯一性是任何索引最理想的特性,可以明確索引鍵值在排序中的位置。

更重要的是,索引鍵指唯一的話,它在每條記錄里才可以正確指向源數據行RID。如果聚集索引鍵值不唯一,SqlServer就需要內部生成uniquifier 列組合當作聚集鍵保證“鍵值”唯一性;如果非聚集索引鍵值不唯一,就會增加RID列(聚集索引鍵或者堆表中的行指針)保證“鍵值”唯一性。

思考(可略過):索引“鍵值”在非葉子節點也有保證唯一性,原因應該是為了明確索引記錄在非葉子節點中的位置。比如有個非聚集索引字段Name2,表中有很多Name2='a'的記錄,導致Name2='a'在非葉子節點上有多條索引記錄(節點),這時候再insert一筆Name2=‘a'的記錄時,就可以根據非葉子節點的RID和新增記錄的RID很快確定要insert到哪個索引記錄(節點)上,如果沒有非葉子節點的RID,那得遍歷到所有Name2='a'的葉子節點才能確定位置。另外,當我們select * from Table1 where Name2<='a'時,返回的數據是按非聚集索引Name2和RID排序的,很好理解返回的數據就是按這邊索引存儲的順序排序的。這是這條sql查詢時有用到Name2索引的結果,如果數據庫查詢計劃因“臨界點”問題選擇直接表數據掃描,那返回的數據默認就是按表數據的順序排序的。

為了“鍵值”唯一性,對于聚集索引,uniquifier 列只在索引值重復時增加。對于非聚集索引,如果創建索引時沒定義唯一,RID會在所有記錄增加,就算索引值是唯一的;如果創建索引時定義唯一,RID只在葉子層增加,用于查找源數據行,即書簽查找操作。

(D).字段長度小

聚集索引鍵長度越小,一頁索引頁就可以容納更多索引記錄,進而減少索引B樹結構的深度。例如,一個百萬記錄的表有一個int聚集索引,可能只需要3層的B樹結構。如果把聚集索引定義在更寬的列(比如uniqueidentifier列需要16 字節),那么索引的深度會增加到4層。任何聚集索引查找需要4個I/O操作(確切的說是4個邏輯讀),原先只要3個I/O操作。
同樣,非聚集索引里會包含聚集索引鍵值,聚集索引鍵長度越小非聚集索引記錄也就越小,一頁索引頁就可以容納更多索引記錄。

1.2 非聚集索引

也是存儲在頁中(PageType標記為2的頁,叫索引頁)。比如表T建立了一個非聚集索引Index_A,那么表T有100條數據的話,那么索引Index_A也就有100條數據(準確的說是100條葉子節點數據,索引是B樹結構,如果樹的高度大于0,那么就有根節點頁或中間節點頁數據,這時索引數據就超過100條),如果表T還有非聚集索引Index_B,那么Index_B也是至少100條數據,所以索引建越多開銷越大。

更新索引字段、插入一條數據、刪除一條數據都會造成索引的維護從而造成性能的一定影響。在不同情況下,性能影響是不同的。比如當你有一個聚集索引,插入的數據又都是在末尾,這樣幾乎是不會造成數據移動,影響較?。蝗绻迦氲臄祿谥虚g位置,一般會導致數據移動,而且可能產生分頁和頁碎片,影響就會稍大一點(如果插入到的中間頁有足夠的剩余空間容納插入的數據,而且位置是在頁末,也是不會造成數據移動)

2.索引的結構

都說SqlServer的索引是B樹結構(這邊假定你對B樹結構有一定了解),那它到底長什么個模樣呢,可以用Sql語句來查看它的邏輯呈現。

新建查詢執行語法: DBCC IND(Test,OrderBo,-1) --其中Test庫的OrderBo表有1萬筆數據,有聚集索引Id主鍵字段
(不妨自己動手建個表,有聚集索引字段,插入1萬表數據,然后執行這個語法看看,會收獲很多,百聞不如一見)

執行結果:

SQLServer,索引

如上圖,看到一個IndexLevel=2的索引頁2112(這邊它就是B樹的根節點,IndexLevel最大的就是根節點,往下就是子級、子子級...只有一個根頁作為B樹結構的訪問入口點),說明一定還有IndexLevel=1的索引頁和IndexLevel=0的葉子頁。由于這邊是聚集索引,因此當IndexLevel=0的葉子頁就是數據頁,存儲的是一筆一筆的物理數據。如上圖也可以看到,IndexLevel=0的行的PageType等于1,就是代表數據頁,上面1.1章節講到聚集索引時,也有提到PageType=1;而如果是非聚集索引,IndexLevel=0的葉子頁,PageType是等于 2,仍然是索引頁。

同樣,我們用Sql命令DBCC PAGE看一看

-- DBCC TRACEON(3604,-1) DBCC PAGE(Test,1,2112,3)  --根節點2112,可以查出它的兩個子節點2280和2448,然后對這兩個子節點再作DBCC PAGE查詢DBCC PAGE(Test,1,2280,3) DBCC PAGE(Test,1,2448,3)

SQLServer,索引

如上圖,IndexLevel=2的2112頁有兩個IndexLevel=1的子節點2280和2448,子節點下又有子節點,每個節點負責不同的索引鍵值的區間(即上圖的“Id(key)”欄位,第一行值是Null,表示最小值或倒序時的最大值)。這樣的層級關系是不是就是一棵B樹結構,其中IndexLevel其實就是B樹結構中的高度Height。

SqlServer在索引中查找某一筆記錄時,是從根節點往下找到葉子節點,因為所有數據地址都有存在葉子節點,這其實是B+樹的特點之一(B樹特點是如果查找的值在非葉子節點就找到,則就能直接返回,顯然SqlServer不是這么做,要驗證這一點你可以set statistics io on把統計開起來,然后select看下邏輯讀的次數)。

既然一定會找到葉子節點,那么索引包含列只要在葉子節點記錄就可以了,即非葉子節點沒有記錄包含列,“索引包含列”見下文第3章節。

B+樹這個特點(所有數據地址都有存在葉子節點)也利于between value1 and value2 區間查詢,只要找到value1和value2(在葉子節點),然后把中間串起來就是要的結果了。

SqlServer索引結構更像是B+樹,最終是B樹和B+樹的混合版,數據結構都是人定的,不一定就是純粹的B樹或者單純的B+樹。

3.索引包含列和書簽查找

談到索引,這邊再講一個SqlServer2005開始增加的“索引包含列”功能,很實用。

比如,在大報表查詢數據時,where條件用到索引字段Name2,但是要select的字段是Name1,這時候可以使用“索引包含列”把Name1包含在索引字段Name2中,大大提高查詢性能。

語法: Create [UNIQUE]  Nonclustered/Clustered Index IndexName On dbo.Table1(Name2) Include(Name1);

接下來分析為什么索引包含列可以大大提高性能。仍然使用DBCC PAGE命令,查看一個非聚集索引并有包含列的索引數據情況:

SQLServer,索引

由上圖可知,包含列Name1也存儲在索引數據中。因此,當數據庫用索引字段Name2定位到要查找的某一行時,就可以直接把Name1的值返回了,而不用再根據RID(上圖是【HEAP RID(Key)】列)定位到數據頁中去取值,即減少了書簽查找。當查詢只返回一條數據,只有一次書簽查找時當然沒什么,如果查詢返回的數據很大,每一筆都要去數據頁找數據取出來,1000筆就是1000次書簽查找,可想而知性能消耗很大,這時候“索引包含列”價值就大大體現出來了。

關于一次書簽查找,表有聚集索引(比如Id)時就是類似執行了一次 select Name1 from Table1 where Id=1 ,利用聚集索引鍵Id查找(查找方式就是索引Id的B樹結構查找),而如果表沒有聚集索引,則是根據數據行指針(由“文件號2byte:頁號4byte:槽號2byte”組成)查找。聚集索引鍵和行指針一般統稱為RID(Row ID)指針。從這里我們可以想到,如果你的表沒有很好的聚集索引字段,建議自增長的Id字段做聚集索引主鍵(冗余出Id字段也行),它符合自增長、不被更改、唯一性、長度小的特性,是聚集索引的很好選擇。

自增長Id絕大部分情況下是適用的,特殊的情況看具體需求而定吧。還有自增長Id要考慮一個缺陷,當對表大數據量的并發insert記錄時,可以想象每個線程都是要insert到末尾那個頁,就會發生競爭和等待。解決這種情況你可以用uniqueidentifier類型字段(16字節,我是不建議使用)或者哈希分區(就是一個表分成多個表,大數據處理中分庫分表是正常的)等。但是我建議先優化你的insert效率(insert性能本身是很快的),測試每秒并發insert數是否滿足生產環境,以保留簡單穩定高效的自增長Id作法。

自增長Id不一定就是用數據庫提供的自增長,你也可以自己寫算法生成一個并發情況下也能唯一的Id(這時候一般長度是bitint,8字節整形),這種情況適合場景是分布式數據庫中主從復制時Id欄位是要求一定不能出錯的情況(主從復制的一般模式下,主庫的Id是按主庫增長,從庫Id也是按從庫自己的增長,如果遇到死鎖等原因導致主從復制不同步時,那從庫的Id就和主庫的Id自增長就對不上號了)。如果自增長Id是冗余出的主鍵,那主從庫Id對不上號也就無影響。

另外,上圖最后一列【Row Size】還告訴我們,索引列或索引包含列的size不要太長,否則一頁容不了幾筆記錄,這樣大大增加了索引頁數量,而且索引數據所占的空間也大大增加了。

總結

以上就是這篇文章的全部內容了,希望本文的內容對大家的學習或者工作具有一定的參考學習價值,如果有疑問大家可以留言交流,謝謝大家對VeVb武林網的支持。


注:相關教程知識閱讀請移步到MSSQL教程頻道。
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb
97超级碰碰人国产在线观看| 亚洲精品在线视频| 中文字幕精品影院| 久久视频这里只有精品| 国产精品大陆在线观看| 亚洲一级黄色av| 国产精品草莓在线免费观看| 97精品在线视频| 97国产精品免费视频| 亚洲一区二区三区乱码aⅴ| 精品国产自在精品国产浪潮| 韩国三级日本三级少妇99| 国产丝袜一区二区三区| 日韩在线视频一区| 亚洲天堂男人的天堂| 91香蕉嫩草影院入口| 国产偷亚洲偷欧美偷精品| 992tv成人免费影院| 亚洲欧美日韩中文在线| 国产综合视频在线观看| 国产91亚洲精品| 亚洲第一色在线| 亚洲第一免费播放区| 色噜噜狠狠狠综合曰曰曰88av| 91精品国产色综合久久不卡98口| 欧美男插女视频| 一本一本久久a久久精品综合小说| 日韩精品免费看| 少妇高潮久久77777| 中文字幕日韩视频| 亚洲成人免费在线视频| 国产亚洲一区精品| 亚洲xxxx做受欧美| 国产精品第一视频| 日日摸夜夜添一区| 色伦专区97中文字幕| 98精品国产高清在线xxxx天堂| 少妇高潮久久77777| 欧美国产日韩一区二区三区| 精品亚洲va在线va天堂资源站| 精品中文字幕久久久久久| 国产欧美在线观看| 欧美高清视频免费观看| 精品久久久久久国产91| 亚洲电影免费观看高清完整版在线| 一区二区福利视频| 欧美视频在线视频| 午夜精品福利在线观看| 国产一区二区丝袜| 国产精品三级久久久久久电影| 26uuu另类亚洲欧美日本一| 欧美大全免费观看电视剧大泉洋| 一区二区三区视频免费在线观看| 国产美女主播一区| 久久久久久亚洲精品不卡| 91午夜在线播放| 一区二区三区www| 国产精品嫩草视频| 国模gogo一区二区大胆私拍| www.日韩系列| 黄色精品一区二区| 成人伊人精品色xxxx视频| 欧美黑人国产人伦爽爽爽| 97久久伊人激情网| 久久久久久久久久久91| 午夜免费日韩视频| 久久亚洲精品成人| 8090理伦午夜在线电影| 亚洲精品第一国产综合精品| 欧美小视频在线观看| 久久亚洲国产精品| 国产精品成人久久久久| 国产大片精品免费永久看nba| 中文字幕视频在线免费欧美日韩综合在线看| 亚洲色图综合网| 久久久精品在线观看| 97精品久久久中文字幕免费| 久久视频免费在线播放| 92看片淫黄大片看国产片| 91精品啪aⅴ在线观看国产| 日韩av在线网| 精品免费在线视频| 91探花福利精品国产自产在线| 欧美亚洲视频一区二区| 欧美一级片免费在线| 日韩在线免费观看视频| 日韩毛片在线看| 久久久精品网站| 91伊人影院在线播放| 欧美在线亚洲在线| 国内精品国产三级国产在线专| 国产日韩在线看| 欧美黑人狂野猛交老妇| 亚洲性线免费观看视频成熟| 亚洲欧洲日本专区| 亚洲国产精品99| 色偷偷噜噜噜亚洲男人的天堂| 动漫精品一区二区| 亚洲美女视频网站| 中文字幕精品视频| 国产成人精品免高潮在线观看| 国产精品在线看| 欧美日韩国产影院| 欧美多人爱爱视频网站| 国产精品18久久久久久首页狼| 国产精品∨欧美精品v日韩精品| 97精品国产97久久久久久免费| 亚洲bt欧美bt日本bt| 欧美日韩激情视频| 在线国产精品视频| 午夜免费日韩视频| 26uuu另类亚洲欧美日本一| 国产美女主播一区| 国产欧美一区二区| 日韩精品视频在线免费观看| 成人免费视频97| 亚洲国产日韩欧美在线动漫| 亚洲欧美国产一本综合首页| 日韩国产在线看| 亚洲精品网站在线播放gif| 国产一区二区久久精品| 亚洲a在线播放| 国产精品黄色影片导航在线观看| 欧美性猛交xxxx乱大交极品| 国产日韩欧美视频在线| 成人444kkkk在线观看| 欧美激情一区二区三区久久久| 在线亚洲欧美视频| 91在线视频一区| 亚洲精品白浆高清久久久久久| 91精品综合久久久久久五月天| 久久国产加勒比精品无码| 欧美日韩国产综合新一区| 久久国产精品视频| 色狠狠久久aa北条麻妃| 国产日本欧美在线观看| 亚洲精品日韩欧美| 国产99久久精品一区二区 夜夜躁日日躁| 欧美丰满少妇xxxxx做受| 隔壁老王国产在线精品| 欧美超级免费视 在线| 久久亚洲综合国产精品99麻豆精品福利| 国产精品第一视频| 日韩精品免费在线视频观看| 欧美尤物巨大精品爽| 欧美成人网在线| 精品女厕一区二区三区| 欧美性xxxx极品hd欧美风情| 国产狼人综合免费视频| 亚洲品质视频自拍网| 国产精品免费久久久| 国产精品中文久久久久久久| 尤物yw午夜国产精品视频| 日韩精品视频在线| 美日韩精品免费观看视频| 亚洲国产99精品国自产| 国产ts人妖一区二区三区| 91久久精品国产91久久| 亚洲人精选亚洲人成在线| 日韩精品视频中文在线观看| 精品成人69xx.xyz| 欧美日韩亚洲激情| 欧美第一淫aaasss性| 亚洲在线视频观看|