索引用于快速找出在某個列中有某一特定值的行,不使用索引,數據庫必須從第一條記錄開始讀完整個表,直到找出相關的行。表越大,查詢數據所花費的時間越多,如果表中查詢的列有一個索引,數據庫能快速到達一個位置去搜索數據,本篇主要介紹與索引相關的內容,包括索引的含義和特點,索引的分類,索引的設計原則以及如何創建和刪除索引。
一:索引的含義和特點索引是一個單獨的,存儲在磁盤上的數據結構,它們包含則對數據表里所有記錄的引用指針,使用索引用于快速找出在某個或多個列中有某一特定值的行,對相關列使用索引是降低查詢操作時間的最佳途徑。索引包含由表或視圖中的一列或多列生成的鍵。
例如:數據庫中有20000條記錄,現在要執行這樣一個查詢:SELECT*FROMtableNameWHEREnum=10000。如果沒有索引,必須遍歷整個表,直到num=10000的這一行為止;如果在num列上創建索引,SQLServer不需要任何掃描,直接在索引里面找10000,就可以得知這一行的位置??梢姡饕慕⒖梢约涌鞌祿牟樵兯俣?。
索引的優點主要有以下幾條:
(1).通過創建唯一索引,可以保證數據庫表的每一行數據的唯一性。
(2).可以大大加快數據的查詢速度,這也是創建索引的最主要的原因。
(3).實現數據的參照完整性,可以速表和表之間的連接。
(4).在使用分組和排序子句進行查詢時,也可以顯著減少查詢中分組和排序的時間。
同時,增加索引也有不利的一面:
(1).創建索引和維護索引要耗費時間,并且隨著數據量的增加所耗費的時間也會增加。
(2).索引需要占磁盤空間,除了數據表占數據空間之外,每一個索引還要占一定的物理空間,如果有大量的索引,索引文件可能比數據文件更快達到做大文件尺寸。
(3).當對表中的數據進行增加,刪除和修改的時候,索引也要動態地維護,這樣就就降低了數據的維護速度。
二:索引的分類不同數據庫中提供了不同的索引類型,SQLServer中的索引有兩種:聚集索引和非聚集索引。它們的區別是在物理數據的存儲方式上。
1.聚集索引
聚集索引基于數據行的鍵值,在表內排序和存儲這些數據行。每個表只能有一個聚集索引,因為數據行本身只能按一個順序存儲。
(1).每個表只能有一個聚集索引;
(2).表中的物理順序和索引中行的物理順序是相同的,創建任何非聚集索引之前要首先創建聚集索引,這是因為非聚集索引改變了表中行的物理順序;
(3).關鍵值的唯一性使用UNIQUE關鍵字或者由內部的唯一標識符明確維護。
(4).在索引的創建過程中,SQLServer臨時使用當前數據庫的磁盤空間,所以要保證有足夠的空間創建索引。
2.非聚集索引
非聚集索引具有完全獨立于數據行的結構,使用非聚集索引不用將物理數據頁中的數據按列排序,非聚集索引包含索引鍵值和指向表數據存儲位置的行定位器。
可以對表或索引視圖創建多個非聚集索引。通常,設計非聚集索引是為了改善經常使用的、沒有建立聚集索引的查詢的性能。
查詢優化器在搜索數據值時,先搜索非聚集索引以找到數據值在表中的位置,然后直接從該位置檢索數據。這使得非聚集索引成為完全匹配查詢的最佳選擇,因為索引中包含搜索的數據值在表中的精確位置的項。
具有以下特點的查詢可以考慮使用非聚集索引:
(1).使用JOIN或者GROUPBY子句,應為連接和分組操作中所涉及的列創建多個非聚集索引,為任何外鍵創建一個聚集索引.
(2).包含大量唯一值的字段。
(3).不返回大型結果集的查詢。創建篩選索引以覆蓋從大型表中返回定義完善的的行子集的查詢。
(4).經常包含在查詢的搜索條件(如返回完全匹配的WHERE子句)中的列。
3.其它索引
除了聚集索引和非聚集索引之外,SQLServer中還提供了其它的索引類型。
唯一索引:確保索引鍵不包含重復的值,因此,表或視圖中的每一行在某種程度上是唯一的。聚集索引和非聚集索引都可以是唯一索引。這種唯一性和主鍵約束是關聯的,在某種程度上,主鍵約束等于唯一性的聚集索引。
包含列索引:一種非聚集索引,它擴展后不僅包含鍵列,還包含非堅列。
索引視圖:在視圖上添加索引后能提高視圖的查詢效率。視圖的索引將具體化視圖,并將結果集永久存儲在唯一的聚集索引中,而且存儲方式相同,創建聚集索引后,可以為視圖添加非聚集索引。
全文索引:一種特殊類型的基于標記的功能索引,由SQLServer全文引擎生成和維護,用于幫助在字符串數據中搜索復雜的詞,這種索引的結構與數據庫引擎使用的聚集索引或非聚集索引的B樹結構是不同的。
空間索引:一種針對geometry數據類型的列上建立的索引,這樣可以更高效的列中的空間對象執行某些操作,空間索引可以減少需要應用開銷相對較大的空間操作的對象數。
篩選索引:一種經過優化的的非聚集索引,尤其適用于涵蓋從定義完善的數據子集中選擇數據的查詢。篩選索引使用篩選謂詞對表中的的部分進行索引,與全表索引相比,設計良好的篩選索引可以提高查詢性能,減少索引維護開銷并可降低索引存儲開銷
xml索引:是與XML數據關聯的索引形式,是XML二進制大對象(BLOB)的已拆分持久表示形式,XML索引可以分為主索引和輔助索引。
三:索引的設計原則索引設計不合理或者缺少索引都會對數據庫和應用程序的性能造成障礙,高效的索引對于獲得良好的性能非常重要。設計索引時,應該考慮以下原則:
(1).索引并非越多越好,一個表中如果有大量的索引,不僅占用大量的磁盤空間,而且會影響INSERT、DELETE、UPDATE等語句的性能。因為當表中數據更改的同時,索引也會進行調整和更新。
(2).避免對經常更新的表進行過多的索引,并且索引中的列盡可能少。而對經常用于查詢的字段應該創建索引,但要避免添加不必要的字段。
(3).數據量小的表最好不要使用索引,由于數據較少,查詢花費的時間可能比遍歷索引的時間還要短,索引可能不會產生優化效果。
(4).在條件表達式中經常用到的、不同值較多的列上建立索引,在不同值較少的列上不要建立索引、比如在學生表的【性別】
字段上只有【男】或【女】兩個不同值,因此就無需建立索引,如果建立索引,不但不會提高查詢效率,反而會嚴重降低更新速度。
(5).當唯一性是某種數據本身的特征時,指定唯一索引,使用唯一索引能夠確保定義的列的數據完整性,提高查詢速度。
(6).在頻繁進行排序或分組(即進行GROUPBY或ORDERBY操作)的列上建立索引,如果待排序的列有多個,可以在這些列上建立組合索引。
四:創建索引在了解了不同索引類型后,下面開始介紹如何使用T_SQL創建索引:
CREATEINDEX命令既可以創建一個改變表的物理順序的聚集索引,也可以創建提高查詢性能的非聚集索引。語法如下:
CREATE[UNIQUE][CLUSTERED|NONCLUSTERRED]
INDEXindex_nameON{table|view}(column[ASC|DESC][,...n])
[INCLUDE(column_name[,...n])]
[with
(
PAD_INDEX={ON|OFF}
|FILLFACTOR=fillfactor
|SORT_IN_TEMPDB={ON|OFF}
|IGNORE_DUP_KEY={ON|OFF}
|STATISRICS_NORECOMPUTE={ON|OFF}
|DROP_EXISTING={ON|OFF}
|ONLINE={ON|OFF}
|ALLOW_ROW_LOCKS={ON|OFF}
|ALLOW_PAGE_LOCKS={ON|OFF}
|MAXDOP=max_degree_of_parallelism
) [,...n] ]
UNIQUE:表示在表或視圖上創建唯一索引。唯一索引不允許兩行具有相同的索引鍵值。視圖的聚集索引必須唯一。
CLUSTERED:表示創建聚集索引,在創建任何非聚集索引之前創建聚集索引,創建聚集索引時會重新生成表中現有的非聚集索引。如果沒有指定CLUSTERED,則創建非聚集索引。
NONCLUSTERED:表示創建一個非聚集索引,非聚集索引數據行的物理順序獨立于與索引排序,每個表最多可包含999個非聚集索引,NONCLUSTERED是CREATEINDEX的默認值。
index_name:指定索引的名稱,索引名稱在表或視圖中必須唯一,但在數據庫中可不必唯一。
ON{table|view}:指定索引所屬的表或視圖。
Column:指定索引基于一列或者多列。指定兩個或者多個列名,可為指定的列的組合值創建組合索引,{table|view}后的括號中,按排序優先級列出組合索引要包括的列。一個組合索引鍵中最多可組合16列。組合索引鍵中的所有列必須在同一個表或視圖中。
[ASC|DESC]:指定索引列的升序或降序排序方向,默認為ASC。
INCLUDE(column[,...n]):指定要添加到非聚集索引的葉級別的非鍵列。
PAD_INDEX:表示指定索引填充,默認值為OFF。ON值表示fillfactor指定的可用空間百分比應用于索引的中間級頁。
FILLFACTOR=fillfactor:制定一個百分比,表示在索引創建或重新生成過程中數據庫引擎應使每個索引頁的葉級別達到的填充程度。fillfactor必須為介于1至100直接的整數值,默認值為0;
SORT_IN_TESTDB:指定是否在tempdb中存儲臨時排序結果,默認值為OFF,ON值表示在tempdb中存儲用于生成索引的中間排序結果,OFF表示中間排序結果與索引存儲在同一數據庫中。
IGNORE_DUP_KEY:指定唯一聚集索引或唯一非聚集索引執行多行插入操作時,出現重復鍵值的錯誤響應。默認值為OFF。ON表示發出一跳警告消息,但只有違反了唯一索引的行才會失敗,OFF表示發出錯誤消息,并回滾整個INSERT事物。
STATISRICS_NORECOMPUTE:指定是否重新計算分發統計信息,默認值為OFF。ON表示不會自動重新計算過時的統計信息,OFF表示啟用統計信息自動更新功能。
DROP_EXISTING:指定刪除并重新生成已命名的先前存在的聚集或非聚集索引。默認值為OFF。ON表示刪除并重新生成現有索引。指定的索引名稱必須與當前現有的索引相同,但可以修改索引定義,例如:可以指定不同的列,排序順序,分區方案或索引選項。OFF表示如果指定的索引名已存在,則會顯示一條錯誤。
ONLINE={ON|OFF}:指定在索引操作期間,基礎表和關聯的索引是否用于查詢和數據修改操縱,默認值為OFF。
ALLOW_ROW_LOCKS:指定是否允許行鎖,默認值為ON,ON表示在訪問索引時允許行所。數據庫引擎確定何時使用行鎖。OFF表示未使用行鎖。
ALLOW_PAGE_LOCKS:指定是否允許頁鎖,默認值為ON,ON表示在訪問索引時允許頁鎖。數據庫引擎確定何時使用頁鎖。OFF表示未使用頁鎖。
MAXDOP:指定在索引操作期間,覆蓋【最大并行度】配置選項,使用MAXDOP可以限制在執行并行計劃的過程中使用的處理器數量,最大數量為64.
【例1】在teacher表中的t_phone列上,創建一個名稱為Idx_phone的唯一聚集索引,降序排列,填充因子為30%,輸入語句如下:
CREATEUNIQUECLOSTEREDINDEXIdx_phone
ONteacher(t_phoneDESC)
WITH
FILLFACTOR=30;
【例2】--在teacher表中的t_name和t_gender列上,創建一個名稱為Idx_nameAndgender的-唯一非聚集組合索引,升序排列,填充因子為10%。如下:
--首先創建teacher表
CREATETABLEteacher(
t_idintIDENTITY(1,1)PRIMARYKEY,
t_namevarchar(20),
t_phonevarchar(11),
t_genderchar(2)
)
--創建索引
CREATEUNIQUENONCLUSTEREDINDEXIdx_nameAndgender
ONteacher(t_name,t_gender)
WITH
FILLFACTOR=10;
注意:如果teacher表中定義了主鍵,則不能執行【例1】中的腳本,因為每個表只能有一個聚集索引,數據行本身只能按一個順序存儲。并且主鍵本身就是一個聚集索引。
五:管理和維護索引索引創建后可以根據需要對數據庫中的索引進行管理,例如在數據表中進行增加,刪除或者更新操作,會使索引頁出現碎塊,為了提高系統的性能,必須對索引進行維護管理,這些管理包括顯示索引信息、索引的性能分析和維護,以及刪除索引等。
1.顯示索引信息
(1).用系統存儲過程查看索引信息
系統存儲過程sp_helpindex可以返回某個表或視圖中的索引信息,語法如下:
sp_helpindex[@objectname=]'name';
[@objectname=]'name':用戶定義的表或視圖的限定或非限定名稱。僅當指定限定的表或視圖名稱時,才需要使用引號。如果提供了完全限定的名稱,包括數據庫名稱,則該數據庫名稱必須是當前數據庫的名稱。
【例】使用存儲過程查看是sample_db數據庫中teacher表中定義的索引信息,輸入語句如下。
USEsample_db;
GO
execsp_helpindex'teacher';
由執行結果可以看到,這里顯示了authors表中的索引信息:
index_name:指定索引名稱.
index_description:包含索引的描述信息,例如唯一性索引,聚集索引等。
index_keys:包含了索引所在表中的列.
(2).查看索引的統計信息
索引信息還包括統計信息,這些信息可以用來分析索引性能,更好的維護索引,索引統計信息是查詢優化器用來分析和評估查詢、制定最優查詢方式的基礎數據,用戶可以用圖形界面化工具來查看索引信息,也可以使用DBCCSHOW_STATISTICS命令來查看索引的信息。
【例】使用DBCCSHOW_STATISTICS命令來查看teacher表中Idx_phone索引的統計信息,如下:
DBCCSHOW_STATISTICS('sample_db.dbo.teacher',Idx_phone);
新聞熱點
疑難解答