【IT專家網獨家稿件】在SQL Server 2008數據庫中,對這商務智能方面的功能做了很大的優化。筆者結合相關的案例來談談這些優化,希望對各位數據庫工程師有所幫助。
優化一:支持多個挖掘模型的交叉驗證。
在數據挖掘中有一個基礎兩個核心?;A就是數據,而核心則是挖掘模型與數據挖掘算法。在商務智能中,只有通過這三方面的共同作用,才能夠得出正確的結果。在以前的版本中,由于采用的挖掘模型不同,最后產生的結果會相差很大,有時候甚至風馬牛不相及。如在SQL Server 數據中,提供了聚類分析模型、決策樹模型、邏輯回歸模型、順序分析和聚類分析模型等等數據挖掘模型。即使這些模型采用的數據與計算方法相同,最后得出的結果很有可能都是不同的。為了提高數據挖掘的準確性,在2008中對此進行了優化。主要是提供了多個數據挖掘模型交叉驗證的方法,來提高結果與決策的準確性。
在SQL Server 2008數據庫版本中,用戶可以在兩個地方調用這個交叉驗證。一是在數據挖掘設計器向導中,可以在“挖掘準確性圖表”視圖中調用交叉驗證;二是通過數據分析存儲過程來對挖掘結構分區,調用交叉驗證。最后數據庫可以根據用戶的需要,生成相關的交叉驗證報表。在這個報表中,會反映各種可能性以及對應的均方根誤差。如果采用聚合模型的話,還會有聚合模型的所有度量值的平均偏差和標準偏差等相關的統計信息。