Microsoft 線性回歸算法是 Microsoft 決策樹算法的一種變體,有助于計算依賴變量和獨立變量之間的線性關系,然后使用該關系進行預測。該關系采用的表示形式是最能代表數據序列的線的公式。例如,以下關系圖中的線是數據最可能的線性表示形式。
關系圖中的每個數據點都有一個與該數據點與回歸線之間距離關聯的錯誤。回歸方程式中的系數 a 和 b 可以調整回歸線的角度和位置??梢詫?a 和 b 進行調整,直到與所有點都關聯的錯誤總數達到最低值,以此獲得回歸公式。還有其他類型的使用多個變量的線性回歸以及非線性回歸方法。但是,線性回歸是一種眾所周知的有用方法,可對一些潛在因素中更改的響應進行建模。
示例可以使用線性回歸確定兩個連續列之間的關系。例如,您可以使用線性回歸根據生產或銷售數據計算趨勢線。還可以使用線性回歸作為基礎,來開發更復雜的數據挖掘模型,以評估數據列之間的關系。盡管有許多計算線性回歸的方法,而且這些方法不需要數據挖掘工具,但是使用 Microsoft 線性回歸算法計算線性回歸的優勢在于可以自動計算并測試變量之間所有可能的關系。您不必選擇計算方法,如計算最小平方法。但對于結果受多個因素影響的應用場景,線性回歸可能會過分簡化其中的關系。
下面我們進入主題,通過簡單的過程配置我們來實現整個數據挖掘的過程,依次步驟如下:
參考文獻:Microsoft 線性回歸算法http://msdn.microsoft.com/zh-cn/library/ms174824(v=sql.105).aspx
新聞熱點
疑難解答