數(shù)據(jù)庫的數(shù)據(jù)挖掘概述(二)
2019-09-08 23:34:20
供稿:網(wǎng)友
數(shù)據(jù)挖掘工具是怎樣準(zhǔn)確地告訴你那些隱藏在數(shù)據(jù)庫深處的重要信息的呢?它們又是如何作出預(yù)測的?答案就是建模。建模實(shí)際上就是在你知道結(jié)果的情況下建立起一種模型,并且把這種模型應(yīng)用到你所不知道的那種情況中。比如說,如果你想要在大海上去尋找一艘古老的西班牙沉船,也許你首先想到的就是去找找過去發(fā)現(xiàn)這些寶藏的時(shí)間和地點(diǎn)有哪些。那么,經(jīng)過調(diào)查你發(fā)現(xiàn)這些沉船大部分都是在百慕大海區(qū)被發(fā)現(xiàn),并且那個(gè)海區(qū)有著某種特征的洋流,以及那個(gè)時(shí)代的航線也有一定的特征可尋。在這眾多的類似特征中,你將它們抽象并概括為一個(gè)普適的模型。利用這個(gè)模型,你就很有希望在具有大量相同特征的另外一個(gè)地點(diǎn)發(fā)現(xiàn)一件不為人知的寶藏。
當(dāng)然,在數(shù)據(jù)挖掘技術(shù)甚至計(jì)算機(jī)出現(xiàn)以前,這種建模抽象的方法就已經(jīng)廣泛地被人們所使用。在計(jì)算機(jī)中的建模和以前的建模方法并無很大不同,主要的差異在于計(jì)算機(jī)能處理的信息量比起以前來更加龐大。計(jì)算機(jī)中能夠存儲(chǔ)已知了結(jié)果的大量不同情況,然后由數(shù)據(jù)挖掘工具從這些大量的信息里面披沙揀金,將能夠產(chǎn)生模型的信息提取出來。一當(dāng)模型建立好了之后,就可以應(yīng)用在那些情形相似但結(jié)果尚未知的判斷中了。比如,現(xiàn)在假設(shè)你是一個(gè)電信公司的營銷主任,公司想發(fā)展一些新的長途電話用戶,那么你是不是會(huì)漫無目的地到街上去散發(fā)廣告呢?――就象漫無目的地在海上去尋寶一樣。其實(shí),比起漫無目的地去進(jìn)行宣傳來,利用你以前的商業(yè)經(jīng)驗(yàn)來有目的地去拉攏客戶會(huì)產(chǎn)生高得多的效率。
作為一個(gè)營銷主任,你對(duì)客戶的很多信息都可以了解得一清二楚:年齡、性別、信用記錄以及長途電話使用狀況。從好的一方面來看,掌握了這些客戶的信息其實(shí)就是掌握了很多潛在的用戶的同樣的信息。問題在于你還不一定了解他們的長途電話使用情況(因?yàn)樗麄兊拈L途電話也許是通過的另一個(gè)電信公司)?,F(xiàn)在你的主要精力就集中在用戶中誰有比較多的長途電話上。通過下面這個(gè)表格,我們可以從數(shù)據(jù)庫里面抽象某些變量,建立起一個(gè)可以對(duì)此進(jìn)行分類營銷的模型。
客戶 潛力
一般信息
(e.g. demographic data) 已知 已知
私有信息
(e.g. customer transactions) 已知 待定
表二、數(shù)據(jù)挖掘應(yīng)用于分類營銷
根據(jù)我們創(chuàng)建的從一般信息到私有信息的計(jì)算模型,我們可以得出表二右下方表格中的信息。比如,一個(gè)電信公司的簡化模型可以是:年薪6萬美圓以上的98%的客戶,每個(gè)月長話費(fèi)80美圓以上。根據(jù)這個(gè)模型,我們就能應(yīng)用這些數(shù)據(jù)來推斷出公司現(xiàn)在尚不能明確的私有信息,這樣,新客戶群體就可以大體確定出來了。小型市場的試銷數(shù)據(jù)對(duì)于這樣的模型來說顯得極為有用。因?yàn)樾》秶鷥?nèi)試銷數(shù)據(jù)的挖掘,能夠?yàn)槿渴袌龅姆诸愪N售打下一個(gè)良好的基礎(chǔ)。表三則描述了另外一樣數(shù)據(jù)挖掘的普遍應(yīng)用:預(yù)測。
過去 現(xiàn)在 將來
靜態(tài)信息和當(dāng)前計(jì)劃 已知 已知 已知
動(dòng)態(tài)信息 已知 已知 待定
表三、數(shù)據(jù)挖掘應(yīng)用于預(yù)測
數(shù)據(jù)挖掘的體系結(jié)構(gòu)
現(xiàn)有很多數(shù)據(jù)挖掘工具是獨(dú)立于數(shù)據(jù)倉庫以外的,它們需要獨(dú)立地輸入輸出數(shù)據(jù),以及進(jìn)行相對(duì)獨(dú)立的數(shù)據(jù)分析。為了最大限度地發(fā)揮數(shù)據(jù)挖掘工具的潛力,它們必須象很多商業(yè)分析軟件一樣,緊密地和數(shù)據(jù)倉庫集成起來。這樣,在人們對(duì)參數(shù)和分析深度進(jìn)行變化的時(shí)候,高集成度就能大大地簡化數(shù)據(jù)挖掘過程。下圖顯示了一個(gè)大型數(shù)據(jù)庫中的高級(jí)分析過程。
集成后的數(shù)據(jù)挖掘體系
應(yīng)用數(shù)據(jù)挖掘技術(shù),較為理想的起點(diǎn)就是從一個(gè)數(shù)據(jù)倉庫開始,這個(gè)數(shù)據(jù)倉庫里面應(yīng)保存著所有客戶的合同信息,并且還應(yīng)有相應(yīng)的市場競爭對(duì)手的相關(guān)數(shù)據(jù)。這樣的數(shù)據(jù)庫可以是各種市場上的數(shù)據(jù)庫:Sybase、Oracle、Redbrick、和其他等等,并且可以針對(duì)其中的數(shù)據(jù)進(jìn)行速度上和靈活性上的優(yōu)化。
聯(lián)機(jī)分析系統(tǒng)OLAP服務(wù)器可以使一個(gè)十分復(fù)雜的最終用戶商業(yè)模型應(yīng)用于數(shù)據(jù)倉庫中。數(shù)據(jù)庫的多維結(jié)構(gòu)可以讓用戶從不同角度,――比如產(chǎn)品分類,地域分類,或者其他關(guān)鍵角度――來分析和觀察他們的生意運(yùn)營狀況。數(shù)據(jù)挖掘服務(wù)器在這種情況下必須和聯(lián)機(jī)分析服務(wù)器,以及數(shù)據(jù)倉庫緊密地集成起來,這樣就可以直接跟蹤數(shù)據(jù)和并輔助用戶快速作出商業(yè)決策,并且用戶還可以在更新數(shù)據(jù)的時(shí)候不斷發(fā)現(xiàn)更好的行為模式,并將其運(yùn)用于未來的決策當(dāng)中。
數(shù)據(jù)挖掘系統(tǒng)的出現(xiàn)代表著常規(guī)決策支持系統(tǒng)的基礎(chǔ)結(jié)構(gòu)的轉(zhuǎn)變。不象查詢和報(bào)表語言僅僅是將數(shù)據(jù)查詢結(jié)果反饋給最終用戶那樣,數(shù)據(jù)挖掘高級(jí)分析服務(wù)器把用戶的商業(yè)模型直接應(yīng)用于其數(shù)據(jù)倉庫之上,并且反饋給用戶一個(gè)相關(guān)信息的分析結(jié)果。這個(gè)結(jié)果是一個(gè)經(jīng)過分析和抽象的動(dòng)態(tài)視圖層,通常會(huì)根據(jù)用戶的不同需求而變化。基于這個(gè)視圖,各種報(bào)表工具和可視化工具就可以將分析結(jié)果展現(xiàn)在用戶面前,以幫助用戶計(jì)劃將采取怎樣的行動(dòng)。
產(chǎn)生利潤的工具
有很多公司都成功地安裝了數(shù)據(jù)挖掘工具。早先采用了這種技術(shù)的公司大部分都是信息密集型公司,比如金融服務(wù)和郵件營銷系統(tǒng),但是現(xiàn)在這種技術(shù)已經(jīng)準(zhǔn)備好應(yīng)用于各個(gè)公司中,只要公司具有大型數(shù)據(jù)庫,并且有強(qiáng)烈的通過軟件技術(shù)改善公司管理的愿望。但是采用數(shù)據(jù)挖掘技術(shù),公司必須兩個(gè)關(guān)鍵的因素,一個(gè)就是大型的,集成化的數(shù)據(jù)庫;另一個(gè)就是定義完善的商業(yè)處理程序,這樣數(shù)據(jù)挖掘才好緊密地應(yīng)用于公司數(shù)據(jù)之上。
采用數(shù)據(jù)挖掘技術(shù)的一些成功應(yīng)用,例如一個(gè)藥品公司,通過對(duì)它最近的營銷強(qiáng)度和銷售結(jié)果的分析,來決定哪一種營銷活動(dòng)在最近幾個(gè)月內(nèi)對(duì)高附加值的醫(yī)生群體影響最大,這樣的分析建立在競爭對(duì)手的銷售活動(dòng)信息和當(dāng)?shù)亟】禒顩r的數(shù)據(jù)系統(tǒng)之上。然后這個(gè)藥品公司可以通過其辦公網(wǎng)絡(luò),將分析結(jié)果傳達(dá)到各地的銷售代表處,銷售代表們則可以根據(jù)公司傳遞的關(guān)鍵信息來作出相應(yīng)的銷售抉擇,這樣,在快速變化的、動(dòng)態(tài)的市場上,銷售代表們都可以根據(jù)各種特殊情況的分析作出最優(yōu)的選擇。
結(jié)語
全面集成了客戶、供應(yīng)者以及市場信息的大型數(shù)據(jù)倉庫導(dǎo)致公司內(nèi)的信息呈爆炸性增長,企業(yè)在市場競爭中,需要及時(shí)而準(zhǔn)確地對(duì)這些信息作復(fù)雜的分析。為了更加及時(shí)地,更加準(zhǔn)確地作出利于企業(yè)的抉擇,建立在關(guān)系數(shù)據(jù)庫和聯(lián)機(jī)分析技術(shù)上的數(shù)據(jù)挖掘工具為我們帶來了一個(gè)新的轉(zhuǎn)機(jī)。目前,數(shù)據(jù)挖掘工具正以前所未有的速度發(fā)展,并且擴(kuò)大著用戶群體,在未來越加激烈的市場競爭中,擁有數(shù)據(jù)挖掘技術(shù)必將比別人獲得更快速的反應(yīng),贏得更多的商業(yè)機(jī)會(huì)。
猜你喜歡的關(guān)注
- u盤無法識(shí)別怎么辦,小編告訴你U盤無法識(shí)別
- usb無線網(wǎng)卡怎么用,小編告訴你安裝教程
- usb調(diào)試在哪,小編告訴你usb調(diào)試在哪
- 優(yōu)盤不顯示,小編告訴你優(yōu)盤不顯示怎么辦
- 低級(jí)格式化,小編告訴你硬盤怎么低級(jí)格式化
- 分區(qū)表丟失,小編告訴你分區(qū)表丟失如何修復(fù)
- 進(jìn)入bios,小編告訴你戴爾筆記本進(jìn)入bios設(shè)
- 怎么刷bios,小編告訴你華碩怎么刷bios
- 讀卡器怎么用,小編告訴你如何使用讀卡器
- bios升級(jí),小編告訴你華碩主板bios怎么升級(jí)