
Urchin 的報(bào)告數(shù)據(jù)存儲(chǔ)在各個(gè)配置文件所獨(dú)有的每月數(shù)據(jù)庫中(注:Urchin分析后的數(shù)據(jù)是按月歸檔),這些數(shù)據(jù)庫一般位于 Urchin 的 data/reports 目錄下。每個(gè)配置經(jīng)過處理的數(shù)據(jù)庫大小為原日志大小的5% 至10%。
默認(rèn)情況下,Urchin 會(huì)保留每月的這些配置文件數(shù)據(jù)庫,但經(jīng)過長時(shí)間的數(shù)據(jù)積累數(shù)據(jù)量會(huì)變大,導(dǎo)致Urchin處理后的數(shù)據(jù)占用空間越來越大,并且在用戶查看時(shí)也會(huì)降低Urchin的響應(yīng)效率。因此,需要優(yōu)化Urchin 配置文件每月數(shù)據(jù)庫的磁盤存儲(chǔ)空間。
優(yōu)化 Urchin 配置文件每月數(shù)據(jù)庫的磁盤存儲(chǔ)空間的方法通常有以下五種:
1.將配置文件設(shè)置為,在處理日志后自動(dòng)刪除原始跟蹤數(shù)據(jù)
2.設(shè)置配置文件以存檔歷史記錄數(shù)據(jù)
3.限制保留歷史記錄報(bào)告數(shù)據(jù)的月份數(shù)。
4.壓縮配置文件數(shù)據(jù)庫。
5.合理設(shè)置數(shù)據(jù)庫自動(dòng)備份。
方法 1:在處理日志后,刪除原始跟蹤數(shù)據(jù)
可對(duì)配置文件加以配置,以便在處理完成后刪除原始訪問者和會(huì)話信息。這可改善大型網(wǎng)站的性能,降低所存儲(chǔ)的數(shù)據(jù)量。請(qǐng)注意:選擇此配置后,跨日期的會(huì)話會(huì)顯示為兩個(gè)會(huì)話(一天一個(gè)會(huì)話),而不是一個(gè)會(huì)話。對(duì)大部分網(wǎng)站來說,結(jié)果中的差異可以忽略不計(jì)。
對(duì)配置文件加以配置,以便在處理完成后刪除原始訪問者和會(huì)話信息:
1.在管理界面中,點(diǎn)擊”配置”,然后再點(diǎn)擊”Urchin 配置文件”–》”配置文件”。
2.修改所需配置文件。
3.在”存儲(chǔ)/數(shù)據(jù)庫”標(biāo)簽中,將”保留原始跟蹤數(shù)據(jù)”字段設(shè)為”關(guān)閉”。
4.點(diǎn)擊”更新”。
方法 2:自動(dòng)存檔歷史記錄數(shù)據(jù)
可對(duì)配置文件加以配置,將每月歷史記錄數(shù)據(jù)壓縮到存檔文件中。報(bào)告可以查看存檔的數(shù)據(jù),但不會(huì)再為已存檔的月份處理額外的點(diǎn)擊。
對(duì)配置文件加以配置以存檔歷史記錄數(shù)據(jù):
1.在管理界面中,點(diǎn)擊”配置”,然后再點(diǎn)擊”Urchin 配置文件”–》”配置文件”。
2.修改所需配置文件。
3.在”存儲(chǔ)/數(shù)據(jù)庫”標(biāo)簽中,將”存檔數(shù)據(jù)庫”字段設(shè)為”打開”。
4.為”在此后存檔數(shù)據(jù)庫”字段指定月份數(shù)字(此選項(xiàng)指定數(shù)據(jù)保留多少個(gè)月后開始自動(dòng)存檔)。
5.點(diǎn)擊”更新”。
方法 3:定期移除不用的配置文件數(shù)據(jù)
Urchin配置文件data/reports/profile-name”目錄下的數(shù)據(jù)是可以移動(dòng)的,因此對(duì)于不使用的數(shù)據(jù)信息定期移除移除即可。這是最簡單直接的方法,建議通過自動(dòng)腳本實(shí)現(xiàn)。
方法 4:壓縮配置文件數(shù)據(jù)庫
將舊的 Urchin 每月數(shù)據(jù)庫壓縮所產(chǎn)生存檔的大小一般只有未壓縮前數(shù)據(jù)庫集的 20% 到 30% 左右。雖然 Urchin 報(bào)告引擎無法直接讀取 ZIP 存檔,但它可隨時(shí)從 ZIP 存檔中提取所需數(shù)據(jù)庫。報(bào)告引擎不會(huì)刪除已解壓縮的數(shù)據(jù)庫,這可提高用戶查看 Urchin 報(bào)告時(shí)對(duì)數(shù)據(jù)的訪問速度。不過,原始的 ZIP 存檔會(huì)保留在原處,因此定期清除操作可直接刪除解壓縮后的數(shù)據(jù)庫,以重新獲取磁盤空間。
方法5:合理設(shè)置數(shù)據(jù)庫自動(dòng)備份
數(shù)據(jù)庫備份和清除功能提供了對(duì)配置文件備份信息的設(shè)置:
1.啟用自動(dòng)回滾數(shù)據(jù)庫,如果處理過程中途停止或中斷,數(shù)據(jù)可以自動(dòng)得到修復(fù)。Urchin 會(huì)自動(dòng)檢測到這種情況并將數(shù)據(jù)回滾到最近的備份(如果有),然后再繼續(xù)。
2.清除備份,使用此選項(xiàng)可以根據(jù)需保留在下一選項(xiàng)中的備份的數(shù)量,自動(dòng)清除以前的備份。如果啟用此功能,Urchin 將自動(dòng)刪除以前的備份,以控制存儲(chǔ)量。
3.要保留的備份數(shù),此選項(xiàng)可為上述清除功能指定每月保留的備份數(shù)量。
通常從優(yōu)化服務(wù)器占用空間的角度考慮會(huì)關(guān)閉備份所有功能,但從配置文件運(yùn)行安全角度考慮,可以啟用備份功能。

Urchin 數(shù)據(jù)庫存儲(chǔ)技術(shù)概述
對(duì)于每個(gè) Urchin 配置文件,Urchin 會(huì)在名為 YYYYMM(年月) 的目錄下,維護(hù)每月存儲(chǔ)的一組數(shù)據(jù)庫文件。這些目錄分別包含約 50 個(gè)為報(bào)告引擎提供數(shù)據(jù)的文件。這些目錄和數(shù)據(jù)庫文件以其存儲(chǔ)數(shù)據(jù)的月份來命名。完整的數(shù)據(jù)庫列表是:
YYYYMM-uhed –> 數(shù)據(jù)庫標(biāo)頭
YYYYMM-usti –> 字符串索引
YYYYMM-ustd –> 字符串?dāng)?shù)據(jù)
YYYYMM-udai –> 匯總表索引
YYYYMM-udXX –> 匯總數(shù)據(jù)表(XX 由數(shù)據(jù)地圖的表編號(hào)替換)。
YYYYMM-uvii –> 訪問者索引
YYYYMM-uvid –> 訪問者數(shù)據(jù)
YYYYMM-used –> 會(huì)話數(shù)據(jù)
YYYYMM-upad –> 路徑數(shù)據(jù)
YYYYMM-utrd –> 交易數(shù)據(jù) (Ecommerce)
YYYYMM-uitd –> 項(xiàng)目數(shù)據(jù) (Ecommerce)
YYYYMM-ulti –> 日志跟蹤索引
YYYYMM-ultd –> 日志跟蹤數(shù)據(jù)
YYYYMM-utod –> 總計(jì)數(shù)據(jù)
YYYYMM-uhid –> 柱狀圖數(shù)據(jù)
YYYYMM-umad –> 訪問者矩陣數(shù)據(jù)
每一組數(shù)據(jù)庫對(duì)于所包含數(shù)據(jù)的月份來說都是完整的。因?yàn)槊吭碌臄?shù)據(jù)庫集之間并無相關(guān)性,因此可對(duì)每個(gè)數(shù)據(jù)庫集獨(dú)立進(jìn)行存檔和修剪操作,其他月份的數(shù)據(jù)不會(huì)受到影響。
正常操作下會(huì)保留每個(gè)月的整套月份數(shù)據(jù)庫文件。不過,Urchin 日志處理引擎只會(huì)使用這些數(shù)據(jù)庫文件的 4 個(gè)文件。這些數(shù)據(jù)庫文件是:
YYYYMM-usti
YYYYMM-udai
YYYYMM-ulti
YYYYMM-ultd
Urchin 日志處理引擎會(huì)使用下列數(shù)據(jù)庫文件處理跨群體和訪問者深入查看報(bào)告。刪除這些內(nèi)容僅會(huì)影響到這些報(bào)告功能。
YYYYMM-uvii
YYYYMM-uvid
YYYYMM-used
YYYYMM-upad
YYYYMM-utrd
YYYYMM-uitd
這些數(shù)據(jù)庫包含有關(guān)訪問者、會(huì)話、路徑、交易和產(chǎn)品的信息。這些文件會(huì)使用當(dāng)月所需總存儲(chǔ)空間的某個(gè)百分比,大約 10% 到 50% 左右。因此,如果將”配置文件配置”的”存儲(chǔ)/數(shù)據(jù)庫”屏幕的”保留原始跟蹤數(shù)據(jù)”選項(xiàng)設(shè)為關(guān)閉的話,即可贏得較大的磁盤空間。
建議只有訪問量極高、保留原始跟蹤數(shù)據(jù)會(huì)造成磁盤或 CPU 資源消耗問題的網(wǎng)站,才停用”保留原始跟蹤數(shù)據(jù)”選項(xiàng)。
文章來源:搜索營銷藝術(shù)
新聞熱點(diǎn)
疑難解答
圖片精選