網站快照老是不更新,查看網站日志的蜘蛛訪問,發現內頁蜘蛛抓取都正常,唯獨首頁會出現蜘蛛返回200064,要么就是301064(因為www和沒有www的做了跳轉)于是我搜索相關資料并分析了該狀態碼,網上都眾說紛紜,先總結一下大致的問題吧。
先說一下200064狀態碼的意思。
200表示正在訪問該頁面了,但出現64說明抓取的大小不正常,這種不光是蜘蛛會出現,用戶訪問也會出現的,意思抓取到一般中途放棄了。比如你自己打開該頁面,但沒等加載完就關閉了,就會出現64的狀態!
關于百度蜘蛛會出現200064的問題總結:
1、比較常見的情況是網站未更新。
(這種說法是說不通的,蜘蛛衡量頁面是否更新是根據頁面大小來的,只要你頁面有變化,大小肯定會不一樣的!所以這條可以排除!)
2、內容質量差,大多為采集信息,原創內容少!
(這個也有可能,但是我的是小說站,地球人都知道小說站幾乎不存在什么‘原創’了,而且我的站內頁也都是正常20000,要說不是原創,內頁內容才是真正的不原創內容了!所以說這一條也不成立,就算有影響,也影響不大!)
3、一部分人說這是K站前兆,出現次數多了會扔入百度沙盒等。
(我可以斬釘截鐵的說這個完全是扯蛋,百度官方也明確給出了答復,200064不是K前兆,對網站沒有影響!當然有沒有影響要看自己判斷了,我個人覺得該狀態碼出現次數多了,雖說不會K站,但多多少少會有些影響的!)
4、網站啟用了GZIP壓縮,導致蜘蛛抓取內容不正常!
(這個問題比較常見,一般是出現在GIZP壓縮設置上,關于這點大家可以搜GZIP壓縮能讓蜘蛛正常抓取的設置!)
5、頁面優化過度!(經過一個多星期的觀察,我的站問題應該是與這個有關)
這個情況有很多種,比如更換了標題關鍵詞,修改了底部信息,改動了框架等,都有可能會影響這個問題!我的站就是因為改動了頁面底部信息,即使我在沒有改動原來框架的情況下,額外加了一個div層,都會出現這種情況。
所以遇到類似問題的站長們,可以參考一下以上幾點問題,早日解決你的困擾!