首先說明我是如何建站的,我當初的夢想是以”書“的形式來統一信息,因為我始終相信”書“是唯一能歸類整理信息的”工具“,所以我做了書站。整個網站模擬自然書的結構。開始的流量只有一天30人。
為什么沒有流量呢? 原因很簡單,因為我的書全是”經典“的書,而不是玄幻類的文化快餐。從此我改變了思路,還是先有流量再說,于是進了百度排行榜,選最熱門的書添加(純手工的方式)??墒亲屛沂氖?,所有的小說站都是廣告,而且禁止粘貼復制!加了一晚上才加了一本書。(幸運的是那段時間我一直在研究網絡蜘蛛,因為我想要實現信息的歸類整理,只有靠機器去完成,人是不可能的。)第2天繼續加書的時候我用自己研究的小工具抓取了下那個“垃圾”書站的內容。發現竟然是靜態頁面再套個iframe,而js 代碼禁止粘貼復制。但iframe里面竟然是一個aspx文件,而且帶有參數。當時喜出往外,于是連續獲取那網站3個頁面,書頁,卷頁,及章頁。我驚奇的發現,原來我可以輕易的寫程序采集出來。于是一天寫了采集程序,終于可以點下按鈕加一本書的??墒菃栴}出現了,成功率只有98%,也就是一本書,至少有一張缺頁。我繼續采第2遍,發現依然缺頁,但缺的不是同一張。終于知道了,因為網速,怎么也會有誤差,于是我設計數據庫,把采集過的地址保存下來,并且判斷是否抓取成功,沒成功就補抓,補抓3遍終于出錯率降低到了萬分之一。繼續完善程序,花了3天針對那個”垃圾“站點寫了采集程序,一晚上采集了近1萬本書。并且全部做了搜索引擎優化。
開始,奇跡發生了。流量 從 30-200-500-1200-3000-6000-12000-3萬 ,我現在依然能記得當時是怎么成幾何級數增長的流量的。平均每過一星期就要增長2-3倍!
盈利:為了掙錢我來到了"落伍”,雖然我承認是編程高手,但對于網掙我是個外行。很快因為網站,我落伍了。很快認識了很多“落伍”的朋友,很快我去嘗試了很多聯盟。什么sogou,keyrun,iplus,myad,百度推廣,gogle推廣,還有采信,電影等等。從點擊廣告,到美女圖片,到彈出窗口,我都放。很快自己真的“落伍”了,很快開始的理想忘了,很快我的站也垃圾了,雖然一天可以掙個100多。
流量的急劇下滑:也許上天的懲罰,也許是因為我太過于急功近利。終于,我遭了“落伍”的黑手。我的站給別人采集了。由于我全部頁面div+css,采集我的站的人基本隨便找個軟件就可以100%采集完。而那個人又是個seo高手。于是我對流量全跑他那去了。我寫信給那個人,他也回了,他告訴我以前不知道采集為何物,也是因為在落伍亮了自己的站,所以給采得體無完服。從那以后,他再也不在落伍發帖,只看帖。從那以后,他也采集了,從那以后。。。。。。。我成了他的目標.......
反采集研究:從那天起,我猛然意識到,光采集還不行,采集所有基本的手段和技術對我來說都不存在技術門檻,但我不能讓我辛苦采集到的內容給別人輕易采集了。于是,我苦心研究了幾天的反采集技術,因為我相信一般采集的人自己都不會寫采集程序,都是下程序來采集的,而且大多數是web采集程序,所以只要能防得住我自己,相信可以防得住99%的菜鳥采集者。當然高手是不可能防得住的,除非你不顯示。終于我研究出了初步的反采集,即能讓搜索引擎搜索,又能讓采集程序無法獲取內容,結合js,又能讓瀏覽器獲取內容。實驗了一個星期,百度成功更新了我改版后的網站!
奇跡,流量少了,掙的錢反而多了!有的時候真是有意載花花不開,無心插柳柳成陰。我無意中采集csdn6萬篇編程文檔,竟然讓我每天掙了10美元!編程站每天只有2000的ip,pv也不過3000,然而經過我優化google廣告的位置,竟然破天荒的達到 3-4%的點擊率,而且單價非常之高?。?!以前3萬ip,15萬pv的讀書站,少的時候只能掙8美元,而2000ip的編程站竟然能獲取這么多收入!
回到原點,人間正道是滄桑!結合自己做百度的經驗,在百度里做競價的都是企業,比如賣車的廣告,沒有人出汽車這個關鍵詞,因為搜汽車的都是看圖片的,但輸入汽車品牌,汽車配件,肯定是商人或用戶,所有有人出高價!同樣的道理,網絡的經濟,尤其是google 的廣告,我們的企業何嘗不是最大的廣告主呢?為了避免無效廣告,為了體驗“效果為王”各個商家都會在很專業的領域買關鍵詞。所以才有編程站的單價之高!所以真正的網掙,是獲取真正有價值的信息,到了今天我才明白了什么是IT,什么是“信息科技”!
未來發展的方向:“采盡天下為我所用“!2005年是搜索力經濟年,在2006年這個勢頭還會持續發展。搜索引擎之所以能火,是因為它海量的信息!既然自己能輕易的把那么復雜書采集了,證明一點沒有我采不到信息,但關鍵不是采集,而是建立起智能蜘蛛,讓服務器自動的去采集,整理,發布。把采集程序寫成windows的服務。開機自動運行,并且定時讀采集規則文件,定時采集,定時發布成最最最簡潔的靜態頁面,方便搜索引擎收入。而信息就是全天下的各行各業的正規信息。在采集的同時,不斷完善反采集技術,做到只有我采別人的,不能讓別人來采我的。因為最后我發布的信息肯定是很簡潔的信息。
我的心里話:錢=有價值的流量=有價值的信息。聯盟就做google吧,因為google是迄今我認為最公正的最不會扣量的網掙聯盟。做國內的10個聯盟都比上做一個google,而且你做那種廣告,用戶體驗會降低,而你放google不但不會妨礙別人訪問,反而會因為google的知名,讓人感覺你的網站正規可信!
新聞熱點
疑難解答