指定您的URL范式
2024-04-26 13:21:11
供稿:網友
發表者: Joachim Kupke, 資深軟件工程師; Maile Ohye, 開發者項目技術帶頭人
原文: Specify your canonical
發表于: 2009年2月12日星期四,12:30 PM
您可能會對URL形式不同造成的重復內容有所擔心,谷歌現在支持一種新的功能,使您可以指定您喜歡的URL格式。如果您的網站通過多種不同形式的URL向訪問者提供完全相同或非常類似的內容,那么通過這種功能您可以自主控制出現在搜索結果中的您網站的URL格式。同時這也有 助于將那些影響您網頁聲望值的因素更固定地指向您所青睞的URL格式上。
讓我們以一個出售瑞典魚的網頁為例,假設我們所青睞的URL格式和所對應的內容是下面這樣的:
http://www.example.com/product.php?item=swedish-fish
然而,訪問者和谷歌機器人實際上可以通過另外的URL形式訪問到這一內容。盡管URL的核心部分與您青睞的URL格式很相近,但是他們依據排序的參數或分類瀏覽種類的不同而向用戶提供略有差別的網頁。
http://www.example.com/product.php?item=swedish-fish&category=gummy-candy
或者,也有可能他們有著完全相同的內容,但是URL看起來并不相同,比如下面的URL還帶有跟蹤參數或者會話ID:
http://www.example.com/product.php?item=swedish-fish&trackingid=1234&sessionid=5678
現在,您可以將如下語句<link rel="canonical" />
加入到其他您不傾向于在搜索引擎出現的URL的<head>代碼中,就能指定您喜歡的URL格式。
比如您不希望以下兩種URL格式在搜索結果中出現:
http://www.example.com/product.php?item=swedish-fish&category=gummy-candy
http://www.example.com/product.php?item=swedish-fish&trackingid=1234&sessionid=5678
只要您將上文中的語句加入到上述兩個網頁的<head>代碼部分,那么谷歌就會知道以上兩個網址實際上是被建議指向您指定的標準URL: http://www.example.com/product.php?item=swedish-fish上。 其他的URL屬性,比如PageRank和相關的其他因素,也都會自動指向該標準URL。
這個標準同時也被其他搜索引擎在抓取和索引您網站時所接受和使用。
以下我們將以FAQ的形式,解答一些您可能存在的疑問:
從強制性與否來說,請問rel="canonical"是一個建議,還是一個指令?
是一個建議。這是一個我們非常自豪的功能,您可以以此提示搜索引擎考慮您對URL格式的喜好。
我能用相對路徑來指定我的URL規范么,比如 <link rel="canonical" href="product.php?item=swedish-fish"/>?
可以,在這里使用相對路徑是可以被正確識別的,如果您在代碼中指定了link,那么相對路徑都會以此base URL為基礎。
我可以將URL范式使用在不是完全相同內容的其他網頁上嗎?
我們允許這些網頁之間有些細微差別,比如歸在不同類目下的同一產品網頁。
如果被指定為規范格式的URL返回404,怎么辦呢?
我們會繼續訪問和抓取您的內容,并應用一些聯想功能去尋找一個URL范式,但是我們強烈建議您將一個可訪問的URL設置成URL范式。
如果我指定的URL范式并沒有被索引會怎樣?
就像網絡上所有的公共內容一樣,我們會努力發現和尋找您指定的URL范式,一旦我們索引到它,我們就會立即將您的rel="canonical"付諸考慮。
我的URL范式可以是一個重定向URL么?
可以,您可以指定一個發生重定向的URL作為URL范式,谷歌會繼續跟蹤這個重定向并嘗試去抓取它。
如果我不小心指定了互相矛盾的URL范式怎么辦?
不用擔心,我們的算法是很聰明并寬容的,我們會跟蹤抓取這個URL范式鏈,但是我們還是強烈建議您盡快將URL范式指定為特定單一URL形式,從而確保您的搜索結果早日得到優化。
這個link tag可以被用來建議一個在其他域名上的URL么?
不可以。如果您需要轉移到一個不同的域名上,那么301永久重定向對您來說更合適。谷歌現在只能認可在不同子域名下的URL范式的指定。所以,站長們可以將www.example.com和example.com, 及help.example.com互相指定為范式,但是不能將example.com和example-widgets.com互相指定為范式。
聽起來不錯,能給我舉一個現實中的例子么?
我們有一個真實的例子wikia.com。比如,您在http://starwars.wikia.com/wiki/Nelvana_Limited 的源代碼中可以發現,該網頁已經把http://starwars.wikia.com/wiki/Nelvana指定為了URL范式。通過使用rel="canonical",兩個網頁的PageRank被整合計算,避免了分散計算的流失,同時搜索結果中也只會包含網站管理員所指定的URL形式。
如果您未能應用URL范式指定您心儀的URL形式,您也不要擔心,我們會盡我們最大努力,選擇一個更優化的URL形式,并將聲望等屬性值進行相應轉移處理,就像我們以前做的那樣(英文)。
補充:這個link tag現在也被Ask.com,微軟Live Search和Yahoo!搜索等搜索引擎所支持。