網站的URL是搜索引擎索引和抓取內容的的一把鑰匙,也是唯一的入口,對于網址的合理處理可以增加收錄數量。由于網站使用的開發語言各不相同,也會產生各種奇形怪狀的URL。
比如長度很長,URL中帶有很多連詞符號(-)、&、%、井號,URL中直接使用中文漢字作為URL的一部分等,這些都是不規范、不友好的URL,會給搜索引擎索引頁面時增加難度。
網站URL優化是每一個網站必須進行的一個步驟,一般情況下我們習慣稱之為URL標準化,好的網址對搜索引擎是有幫助的,常見的方法是使用URL重寫的方式來達到優化的目的。
幾乎所有的搜索引擎在URL優化上都建議使用靜態或偽靜態的方式,也就是使用rewrite方法將動態網址處理成偽靜態的方式,那么是不是只要使用了URL重寫就算真正的對搜索引擎友好了呢?
答案是否定的,因為有些URL重寫規則本身就有問題,比如這個網址/seo/df-r-y-00-12-h/%hfgh/%hf/2.html,雖然已經是偽靜態了,但是可以很直觀的看出目錄層級太多,特殊符號太多。即使是偽靜態,這樣的網址也是不規范的偽靜態。
所以想要是URL對搜索引擎友好,不僅要做好URL重寫,還應該做好規范的偽靜態,具體應該這樣來優化網站的URL。
一般情況下,一個網站應該有清晰的目錄結構,欄目列表首頁→欄目1,首頁→欄目1→欄目2,如下圖所示,網站的分類欄目是層次清楚的,在重寫URL時也應該按照這樣的層級關系來處理。
URL欄目層級優化
欄目頁應該這樣去做優化:
/lanmu1/
/lanmu1/lanmu2/
/lanmu1/lanmu2/lanmu3/
每一級欄目都清晰明了,在做欄目優化時最后要加上斜杠,URL目錄最大保持在3層目錄,網址目錄層級太多不利于SEO優化,這樣會減少搜索引擎對服務器的請求,網址最后的斜杠有指向具體文件的意思。
不知道從什么時候起,有人鼓吹在URL中出現關鍵詞有利于排名的提升,作用會有那么一丁點,實際上是一種誤導。
在URL中不要使用特殊符號,因為你不確定某個特殊符號是否會造成收錄失敗,比如URL中的井號,搜索引擎在遇到網址中的井號時就會直接截斷井號后面的內容不予理會。而特殊符號也會增加解析URL的難度,正確的做法是URL只用字母和數字,盡量少用或不使用下劃線、連詞符號、及中文。
中文出現在網址中,搜索引擎在識別URL時會進行二次轉碼識別,優勢難免會出現識別不了的情況,所以那些用中文關鍵詞作為URL一部分的是完全不規范的,而且對排名沒有什么提升效果。
網址太長了搜索引擎抓取也會比較費勁,不是抓取不了,而是增加了搜索引擎識別的難度。對瀏覽器來說網址有多長都沒有關系,但是搜索引擎不行,想要收錄好就不要把URL弄得很長。URL長度的計算方法是除去協議“http(s)://”后剩下的全部符號及字符數量,按照網站的編碼,utf8占3個字節,gbk占2個字符,可以自行計算一下是否超出了長度。
有人喜歡把詳情頁的URL制作成欄目的方式,比/asd/2.html則把網址寫成/asd/2這樣的方式,原因是欄目頁的權重會比詳情頁更高,為了提高詳情頁的權重所以這樣做。這種做法也是不對的,詳情頁就應該明確地指出具體的文件名,這樣搜索引擎就不用再去查找了。詳情頁使用URL重寫后應該以.html結尾,指明這是一個靜態文件,而不是讓搜索引擎還有在去查找一番。
所以欄目頁要記得在最后加上斜杠,不如“/seo/felei1”這個欄目頁正確的寫法是“/seo/felei1/”,詳情頁/lm/a.html這樣才算正確。
總之在優化URL時可以統一一個規則,不要想當然的隨便優化,優化不當可能會導致收錄不好,最保險的方法就是使用字母,數字,不使用特殊符號。