一個規范的網站,網站地圖肯定是少不了的。一個單獨的網站地圖頁面不僅可以讓用戶對整個網站的目錄結構及內容有一個很好的認識且一目了然,而且方便百度蜘蛛跟蹤連接爬行到網站所有主要部分內容。
網站地圖主要有兩種:
XML網站地圖
HTML網站地圖
下面我們一個個來學習這兩種網站地圖。
HTML網站地圖
HTML版本的網站地圖主要是給用戶看的,主要列出了網站上所有主要連接的頁面。特指HTML版本網站地圖英文是sitemap,其中s需要小寫。
小規模網站,其網站地圖可以列出網站上所有的頁面。
規模稍大的網站,一個網站地圖列出所有頁面不是很現實。可以只列出網站上主要連接(一級分類,二級分類)。也可以將網站地圖分成多個文件,主網站地圖列出通往次級網站地圖的連接,次級網站地圖在列出一部分頁面連接。這樣,多個網站地圖頁面加一起,就可以列出所有或絕大部分重要頁面了。
如果有一個良好的導航系統或者鏈接結構的網站,不一定要列出完整所有頁面的網站地圖。其實,網站地圖和分類結構大同小異。
XML網站地圖
XML版本網站地圖主要是給搜索引擎看的,由XML標簽組成,該文件必須是utf8編碼。實際上,就是列出網站要被收錄的頁面鏈接。特指XML版本網站地圖英文是Sitemap,其中S通常是大寫。
簡單的XML網站地圖可以是一個文本文件,列出頁面的鏈接,一行一個,這樣搜索引擎就能理解和抓取文件的內容了。
標準的XML網站地圖文件如下:
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84"> <url> <loc>http://wxlpsy.com/category-2.html</loc> <lastmod>2016-11-07</lastmod> <changefreq>weekly</changefreq> <priority>0.4</priority> </url> </urlset>
標簽解讀
urlset:聲明文件所使用的Sitemap協議版本,是必須要的標簽
url:是它下面所有網址的母標簽,是必須要的標簽
loc:列出頁面完整的url,是必須要的標簽
lastmod:表示頁面最后一次更新時間,此標簽可選。
priority:可選標簽,表示鏈接的相對重要程度
changefreq:代表文件的更新頻率,是可選標簽。可以有以下值:
changefreq標簽值
always:表示一直變動,指每次訪問頁面內容都不同
hourly:每小時
daily:每天
weekly:每周
monthly:每月
yearly:每年
never:從不改變
設置頻率更新值是給搜索引擎一個參考。但是,搜索引擎不一定就認為更新頻率就如站長設置的一樣。
XML網站地圖最多可以列出5萬個URL,且文件大小不能超過10MB。
如果網站要收錄的URL太多,可以分成多個網站地圖文件。
一個網站最多可以有1000個XML網站地圖文件,可以列出5000個網址。
XML網站地圖可以通過站長工具后臺提交,百度、360、google都支持該功能。另一種可以放到robots.txt 文件了通知搜索引擎,如下:
Sitemap: http://www.sztqnet.com/sitemap.xml
主流的搜索引擎都支持robots文件制定網站地圖文件位置。