我們在優化網站的時候都會遇到頁面的相識度,頁面的相識度指的是網站頁面與頁面的相識度。搜索引擎在抓取頁面的時候,通常都會對頁面就行比較,如果一個頁面的相識度達到80%以上搜索引擎就會認為是垃圾內容,就不會給予收錄,在70%到80%之間的搜索引擎會收錄,但是給予的權重不高;
搜索引擎在判斷價相識度高度的同時會采用兩種算法,一種叫做MD5的算法,如果摘要太過于相識就會認為是抄襲;另外一種就是關鍵詞的出現程度,搜索引擎在判斷頁面內容是否是高價值的時候會吧你網站上面所出現的文字進行組合,組合成可以匹配的關鍵詞,在用這些關鍵詞去搜索引擎的數據庫里面進行匹配,如果大部分的關鍵詞都在同一另個網站頁面上的時候,就證明你的這個頁面是垃圾頁面。
網站頁面的布局都是導航、頁面的邊欄、底部跟主要區域,不同的就是樣式、代碼跟內容,所以我們最主要的就是解決這三個個問題,不懂代碼的只要解決內容就可以了。
頁面的相識度也可以不是在同一個網站上面的頁面。很多人建網站都是用一些開源的程序,然后在尋找一個適合自己行業的模板,但是這些模板都是有很多人在用了的,我們在去用就會產生跟其網站上面的相識度,仿別人網站上面的模板來用,即使你使用不同的開源程序或者不用語言編寫出來的程序都會產生頁面的相識度過高。
網站上面的樣板文字是大多數企業網站都會有的,這些樣板文字的產生大多數都是站長在做網站的時候都喜歡在在網站的邊欄上面放上一些全站使用的文章或者文字,比如說公司簡介、聯系我們…等一些無關緊要的,對于這些無關緊要的我們可以把它做成一張圖片,添加上去就可以了。
采集的文章無論是從MD5算法,還是關鍵詞匹配,都是在同一個網站上面,想要相識度不高,怎么會可能呢?
至于跟別人網站上面的相識度我們只要內容,跟他們不一樣就可以了
有問題不可怕,知道了問題的產生我們改正就可以了,避免下次反同樣的錯誤,建議大家盡量努力寫原創的文章,原創的文章不僅僅搜索引擎喜歡,而且還能夠降低網站頁面與外部頁面的相識度。