最近,在站長圈刮起一股勁風,可能你已經知道是什么了,沒錯,就是百度即將上線的勁風算法。其實,勁風算法跟小網站沒啥網站,因為小網站,在正常情況下,頁面都不會超過10000個,而,勁風算法主要打擊的是不利用戶體驗的聚合頁。
從字面意思理解,把信息聚集到一個頁面中,正確的說,是把同一注意的內容聚集到一個頁面當中來。
如果能在這種狀態下,對用戶體驗絕對是好的,方便用戶一站式解決問題。
但,我們反過來思考一下,當你通過搜索引擎,搜索有關“減肥方法”的信息,看到一個聚合頁面點擊進去,本以為會有自己想要的信息,解決該聚合頁全都充斥了游戲、育兒等不相關的信息,減肥的信息只有1-2條,是不是瞬間有種被騙的感覺。
這類的聚合頁,就是百度搜索引擎所說的,為了優化而優化的頁面。
不過,從另外一方面來說,凡是搜索引擎打擊的,說明該方法都是確實有效的,只不過我們要換換思路來做而已。
總核心原則:
幫助用戶解決問題為主。
勁風算法,主要懲罰的對象是針對惡劣的聚合頁。
不管是網站還是百度智能小程序,都在勁風的懲罰范圍內。而基于這個算法的面世,其主要問題是行業內,存在很多單純以獲得流量為目的,不管用戶搜索需求滿足度以及搜索體驗的聚合頁。百度為了保障搜索用戶在使用搜索引擎時的整體體驗,同時保證搜索排序的公平公正性。上線了勁風算法。就是為了懲罰創造這一類聚合的網站。
1、站點內容跨領域或過于分散
這個指的是網站中包含了太多領域的詞匯。例如你既要做游戲、又搞教育,還參與了加盟,甚至有電影。不僅搜索引擎無法識別你網站自身的專注領域,用戶訪問你站點的聚合頁后,得到的體驗也是極差的。
這種網站一般都是通過采集拼湊的內容。而這種網站也基本可以理解為是完全基于流量目的的流量站。只能是站長單方面獲得了流量,但對用戶、對搜索引擎都是傷害的。
2、標題與內容不相符
這里所說的標題,更多的可以理解為是我們聚合頁面的關鍵詞,例如這個聚合頁你的關鍵詞是SEO培訓,而里面調取的內容有介紹游戲的、介紹電影的等與關鍵詞本身不相關的內容。這樣即便搜索用戶進入到你這個聚合頁,還是不能很好的解決用戶需求!
3、利用站內搜索生成的聚合頁
利用站內搜索功能,批量生成靜態頁面,這種操作是批量生成聚合頁的慣用手法。多為大內容量較大的網站盛行。
SEO通過大量的關鍵詞整理,然后技術人員以這些詞為站內的搜索詞,將返回的搜索結果批量生成另一種模板的頁面。稱之為利用站內搜索做聚合頁最典型的方式。
這種頁面生成的技術含量最難點在于自身搜索引擎的技術能力。而很多網站又沒有專業的搜索引擎團隊,即便生成出來的內容,相關性差、頁面可讀性低。同樣是勁風算法打擊的對象。
4、內容為空,或較少,以及失效的聚合頁
批量生成的聚合頁,以SEO為首,單純以獲取流量為目的的頁面。大多都會存在聚合頁內,調取的內容過少,甚至為空的現象。
這種類型的頁面可想而知,毫無用戶體驗可言。所以勁風算法對其進行懲罰也是早晚的事情!
針對命中勁風算法之后,并不是說這個網站就從此廢掉了。只要改過自新、百度還是會給機會讓網站重新獲得百度的信任的。
而勁風算法的懲罰周期官方并沒有具體公布,但通過以往算法懲罰后的經驗推斷。一般在3~6個月左右。具體的要視情況而定!
從經驗上來看,網站構成勁風算法的懲罰條件后。會從以下兩個維度進行考慮(個人推斷):
1、對搜索生態造成影響的程度,例如你聚合頁的體量很大,且造成了一定時間內大量搜索用戶體驗較差的情況。
2、聚合頁滿足懲罰條件過多的,上面提到的4種情況中,滿足一條就會遭受懲罰,但很有可能同時符合4種降權條件:既是領域分散的網站,又利用站內搜索批量生成靜態頁,且內容為空的、過少的多的自己都沒統計過。
更多的會圍繞這兩個維度的情況,進行智能給出懲罰周期!
那,命中勁風算法之后,我們就等著恢復嗎?如果不對網站進行整改是基本不可能恢復的。所以恢復的前提是你已經改過自新了!而針對整改我給出如下建議:
前提要明確,聚合頁還是可以做的,只不過針對不能滿足搜索用戶需求,單純以獲取自然搜索來源流量為目的的,是不能再做了。你也不要報著上有對策、下有政策的心態,想辦法去規避被懲罰。即便這一次你沒有命中,那么按照百度的慣例,還會有下一次的勁風算法2.0等著你。
1、針對網站領域過于分散的:
建議確定好一個主要的領域,且將其他領域的內容robots掉,屏蔽搜索引擎抓取,且不再參與搜索引擎排名;
更完美的方式是對其他領域的內容進行刪除,并將刪除的內容URL在百度搜索資源平臺提交404,確保網站無恙。
2、針對題文不相符的:
如果你有精力與資源,可以對應每一個聚合頁的主題進行審查,確保聚合頁下內容都是針對當前聚合頁主題所延展的相關內容。
從技術角度看,建議通過內容相似度計算的方式將網頁內的主體文本進行提取計算。得出當前聚合頁的主題與內容的相似度得分。
并通過實際觀察,確保相似度得分在哪個值上,是可以解決搜索用戶需求的。
例如通過觀察,我認為相似度得分達到62%(便于理解的假設值)的,基本都是相關頁面,那么針對低于62%的暫時就別在前端頁面進行展示了,如果這類URL被訪問到建議設置404,并提交百度搜索資源平臺!
3、針對利用搜索批量生成的:
利用站內搜索批量生成的內容,其最關鍵的問題在于其內容無法滿足用戶需求。畢竟你的搜索引擎技術無法與百度相比。這里給出的建議是:
(1)招聘精通搜索引擎的技術人員,針對搜索調取的內容相關進行大幅度提升。從而提升用戶的體驗度。
(2)利用第3點提到的相似度判斷方式,讓編輯協助完成低于62%的聚合頁的內容撰寫工作。以此不斷提升滿足62%的內容量。
(3)技術能力達不到的,可以通過其他辦法進行嘗試,但最終還是無法確保滿足用戶需求的,建議刪除或者robots操作。
4、針對內容為空或過于少,甚至無效的:
內容為空,甚至過少。在你站點內容資源很豐富沒得到更多調取到聚合頁的情況時,可以采取以下方式:
將更多品類的內容進行搜索整理,從而提升聚合頁下內容整體的豐富度,前期要保證相關性。例如我這個聚合頁是圍繞爬蟲抓取策略展開的,那么其調取的內容都應該基于爬蟲抓取的策略,不能劍走偏鋒,適得其反!
其次,也可以給予你的聚合頁關鍵詞進行分類。例如爬蟲抓取、爬蟲算法、搜索引擎爬蟲、baiduspider,我們認為是一類聚合頁。當內容為空或少于X條時,我們可以通過擴展調取的維度進行補全。
從技術需求的實現角度可以為:如果當前聚合頁下調取內容為0或不足X條時,那么調取當前聚合頁所屬關鍵詞同類別的其他內容,補全X條。
這樣一來,通過擴大調取的品類,以及給關鍵詞做分類形成補全規則問題就能很少的得到解決!
但如果你的內容資源信息很少,那么建議設定的邏輯為:當內容低于X條,甚至為空時,當前頁面返回404。另外,由于我們這些做了404的頁面已經被收錄或者爬蟲抓取了,建議再提交百度搜索資源平臺的死鏈提交工具,進行完備。確保不會讓搜索引擎認為你網站存在大量的死鏈接!
問題:
同一個網站存在太多跨領域的主題,比如一個網站中同時存在著,體育、游戲、視頻、旅游等領域的內容。
記住,你做的不是門戶,你做門戶也不行。
目前,搜索引擎的傾向是垂直!
所以,網站本身跨領域的內容太多,也會成為一種累贅,耗資源不說,搜索引擎也無法給你一個準確的定位。
如何解決這個問題呢?
分兩種情況:
1、新站
如果你的網站剛上線,那感覺再思考一下網站所做的重點領域,把不相關的內容給處理掉。
正常情況下,新站收錄還沒有起來,可以把一些沒有被蜘蛛爬取過,沒有收錄的頁面給刪除掉。
注意,是沒有被蜘蛛爬取,沒有收錄的頁面
2、老站
老網站,已經有不少收錄了,這個時候,你不能輕易的刪除頁面,很容易被搜索引擎懲罰。
可以用robots的方法,把不相關領域的頁面給屏蔽掉,這是應對沒有被收錄的頁面。如果在自查后確實不需要這些內容了,可考慮把其刪除(按照新站的方法做)
如果是已經被收錄的頁面,也是可以用robots屏蔽,或者用301跳轉到其他頁面去。
注意,已經被收錄的頁面要刪除的話,事先一定要記錄好網址,后面一一提交到搜索引擎哪里去,這點很重要,切記不要把沒有收錄的頁面地址也提交過去。
問題:
關于這個頁面,說白了還是網站本身的數據不夠充足,沒有辦法聚合出更相關的內容。
上圖所示,所展現的內容只是簡單的匹配了造句、句這樣的字,并沒有跟似有關的內容出現,文不對題的情形很嚴重。
解決方法:
1、建立你的聚合頁詞庫2、針對關鍵詞去搞內容3、利用python給關鍵詞分詞3、關鍵詞每個詞語都要調用到。
簡單解釋一下,比如“減肥食譜一周瘦10斤”這個關鍵詞,通過分詞之后,會變成這樣:
減肥食譜一周瘦10斤
注意,上方都是跟減肥有關的,那么你在調用內容的時候,要圍繞這些詞語去調用內容。
比如,10斤這樣的詞,在通過精準調用后,可能會調用出類似這樣的內容:
我的減肥方法好,瘦了10斤向著減10斤的目標去減肥
是不是都跟減肥有關呢?
前提是你的網站里面有這些內容存在,不然也是無內容可掉。
這類玩法太高級,像我這種技術小白還是玩不了的,簡單的說,就是通過網站的搜索引擎,把關鍵詞導入進去,生成符合跟關鍵詞有關的頁面。
這類玩法太高級,不多少,不過總的原則是,網站內容不夠多,調取數據精度不夠高也是沒用的。
問題:
一個頁面中只有關鍵詞的多次出現,但沒有跟關鍵詞有關的內容出現,這就是無效的空頁面,就像上圖一樣,沒啥內容。
怎么解決這類問題呢?
還是以“減肥食譜一周瘦10斤”關鍵詞來說明。
比如,你的網站并沒有跟減肥食譜一周瘦10斤匹配的內容出現,那么,你完全可以調用出跟減肥食譜相關的信息出來。
只要是減肥食譜,都具有減肥的效能。
假如,我一開始只想找1種減肥食譜,但打開你的聚合面之后,給了我10種不同的減肥食譜,我也會很高興的認為,你的內容不錯。
按照這個思路,有序的組建內容。