分詞技術是搜索引擎對用戶提交的關鍵詞進行處理以后,根據用戶的關鍵詞串進行匹配的一種技術。雖然谷歌是這種技術的創始者,但由于中文比英文復雜得多,所以中文分詞這方面還是百度領先。
中文分詞有三種方法:字符串匹配的分詞法、詞義分詞法以及統計分詞法。
這里概念就不介紹了,我們直接分析案例。我們以“金融網站建設”作為例子,假如這就是你網站的關鍵詞:
這個關鍵詞用字符串匹配的分詞是“金融網站建設”,詞義分詞是“金融網站”、“網站建設”,統計分詞是“金融”、“網站”、“建設”。一個詞分成這么多個,百度還會按照這些分詞詞語的匹配、詞義的匹配、詞語出現的頻率,最后決定根據哪些詞語捕捉網頁。
話不多說,我們在百度輸入“金融網站建設”,從搜索結果我們可以看到,除去廣告,排名第一的網站紅色的關鍵詞大體都是“金融網站建設”以及其分詞:
這里有人可能會奇怪,有些網站詞義不太相近位置也很靠前,比如:
這主要是因為除去標題意思相近,文章的被關注率,網站主題,網站的外鏈及權重也是決定其排名的因素。但是這和我們的主題無關就不多介紹了。
然后我們再用百度快照來看一下
你能看到“金融網站建設”被標黃,這是百度給的權重。其中黃色>藍色>綠色,這里我們看到的全部是黃色,這也就是為什么該網站排名靠前的原因。
所以以這個內容為例,我們最優先考慮的關鍵詞應當是“金融網站建設”以及“金融”,然后再考慮“金融網站”,再考慮“網站建設”。因為“建設這個內容太寬泛可能與行業無關,我們就不予考慮了。
通過中文分詞技術,再熟悉網民搜索的習慣,我們將更容易為我們的網站確定關鍵詞,在提升網站排名上如魚得水。