百度作為第一大中文搜索引擎是不希望搜索結(jié)果被控制的,百度搜索URL這么多的參數(shù)我們不可能一下子記住,其實(shí)我們記住幾個(gè)重要的參數(shù)就可以了,現(xiàn)在已經(jīng)有黑帽SEO利用這些參數(shù)人為的去影響百度結(jié)果了,在百度輸入關(guān)鍵詞搜索出現(xiàn)的列表頁,點(diǎn)擊目標(biāo)鏈接,然而跳轉(zhuǎn)的時(shí)候卻是百度地址,經(jīng)過百度解析,才真的跳到目標(biāo)頁面。
word=代表手機(jī)移動(dòng)搜索,wd=代表電腦PC搜索
sa=ib(首頁)
sa=tb(上方搜索輸入框)
sa=np(內(nèi)頁)
oq=上一次搜索詞(之前利用這個(gè)刷出下拉)
rq=這段時(shí)間新增加的參數(shù),參數(shù)跟oq調(diào)用的也是上一次搜索詞
sa=ts_“?”(1代表第一個(gè)下拉詞,2代表第二個(gè)下拉詞,3代表第三個(gè)下拉詞,4代表第四個(gè)下拉詞,5代表第五個(gè)下拉詞,例:sa=ts_1 那么就是第一個(gè)下拉詞)
rsv_pq=(搜索驗(yàn)證)
rsv_t=(搜索驗(yàn)證)
ssid=(據(jù)說是識(shí)別路由器,反正是識(shí)別網(wǎng)絡(luò)或者網(wǎng)段之類的東西,只用利用360瀏覽器進(jìn)行搜索才有這個(gè)參數(shù))
tn=搜索框來源標(biāo)識(shí),tn=iphone是代表模擬手機(jī)設(shè)備蘋果模擬器,tn=zbios代表是蘋果下面的客戶端搜索。
百度的搜索URL存在著一定的規(guī)律和邏輯,下面的鏈接是我使用百度搜索“標(biāo)點(diǎn)符”后得到的鏈接,下面就來一起分析下百度搜索結(jié)果URL的秘密。
http://www.baidu.com/s?wd=標(biāo)點(diǎn)符&rsv_spt=1&issp=1&rsv_bp=0&ie=utf-8&tn=baiduhome_pg&inputT=2969
URL中的s?表示搜索,&符號(hào)起到參數(shù)分割的作用。上述鏈接涉及到的參數(shù)如下:
wd:Keyword,查詢的關(guān)鍵詞,有時(shí)還會(huì)是word,比如www.hao123.com打開的鏈接就是word,wd后面的關(guān)鍵詞使用gb2312進(jìn)行編碼,如果搜索詞中出現(xiàn)空格則使用+號(hào)替換;
rsv_spt:識(shí)別瀏覽器,目前測試下來Chrome、FireFox、Safari的為3,IE瀏覽器為1;
rsv_bp:判斷搜索位置:0為從百度首頁進(jìn)入,1為搜索結(jié)果頂部搜索,2為搜索結(jié)果底部搜索;
ie:InputEncoding,查詢關(guān)鍵詞的編碼,缺省設(shè)置為簡體中文,即ie=gb2312;
tn:搜索框來源標(biāo)識(shí),如百度首頁的就是baiduhome_ph,hao123站來的sitehao123,遨游瀏覽器的為tn=myie2dg等。除了百度自身用來數(shù)據(jù)統(tǒng)計(jì)好,詞數(shù)據(jù)還對(duì)百度搜索聯(lián)盟分成起到跟蹤作用。tn=baidulocal表示百度站內(nèi)搜索,返回的結(jié)果很干凈,無廣告干擾;
inputT:搜索響應(yīng)時(shí)間,單位是毫秒;
以上我上面的URL中出現(xiàn)的參數(shù),但是百度的搜索引擎參數(shù)遠(yuǎn)遠(yuǎn)比上面的還要多。再來看看還有哪些參數(shù):
bs:BeforeSearch,上一次搜索的關(guān)鍵詞;百度會(huì)記錄上一次用戶的搜索詞是什么;
sr:結(jié)合bs使用。一般查詢sr=0或者為空值,但sr=1時(shí),查詢將結(jié)合bs的值一起作為查詢的關(guān)鍵字。默認(rèn)值為0,除0,1外其它值無效。
pn:PageNumber,搜索結(jié)果的頁碼,從零開始計(jì)數(shù)。即pn=${結(jié)果頁碼-1}*rn;
rn:RecordNumber,搜索結(jié)果顯示條數(shù),缺省設(shè)置rn=10,取值范圍:10-100;
cl:Class,搜索類型,cl=3為網(wǎng)頁搜索,cl=2為圖片搜索;
lm:搜索結(jié)果的時(shí)間限制。以天為單位,例如搜索最近一個(gè)月的網(wǎng)頁,lm=30.默認(rèn)值為0,表示沒有時(shí)間限制;
ct:語言限制。0-所有語言,1-簡體中文網(wǎng)頁,2-繁體中文網(wǎng)頁;其它不確定或者無效或。默認(rèn)值為0;
q5:搜索內(nèi)容位置限制。0-所有內(nèi)容;1-網(wǎng)頁標(biāo)題(相當(dāng)于使用’title:’查詢前綴);2-url(相當(dāng)于使用’inurl:’查詢前綴);其它值等效于0,默認(rèn)值為0;
q6:搜索內(nèi)容網(wǎng)站限制。例如q6=www.biaodianfu.com,表示只搜索http://www.biaodianfu.com/的網(wǎng)頁;相當(dāng)于使用了’site:前綴’,默認(rèn)值為空
dq:不建議使用該參數(shù)。查詢內(nèi)容來原的地區(qū)限制。具體值有百度確定,默認(rèn)值為空。使用這個(gè)參數(shù)的效果很差;
oq:相關(guān)搜索的主詞,例如,搜索“標(biāo)點(diǎn)符”后點(diǎn)擊“標(biāo)點(diǎn)符號(hào)”,出現(xiàn)的相關(guān)搜索,用來記錄來源詞“標(biāo)點(diǎn)符”,或輸入搜索詞,輸入到一半點(diǎn)推薦關(guān)鍵詞的那個(gè)詞,兩個(gè)通過出現(xiàn)rsp/rsv_bp進(jìn)行區(qū)分;
rsp:相關(guān)搜索詞的位置,第一個(gè)推薦詞為0,第二個(gè)為1,以此類推;
usm:在百度搜索任何詞從任何一頁點(diǎn)到第三頁以后的,都會(huì)隨機(jī)出現(xiàn)usm的參數(shù)。當(dāng)usm=0的時(shí)候是正常排名。當(dāng)usm=1的時(shí)候所有排名后移一位,當(dāng)usm=2的時(shí)候排名后移兩位,以此類推。而詞參數(shù)影響排名的效果只對(duì)第三頁以及第三頁以后的有效,也就是說前20名的排名不受詞因素影響。此參數(shù)具體作用未知;
f:搜索判斷,f=8用戶自主搜索,f=3下拉框推薦,f=1相關(guān)搜索;
rsv_ers:出現(xiàn)的值為rsv_ers=xn0或rsv_ers=xn1,目前還不知道具體的作用。
rs_src:目前看到的都是rs_src=0,此參數(shù)與rsv_ers同時(shí)出現(xiàn)。
http://www.baidu.com/s?wd=關(guān)鍵字
wd(Keyword):查詢的關(guān)鍵詞;
http://www.baidu.com/s?wd=關(guān)鍵字&cl=3
cl(Class):搜索類型,cl=3為網(wǎng)頁搜索,cl=2為圖片搜索;
http://video.baidu.com/v?rn=20&pn=0
pn(PageNumber):顯示結(jié)果的頁數(shù);
http://www.baidu.com/s?ie=gb2312
ie(InputEncoding):查詢關(guān)鍵詞的編碼,缺省設(shè)置為簡體中文,即ie=gb2312;
http://image.baidu.com/i?ct=503316480&si=zbjingshui.com
ct–此值一般是一串?dāng)?shù)字,可能是搜索請(qǐng)求的驗(yàn)證碼;
si–在限定的域名中搜索,比如想在本站內(nèi)搜索可使用參數(shù)si=shangzhiwang.com,要使這個(gè)參數(shù)有效必須結(jié)合ct參數(shù)一起使用;
http://video.baidu.com/v?rn=20&pn=0
rn(RecordNumber):搜索結(jié)果顯示條數(shù),缺省設(shè)置rn=10,取值范圍:10-100;
http://www.baidu.com/s?bs=商智網(wǎng)絡(luò)
bs(BeforeSearch):上一次搜索的關(guān)鍵詞;
tn:提交搜索請(qǐng)求的來源站點(diǎn),這是百度與免費(fèi)軟件合作時(shí)的利益來源,舉例來說我們使用的一些免費(fèi)瀏覽器中所提供的百度搜索時(shí),URL地址中都帶有tn=內(nèi)容,tn=后面的內(nèi)容就是百度聯(lián)盟的賬號(hào)。如:Firefox的tn=suvion_dg(tn=suvion_4_dg),傲游的tn=myie2dg,TheWorld的tn=suvion_4_pg,只要你使用了這些帶有tn=的搜索,只要點(diǎn)擊了其中的廣告,提供該軟件的瀏覽器就會(huì)從中賺取利益。搜索結(jié)果有個(gè)例外,當(dāng)tn=baidulocal時(shí),你可以得到一個(gè)無競價(jià)無廣告的百度搜索結(jié)果.
http://www.baidu.com/s?lm=0(搜索結(jié)果時(shí)間限制)&si=&rn=10(每頁顯示的數(shù)目)&ie=gb2312&(語言)ct=0&wd=?%6??&(關(guān)鍵詞)pn=10(在第pn比上10后加上1頁)&ver=0&cl=3&uim=6&usm=0
tn搜索框所屬網(wǎng)站。比如tn=sitehao123,就是http://www.hao123.com/左上那個(gè)搜索框
ieInputEncoding-輸入編碼。百度似乎不支持其它編碼。默認(rèn)值是“gb2312”
word搜索的關(guān)鍵詞。
kw搜索的關(guān)鍵詞。
bsBeforeSearch-上一次搜索輸入的關(guān)鍵詞.
sr不建議使用該參數(shù).結(jié)合bs使用。一般查詢sr=0或者為空值,但sr=1時(shí),查詢將結(jié)合bs的值一起作為查詢的關(guān)鍵字.默認(rèn)值為0,除0,1外其它值無效。
ct語言限制。0-所有語言,1-簡體中文網(wǎng)頁,2-繁體中文網(wǎng)頁;其它不確定或者無效或。默認(rèn)值為0.
rn每頁包含的搜索結(jié)果數(shù)目。默認(rèn)值為10
pn搜索結(jié)果的頁碼,從零開始計(jì)數(shù)。即pn=${結(jié)果頁碼-1}*rn。
lm搜索結(jié)果的時(shí)間限制。以天為單位,例如搜索最近一個(gè)月的網(wǎng)頁,lm=30.默認(rèn)值為0,表示沒有時(shí)間限制。
q5搜索內(nèi)容位置限制.0-所有內(nèi)容;1-網(wǎng)頁標(biāo)題(相當(dāng)于使用’title:'查詢前綴);2-url(相當(dāng)于使用’inurl:'查詢前綴);其它值等效于0.默認(rèn)值為0
q6搜索內(nèi)容網(wǎng)站限制.例如q6=sohu.com,表示只搜索sohu.com的網(wǎng)頁;相當(dāng)于使用了’site:前綴’.默認(rèn)值為空
dq不建議使用該參數(shù).查詢內(nèi)容來原的地區(qū)限制.具體值有百度確定.默認(rèn)值為空.試了一下,使用這個(gè)參數(shù)的效果很差.
myselectvalue
submit=
tb=on貼吧?
f未知。默認(rèn)值為空
cl未知。默認(rèn)值為空
rs2未知。
sc未知。
================================================================
構(gòu)造半自動(dòng)化搜索引擎查詢,需要了解一下,百度url構(gòu)成方式和參數(shù)的作用。雖然是轉(zhuǎn)載,但是還是有很大的學(xué)習(xí)意義了。
http://www.baidu.com/baidu?cl=3&tn=baidutop10&wd=????
這是一個(gè)從百度風(fēng)云榜里面截取的url鏈接了。cl=3表示網(wǎng)頁搜索,tn表示來源站點(diǎn),wd是關(guān)鍵詞%B6%B9%B0%EA是utf編碼之后的結(jié)果了。
必備參數(shù):
wd——查詢的關(guān)鍵詞(Keyword)
pn——顯示結(jié)果的頁數(shù)(PageNumber)
cl——搜索類型(Class),cl=3為網(wǎng)頁搜索
可選參數(shù):
rn——搜索結(jié)果顯示條數(shù)(RecordNumber),取值范圍在10–100條之間,缺省設(shè)置rn=10
ie——查詢輸入文字的編碼(InputEncoding),缺省設(shè)置ie=gb2312,即為簡體中文
tn——提交搜索請(qǐng)求的來源站點(diǎn)
幾個(gè)有用的tn
tn=baidulocal表示百度站內(nèi)搜索,返回的結(jié)果很干凈,無廣告干擾。
比如,在百度站內(nèi)搜索“快樂”,看看返回結(jié)果是不是很清爽。
tn=baiducnnic想把百度放在框架中嗎?試試這個(gè)參數(shù)就可以了,是百度為Cnnic定制的
si——在限定的域名中搜索,比如想在新浪的站內(nèi)搜索可使用參數(shù)si=sina.com.cn,要使這個(gè)參數(shù)有效必須結(jié)合ct參數(shù)一起使用。
ct——此參數(shù)的值一般是一串?dāng)?shù)字,估計(jì)應(yīng)該是搜索請(qǐng)求的驗(yàn)證碼
si和ct參數(shù)結(jié)合使用,比如在sina.com.cn中搜索“理想”,可用:http://www.baidu.com/s?q=&ct=2097152&si=sina.com.cn&ie=gb2312&cl=3&wd=理想
bs——上一次搜索的關(guān)鍵詞(BeforeSearch),估計(jì)與相關(guān)搜索有關(guān)
如果你是一個(gè)細(xì)心的人在百度搜索的時(shí)候你就會(huì)發(fā)現(xiàn)每次搜索百度搜索網(wǎng)址的參數(shù)除了我們搜的關(guān)鍵詞其它參數(shù)會(huì)隨之變化.
要成為一名合格的網(wǎng)站優(yōu)化員(自稱SEOer)了解這些參數(shù)是必須的.
跟隨老修一起來仔細(xì)研究一下隱藏在百度搜索網(wǎng)址參數(shù)里的這些小秘密吧:
1.瀏覽器輸入www.baidu.com打開百度首頁/輸入"老吧"搜索再看百度的附加了參數(shù):(這里我只分析關(guān)鍵的參數(shù))
http://www.baidu.com/#wd=老吧
上面紅色的部分就是我剛搜索的關(guān)鍵詞"老吧",只是中文字體經(jīng)過瀏覽器的編碼變成上面的樣子,wd就是百度其中的一個(gè)參數(shù)(wd=關(guān)鍵字).
2.搜索的結(jié)果肯定不止一頁,我們點(diǎn)第二頁,百度搜索結(jié)果網(wǎng)址又多了些參數(shù):
http://www.baidu.com/s?wd=老吧&pn=100&rn=100&ie=utf-8&usm=2
rn=100rn參數(shù)是指定每頁顯示100條結(jié)果,一般是10的倍數(shù),最大100條/每頁;
pn=100pn參數(shù)則是當(dāng)前頁碼,不過百度進(jìn)行了運(yùn)算,如果是第一頁pn就等于0,如果是第二頁則是(rn=100)*((pn=0)+1)這樣顯示第二頁就剛好是rn=100了.
3.如果我們這時(shí)候在當(dāng)前的百度網(wǎng)頁輸入框中重新搜索一個(gè)詞"老修",看百度搜索結(jié)果的網(wǎng)址又加了參數(shù).
http://www.baidu.com/s?rn=100&ie=utf-8&bs=老吧&f=8&rsv_bp=1&wd=老修&rsv_sug3=6&rsv_sug4=187&rsv_sug1=6&rsv_sug2=0&inputT=2
wd參數(shù)是我們當(dāng)前搜索的"老修"關(guān)鍵詞,"bs參數(shù)"則是指BeforeSearch-上一次搜索輸入的關(guān)鍵詞
如果我們?cè)僭谳斎肟蛑性偎褎e的詞,百度url中的參數(shù)基本不加了.
4.還有一種情況是當(dāng)我們輸入一個(gè)關(guān)鍵詞的時(shí)候百度會(huì)給我們一些下拉詞選擇,如果選擇一個(gè)關(guān)鍵詞,url參數(shù)又不一樣了:
http://www.baidu.com/s?tn=baiduhome_pg&rn=100&ie=utf-8&bs=老吧&f=3&rsv_bp=1&rsv_spt=1&wd=老濕吧&rsv_sug3=1&rsv_sug4=15&rsv_sug1=1&oq=老吧&rsv_sug2=1&rsp=4&inputT=0&rsv_sug=1
選擇下拉的關(guān)鍵詞則多了個(gè)oq參數(shù),伴隨這oq參數(shù)同時(shí)還有一個(gè)關(guān)鍵的的f=3,這兩個(gè)參數(shù)的含義引用網(wǎng)上的解釋:
oq參數(shù)是指原先查詢字符串(originalqueryString)
oq和關(guān)鍵詞(wd)參數(shù)值有著相同的特征,亦是自行輸入搜索詞,百度搜索框提示詞,相關(guān)搜索候選詞或者錯(cuò)別字提示正確搜索詞等,長度限制在38個(gè)漢字以內(nèi)。
oq參數(shù)不僅在相關(guān)搜索(f=1)中出現(xiàn),另外幾種搜索形式,如即時(shí)搜索提示(f=3)、錯(cuò)別字提示正確搜索(f=12)也會(huì)有oq.rsp=4表示是第四個(gè)提示詞.
f(form)參數(shù)值:1相關(guān)搜索;3即時(shí)搜索提示;8自主搜索形式;12錯(cuò)別字提示正確搜索
ct此值一般是一串?dāng)?shù)字,可能是搜索請(qǐng)求的驗(yàn)證碼;
si在限定的域名中搜索,比如想在站內(nèi)搜索可用si=lao8.org,這個(gè)參數(shù)必須結(jié)合ct參數(shù)一起使用;類似:site:lao8.org
tn提交搜索請(qǐng)求的來源站點(diǎn),這是百度與免費(fèi)軟件合作時(shí)的利益來源,
ie網(wǎng)頁編碼比如:gb2312/GBK/UTF-8等
ct語言限制。0-所有語言,1-簡體中文網(wǎng)頁,2-繁體中文網(wǎng)頁等等;
lm搜索結(jié)果的時(shí)間限制。以天為單位
q5搜索內(nèi)容位置限制.0-所有內(nèi)容;1-網(wǎng)頁標(biāo)題(相當(dāng)于使用’title:'查詢前綴);2-url(相當(dāng)于使用’inurl:'查詢前綴);其它值等效于0.默認(rèn)值為0
q6搜索內(nèi)容網(wǎng)站限制.例如q6=sohu.com,表示只搜索sohu.com的網(wǎng)頁;相當(dāng)于使用了’site:前綴’.默認(rèn)值為空
dq查詢內(nèi)容來原的地區(qū)限制.
rs_src相關(guān)搜索_語義關(guān)聯(lián)性(relatedsearch_src)參數(shù)值:0與原先查詢字符串語義關(guān)聯(lián)性較高1與原先查詢字符串語義關(guān)聯(lián)性較低(當(dāng)我們搜索的時(shí)候點(diǎn)百度底下提示的相關(guān)搜索就會(huì)有這個(gè)參數(shù))
rsv_bp=0表示在百度首頁、瀏覽器的百度搜索欄、導(dǎo)航站等初次在搜索框輸入內(nèi)容進(jìn)行搜索。
rsv_bp=1表示在百度搜索結(jié)果的頁眉(header)搜索框中繼續(xù)搜索
rsv_bp=2表示在百度搜索結(jié)果的頁腳(footer)搜索框中繼續(xù)搜索,至少連續(xù)搜索過2次以上,才會(huì)出現(xiàn)rsv_bp=1或rsv_bp=2。
rsv_sug=0rsv_sug=1rsv_sug=2,分別表示搜索框提示0-2條搜索歷史記錄。以藍(lán)色字體和其他黑色提示詞區(qū)分開。
rsv_sug1搜索框提示次數(shù)
rsv_sug2搜索框提示詞搜索方式:0鍵盤選擇搜索框提示詞后,沒有更改過提示詞的搜索方式,1非鍵盤(如鼠標(biāo)、手指等)選擇搜索框提示詞進(jìn)行搜索
rsv_sug3和鍵盤重復(fù)速率有關(guān)。鍵盤重復(fù)速度或網(wǎng)速越快,rsv_sug3參數(shù)值越小,但不小于0;重復(fù)速度或網(wǎng)速越慢,rsv_sug3參數(shù)值越大,但不超過總輸入次數(shù)。鍵盤重復(fù)速度越快表明用戶大概知道自己要搜的是什么關(guān)鍵詞,但不能反過來認(rèn)為速度越慢就越不清楚自己想要搜索的是什么。
rsv_sug4反饋搜索結(jié)果用時(shí)
rsv_sug5提示詞輸入搜索框方式
rsv_n其他輸入搜索詞方式:1提示詞填充到搜索框后做了修改,2粘貼搜索詞
rsv_spt首頁搜索類型:1新版百度首頁搜索(先要登錄百度帳號(hào));2百度實(shí)時(shí)熱點(diǎn)搜索(先要登錄百度帳號(hào));3傳統(tǒng)百度首頁搜索
rsv_ers參數(shù)是百度統(tǒng)計(jì)用戶翻頁行為的.
inputT輸入耗時(shí)
另外還有一個(gè)參數(shù)USM,這個(gè)參數(shù)通常出現(xiàn)的非第一頁搜索結(jié)果中,比如搜索一個(gè)詞打開第二頁,修改這個(gè)參數(shù)的值:分別為1/2/3,就會(huì)發(fā)現(xiàn)非第一頁的搜索排名發(fā)生的移動(dòng).目前還搞不懂百度用這個(gè)詞做什么.