關(guān)于百度站長平臺網(wǎng)頁抓取功能解析

2013-04-27    分類: 網(wǎng)站建設(shè)

關(guān)于百度站長平臺網(wǎng)頁抓取功能解析:

網(wǎng)頁抓取功能主要包括索引量、Robots、鏈接提交、死鏈提交、抓取頻次、抓取診斷、抓取異常等內(nèi)容。我們通過索引量可以看到站點在一定時間內(nèi)被索引的量和變化趨勢,能及時掌握網(wǎng)站的實際情況,并且可以指定規(guī)則,檢測某個頻道或者專題被收錄和索引的情況。

百度站長網(wǎng)頁抓取功能

鏈接提交包括主動推送、自動推送、 Sitemap、手動提交四種提交方式。其中主動推送是最快捷的方式,能夠確保當(dāng)天新鏈接被收錄進來。自動推送是最便捷的方式,把JS代碼部署到每一頁面,頁面被瀏覽時自動推送到百度,一般都與主動推送結(jié)合使用。Sitemap提交慢于主動推送,需要定期更新。手動提交比較機械化,但是可以把鏈接一次性提交給百度。

死鏈提交主要是處理網(wǎng)站上已存在的死鏈,當(dāng)網(wǎng)站死鏈數(shù)據(jù)累積過多,并且被展示到搜索結(jié)果頁中時,對網(wǎng)站本身的訪問體驗和用戶轉(zhuǎn)化都產(chǎn)生了負面影響。另外,百度檢查死鏈的流程也會為網(wǎng)站帶來額外負擔(dān),影響網(wǎng)站其他正常頁面的抓取和索引。死鏈提交方式包括文件提交和規(guī)則提交。文件提交是將已制作好的死鏈文件上傳至網(wǎng)站根目錄,然后將死鏈文件地址提交。規(guī)則提交是指將相同鏈接前綴下的死鏈寫成鏈接規(guī)則,且與其匹配的鏈接全部都是死鏈,然后將這個死鏈規(guī)則提交。目前支持兩種死鏈規(guī)則:目錄規(guī)則,以“”結(jié)尾的前綴;CGI規(guī)則,以“?”結(jié)尾的前綴。

Robots功能用于檢測與更新網(wǎng)站的 robots. txt文件,如果網(wǎng)站長時間不被搜索引擎抓取,可能是 robots.txt文件出了問題,需要對其進行檢測更新。需要注意的是, robots.xt文件大不超過48k,目錄不超過250個字符。

抓取頻次功能可以監(jiān)測蜘蛛抓取網(wǎng)站的頻次和每次抓取所用時間。

抓取診斷功能可以監(jiān)測蜘蛛抓取網(wǎng)站是否正常,是否能夠正常抓取網(wǎng)站內(nèi)容。每個站點每周最多能夠抓取整段200次,通過抓取整段可以監(jiān)測網(wǎng)站內(nèi)容是否符合預(yù)期,是否被加了黑鏈,是否隱藏文本,連通是否正常等。

抓取異常監(jiān)測可以監(jiān)測網(wǎng)站異常和鏈接異常兩個方面。網(wǎng)站異常會出現(xiàn)DNS異常、連接與抓取超時、鏈接錯誤的情況;鏈接異常會出現(xiàn)訪問被拒、找不到頁面、服務(wù)器錯誤、其它錯誤等情況。

網(wǎng)站題目:關(guān)于百度站長平臺網(wǎng)頁抓取功能解析
文章轉(zhuǎn)載:http://www.bm7419.com/news5/555.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供外貿(mào)建站、網(wǎng)頁設(shè)計公司、域名注冊、商城網(wǎng)站、動態(tài)網(wǎng)站、全網(wǎng)營銷推廣

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

成都網(wǎng)頁設(shè)計公司