關于robots文件作用與寫法的總結

2023-12-08    分類: 網(wǎng)站建設

首先我們應該明白Robots.txt文件是網(wǎng)站與搜索引擎之間的一種協(xié)議,當搜索引擎來抓取你網(wǎng)站的時候,首先會看你網(wǎng)站根目錄的Robots文件,搜索引擎會根據(jù)你寫的這個協(xié)議來抓取你的網(wǎng)站內容,當然抓取的頁面都是由你寫的Robots來確定的。

Robots的基本概念與作用

搜索引擎使用spider程序來訪問網(wǎng)站里面的內容,但是你的Robots文件可以告訴它那個頁面可以訪問,那個頁面不可以訪問,有些人認為網(wǎng)站當然容許抓取訪問了,錯,一些網(wǎng)站后臺隱私文件、js、死鏈這些都是需要屏蔽的。

Robots常見的規(guī)則

1、User-agent指令: 此指令定義了此指令下面的內容對哪些蜘蛛有效。默認所有蜘蛛都允許抓取,如果此指令指定了特定的蜘蛛,那么此指令下跟的內容就對特定蜘蛛有效。

2、Disallow指令: 指禁止搜索引擎抓取的路徑​,也就是說此指令定義了禁止蜘蛛抓取哪些內容

3、Allow指令: ​允許搜索引擎收錄的地址,此指令定義了允許蜘蛛抓些哪些內容,如果是某些內容允許,其它全部拒絕,則可以用這個指令,大多數(shù)網(wǎng)站只用到禁止指令。

User-agent的用法示例

此指令是用來定義蜘蛛名的:常見的蜘蛛名包括:baiduspider、Googlebot、MSNbot、baiduspider-image、Youdaobot、Sogou web spider、Sogou inst spider、Sogou spider2、Sogou blog、Sogou News Spider、Sogou Orion spider、Sosospider、pangusoSpider、JikeSpider、yisouspider、EasouSpider。

Disallow的用法示例

1、禁止整站被抓?。?/p>

Disallow: /

2、禁止根目錄下的woniuseo目錄抓?。?/p>

Disallow: /woniuseo/

3、禁止根目錄下的woniuseo目錄下的單個頁面woniuseo.html被抓?。?/p>

Disallow:/woniuseo/woniuseo.html

4、禁止全站含有?的頁面被抓取:

Disallow: /*?*

5、禁止全站含有woniuseo的頁面被抓?。?/p>

Disallow: /*woniuseo*

6、禁止全站后綴為.aspx的頁面被抓?。?/p>

Disallow: /*.aspx$

7、禁止全站后綴為.jpg的文件被抓?。?/p>

Disallow:/*.jpb$

Allow的用法示例

1、允許所有頁面被抓?。?/p>

Allow: /

2、允許woniuseo的目錄被抓?。?/p>

Allow: /woniuseo/

3、允許抓取.html的頁面:

Allow: /*.html$

4、允許抓取.jpg的圖片:

Allow: /*.jpg$

總結:

把上面的內容結合起來就能夠得到最佳的Wordpress程序robots.txt文件了。

User-agent: *
Disallow: /wp-admin/
Disallow: /wp-content/
Disallow: /wp-includes/
Disallow: /*/comment-page-*
Disallow: /*?replytocom=*
Disallow: /category/*/page/
Disallow: /tag/*/page/
Disallow: /*/trackback
Disallow: /feed
Disallow: /*/feed
Disallow: /comments/feed
Disallow: /?s=*
Disallow: /*/?s=*\
Disallow: /attachment/
使用方法:新建一個名稱為robots.txt文本文件,將上面的內容放進去,然后上傳到網(wǎng)站根目錄即可。​最后,就要要去網(wǎng)站看一下文件是否存在http://你的域名/robots.txt。上面只是些基本的寫法,當然還有很多,不過這些已經(jīng)夠我們使用了。

網(wǎng)頁標題:關于robots文件作用與寫法的總結
本文鏈接:http://www.bm7419.com/news28/299828.html

成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供搜索引擎優(yōu)化、微信小程序、用戶體驗、建站公司、品牌網(wǎng)站建設、企業(yè)網(wǎng)站制作

廣告

聲明:本網(wǎng)站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經(jīng)允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)

微信小程序開發(fā)