< >

如何寫一個合理的robots.txt文件

發表日期：2021-01-14 18:57:30作者來源：瀏覽次數：

robots.txt文件的寫法
User-agent: * 　　這里的*代表的所有的搜索引擎種類，*是一個通配符
Disallow: /admin/ 這里定義是禁止爬尋admin目錄下面的目錄
Disallow: /require/ 　這里定義是禁止爬尋require目錄下面的目錄
Disallow: /require/ 這里定義是禁止爬尋require目錄下面的目錄
Disallow: /ABC 這里定義是禁止爬尋ABC整個目錄
Disallow: /cgi-bin/*.htm 禁止訪問/cgi-bin/目錄下的所有以".htm"為后綴的URL(包含子目錄)。
Disallow: /*?* 禁止訪問網站中所有的動態頁面
Disallow: .jpg$ 禁止抓取網頁所有的.jpg格式的圖片
Disallow:/ab/adc.html 禁止爬去ab文件夾下面的adc.html所有文件
User-agent: * 　　這里的*代表的所有的搜索引擎種類，*是一個通配符
Allow: /cgi-bin/　　這里定義是允許爬尋cgi-bin目錄下面的目錄
Allow: /tmp 這里定義是允許爬尋tmp的整個目錄
Allow: .htm$ 僅允許訪問以".htm"為后綴的URL。
Allow: .gif$ 允許抓取網頁和gif格式圖片

在這個例子中，該網站有三個目錄對搜索引擎的訪問做了限制，即搜索引擎不會訪問這三個目錄。
需要注意的是對每一個目錄必須分開聲明，而不要寫成 “Disallow: /cgi-bin/ /tmp/”。
User-agent:后的*具有特殊的含義，代表“any robot”，所以在該文件中不能有“Disallow: /tmp/*” or “Disallow:*.gif”這樣的記錄出現。
User-agent: *
Disallow: /cgi-bin/
Disallow: /tmp/
Disallow: /~joe/
Robot特殊參數：
允許 Googlebot：
如果您要攔截除 Googlebot 以外的所有漫游器訪問您的網頁，可以使用下列語法：
User-agent:
Disallow:/
User-agent:Googlebot
Disallow:
Googlebot 跟隨指向它自己的行，而不是指向所有漫游器的行。

如沒特殊注明，文章均為江浙滬網絡推廣,轉載請注明來自http://www.0898bike.com/html/news/

返回列表

下一篇：應該怎樣才能消除百度相關搜索負面信息
上一篇：怎樣把控網站更新頻率才能利于網站優化

相關推薦新聞

相關標簽: 網站報價網站報價方案

網站建設解決方案: 抖音推廣解決方案響應式網站建設方案手機微信網站解決方案旅游網站解決方案

志強網絡擁有資深設計師團隊和自主系統開發技術團隊，為客戶專業定制企業品牌網站、響應式網站、商城系統、手機微信網站、外貿網站、營銷型網站、旅游網站、微信小程序、APP等。歡迎廣大客戶咨詢！

AV在线手机/免费黄视频网站/色婷婷精品大视频在线蜜桃视频/www。三级片。com

如何寫一個合理的robots.txt文件

網站SEO優化不僅僅是做搜索引擎排名，更應該關注的是優化

貴陽seo優化推廣的方法和途徑你知道多少

電子郵件營銷用實力詮釋在數字營銷浪潮中重要地位

「紙巾網絡營銷微觀分析」

南寧網絡推廣需要注意哪幾點【找SEO優化】

網站推廣-如何提升內容的有效性

新北seo_seo公司

企業網站首頁設計的四大要求分析

搜索引擎優化的本質是什么？

一份實用的seo整體優化方案

最新簽約

公司新聞

常見問題

抖音

財經新聞

cosplay

jk

漢服

lolita

SEO優化