亚洲国产日韩欧美一区二区三区,精品亚洲国产成人av在线,国产99视频精品免视看7,99国产精品久久久久久久成人热,欧美日韩亚洲国产综合乱

首頁 專題 SEO 什么是robots.txt?

什么是robots.txt?

May 23, 2019 am 11:01 AM

robots.txt是搜索引擎訪問網(wǎng)站時(shí)要查看的第一個(gè)文件,是用于規(guī)定搜索引擎對網(wǎng)站內(nèi)容抓取范圍的文本文件。當(dāng)一個(gè)搜索蜘蛛訪問一個(gè)站點(diǎn)時(shí),它會(huì)首先檢查該站點(diǎn)根目錄下是否存在robots.txt,如果存在,則會(huì)按照文件中的內(nèi)容來確定訪問的范圍。

什么是robots.txt?

在網(wǎng)站建設(shè)過程中我們會(huì)有一部分內(nèi)容不希望被搜索引擎抓取到或者不希望其在互聯(lián)網(wǎng)中出現(xiàn),那么要怎么辦呢?我要怎么跟搜索引擎說你不要抓取我的xx內(nèi)容呢?這時(shí)候robots就派上用場了。

robots.txt是搜索引擎中訪問網(wǎng)站的時(shí)候要查看的第一個(gè)文件。Robots.txt文件告訴蜘蛛程序在服務(wù)器上什么文件是可以被查看的。

當(dāng)一個(gè)搜索蜘蛛訪問一個(gè)站點(diǎn)時(shí),它會(huì)首先檢查該站點(diǎn)根目錄下是否存在robots.txt,如果存在,搜索機(jī)器人就會(huì)按照該文件中的內(nèi)容來確定訪問的范圍;如果該文件不存在,所有的搜索蜘蛛將能夠訪問網(wǎng)站上所有沒有被口令保護(hù)的頁面。

語法:最簡單的 robots.txt 文件使用兩條規(guī)則:

? User-Agent: 適用下列規(guī)則的漫游器

? Disallow: 要攔截的網(wǎng)頁

但是我們需要注意的幾點(diǎn):

1.robots.txt必須存放在網(wǎng)站的根目錄下,

2.其命名必須為robots.txt,且文件名必須全部小寫。

3.Robots.txt是搜索引擎訪問網(wǎng)站的第一個(gè)頁面

4.Robots.txt中必須指明user-agent

robots.txt使用誤區(qū)

?誤區(qū)一:我的網(wǎng)站上的所有文件都需要蜘蛛抓取,那我就沒必要在添加robots.txt文件了。反正如果該文件不存在,所有的搜索蜘蛛將默認(rèn)能夠訪問網(wǎng)站上所有沒有被口令保護(hù)的頁面。

?每當(dāng)用戶試圖訪問某個(gè)不存在的URL時(shí),服務(wù)器都會(huì)在日志中記錄404錯(cuò)誤(無法找到文件)。每當(dāng)搜索蜘蛛來尋找并不存在的robots.txt文件時(shí),服務(wù)器也將在日志中記錄一條404錯(cuò)誤,所以你應(yīng)該做網(wǎng)站中添加一個(gè)robots.txt。

?誤區(qū)二:在robots.txt文件中設(shè)置所有的文件都可以被搜索蜘蛛抓取,這樣可以增加網(wǎng)站的收錄率。

?網(wǎng)站中的程序腳本、樣式表等文件即使被蜘蛛收錄,也不會(huì)增加網(wǎng)站的收錄率,還只會(huì)浪費(fèi)服務(wù)器資源。因此必須在robots.txt文件里設(shè)置不要讓搜索蜘蛛索引這些文件。

?具體哪些文件需要排除, 在robots.txt使用技巧一文中有詳細(xì)介紹。

?誤區(qū)三:搜索蜘蛛抓取網(wǎng)頁太浪費(fèi)服務(wù)器資源,在robots.txt文件設(shè)置所有的搜索蜘蛛都不能抓取全部的網(wǎng)頁。

?如果這樣的話,會(huì)導(dǎo)致整個(gè)網(wǎng)站不能被搜索引擎收錄。

robots.txt使用技巧

?1. 每當(dāng)用戶試圖訪問某個(gè)不存在的URL時(shí),服務(wù)器都會(huì)在日志中記錄404錯(cuò)誤(無法找到文件)。每當(dāng)搜索蜘蛛來尋找并不存在的robots.txt文件時(shí),服務(wù)器也將在日志中記錄一條404錯(cuò)誤,所以你應(yīng)該在網(wǎng)站中添加一個(gè)robots.txt。

?2. 網(wǎng)站管理員必須使蜘蛛程序遠(yuǎn)離某些服務(wù)器上的目錄——保證服務(wù)器性能。比如:大多數(shù)網(wǎng)站服務(wù)器都有程序儲(chǔ)存在“cgi-bin”目錄下,因此在robots.txt文件中加入“Disallow: /cgi-bin”是個(gè)好主意,這樣能夠避免將所有程序文件被蜘蛛索引,可以節(jié)省服務(wù)器資源。一般網(wǎng)站中不需要蜘蛛抓取的文件有:后臺(tái)管理文件、程序腳本、附件、數(shù)據(jù)庫文件、編碼文件、樣式表文件、模板文件、導(dǎo)航圖片和背景圖片等等。

?下面是VeryCMS里的robots.txt文件:

?User-agent: *

?Disallow: /admin/ 后臺(tái)管理文件

?Disallow: /require/ 程序文件

?Disallow: /attachment/ 附件

?Disallow: /images/ 圖片

?Disallow: /data/ 數(shù)據(jù)庫文件

?Disallow: /template/ 模板文件

?Disallow: /css/ 樣式表文件

?Disallow: /lang/ 編碼文件

?Disallow: /script/ 腳本文件

?3. 如果你的網(wǎng)站是動(dòng)態(tài)網(wǎng)頁,并且你為這些動(dòng)態(tài)網(wǎng)頁創(chuàng)建了靜態(tài)副本,以供搜索蜘蛛更容易抓取。那么你需要在robots.txt文件里設(shè)置避免動(dòng)態(tài)網(wǎng)頁被蜘蛛索引,以保證這些網(wǎng)頁不會(huì)被視為含重復(fù)內(nèi)容。

?4. robots.txt文件里還可以直接包括在sitemap文件的鏈接。就像這樣:

?Sitemap: http://www.***.com/sitemap.xml

?目前對此表示支持的搜索引擎公司有Google, Yahoo, Ask and MSN。而中文搜索引擎公司,顯然不在這個(gè)圈子內(nèi)。這樣做的好處就是,站長不用到每個(gè)搜索引擎的站長工具或者相似的站長部分,去提交自己的sitemap文件,搜索引擎的蜘蛛自己就會(huì)抓取robots.txt文件,讀取其中的sitemap路徑,接著抓取其中相鏈接的網(wǎng)頁。

?5. 合理使用robots.txt文件還能避免訪問時(shí)出錯(cuò)。比如,不能讓搜索者直接進(jìn)入購物車頁面。因?yàn)闆]有理由使購物車被收錄,所以你可以在robots.txt文件里設(shè)置來阻止搜索者直接進(jìn)入購物車頁面

以上是什么是robots.txt?的詳細(xì)內(nèi)容。更多信息請關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本站聲明
本文內(nèi)容由網(wǎng)友自發(fā)貢獻(xiàn),版權(quán)歸原作者所有,本站不承擔(dān)相應(yīng)法律責(zé)任。如您發(fā)現(xiàn)有涉嫌抄襲侵權(quán)的內(nèi)容,請聯(lián)系admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費(fèi)脫衣服圖片

Undresser.AI Undress

Undresser.AI Undress

人工智能驅(qū)動(dòng)的應(yīng)用程序,用于創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用于從照片中去除衣服的在線人工智能工具。

Clothoff.io

Clothoff.io

AI脫衣機(jī)

Video Face Swap

Video Face Swap

使用我們完全免費(fèi)的人工智能換臉工具輕松在任何視頻中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費(fèi)的代碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

功能強(qiáng)大的PHP集成開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網(wǎng)頁開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級(jí)代碼編輯軟件(SublimeText3)

熱門話題

Laravel 教程
1597
29
PHP教程
1488
72
我們對SEO的好奇不那么好嗎? 我們對SEO的好奇不那么好嗎? Jul 07, 2025 am 09:12 AM

我注意到,Google的搜索副總裁Hyung-jin Kim在2022年11月在SMX Next在SEO社區(qū)的下一步都沒有注意到。

我們看到了2024年3月3日Google的一周的核心和垃圾郵件更新 我們看到了2024年3月3日Google的一周的核心和垃圾郵件更新 Jul 07, 2025 am 09:16 AM

現(xiàn)在,我們已經(jīng)進(jìn)入Google 2024年3月的Core和垃圾郵件更新大約一周了,而Boy,它很忙。在那個(gè)時(shí)候,我們看到了搜索排名波動(dòng)率,有些與算法更新有關(guān),有些與Google發(fā)行手動(dòng)操作有關(guān)

Bing深入搜索均為所有用戶正式使用 Bing深入搜索均為所有用戶正式使用 Jul 05, 2025 am 09:32 AM

Bing Deep Search是一項(xiàng)可選的生成AI功能,旨在幫助用戶解決缺乏直接答案的復(fù)雜問題,現(xiàn)在已為所有用戶完全使用。微軟宣布,Bing搜索中的深搜索功能可以n

chatgpt是Google搜索殺手我們一直期待的嗎? chatgpt是Google搜索殺手我們一直期待的嗎? Jul 05, 2025 am 09:14 AM

Altavista。 Lycos。雅虎。曾幾何時(shí),這些是世界上最受歡迎的搜索引擎。然后是Google。它確實(shí)搜索更好。 自2002年左右以來,Google一直是搜索引擎 - 它的優(yōu)勢僅在一年之后增長

Google開始測試來自SGE的AI概述。 Google開始測試來自SGE的AI概述。 Jul 05, 2025 am 09:33 AM

Google當(dāng)前正在直接在標(biāo)準(zhǔn)的Google搜索結(jié)果中試用AI概述,即使對于尚未注冊Google搜索生成體驗(yàn)(SGE)實(shí)驗(yàn)室功能的用戶也是如此。根據(jù)Google發(fā)言人對搜索E的講話

Microsoft Bing Search和Microsoft廣告的負(fù)責(zé)人Mikhail Parakhin降低了 Microsoft Bing Search和Microsoft廣告的負(fù)責(zé)人Mikhail Parakhin降低了 Jul 05, 2025 am 09:15 AM

Mikhail Parakhin離開了他擔(dān)任Bing Search和Microsoft廣告負(fù)責(zé)人的職位,可能會(huì)在公司內(nèi)部扮演不同的角色。 “負(fù)責(zé)公司的Bing搜索引擎和廣告部門的Mikhail Parakhin將

2024年SEO和PPC合作的4個(gè)關(guān)鍵 2024年SEO和PPC合作的4個(gè)關(guān)鍵 Jul 06, 2025 am 09:27 AM

每年都會(huì)帶來數(shù)字營銷的大量變化。在我從事業(yè)內(nèi)10年的每一個(gè)中,我注意到今年年初可以標(biāo)志著SEO和PPC共同努力的呼吁。2024年的差異?有一頭大象

研究發(fā)現(xiàn),REDDIT在Google產(chǎn)品審查搜索結(jié)果中過多顯示 研究發(fā)現(xiàn),REDDIT在Google產(chǎn)品審查搜索結(jié)果中過多顯示 Jul 15, 2025 am 09:13 AM

Reddit出現(xiàn)在97.5%的Google搜索查詢中,與產(chǎn)品評論有關(guān),并在Google的討論中占有將近三分之二的位置和論壇在搜索結(jié)果頁面上的功能,但根據(jù)新的分析。而reddit可以

See all articles