亚洲国产日韩欧美一区二区三区,精品亚洲国产成人av在线,国产99视频精品免视看7,99国产精品久久久久久久成人热,欧美日韩亚洲国产综合乱

首頁 專題 SEO 什麼是robots.txt?

什麼是robots.txt?

May 23, 2019 am 11:01 AM

robots.txt是搜尋引擎造訪網(wǎng)站時要查看的第一個文件,是用來規(guī)定搜尋引擎對網(wǎng)站內(nèi)容抓取範(fàn)圍的文字檔案。當(dāng)一個搜尋蜘蛛造訪一個網(wǎng)站時,它會先檢查該網(wǎng)站根目錄下是否存在robots.txt,如果存在,則會依照檔案中的內(nèi)容來決定造訪的範(fàn)圍。

什麼是robots.txt?

在網(wǎng)站建置過程中我們會有一部分內(nèi)容不希望被搜尋引擎抓取到或不希望其在網(wǎng)路中出現(xiàn),那麼該怎麼辦呢?我要怎麼跟搜尋引擎說你不要抓取我的xx內(nèi)容呢?這時候robots就派上用場了。

robots.txt是搜尋引擎中造訪網(wǎng)站的時候要查看的第一個檔案。 Robots.txt檔案告訴蜘蛛程式在伺服器上什麼檔案是可以被檢視的。

當(dāng)一個搜尋蜘蛛造訪一個網(wǎng)站時,它會先檢查該網(wǎng)站根目錄下是否存在robots.txt,如果存在,搜尋機器人就會按照該檔案中的內(nèi)容來確定存取的範(fàn)圍;如果該文件不存在,所有的搜尋蜘蛛將能夠存取網(wǎng)站上所有沒有被口令保護的頁面。

語法:最簡單的robots.txt 檔案使用兩個規(guī)則:

? User-Agent: 適用下列規(guī)則的漫遊器

? Disallow: 要攔截的網(wǎng)頁

但是我們需要注意的幾點:

1.robots.txt必須存放在網(wǎng)站的根目錄下,

2.其命名必須為robots.txt,且檔案名稱必須全部小寫。

3.Robots.txt是搜尋引擎存取網(wǎng)站的第一個頁面

4.Robots.txt中必須指明user-agent

robots.txt使用迷思

?迷思一:我的網(wǎng)站上的所有檔案都需要蜘蛛抓取,那我就沒必要在新增robots.txt檔案了。反正如果該檔案不存在,所有的搜尋蜘蛛將預(yù)設(shè)能夠存取網(wǎng)站上所有沒有被口令保護的頁面。

?每當(dāng)使用者試圖存取某個不存在的URL時,伺服器都會在日誌中記錄404錯誤(無法找到檔案)。每當(dāng)搜尋蜘蛛來尋找不存在的robots.txt檔案時,伺服器也會在日誌中記錄一條404錯誤,所以你應(yīng)該做網(wǎng)站中新增一個robots.txt。

?迷思二:在robots.txt檔案中設(shè)定所有的檔案都可以被搜尋蜘蛛抓取,這樣可以增加網(wǎng)站的收錄率。

?網(wǎng)站中的程式腳本、樣式表等檔案即使被蜘蛛收錄,也不會增加網(wǎng)站的收錄率,只會浪費伺服器資源。因此必須在robots.txt檔案中設(shè)定不要讓搜尋蜘蛛索引這些檔案。

?具體哪些檔案需要排除, 在robots.txt使用技巧一文中有詳細(xì)介紹。

?迷思三:搜尋蜘蛛抓取網(wǎng)頁太浪費伺服器資源,在robots.txt檔案設(shè)定所有的搜尋蜘蛛都不能抓取全部的網(wǎng)頁。

?如果這樣的話,會導(dǎo)致整個網(wǎng)站無法被搜尋引擎收錄。

robots.txt使用技巧

?1. 每當(dāng)使用者試圖存取某個不存在的URL時,伺服器都會在日誌中記錄404錯誤(無法找到文件)。每當(dāng)搜尋蜘蛛來尋找不存在的robots.txt檔案時,伺服器也會在日誌中記錄一個404錯誤,所以你應(yīng)該在網(wǎng)站中新增一個robots.txt。

?2. 網(wǎng)站管理員必須將蜘蛛程式遠(yuǎn)離某些伺服器上的目錄-保證伺服器效能。例如:大多數(shù)網(wǎng)站伺服器都有程式儲存在「cgi-bin」目錄下,因此在robots.txt檔案中加入「Disallow: /cgi-bin」是個好主意,這樣就能夠避免將所有程式檔案被蜘蛛索引,可以節(jié)省伺服器資源。一般網(wǎng)站中不需要蜘蛛抓取的文件有:後臺管理文件、程式腳本、附件、資料庫文件、編碼文件、樣式表文件、範(fàn)本文件、導(dǎo)覽圖片和背景圖片等等。

?下面是VeryCMS裡的robots.txt檔案:

?User-agent: *

?Disallow: /admin/ 後臺管理檔案

?Disallow: / require/ 程式檔案

?Disallow: /attachment/ 附件

?Disallow: /images/ 圖片

?Disallow: /data/ 資料庫檔案

?Disallow: / template/ 範(fàn)本檔案

?Disallow: /css/ 樣式表檔案

?Disallow: /lang/ 編碼檔案

?Disallow: /script/ 腳本檔案

3. 如果你的網(wǎng)站是動態(tài)網(wǎng)頁,並且你為這些動態(tài)網(wǎng)頁創(chuàng)建了靜態(tài)副本,以供搜尋蜘蛛更容易抓取。那你需要在robots.txt檔案中設(shè)定避免動態(tài)網(wǎng)頁被蜘蛛索引,以確保這些網(wǎng)頁不會被視為含重複內(nèi)容。

?4. robots.txt檔案裡也可以直接包含在sitemap檔案的連結(jié)。就像這樣:

?Sitemap: http://www.***.com/sitemap.xml

##

?目前對此表示支援的搜尋引擎公司有Google, Yahoo, Ask and MSN。而中文搜尋引擎公司,顯然不在這個圈子內(nèi)。這樣做的好處就是,站長不用到每個搜尋引擎的站長工具或相似的站長部分,去提交自己的sitemap文件,搜尋引擎的蜘蛛自己就會抓取robots.txt文件,讀取其中的sitemap路徑,接著抓取其中相連結(jié)的網(wǎng)頁。

?5. 合理使用robots.txt檔案還能避免存取時發(fā)生錯誤。例如,不能讓搜尋者直接進(jìn)入購物車頁面。因為沒有理由讓購物車被收錄,所以你可以在robots.txt檔案中設(shè)定來阻止搜尋者直接進(jìn)入購物車頁面

以上是什麼是robots.txt?的詳細(xì)內(nèi)容。更多資訊請關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本網(wǎng)站聲明
本文內(nèi)容由網(wǎng)友自願投稿,版權(quán)歸原作者所有。本站不承擔(dān)相應(yīng)的法律責(zé)任。如發(fā)現(xiàn)涉嫌抄襲或侵權(quán)的內(nèi)容,請聯(lián)絡(luò)admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅(qū)動的應(yīng)用程序,用於創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網(wǎng)頁開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

我們對SEO的好奇不那麼好嗎? 我們對SEO的好奇不那麼好嗎? Jul 07, 2025 am 09:12 AM

我注意到,Google的搜索副總裁Hyung-jin Kim在2022年11月在SMX Next在SEO社區(qū)的下一步都沒有註意到。

我們看到了2024年3月3日Google的一周的核心和垃圾郵件更新 我們看到了2024年3月3日Google的一周的核心和垃圾郵件更新 Jul 07, 2025 am 09:16 AM

現(xiàn)在,我們已經(jīng)進(jìn)入Google 2024年3月的Core和垃圾郵件更新大約一周了,而Boy,它很忙。在那個時候,我們看到了搜索排名波動率,有些與算法更新有關(guān),有些與Google發(fā)行手動操作有關(guān)

Bing深入搜索均為所有用戶正式使用 Bing深入搜索均為所有用戶正式使用 Jul 05, 2025 am 09:32 AM

Bing Deep Search是一項可選的生成AI功能,旨在幫助用戶解決缺乏直接答案的複雜問題,現(xiàn)在已為所有用戶完全使用。微軟宣布,Bing搜索中的深搜索功能可以n

Google開始測試來自SGE的AI概述。 Google開始測試來自SGE的AI概述。 Jul 05, 2025 am 09:33 AM

Google當(dāng)前正在直接在標(biāo)準(zhǔn)的Google搜索結(jié)果中試用AI概述,即使對於尚未註冊Google搜索生成體驗(SGE)實驗室功能的用戶也是如此。根據(jù)Google發(fā)言人對搜索E的講話

chatgpt是Google搜索殺手我們一直期待的嗎? chatgpt是Google搜索殺手我們一直期待的嗎? Jul 05, 2025 am 09:14 AM

Altavista。 Lycos。雅虎。曾幾何時,這些是世界上最受歡迎的搜索引擎。然後是Google。它確實搜索更好。 自2002年左右以來,Google一直是搜索引擎 - 它的優(yōu)勢僅在一年之後增長

Microsoft Bing Search和Microsoft廣告的負(fù)責(zé)人Mikhail Parakhin降低了 Microsoft Bing Search和Microsoft廣告的負(fù)責(zé)人Mikhail Parakhin降低了 Jul 05, 2025 am 09:15 AM

Mikhail Parakhin離開了他擔(dān)任Bing Search和Microsoft廣告負(fù)責(zé)人的職位,可能會在公司內(nèi)部扮演不同的角色。 “負(fù)責(zé)公司的Bing搜索引擎和廣告部門的Mikhail Parakhin將

2024年SEO和PPC合作的4個關(guān)鍵 2024年SEO和PPC合作的4個關(guān)鍵 Jul 06, 2025 am 09:27 AM

每年都會帶來數(shù)字營銷的大量變化。在我從事業(yè)內(nèi)10年的每一個中,我注意到今年年初可以標(biāo)誌著SEO和PPC共同努力的呼籲。 2024年的差異?有一頭大象

8個步驟以最大化全球網(wǎng)站遷移期間的成功 8個步驟以最大化全球網(wǎng)站遷移期間的成功 Jul 04, 2025 am 09:13 AM

遷移網(wǎng)站是一項複雜的事業(yè),但是當(dāng)它涉及到跨多個市場的全球網(wǎng)站過渡時,挑戰(zhàn)呈指數(shù)更大。 本文提供了全球網(wǎng)站MI最大化成功的全面指南

See all articles