一般人架設wordpress,通常不知道robots.tx的重要性。
robots的全名是Robots Exclusion Protocol
google翻譯是「機器人排除協議」
就是告訴搜尋引擎,你的網站那些頁面可以抓,那些頁面不用抓。
因為搜尋引擎要開始抓爬你的網站時
會先看你網站根目錄有沒有robots.txt
如果有這個,搜尋引擎就會根據robots.txt來進行有範圍的抓爬。
另一點,當搜尋引擎抓不到robots.txt時,就會形成一個404錯誤頁面。
變成收錄錯誤頁面。
所以一個wordpress網站的根目錄,增加robots.txt是蠻重要的。
當你建立好後,或者有些已經建立好了。
你可以在遊覽器網址那邊輸入
http://你的網址/robots.txt
檢查看看。
若沒有,你可以自行建立,或者按右鍵下載
上傳到你的根目錄,再次檢查看看。
完整的robots.txt裡面要有這些內容
[cc lang="php"] User-agent: * Disallow: /wp-admin/ Disallow: /wp-content/ Disallow: /wp-includes/ Disallow: /*/comment-page-* Disallow: /*?replytocom=* Disallow: /category/*/page/ Disallow: /tag/*/page/ Disallow: /*/trackback Disallow: /feed Disallow: /*/feed Disallow: /comments/feed Disallow: /?s=* Disallow: /*/?s=* Disallow: /attachment/ [/cc]