使用robots.txt优化你WordPress网站

文章目录

  1. 一般人架设wordpress,通常不知道robots.tx的重要性。
  2. robots的全名是Robots Exclusion Protocol
  3. google翻译是「机器人排除协议
  4. 就是告诉搜寻引擎,你的网站那些页面可以抓,那些页面不用抓。
  5. 因为搜寻引擎要开始抓爬你的网站时
  6. 会先看你网站根目录有没有robots.txt
  7. 如果有这个,搜寻引擎就会根据robots.txt来进行有范围的抓爬。
  8. 另一点,当搜寻引擎抓不到robots.txt时,就会形成一个404错误页面。
  9. 变成收录错误页面。
  10. 所以一个wordpress网站的根目录,增加robots.txt是蛮重要的。
  11. 当你建立好后,或者有些已经建立好了。
  12. 你可以在游览器网址那边输入
  13. http://你的网址/robots.txt
  14. 检查看看。
  15. 若没有,你可以自行建立,或者按右键下载
  16. 上传到你的根目录,再次检查看看。
  17. 完整的robots.txt里面要有这些内容
  18. 下面我们解释一下这些分别什么意思、
  19. 1、Disallow: /wp-admin/、Disallow: /wp-content/和Disallow: /wp-includes/
  20. 告诉搜寻引擎不需抓后台程式及页面。
  21. 2、Disallow: /*/comment-page-*和Disallow: /*?replytocom=*
  22. 停止让搜寻引擎抓留言评论分页等相关连结。
  23. 3、Disallow: /category/*/page/和Disallow: /tag/*/page/
  24. 停止搜寻引擎抓取分类页面和标签页。
  25. 4、Disallow: /*/trackback
  26. 停止搜寻引擎抓取trackback等垃圾资讯
  27. 5、Disallow: /feed、Disallow: /*/feed和Disallow: /comments/feed
  28. 停止搜寻引擎抓取feed连结
  29. 因为feed只是订阅本站,和搜寻引擎无关。
  30. 6、Disallow: /?s=*和Disallow: /*/?s=*
  31. 停止搜寻引擎抓取站内搜索结果
  32. 7、Disallow: /attachment/
  33. 停止搜寻引擎抓取附件页面,像是无意义的图片附件页面。
  34. 这些是基本的写法,可以有很多,可是够用了!
一般人架设wordpress,通常不知道robots.tx的重要性。
robots的全名是Robots Exclusion Protocol
google翻译是「机器人排除协议
就是告诉搜寻引擎,你的网站那些页面可以抓,那些页面不用抓。
因为搜寻引擎要开始抓爬你的网站时
会先看你网站根目录有没有robots.txt
如果有这个,搜寻引擎就会根据robots.txt来进行有范围的抓爬。
另一点,当搜寻引擎抓不到robots.txt时,就会形成一个404错误页面。
变成收录错误页面。
所以一个wordpress网站的根目录,增加robots.txt是蛮重要的。
当你建立好后,或者有些已经建立好了。
你可以在游览器网址那边输入
http://你的网址/robots.txt
检查看看。
若没有,你可以自行建立,或者按右键下载
上传到你的根目录,再次检查看看。
完整的robots.txt里面要有这些内容
[cc lang="php"]User-agent: *Disallow: /wp-admin/Disallow: /wp-content/Disallow: /wp-includes/Disallow: /*/comment-page-*Disallow: /*?replytocom =*Disallow: /category/*/page/Disallow: /tag/*/page/Disallow: /*/trackbackDisallow: /feedDisallow: /*/feedDisallow: /comments/feedDisallow: /?s=*Disallow: /*/ ?s=*Disallow: /attachment/[/cc]
下面我们解释一下这些分别什么意思、
1、Disallow: /wp-admin/、Disallow: /wp-content/和Disallow: /wp-includes/
告诉搜寻引擎不需抓后台程式及页面。
2、Disallow: /*/comment-page-*和Disallow: /*?replytocom=*
停止让搜寻引擎抓留言评论分页等相关连结。
3、Disallow: /category/*/page/和Disallow: /tag/*/page/
停止搜寻引擎抓取分类页面和标签页。
4、Disallow: /*/trackback
停止搜寻引擎抓取trackback等垃圾资讯
5、Disallow: /feed、Disallow: /*/feed和Disallow: /comments/feed
停止搜寻引擎抓取feed连结
因为feed只是订阅本站,和搜寻引擎无关。
6、Disallow: /?s=*和Disallow: /*/?s=*
停止搜寻引擎抓取站内搜索结果
7、Disallow: /attachment/
停止搜寻引擎抓取附件页面,像是无意义的图片附件页面。
这些是基本的写法,可以有很多,可是够用了!
 

评论 (0)

此处尚未发表评论

留言

  1. 以游客身份发表评论。注册登入到您的帐户。
附件 (0/ 3)
分享您的位置