您当前的地位:赢咖平台登录 > faq问答 > robots.txt写法_怎么写robots


赢咖平台登录报道robots.txt写法_怎么写robots_最新博猫地址运动上赢咖平台登录官网

作者:赢咖平台登录SEO 时间:2016-09-12 11:30:10 来源:

  robots是站点与spider沟通的重要渠道,站点通过robots文件声明该网站中不想被搜索引擎收录的部分或者指定搜索引擎只收录特定的部分。请注意,仅当您的网站包含不希望被搜索引擎收录的内容时,才需要使用robots.txt文件。如果您希望搜索引擎收录网站上一切内容,请勿树立robots.txt文件。NNN赢咖平台登录seo

  robots文件往往放置于根目录下,包含一条或更多的记载,这些记载通过空行分开(以CR,CR/NL, or NL作为结束符),每一条记载的格式如下所示:
  "<field>:<optional space><value><optionalspace>"
  在该文件中能够使用#进行注解,具体使用方法和UNIX中的惯例一样。该文件中的记载通常以一行或多行User-agent开头,后面加上若干Disallow和Allow行,详细情况如下:
  User-agent:该项的值用于描述搜索引擎robot的名字。在"robots.txt"文件中,如果有多条User-agent记载说明有多个robot会受到"robots.txt"的限制,对该文件来说,至少要有一条User-agent记载。如果该项的值设为*,则对任何robot均有效,在"robots.txt"文件中,"User-agent:*"这样的记载只能有一条。如果在"robots.txt"文件中,加入"User-agent:SomeBot"和若干Disallow、Allow行,那么名为"SomeBot"只受到"User-agent:SomeBot"后面的 Disallow和Allow行的限制。
  Disallow:该项的值用于描述不希望被访问的一组URL,这个值能够是一条完整的路径,也能够是路径的非空前缀,以Disallow项的值开头的URL不会被 robot访问。例如"Disallow:/help"禁止robot访问/help.html、/helpabc.html、/help/index.html,而"Disallow:/help/"则同意robot访问/help.html、/helpabc.html,不能访问/help/index.html。"Disallow:"说明同意robot访问该网站的一切url,在"/robots.txt"文件中,至少要有一条Disallow记载。如果"/robots.txt"不存在或者为空文件,则对于一切的搜索引擎robot,该网站都是开放的。
  Allow:该项的值用于描述希望被访问的一组URL,与Disallow项相似,这个值能够是一条完整的路径,也能够是路径的前缀,以Allow项的值开头的URL 是同意robot访问的。例如"Allow:/hibaidu"同意robot访问/hibaidu.htm、/hibaiducom.html、/hibaidu/com.html。一个网站的一切URL默认是Allow的,所以Allow通常与Disallow搭配使用,实现同意访问一部分网页同时禁止访问其它一切URL的功能。
  使用"*"and"$":Baiduspider撑腰使用通配符"*"和"$"来模糊匹配url。
  "*" 匹配0或多个任意字符
  "$" 匹配行结束符。
  最后需要说明的是:百度会严厉遵守robots的相关协议,请注意区分您不想被抓取或收录的目录的大小写,百度会对robots中所写的文件和您不想被抓取和收录的目录做精确匹配,否则robots协议无法生效。

欢迎关切赢咖平台登录seo的博客,您也能够关切我的微信:beyondnever 或者加我赢咖平台登录/p>

.

在线客服

咨询客服
Sitemap
条评论