您当前的位置:首页 > 电脑百科 > 站长技术 > 网站

要想网站排名靠前,robots.txt文件必须写好!详解robots文件

时间:2019-07-03 15:05:59  来源:  作者:

Robots文件是每个网站做优化时必做的文件!它必须放置在网站的根目录下面,它的作用是规定搜索引擎是否可以访问我的网站及规定具体访问哪些页面的文件。这样的话我们网站中很多不需要搜索引擎收录的页面我们就不允许搜索引擎读取,这样会节约它的时间和减少它的工作难度。以达到让搜索引擎喜欢我们的网站的目的。毕竟,做seo就是一个如何让搜索引擎更喜欢我们的网站的过程。

检查一个网站有没有做robots.txt文件的方式就是在网址后加robots.txt来访问,如:http://www.sjk8.com/robots.txt 如果一个网站不做robots文件,想排名好,基本是不可能的。如图:

要想网站排名靠前,robots.txt文件必须写好!详解robots文件

robots文件

Robots文件具体的制作方法是,先新建一个文本文档,名字必须为“robots.txt”,内容写法如下:

  1. user-agent:* (中文名为用户代理,表示允许抓取的搜索引擎是哪些)
  2. Allow:/aaa (可以不写,它表示可以读取的文件夹,默认就是可读取的)
  3. Disallow:/ 文件或者文件夹的名字(列出不允许读取的文件或者文件夹)

第一句简单理解为允许任何搜索引擎抓取,第二句表示可以抓取哪些文件夹,第三句表示不允许抓取哪些内容 。我们需要把所有不需要抓取的文件夹或者文件一一列举出来。

注意“*”的使用,“*”代表任何字符,如*.css代表所有的css文件。

在第二句中的/符号表示网站的根目录。如果我们的网站不允许哪个搜索引擎收录,比如不允许百度收录,robots.txt文件写法如下:

  1. User-agent: Baiduspider
  2. Disallow: / (这里”/”表示网站根目录)

第一句的baiduspider是百度蜘蛛名称,第二句表示不允许它抓取根目录下的其它任何文件或者文件夹。如果不允许哪个搜索引擎抓取,只需要更改上面的代码中的“baiduspider”就可以了。因为搜索引擎读取robots文件是一行一行从上向下读取的。先执行上面的语句,再执行下面的语句。

seo技术

比如:屏蔽一个文件夹/aa,但是又能抓取其中某个文件夹的写法:/aa/main

robots.txt写法如下:

  1. User-agent: *
  2. Disallow: /aa
  3. Allow: aa/main

如果需要访问这个被禁止的文件夹下面的某些文件,只需要把这些文件一个个allow就可以了,当然,如果是某个类型,也就是同一个扩展名的文件,可以用如下方式抓取:

仅允许访问某目录下某个后缀的文件:

robots.txt写法如下:

  1. User-agent: *
  2. Allow: *.html
  3. Disallow: /

仅允许访问某目录下某个后缀的文件,也可以使用“$”表达:

robots.txt写法如下:

  1. User-agent: *
  2. Allow: .html$
  3. Disallow

robots文件怎么写

常见搜索引擎蜘蛛的名字:

googlebot、Bingbot、360Spider、Yisouspider、Sogouspider、Yahoo! Slurp

然后将制作好的robots.txt 文件上传至我们网站的根目录下即可。



Tags:robots   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com),我们将及时更正、删除,谢谢。
▌相关推荐
robots.txt协议是网站和搜索引擎的协议。作为网站优化人员,一定要会看robots文件,也要会写robots文件,那么,robots.txt文件有什么作用?robots.txt文件的作用有:(1)引导搜索引擎蜘蛛...【详细内容】
2020-10-12  Tags: robots  点击:(172)  评论:(0)  加入收藏
robots.txt是搜索引擎中访问网站的时候要查看的第一个文件。当一个搜索蜘蛛访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,假如存在,搜索机器人就会按照该文件...【详细内容】
2020-01-08  Tags: robots  点击:(74)  评论:(0)  加入收藏
如何编写wordpress的robots.txt文件【robots.txt文件编写规则】不论我们SEO站长用什么建站程序,都应该了解掌握robots文件的编写规则和格式,那么robots文件的格式规则是怎样的...【详细内容】
2019-11-03  Tags: robots  点击:(85)  评论:(0)  加入收藏
Robots协议(也称为爬虫协议、机器人协议等)的全称是“网络爬虫排除标准”(Robots Exclusion Protocol),网站通过Robots协议告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取。 Robo...【详细内容】
2019-09-18  Tags: robots  点击:(169)  评论:(0)  加入收藏
什么是robots文件robots是站点与spider沟通的重要渠道,站点通过robots文件声明该网站中不想被搜索引擎收录的部分或者指定搜索引擎只收录特定的部分。请注意,仅当您的网站包...【详细内容】
2019-08-20  Tags: robots  点击:(185)  评论:(0)  加入收藏
什么情况下要设置禁止搜索引擎抓取自己的网站呢?公司内部测试的网站,或者内部网,或者后台登录的页面,肯定不希望被外面的人搜索到,所以要禁止搜索引擎抓取。还有在我们的网站还...【详细内容】
2019-08-07  Tags: robots  点击:(374)  评论:(0)  加入收藏
robots.txt文件,是每一个搜索引擎蜘蛛到你的网站之后要寻找和访问的第一个文件,robots.txt是你对搜索引擎制定的一个如 何索引你的网站的规则。通过该文件,搜索引擎就可以知道...【详细内容】
2019-08-01  Tags: robots  点击:(215)  评论:(0)  加入收藏
Robots文件是每个网站做优化时必做的文件!它必须放置在网站的根目录下面,它的作用是规定搜索引擎是否可以访问我的网站及规定具体访问哪些页面的文件。这样的话我们网站中很多...【详细内容】
2019-07-03  Tags: robots  点击:(389)  评论:(0)  加入收藏
外媒 VentureBeat 报道称,谷歌希望将发展数十年的 robots.txt 解析器开源,以推动 REP 成为搜索引擎爬虫的行业标准。机器人排除协议(REP)是荷兰软件工程师 Martijn Koster 于 19...【详细内容】
2019-07-02  Tags: robots  点击:(321)  评论:(0)  加入收藏
▌简易百科推荐
今天我们来聊一下北京地区的《ICP经营许可证》有多好办,现在的互联网上提供的商机越来越多,增值电信业务十分火爆,企业通过互联网突破地域的限制,把公司产品卖到更远的地方,同时...【详细内容】
2021-12-17  梦想理应飞翔Yy    Tags:《ICP经营许可证》   点击:(12)  评论:(0)  加入收藏
转自: https://blog.kermsite.com/p/blog-intro/由于格式问题,部分链接、表格可能会失效,若失效请访问原文此专题将详细介绍如何从零开始搭建一个个人博客。Dec 01, 2021阅读时...【详细内容】
2021-12-17  LaLiLi    Tags:个人博客   点击:(7)  评论:(0)  加入收藏
SP证是第二类增值电信业务经营许可证的简称。分为全网SP证和地网SP证。申请经营许可证是在工信部申请,全网SP经营许可证的有效期是5年,全网SP许可证在工信部办理全网SP续期,地...【详细内容】
2021-11-01  s陳述    Tags:sp证书   点击:(39)  评论:(0)  加入收藏
现在还有许多人不知道EDI许可证是什么东西今天我就来给大家讲解一下.EDI许可证就是一种增值电信业务经营许可证。是针对在线数据处理和交易处理业务需求的专业资格证书。 《...【详细内容】
2021-10-28  soberXx    Tags:edi许可证   点击:(75)  评论:(0)  加入收藏
元素的化学概念,如周期表中的化学元素,一切物质都是由元素构成的。对程序员而言,网站建设制作就是代码构成网站。企业网站设计者也收集了各种各样的元素,但并非所有元素都需要运...【详细内容】
2021-10-26  南宁云尚网络    Tags:企业网站   点击:(40)  评论:(0)  加入收藏
在运营网站的过程中,有一件不可忽略的事情。那就是网站上线之前需要完成 ICP 备案。说到这里,很多朋友就提出疑问了~· 什么是 ICP 备案呢?· ICP 备案需要哪些材...【详细内容】
2021-10-22  启测云    Tags:ICP备案   点击:(46)  评论:(0)  加入收藏
最近有朋友问我,我公司有外资就不能申请ICP许可证了么?外资的定义是什么?其实是可以的,但有一个特定条件必须满足,外资公司是指公司有外资股东,比如香港、加拿大、美国、韩国等等,...【详细内容】
2021-10-21  小白速看Z    Tags:ICP   点击:(51)  评论:(0)  加入收藏
自互联网出现以来,超文本传输协议http协议被广泛用于在Web浏览器和网站服务器之间传递信息,但随着互联网的发展,另一种协议——https出现,并与http一同服务于这个互联...【详细内容】
2021-10-20  我是FEIYA    Tags:https   点击:(44)  评论:(0)  加入收藏
Grafana Loki 是一个日志聚合工具,它是功能齐全的日志堆栈的核心。图片来自 包图网先看看结果有多轻量吧: Loki 是一个为有效保存日志数据而优化的数据存储。日志数据的高效索...【详细内容】
2021-09-14    51CTO  Tags:Loki日志   点击:(97)  评论:(0)  加入收藏
背景最近做微信小程序开发比较多,大家知道线上微信小程序为了安全起见,要求后端通信协议必须是HTTPS,这就要求需要安装证书。为了测试预发布线上环境,特地买了个最便宜的域名,为...【详细内容】
2021-09-14  小李子说程序    Tags:HTTPS证书   点击:(125)  评论:(0)  加入收藏
最新更新
栏目热门
栏目头条