您当前的位置:首页 > 电脑百科 > 站长技术 > 网站

robots.txt文件的作用和写法

时间:2020-10-12 10:37:30  来源:  作者:

robots.txt协议是网站搜索引擎的协议。

作为网站优化人员,一定要会看robots文件,也要会写robots文件,那么,robots.txt文件有什么作用?

robots.txt文件的作用有:

(1)引导搜索引擎蜘蛛抓取指定内容或栏目。比如,有的网站部分内容,只有注册会员后,登陆会员功能才能看到更多内容。

(2)网站改版或者URL需要重写优化的时候屏蔽对搜索引擎不友好的链接。

(3)屏蔽死链接、404页面;

(4)屏蔽无内容页面、无价值页面;

(5)屏蔽重复页面,如搜索结果页、评论页面等;

(6)屏蔽任何不想收录页面;

(7)引导蜘蛛抓取网站地图。

网站设置robots.txt可以集权到网站重要页面,保护网站安全。

知道了robots.txt的作用和设置robots.txt的必要性后,我就要知道robots.txt怎么写?

User-agent:Baiduspider

Disallow:/

禁止百度抓取

 

User-agent:*

Disallow:/

不允许所以蜘蛛抓取

 

User-agent:Baiduspider

Disallow:/baidu/

禁止访问/baidu/里面的所有文件夹

 

User-agent:*

Disallow:/baidu/huaxia.js

紧张蜘蛛抓取某个文件夹下面的某个内容

 

知道了这些,我们就根据robots.txt文件的写法和实际需要。把写好的robots.txt文件,通过FTP网站后台打开上传网站跟目录就可以了。

 

为了方便各位朋友学习,robots.txt文件我们举例写一下,供需要学习的朋友参考:

User-agent: *

Disallow: /baidu/huaxia.js

指定所有搜索引擎蜘蛛抓取站点根目录下/baidu/文件夹下的huaxia.js文件

 

User-agent: *

Allow: /baidu/ccc

Disallow: /baidu/

禁止所有搜索引擎抓取baidu文件夹

但可以抓取百度文件夹下含有ccc的文件及文件夹

 

User-agent: *

Disallow: /*.js$

禁止抓取站点根目录所有js文件

 

User-agent: *

Disallow: /*.css$

禁止抓取站点根目录下所有css文件

 

User-agent: *

Disallow: /*?*

禁止蜘蛛抓取所有动态路径

 

Sitemap: 域名/sitemap.xml

网站地图写法

robots.txt文件的作用和写法

robots.txt书写规格

robots.txt文件书写注意事项:

英文符号下写;

冒号后要有空格;

首个字母要大写;

/ 网站根目录(网站所有)

 

其实,robots.txt文件,只要熟悉理解代码,书写和应用很简单。



Tags:robots.txt   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com),我们将及时更正、删除,谢谢。
▌相关推荐
robots.txt协议是网站和搜索引擎的协议。作为网站优化人员,一定要会看robots文件,也要会写robots文件,那么,robots.txt文件有什么作用?robots.txt文件的作用有:(1)引导搜索引擎蜘蛛...【详细内容】
2020-10-12  Tags: robots.txt  点击:(172)  评论:(0)  加入收藏
robots.txt是搜索引擎中访问网站的时候要查看的第一个文件。当一个搜索蜘蛛访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,假如存在,搜索机器人就会按照该文件...【详细内容】
2020-01-08  Tags: robots.txt  点击:(74)  评论:(0)  加入收藏
如何编写wordpress的robots.txt文件【robots.txt文件编写规则】不论我们SEO站长用什么建站程序,都应该了解掌握robots文件的编写规则和格式,那么robots文件的格式规则是怎样的...【详细内容】
2019-11-03  Tags: robots.txt  点击:(85)  评论:(0)  加入收藏
Robots协议(也称为爬虫协议、机器人协议等)的全称是“网络爬虫排除标准”(Robots Exclusion Protocol),网站通过Robots协议告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取。 Robo...【详细内容】
2019-09-18  Tags: robots.txt  点击:(168)  评论:(0)  加入收藏
什么是robots文件robots是站点与spider沟通的重要渠道,站点通过robots文件声明该网站中不想被搜索引擎收录的部分或者指定搜索引擎只收录特定的部分。请注意,仅当您的网站包...【详细内容】
2019-08-20  Tags: robots.txt  点击:(184)  评论:(0)  加入收藏
什么情况下要设置禁止搜索引擎抓取自己的网站呢?公司内部测试的网站,或者内部网,或者后台登录的页面,肯定不希望被外面的人搜索到,所以要禁止搜索引擎抓取。还有在我们的网站还...【详细内容】
2019-08-07  Tags: robots.txt  点击:(374)  评论:(0)  加入收藏
Robots文件是每个网站做优化时必做的文件!它必须放置在网站的根目录下面,它的作用是规定搜索引擎是否可以访问我的网站及规定具体访问哪些页面的文件。这样的话我们网站中很多...【详细内容】
2019-07-03  Tags: robots.txt  点击:(389)  评论:(0)  加入收藏
外媒 VentureBeat 报道称,谷歌希望将发展数十年的 robots.txt 解析器开源,以推动 REP 成为搜索引擎爬虫的行业标准。机器人排除协议(REP)是荷兰软件工程师 Martijn Koster 于 19...【详细内容】
2019-07-02  Tags: robots.txt  点击:(320)  评论:(0)  加入收藏
▌简易百科推荐
今天我们来聊一下北京地区的《ICP经营许可证》有多好办,现在的互联网上提供的商机越来越多,增值电信业务十分火爆,企业通过互联网突破地域的限制,把公司产品卖到更远的地方,同时...【详细内容】
2021-12-17  梦想理应飞翔Yy    Tags:《ICP经营许可证》   点击:(12)  评论:(0)  加入收藏
转自: https://blog.kermsite.com/p/blog-intro/由于格式问题,部分链接、表格可能会失效,若失效请访问原文此专题将详细介绍如何从零开始搭建一个个人博客。Dec 01, 2021阅读时...【详细内容】
2021-12-17  LaLiLi    Tags:个人博客   点击:(6)  评论:(0)  加入收藏
SP证是第二类增值电信业务经营许可证的简称。分为全网SP证和地网SP证。申请经营许可证是在工信部申请,全网SP经营许可证的有效期是5年,全网SP许可证在工信部办理全网SP续期,地...【详细内容】
2021-11-01  s陳述    Tags:sp证书   点击:(38)  评论:(0)  加入收藏
现在还有许多人不知道EDI许可证是什么东西今天我就来给大家讲解一下.EDI许可证就是一种增值电信业务经营许可证。是针对在线数据处理和交易处理业务需求的专业资格证书。 《...【详细内容】
2021-10-28  soberXx    Tags:edi许可证   点击:(75)  评论:(0)  加入收藏
元素的化学概念,如周期表中的化学元素,一切物质都是由元素构成的。对程序员而言,网站建设制作就是代码构成网站。企业网站设计者也收集了各种各样的元素,但并非所有元素都需要运...【详细内容】
2021-10-26  南宁云尚网络    Tags:企业网站   点击:(39)  评论:(0)  加入收藏
在运营网站的过程中,有一件不可忽略的事情。那就是网站上线之前需要完成 ICP 备案。说到这里,很多朋友就提出疑问了~· 什么是 ICP 备案呢?· ICP 备案需要哪些材...【详细内容】
2021-10-22  启测云    Tags:ICP备案   点击:(45)  评论:(0)  加入收藏
最近有朋友问我,我公司有外资就不能申请ICP许可证了么?外资的定义是什么?其实是可以的,但有一个特定条件必须满足,外资公司是指公司有外资股东,比如香港、加拿大、美国、韩国等等,...【详细内容】
2021-10-21  小白速看Z    Tags:ICP   点击:(51)  评论:(0)  加入收藏
自互联网出现以来,超文本传输协议http协议被广泛用于在Web浏览器和网站服务器之间传递信息,但随着互联网的发展,另一种协议——https出现,并与http一同服务于这个互联...【详细内容】
2021-10-20  我是FEIYA    Tags:https   点击:(44)  评论:(0)  加入收藏
Grafana Loki 是一个日志聚合工具,它是功能齐全的日志堆栈的核心。图片来自 包图网先看看结果有多轻量吧: Loki 是一个为有效保存日志数据而优化的数据存储。日志数据的高效索...【详细内容】
2021-09-14    51CTO  Tags:Loki日志   点击:(97)  评论:(0)  加入收藏
背景最近做微信小程序开发比较多,大家知道线上微信小程序为了安全起见,要求后端通信协议必须是HTTPS,这就要求需要安装证书。为了测试预发布线上环境,特地买了个最便宜的域名,为...【详细内容】
2021-09-14  小李子说程序    Tags:HTTPS证书   点击:(124)  评论:(0)  加入收藏
最新更新
栏目热门
栏目头条