您现在的位置是:首页 > 站长新闻站长新闻
CCbot蜘蛛你有见过吗?
2021-02-06【站长新闻】人已围观
简介不清楚您的网站日志中是否有出现过一个不太常见的CC蜘蛛,访问名称为:CCBot/2.0,下面我们具体来了解一下CCbot是什么蜘蛛?一. CCbot是什么蜘蛛?CCbot,全称为Common Crawl Bot,是一个非营利性基金会致力于提供
不清楚您的网站日志中是否有出现过一个不太常见的CC蜘蛛,访问名称为:CCBot/2.0,下面我们具体来了解一下CCbot是什么蜘蛛?
一. CCbot是什么蜘蛛?
CCbot,全称为Common Crawl Bot,是一个非营利性基金会致力于提供可以被所有人访问和分析的Web爬网数据的开放存储库。
二. 你如何处理CCbot蜘蛛?
方法1. 使用robots.txt
使用robots.txt文件来允许或禁止蜘蛛访问页面的权限。robots.txt是放在网站根目录中,蜘蛛来访问时会先查找并查看robots.txt文件,并遵守robots协议来访问网站上的内容,允许访问则访问,不允许访问蜘蛛则离开。
①. 不允许任何蜘蛛访问您站点的任何部分
User-agent:*
Disallow:/
②. 允许任何蜘蛛访问您站点的任何部分
User-agent:*
Disallow:
③. 不允许CCbot蜘蛛访问网站的任何部分
User-agent:ccbot
Disallow:/
④. 允许CCbot蜘蛛访问您站点的任何部分
User-agent:ccbot
Disallow:
⑤. 允许CCbot蜘蛛访问您站点,但不允许CCbot访问“wp-admin”文件夹
User-agent:ccbot
Disallow:/wp-admin
方法2. 使用元标记
可以在页面中使用元标记来帮助控制搜索引擎蜘蛛对您网站的访问权限。如果您为所有页面使用模板,则可以在和之间添加元标记, 它将适用于使用该模板的所有页面。如果要控制特定页面,可以在和之间的各个页面上添加元标记 。
①. 允许所有蜘蛛访问您的页面
②. 允许所有蜘蛛访问您的网页并跟踪页面上的链接
③. 允许所有蜘蛛访问您的网页,但不允许他们跟踪链接
④. 不允许任何蜘蛛访问您的网页
⑤. 允许CCbot访问您的网页
⑥. 不允许CCbot访问您的页面
⑦. 允许CCbot访问您的页面并跟踪更多页面的链接
如果你在网站日志中也发现了CCbot,不要惊慌,你接下来需要做的就是是允许它继续爬行还是禁止爬行?May个人觉得这类蜘蛛没有多大的意义,一旦发现这类蜘蛛爬行比较频繁,最好的方式就是禁止这些蜘蛛继续访问我们的网站。
很赞哦! ()
下一篇:http和https的区别
相关文章
随机图文
-
seo网站优化切忌过度优化文章外链
在这里,我给大家分享一篇网站SEO方面的文章,主要讲的是关于百度优化。确实,我们在百度优化过程中不要太过火,否则就会适得其反。网站SEO优化适度即可,不要影响文章的阅读,这是最基 -
网站优化绝对不能忽视的内容
网站完成建设并且上线之后并不代表着这个网站就已经非常的完美了,随着登录浏览的人变得越来越多,网站也会暴露出很多的问题,所以对网站进行后期的优化维护是必不可少的。网站的维护工作主要包括了下面几个方面。1、维护服务器网站的服务器是比较容易出现问题 -
看看移动网站建设中需要注意哪些问题?
当前,随着大屏智能手机的普及,移动手机网站也越来越流行,合理的手机移动网站建设对许多企业来说也是比较重要的事情。通过移动手机网站的展示,能吸引到更多的用户浏览我们的手机网站,通过手机网站可以展示企业的良好形象、优质的服务。下面我们一起来看看移 -
如何通过外链给企业网站制作带来权重?
每个人都知道做SEO很辛苦,而且每天的工作都是在网上发布大量的外链,但同时,为什么有些人做的网站就有很大的提升,而有些人的网站却迟迟没什么动静。其中很大一部分是因为外链的质量不同。如果你有相同数量的外链,别人的都是高权重的外链,而你的外链却是