破碎锤厂家
免费服务热线

Free service

hotline

010-00000000
破碎锤厂家
热门搜索:
技术资讯
当前位置:首页 > 技术资讯

新浪博客更新robot文件屏蔽门误解消除

发布时间:2020-07-24 10:52:20 阅读: 来源:破碎锤厂家

前几日有文章称由于众多站长滥发信息做外链,致使垃圾博文充斥新浪博客,因此新浪博客开始屏蔽百度蜘蛛,有网友发现大部分新浪博客快照在百度中已没有更新,通过查看新浪robots文件(发现其内容为:

#####################################################

# SINA BLOG 制止搜索引擎收录配置文件

# 文件: ~/t

# 编写: 阿狼

# 日期: 2005-03-24

#####################################################

#开放百度的搜索引擎的User-Agent代码,*表示所有###########

User-agent: Baiduspider

#限制不能搜索的目录,Disallow: 为空时开放所有目录####

Disallow: /admin/

Disallow: /include/

Disallow: /html/

Disallow: /queue/

Disallow: /config/

#限制的搜索引擎的User-Agent代码,*表示所有###########

User-agent: *

#临时限制对所有目录的制止抓取

Disallow: /

由于该文件中有一句:User-agent: Baiduspider 由此很多站长判定,新浪已完全屏蔽百度蜘蛛,今后靠养新浪博客做外链的方法已不可行了。

看到这则消息后,我感觉有几个疑点:

1、新浪作为世界知名的中文门户网站,其数据处理能力,违规内容管理方法,都足以应付目前的垃圾信息,而屏蔽百度蜘蛛会致使流量大减,这与新浪的发展战略不符。

2、该robots文件的日期为:2005-03-24,似乎是新浪博客刚上线的时候建立的文件,如果近期新浪的网管修改过robots的话,日期应当更改成新的日期。

3、熟习robots写法的朋友都知道,该t文件中仅仅是是设置了制止百度蜘蛛访问后台文件夹,并没有其他限制。

基于以上几点疑虑,我感觉文章中的观点有失误的地方,事情应当没有那末糟,果然在8月18日有网友发现新浪博客悄悄更换了t文件,内容改成:

#开放百度的搜索引擎的User-Agent代码

User-agent: Baiduspider

#限制不能搜索的目录,Disallow: 为空时开放所有目录####

Disallow: /admin/

Disallow: /include/

Disallow: /html/

Disallow: /queue/

Disallow: /config/

#开放bing的搜索引擎的User-Agent代码

User-agent: msnbot

#限制不能搜索的目录,Disallow: 为空时开放所有目录####

Disallow: /admin/

Disallow: /include/

Disallow: /html/

Disallow: /queue/

Disallow: /config/

User-agent: bing

#限制不能搜索的目录,Disallow: 为空时开放所有目录####

Disallow: /admin/

Disallow: /include/

Disallow: /html/

Disallow: /queue/

Disallow: /config/

#限制的搜索引擎的User-Agent代码,*表示所有###########

User-agent: *

#临时限制对所有目录的制止抓取

Disallow: /

#限制不能搜索的目录,Disallow: 为空时开放所有目录####

##Disallow: /admin/

##Disallow: /include/

##Disallow: /html/

##Disallow: /queue/

##Disallow: /config/

#开放搜索的目录有####################################

# /

# /advice/

# /help/

# /lm/

# /main/

# /myblog/

可以看出新修改的t文件中的写法已完全支持各类主流搜索引擎抓取博客内容,一个开放的新浪博客又回来了!

针对前几日出现的情况,个人猜想可能是由于以下几种缘由:

1、前几日大部分新浪博客被K,可能是由于百度调剂算法所致使的。

2、原来的t文件极可能是新浪博客刚上线得到时候建立的,由于当时google还没有正式进入中国,中文搜索还是百度一家独大,因此设置的内容主要针对百度,尔后该文件一直没有修改,直到最近被网友发现,新浪工作人员才想起重新修改。

虽然这次屏蔽门只是一场虚惊,但是也给各位站长敲响了警钟,不要一味的盲目滥发垃圾信息,及污染了互联网环境又耗费了网络服务商的资源,当心竭泽而渔!培养10个高质量的博客比养100个垃圾博客更有效!

以上是我的一点见解,希望有朋友转载的时候保存我的一个链接jfbest 多一份保存 多一倍运气,多一份口碑,多一份成功,谢谢!

贵阳最好的羊癫疯医院

乌鲁木齐癫痫病医院哪家好

贵阳治疗癫痫费用

贵州治癫痫病的医院