首页 > 问答 > 蜘蛛疯狂抓取 jquery-1.3.2.min.js  文件是怎么回事?

蜘蛛疯狂抓取 jquery-1.3.2.min.js  文件是怎么回事?

[导读]:最近发现一个老站排名全部掉了,就去观察了IIS日志 爬虫确实抓取禁掉的css和JS, 我猜想是不是百度通过css和js来判断是不是作弊,判断你的页面是不是有弹窗,有针对普通浏览器用...

最近发现一个老站排名全部掉了,就去观察了IIS日志



爬虫确实抓取禁掉的css和JS,
我猜想是不是百度通过css和js来判断是不是作弊,判断你的页面是不是有弹窗,有针对普通浏览器用户的内容.有针对百度的内容.

###

我也发现 百度蜘蛛开始爬明明禁止掉的css和JS

###

这种情况应该一般是蜘蛛吃药了,

之前的A站点被惩罚后连续观察了俩个月的日志不单单在抓取 文件 还有其他的JS文件,正常的文章,却一带而过;

B站点被惩罚后,不单单抓取被Robots禁止的JS文件同时还抓取,很早之前就删除的目录;

难道这就是传说中的沙盒蜘蛛又名傻猪。

###

这种情况之前也遇到过。Robots里单独写个规则禁止下

本文来自投稿,不代表微盟圈立场,如若转载,请注明出处:https://www.vm7.com/a/ask/29774.html