蜘蛛疯狂抓取 jquery-1.3.2.min.js 文件是怎么回事?
[导读]:最近发现一个老站排名全部掉了,就去观察了IIS日志 爬虫确实抓取禁掉的css和JS, 我猜想是不是百度通过css和js来判断是不是作弊,判断你的页面是不是有弹窗,有针对普通浏览器用...
最近发现一个老站排名全部掉了,就去观察了IIS日志

爬虫确实抓取禁掉的css和JS,
我猜想是不是百度通过css和js来判断是不是作弊,判断你的页面是不是有弹窗,有针对普通浏览器用户的内容.有针对百度的内容.
我也发现 百度蜘蛛开始爬明明禁止掉的css和JS
###这种情况应该一般是蜘蛛吃药了,
之前的A站点被惩罚后连续观察了俩个月的日志不单单在抓取 文件 还有其他的JS文件,正常的文章,却一带而过;
B站点被惩罚后,不单单抓取被Robots禁止的JS文件同时还抓取,很早之前就删除的目录;
难道这就是传说中的沙盒蜘蛛又名傻猪。
这种情况之前也遇到过。Robots里单独写个规则禁止下
本文来自投稿,不代表微盟圈立场,如若转载,请注明出处:https://www.vm7.com/a/ask/29774.html