网站页面数量有几百万个。
被植入的页面也有很多,因为被植入都是标签页面
被植入的时间是11年左右
处理:发现之后及时处理
现在的问题是:虽然都已经打不开,404页面,但是查询收录的时候,网站还是有很多的植入页面被百度和谷歌收录了,时间已经过去3年多了。求教大家一些解决方法
赞同以上几位同学的回复。
先确认下Http返回值是 404;
然后,做一个错误链接的list,提交给百度的站长平台里;
同时Robots.txt屏蔽之;
应该是在一个月左右生效,你这个数量比较大的话,你在站长平台登陆进入后的左侧发起一个投诉,希望获得其人工处理。
理论上不可能这么久了页面快照还在。
去投诉每一个页面的快照,并设置404页面,HTTP状态码不要搞错,也不要做跳转至首页。
也可以试试制作一个404xml页面在百度站长工具提交。
如果页面少一些 我会建议 吧链接ping给百度。那么大的数据量如果都ping给百度 又都是404 怕有影响,可以分批量ping,其实我估计蜘蛛对这些链接已经后来爬行过了,但是因为大量的404重复页面 他没有取得新的内容,再次爬过来还是那样引起不了他的兴趣所以快照就一直没有更新起来,
###我感觉吧这些页面提交到 百度站长工具的404页面 靠谱 让他不抓取 或者把这些页面写入 Robots.txt
###tobots掉,然后百度站长工具 拒绝下连接,提交下404。
###把这些页面写入 Robots.txt直接屏蔽掉就可以了,如果要提交给度娘的话不一定能混快就处理完毕,所以最行之有效的方法就是这个了~
###百度投诉!要么就不用理他!等搜索引擎自动消除
本文来自投稿,不代表微盟圈立场,如若转载,请注明出处:https://www.vm7.com/a/ask/23238.html