首页 > 问答 > apache网站日志中百度蜘蛛抓取返回404,然而来源为什么是“-”

apache网站日志中百度蜘蛛抓取返回404,然而来源为什么是“-”

[导读]:如图: 如果返回的是200,图中箭头“-”就是蜘蛛正在抓取页面的入口页面吧?但为什么404却没有呢? "-"这一栏:指的是用户请求所在的页面,对于这个来说是百度蜘蛛请求访...

如图:
如果返回的是200,图中箭头“-”就是蜘蛛正在抓取页面的入口页面吧?但为什么404却没有呢?

"-"这一栏:指的是用户请求所在的页面,对于这个来说是百度蜘蛛请求访问蜘蛛时所在的页面。"-"代表日志上统计不到蜘蛛请求所在的页面。有以下两种可能:
1、百度蜘蛛从其它网站来网站的;
2、百度蜘蛛从百度的数据库出发,以之前抓取的数据为基础,访问网站的;
/2015-05/ART……这个页面是否有外链,如果没有外链,那只能是第二种情况;
/2015-05/ART……这个页面是否被百度收录,如果不被收录,同时之前没有被抓取过,同时有外链,那就是第一种情况。

###

蜘蛛抓取的这个页面不存在,就会出现返回码为404。

本文来自投稿,不代表微盟圈立场,如若转载,请注明出处:https://www.vm7.com/a/ask/37589.html