apache网站日志中百度蜘蛛抓取返回404，然而来源为什么是“－”

作者：caoliu社区 • 时间：2020-03-08 • 问答 • 来源：江有健 • 阅读

[导读]：如图：如果返回的是200，图中箭头“－”就是蜘蛛正在抓取页面的入口页面吧？但为什么404却没有呢？ "-"这一栏：指的是用户请求所在的页面，对于这个来说是百度蜘蛛请求访...

如图：
如果返回的是200，图中箭头“－”就是蜘蛛正在抓取页面的入口页面吧？但为什么404却没有呢？

"-"这一栏：指的是用户请求所在的页面，对于这个来说是百度蜘蛛请求访问蜘蛛时所在的页面。"-"代表日志上统计不到蜘蛛请求所在的页面。有以下两种可能：
1、百度蜘蛛从其它网站来网站的；
2、百度蜘蛛从百度的数据库出发，以之前抓取的数据为基础，访问网站的；
/2015-05/ART……这个页面是否有外链，如果没有外链，那只能是第二种情况；
/2015-05/ART……这个页面是否被百度收录，如果不被收录，同时之前没有被抓取过，同时有外链，那就是第一种情况。

###

蜘蛛抓取的这个页面不存在，就会出现返回码为404。

本文来自投稿，不代表微盟圈立场，如若转载，请注明出处：https://www.vm7.com/a/ask/37589.html

seo培训学院

caoliu社区

关于带WWW和不带WWW的网站问题

« 上一篇

百度蜘蛛只爬行网站首页，内容页面不抓取，怎么办？

apache网站日志中百度蜘蛛抓取返回404，然而来源为什么是“－”

相关推荐