首页 > 问答 > 百度快照穿越时空是针对用户体验还是另有隐情?

百度快照穿越时空是针对用户体验还是另有隐情?

[导读]:最近有一站点,是网上镜像的一整套程序,包括所有的数据文件,因为数据库中本身已有数万条数据,上线后就没怎么打理,虽然质量不高吧。但今天发现一亮点,不知道大家有...

  最近有一站点,是网上镜像的一整套程序,包括所有的数据文件,因为数据库中本身已有数万条数据,上线后就没怎么打理,虽然质量不高吧。但今天发现一亮点,不知道大家有没有遇到过。看下图:收录的页面快照皆为文章的发布日期,正常来说是当天发布当天就被收录



首先,感谢夫唯老师难得的再次邀请,决定废话多点,那就写篇文章吧,说错请喷,哈哈....

  1. 通常所说的快照更新时间,是指索引时间。这个时间可以是发布文章并被百度第一次索引的时间,可以是最后或中途索引的时间。正常情况下这个时间不会前于被百度第一次索引的时间。
  2. 那么非常正的情况呢?就是早于百度第一次索引的时间,根据网站服务器返回的时间来提取,所以它玩了”穿越”。
  就比如LZ所提供的这个,实际上是今天才发布并被百度第一次索引,但却给了2011年前的时间,这主要是因为服务器上给搜索引擎返回了这个时间节点。这种情况并不少见,比如你在百度搜“建设中”,后面一大堆2003年的快照……
  3. 百度截取了服务器上返回的时间并左侧显示出来,而不是显示第一次索引的时间,可不可说是不是一种用户体验的提升?
  这网站返回的时间比发布的时间还早,那从某种程度上意味着,这个内容编写出来肯定是早于索引时间的,所以在左侧百度加以显示出来(很多论坛或博客的帖子都有此提示,只要有发布时间的就有机会),它的意义在于能比较地明确告诉用户这个内容能追踪到最早产生于世上的日期是这个,请不要以快照时间为准(不是说这个页面生产时间,而是说里面的内容)。这个只是区别于正常搜索结果的一个附加用户体验,是右侧快照时间的一个补充(这时右侧的快照时间能告诉用户这个可能是该页面最近更新的时间),并不是像LZ所说的担心“误以为收录迟缓”,否则百度所有网站都以第一次索引时间为准了,干嘛还更新它呢。
  4. 因此,左侧这个时间和右侧的“百度快照”不一定是不同步的。
  那右侧的“百度快照”呢,如第1点所说,它可以是第一次索引的时间,可以是服务器返回的时间,也可以是最后或中途索引的时间。为什么说“也可以是最后或中途索引的时间”?因为这个时间需要被搜索引擎认为有更新索引的价值才会更新,哪怕更新页面内容的索引了,快照时间它也未必会更新,因为它觉得更新量过小了,对整体内容影响不大,这点例证在之前博主有个网站出现过 – 即内容更新过来了,但快照时间还是旧的。
  最后,说归说,快照时间如百度人员一再声明那样,只是个鸡肋,SEO无需过度关注……
  相关阅读: 关于百度快照问题的若干说明

###

首页我先感谢夫唯老师的邀请,第一次受到邀请回答,还是感觉很荣幸的。

虽然看了LZ的问题,但是感觉解决说明起来还是有点困难,但是无论怎么样吧,第一次邀请也不能太掉面子,针对这个问题,我还是分析一下原因吧,分析的不好,大家不要喷我哈。

1、快照回档。针对百度官方给出的说法:一个重要网页的快照往往会在搜索引擎数据库中保存有多份网页快照,这些快照的抓取时间并不相同。在一些极特殊情况下,搜索引擎系统可能会选择不同于当前搜索结果中的快照版本,导致出现快照时间倒退的情况。这算是一种情况,也是比较特殊。

2、百度在针对原创进行实验,利用文章的发布时间进行原创的验证。将所有重复性的文章进行最初的快照对比,在时间上的差异来判断原创文章。当然,这是我个人的想法。

3、百度毕竟是机器操作,出现一些个例或者特殊情况,也是正常的。没必要大惊小怪。

以上就是我的个人拙见,分析的不好,希望有更好的意见的朋友能指点一下。

###

关于这个问题请查看http://ask.seowhy.com/article/15!

这个已经经过多次论证,显示页面快照时间和页面中的时间戳是有很大关系的!

###

这应该也是百度目前正在纠结的关于如何判断文章原创性的问题,是根据网站服务器上的发布时间来规定还是通过网站本身的权威性判断文章的原创性,如果根据网站服务器上的时间来判断,就会出现上述情况,这个实例是不是说明了这一点,百度目前的技术只能通过网站服务器的时间来判断一个网站上文章的原创性,静待大神分析。。。

本文来自投稿,不代表微盟圈立场,如若转载,请注明出处:https://www.vm7.com/a/ask/21520.html