直接上图
![](https://www.vm7.com/uploads/allimg/200303/62bed7d8abb6af8a85ab7d9b08f392ac.jpg)
一呼百应 的百度索引量这么大,之前有一个同学是搜了网的SEO总监,一起去参加了百度的高级站长大会,他提到的问题和你类似。就是百度的索引量过亿,但Site的数值却才1千万,我刚才看了下,目前还是一千万左右。
百度工程师在场的回复是,这是百度site数值的误差,以索引量为准。但问题是,site数值决定排名和流量,即只有site有的网页才参与排名。这个问题,百度工程师没给予回复。目前site数值与索引量的问题还是没完全解决中。
楼主的问题,我想可以参考下这个话题:http://ask.seowhy.com/question/8585
人人网的 @殷祎东 发起的。这个话题里那些回复很有价值,研究下会有启发,特别是通过在索引量里设置各个栏目、目录的针对性查询。从而获知,收录不理想的栏目。
楼主提到的一个特殊情况,即:企业发了很多信息,可能今天被抓取,第二天被删除的问题。
我想,如果这个情况数量确实庞大,是否可以利用下这个牛x的Nofollow标签。
我们可以对一些新注册的企业刚发布的N天之内的帖子,给予 nofollow。过了N天,这个帖子如果没被删除,则代表其质量过了贵网站的审核期,然后可以让蜘蛛抓取了。
这样利用nofollow来协调,有很多好处。望多加体会。
索引量亿,那当然索引还真心不靠谱。我有网站Site有46个,但是索引却只有2个。到底哪个准,还真说不清楚。
对于数据量如此之大来看,把握质量和重复内容都是B2B网站的难点。
【索引下降原因】我觉得是
没有实际内容、title相同的页面,例如列表页。
重复的内容,由于同类企业发布的信息,30%的内容重复不为过。一呼百应的每天发布率那么高,同类行业非常多,企业发布的信息几乎都是互联网相互抄袭,同时发布在一呼百应的几率也很大。
非法页面,B2B网站审核机制可以避免一些,用敏感词禁止。对于审核在如此在的发布量前提下,漏网之鱼不少。产生的404、500页面,提交百度也无补于事。论坛也会发生同类的问题,帖子在被收录后,才进行审核删除。很难避免的一个问题。
个人想到的方法:
1、尽量完善自身网站的审核机制,尽量避免产生这类页面。
2、多在站内企业后台发布系统中做提示,设置带“*”的填写项,尽量增加相应的创意设计。
3、对于审核删除产生的404页面,可以在Robots内建立一个:Disallow: / 相应禁止蜘蛛再次浪费。页面删除也尽量不要留有入口。
(PS。只能说尽量这个词,内容审核方面,目前就连百度也无法完美的做到垃圾内容一个都不收录的程度)
目前我也是B2B网站,但是索引与site的比例也在增加,由于我这边网站每天的企业发布量并不是很多,审核还行。但是重复内容却是目前的难题,毕竟企业行业都相同。也在此请教一呼百应的运营:【你们是如何避免企业发布的内容大量重复的问题呢?】
请教一下,百度索引量1亿,也太牛了,怎么才能增加百度收录量?
###近期是这样的,我的也下降了
###搜索引擎 建立索引基本过程:
WEB→Spider→线下存储库→页面分析→切词分词→建立倒排索引
现状:索引下降
常识:哪些情况会被清楚索引库
eg: 严重作弊内容页面、欺诈内容页面、不存在页面。。。。等等。
--------用数据来证明 现状-------------
维度细分、对比分析:
.细分索引下降在哪些频道,哪些内容页面。。。。
.爬虫日志方面对比。。。。。
.事件发生 前后工作记录进行对比 。。。。
.。。。。。。。。。。。。。。。。
.寻问相关百度人员。。(PS:有渠道的话)
很明显是网页内容的问题,很多网页质量不高。
可能存在大量的重复页面,重复内容。
想办法减少一些垃圾页面,提高页面质量咯~
举个例子,一个商家不能发部同样的内容超过2条,title不能一样,内容不能一样。内容介绍不能低于200字,引导用户去写一些原创的东西。
第一只能及时发现,及时删除
就好比之前网站被挂了很多非法页面,整理提交给百度,或者加大力度审核
保证重点页面被收录,保证流量趋势是上涨的就行了呗,毕竟能有排名的页面占收录页面的很小一部分,这个索引收录不用太关心吧。
###索引量只是一个参考值,不是Site数据很正常,这样去理解就对了,不要去挖掘更深的东西,百度搜索引擎工程师多还没弄明白,你瞎着急什么啊。踏踏实实做站吧小伙子。
本文来自投稿,不代表微盟圈立场,如若转载,请注明出处:https://www.vm7.com/a/ask/23944.html