目前帮公司分析tag页面不收录的问题,具体页面是 www点zx123点cn/ask/tlist/ 这个页面下面的tag基本不收录,收录的只是一部分之前的url,具体情况是这样,之前公司的tag页面链接全是用的中文的形式,后面无论是发链接还是浏览都不是很方便,所以说改到目前这个/tlist/ 目录下了,但是一改的话,之前tag页面收录上千,删得几乎只有20来条了吧!虽然都进行了301定向到现在这个url下,但是百度一直没有放出来,还是之前的页面,如何去解决这些问题呢?求大神相助!
做了更改,你又作了301定向,最好也在百度站长平台提交一下!其次就是这还需要百度适应一段时间。
分析为什么没收录,可以通过网站爬虫日志分析得出结果:
1、观察日志爬虫(Baiduspider)是否来抓爬ask/tlist/ 目录下的URL
2、如果有爬,那就要判断是哪一段的IP:
* 代表百度蜘蛛IP造访,准备抓取你东西,抓取网页的百度蜘蛛
* 这个蜘蛛经常来,别的来的少,表示网站可能要进入沙盒了,或被者降权。
* 抓取内页收录的,权重较低,爬过此段的内页文章暂时被收录但不放出来(意思也就是说待定),因不是原创或采集文章。(百度网页爬虫(百度图片爬虫)
以上IP有爬,却不收录,说明你的页面质量不行!
重点抓取更新文章的内页达到90%,8%抓取首页,2%其他。权重IP 段,爬过的文章或首页基本24小时放出来。
PS:适当发布一些瞄文本、超级文本外链,引导蜘蛛
有改动的情况下,基本上都有一段时间不收录或者不更新,现在能做的就是:更新,高质量外链
本文来自投稿,不代表微盟圈立场,如若转载,请注明出处:https://www.vm7.com/a/ask/22892.html