聚合能提升网站的收录以及流量等各个方面,但是如果两个非常相近的词各自生成一个页面,就会造成内容及其相似甚至完全相同的情况,一旦聚合关键词上一定的级别,如10W,那么造成的重复页面就会带来很多的忧患!
这里想和大家探讨一下如何有效的避免聚合页面的重复率。
现在正在做的思路是:将聚合页面设定几个属性:
1、全局,是否调用全站数据(或者指定调用哪几个模块信息)
2、手动添加信息:类似于专题页面
聚合页做得好,比一般的页面用户体验要好得多。
关于页面重复率问题,这个可以参考如下的解决思路:
1、聚合页面匹配内容时,匹配规则可以依次为内容属性匹配、标题精准匹配、短语匹配、模糊匹配等
2、生成长尾词的时候,尽量别少出现雷同词或意思相近关键词
3、采用内容ID判断方法,超过50%的内容重复则自动进行下一类型的结果匹配规则
另外,聚合页其实也可以做得很智能,简单整理一套语义切词系统,根据关键词特点分析用户可能最为关注的内容,按照一定规则将最相关信息展示在最前,页面的体验就更牛了
说白了,就是一个页面相似度过高的问题。
解决方法:
1、增加页面的评论功能
2,增加随机文章页面
3,Tag标签
4,“热门文章”、“本周热门文章”、“统计热门排行”等
1,获取词相关的内容集合,可以把id聚合在列表,进行倒排序。
2.对id集合进行去重,或相似度高的去重处理。
3. 根据剩下的id集合,进行关键词的筛选,取出合适的做
剩下的一些相似度高的词或重复结果的词如果要做,就看id集合的数量了,假设结果有100个,每页显示20个 你可以把其中5个词只显示1页的数据,确保不重复。当然如果进行适当的混淆,还可以再多点的词。
如果有分页,Nofollow掉分页。
大概就这么回事,思路而已,自己琢磨吧。
嗯,我现在做的资讯站,tag大多设定的是形容词。
主页——品牌词
栏目——主要关键词
内页——长尾关键词
专题——大流量关键词
tag——考虑关键词的唯一性只选择形容词。
聚合页面的重复率的问题,我举一个案例:
我观察过一个网站,www点51test点net,
他就是全部聚合页面而成。
看一下他的处理方式吧。
重复是因为内容太少或者是太单一,10W的聚合页面,根据行业和具体页面主题的竞争度,一般数据需要在200W以上。
###这样的页面,尽量不要使用随机的关键词,如果能够手动设置,那就可以很好的控制这方面的问题了。另外一方面,可以在网站的后台增加一些功能,看页面的相似度,也可以多做一些模版,通过不同的布局方式来解决这些问题。
###聚合可以判断,如果几个条件组合时没有相关数据,可以程序可以不让点击,就可以解决。
或是在这个结果页,放上其他随机推荐数据。
其实这个问题我和很多朋友探讨过,量大不重复的话,你就得添加很多随机调用的东西,比喻,随机调用文章,再一个文章的描述页可以随机调用文章中的前100字,100至200字,可以随机调用产品图片,总之你随机的板块越多,那么重复的概率就越小了!
###1、聚合页面调用的内容可以多种排序。
2、可以根据频道内容调用相关TAG
3、TAG的设置本身要具有逻辑性
可以用分词工具将关键词对应分词,去除一些修饰词等,然后去重复,将去重后的关键词生成聚合页面,这样应该能减少很大程度的重复页面。去重复后再生成页面也是有数量限制的,总数据的多少,每个聚合页面调用的数量,都对此有很大影响! 上面然姐说的方法表示支持!
1、全局,是否调用全站数据(或者指定调用哪几个模块信息)
个人看法:这个你能设定多少规则呢?难道要每次聚合一个页面就想出一个不同的数据调用规则?关键词少的情况下还行,要是成千上万就不太实际了吧?不过结合不同调用规则确实是一种好方法,可以整合到聚合页面之中。
2、手动添加信息:类似于专题页面
个人看法:不同意的看法和上面提到的差不多,就是关键词太多的情况下手动太局限性了。我用dedeCMS专题手动添加规则和关键词聚合页面,几个月了也没弄多少页面,呵呵 也许是我执行力不行吧
以商城为例,国平老师曾经给出过一个公式是:
X=A/B*2
X代表聚合页面数量,A代表商品总数,B代表每页商品数。
汗,你是准备大量生成页面么。
如果是自动生成的建议采用一些随机性。
比如其中一块是调用资讯内容,那么就随机调用若干条。
本文来自投稿,不代表微盟圈立场,如若转载,请注明出处:https://www.vm7.com/a/ask/20756.html