首页 > 问答 > 百度lee又发文章了,这次是针对原创的,大家怎么看?

百度lee又发文章了,这次是针对原创的,大家怎么看?

[导读]:转其中一段baidu关于原创的处理办法: 互联网动辄上百亿、上千亿的网页,从中挖掘原创内容,可以说是大海捞针,千头万绪。我们的原创识别系统,在百度大数据的云计算平台...

转其中一段baidu关于原创的处理办法:
互联网动辄上百亿、上千亿的网页,从中挖掘原创内容,可以说是大海捞针,千头万绪。我们的原创识别系统,在百度大数据的云计算平台上开展,能够快速实现对全部中文互联网网页的重复聚合和链接指向关系分析。
首先,通过内容相似程度来聚合采集和原创,将相似网页聚合在一起作为原创识别的候选集合;
其次,对原创候选集合,通过作者、发布时间、链接指向、用户评论、作者和站点的历史原创情况、转发轨迹等上百种因素来识别判断出原创网页;
最后,通过价值分析系统判断该原创内容的价值高低进而适当的指导最终排序。

这样看baidu这次主要开始处理原创问题,结合之前搜索时候发现搜索结果下面有xxx原创文章,如果按这种说法,以后标记有原创的理论上会排名靠前。

我还是很好奇怎么判断,里面说通过作者,发布时间,如果我发了一篇原创,但是我的站收录可能比较慢,但是别人也同样转过去了,如果是自己的站和数据库理论上可以修改发布时间,那怎么算?读服务器记录?

链接就不发了,大家都知道地方

一个网站,他的历史原创性,即这个网站是否是一个习惯原创的站,这是一个很重要的指标。
原创度高的内容站,将在接下来的时间里获得很高的权重。
但现在有一个问题是,更新和原创的博弈。如果一个网站原创度不错,但长期没怎么更新,他是否依然获得很好的权重?
这里涉及到,搜索引擎推荐链接时,是推荐当前网页,还是通过推荐当前网页来推荐网站?前者会更看重更新度,后者更看重网站整体原创度。

百度最新文章链接地址:

###

花了点时间做了张图

###

原创?我原创的文章百度刚刚给我两天高权重,然后下面的人不听指挥把这篇文章转载到高权重的行业网站上面去,结果我的原创的权重没了,完全找不到了,人家复制我的给予了高权重。由此可看,百度的所谓原创高权重还是更多的给予权重高,流量大的站点。即使他们是转载抄袭的。

###

首先影响的肯定是大网站,大网站蜘蛛爬行的频率高啊!
但是企业站呢,绝大多数的行业应该都没有那么多的原创文章更新吧!
就算真的每个网站都写原创,我觉得我实在没什么写了,但是非要更新原创,我可能就会编造。
这是一种猜想,如果成立的话,那岂不是垃圾虚假的内容会越来越多?

###

“通过内容相似程度来聚合采集和原创,将相似网页聚合在一起作为原创识别的候选集合”,反反复复念了好几遍,还不是很清楚这句话的意思,有哪位介绍下?

ps:原创并不代表一切,对用户各种需求有帮助的内容才是最合适的(见过了太多洋洋洒洒几千字的文章,但看完不知所云的原创),所以百度重视尊重原创只是第一步,基本解决了这一步,下一步才是关键,既搜索引擎把客户最需要的内容或者最符合大家需求的内容给与好的排名和权重。

###

原创是非常好的,但是也不是绝对的。对用户有价值的东西才是最重要。原创而没有价值又有什么用,

###

不管百度的算法最后几时出来,准确性有多大,我认为,百度将越来越重视原创,同时提到伪原创影响了用户体验,影响了原创网站的利益什么的,我得出的一个基本结论就是:原创很重要,站长要越来越重视;用户体验很重要,不要为了SEO坏了用户体验。

###

星火计划的启动,可能是未来我们优化的主要方向。

###

历史原创性,说白了就是人工选择一批网站。完全不信百度有这么强的技术实力来实现原创识别,应该只是研究方向,目前只是起到稻草人的功效。(百度官方的话是有中国特色的,需要打折扣的。)

###

原创性和价值性将是决定网站内容质量的重要因素,原创不难,但价值却难多了,对这个起源算法抱怀疑态度,毕竟原创加价值太难判断了

###

历史原创性,必然会成为判断原创的重要依据。

###

有时真不知道何去何从,但是有一点,原创文章肯定很重要。

###

静观其结果,看看它这个算法准不准确。
要是某blog大部分时间都原创,偶尔转载一点不出名的blog的文章,那它会不会判断出来呢?

###

伪原创要遵循以下三个规律
1、文章质量要有价值,吸引众人的目光,最好是当天发布的文章
什么是有价值的文章?可读性、权威、吸引人。如果你及时赶上了刚刚发布的文章,并且你网站的权重比它要高,那么恭喜你了,不过这种行为是不道德的。如果很老的文章就不要去伪了,因为你随便在百度上一搜,就能搜索出几千甚至上万更多的网页来。郑州seo做伪原创一般超过三天的就不去了,但这也不是确切的依据。当然文章在引擎中被收录显示出来后,如果超过20条就不要去伪原创了。因为引擎在收录一篇文章后会把文章放入他的数据库,再次收录他会抓取数据库的内容进行比对。
2、网站标题一定要修改
网站标题是重重之重了,网站标题直接决定着你这篇文章是否会被搜索引擎收录,哪怕你的文章是原创的,如果采用了在百度上搜索结果成千上万的标题,那么你这篇文章也不一定会收录的,所以标题是重重之重,有的时候我们发博客的时候只需要改下文章标题即可顺利被搜索引擎收录,可见标题对搜索引擎评价网页质量是多么的重要。
3、对原创内容进行伪原创处理
对原创内容进行伪原创处理这里就不再多主闻,三个规律之下已经为大家介绍了具体的方法,总之伪原创要灵活运用即可。
1、太短文章不适合用
伪原创工具都是对原来的文字进行段落对调,互换,这对一些长篇文章的效果是立竿见影的,但是如果文章本身字数少,特别像亲挑网这种化妆品网站,大部分文章都是图片居多,文字极少,那使用起来就无效了。
2、必须结合手工来做
再好的工具也不能代替手工的工作,伪原创也是一样,你想让网站有收录,除了用软件之外,手工更新也是不可少的,要么自己来,要么请个专职编辑,总之,全自动工作你就甭想了,呵呵。
3、不能用反义词,慎用近义词替换
前面说过了,对原文章的替换,至少是语句级的,最好是段落和篇幅上的,逐字逐句的替换,效果几乎没有,还把意思搞的乱七八糟,最终得不偿失。
伪原创的方法选择
我一向都认为国内的站长们是最聪明的一类人,为了讨好搜索引擎,大家可谓是煞费苦心,想了不少办法。真可谓“这网络上本没有路,站长走多的就成了路”,呵呵。回到伪原创这个话题,目前大家所熟知的,至少有翻译法、问答拼凑法、替换法、打乱法、整合法几种。这些方法各有千秋,站在我个人的角度,最为推崇的还是整合法,具体而言就是找到几篇相似的文章,将文章的具体内容、段落打乱并且进行拼凑,最后再起一个响亮的标题,就搞定了。
我们知道,百度判断文章是否原创,重要的一个算法就是文章的现实程度,它会将文章划分为好几个区块,与原文进行对照,如果相同的比例超过一定的限额,就判定为抄袭。而相似文章整合法最大的优势在于,你的文章至少来自三个以上不同的地方,仅仅依靠单向性的比较,是很难发现相同的。因此这方法安全性最高,但是操作起来略微繁琐一些。适合全职站长使用。
小技巧助力伪原创
要想让文章被搜索引擎认为是原创并收录,一些小技巧也同样必不可少。
1、拼音标注法
众所周知,很多的伪原创方法,由于进行了大量的替换,最终的文章可读性非常差。而真正成功的方法应该始终以把用户的体验放在第一位。有一些聪明的站长把一些比较生僻的词语整理出来,并在旁边标注上拼音的发音,做成词库,这样在需要的时候,就可以自动进行体会,最终的结果不仅很好的增强了文章的伪原创效果,而且在用户看来,也同样是一件非常体贴的设计,何乐而不为呢?
2.标点符号替换法
类似的方法还有标点符号替换法,顾名思义,就是把文章的句号,逗号互换,毕竟现在网络上的信息泛滥,没有人上网看文章会在咬文嚼字之余还去注意文章的标点符号用的是否争取和恰当,所以它也是一种温和而有效的伪原创手段。
那么,我们文军信息SEO技术部在网站优化推广的过程中,如何来做伪原创呢?一起去瞧瞧:
1、首先遵循伪原创原则,改头改为改标题哦!
2、通读文章,找出不符合当前时代背景或者用户需求的文字,并且删除掉。
3、查找文献,找到当前环境下符合时代发展或者用户需求的内容,用自己的话添加。
4、插入图片,图文并茂,虽然百度对图片内容不识别,但图片可以加上ALT属性,也可以证明用户体验度的上升。
5、清晰段落,合理的为文章分段,插入小标题,让文章阅读性更强。
6、突出要点,首关键词加粗、重要内容斜体标记,都是突出要点的方法。
7、完善内链,在需要插入内链引导读者更深入了解产品概念的地方插入内链,也是非常必要的。

###

第一次来,冒个泡

本文来自投稿,不代表微盟圈立场,如若转载,请注明出处:https://www.vm7.com/a/ask/17659.html