到底哪一个才是原创?
如图。
目前看, google识别原创的最主要手段就是识别传播能力. 根据meme理论传播越广的内容其价值越高:
其实这里换了概念, 把"原创"换成了"价值高".
这是一种对于识别"原创"困难的折中. 把找出"源头"的工作, 交给了用户的群体智慧. 网页被用户通过主动的方式看到的越多, 那么他是"原创"的概率就越大. 把识别的工作, 交给了全体用户来共同参与.
相当于是我们找出了信息源(但有可能不是原创), 再把这个结果告诉google. 虽然可能不是真正的原创, 但可能是最具影响力的结果。
基于以上,在你的搜索中,新浪科技和软件资讯,被用户看到的概率相当大,谷歌就认为是原创的。
到底谁是真正的原创,有可能是新浪,有可能是软件资讯,也有可能是别的,谷歌这方面没有给出。
可能谷歌以为内容都会给用户利用价值,所以就都标记了原创。
百度官方给出的原创“起源”算法:
首先,通过内容相似程度来聚合采集和原创,将相似网页聚合在一起作为原创识别的候选集合;
其次,对原创候选集合,通过作者、发布时间、链接指向、用户评论、作者和站点的历史原创情况、转发轨迹等上百种因素来识别判断出原创网页;
最后,通过价值分析系统判断该原创内容的价值高低进而适当的指导最终排序。
依上所述,对于原创候选集合的识别,百度判断的依据有作者、时间、用户评论等等百种因素,然后通过通过价值分析系统进行识别排序。那么百度怎么才能知道一篇文章具有价值呢?正如 杜春义所说,google把设别原创的工作交给了用户,百度也是一样。
回到你截图的这篇文章,很明显,中关村在线的文章并没有新浪科技的完整,从人工识别的角度来看,中关村在线的文章属于伪原创。然而当我现在搜索文章标题的时候,中关村在线排在了第一位,而且给出了原创标识,而新浪科技的那篇文章已经不知去向。不过,搜索新浪科技文章的url,百度也给出了原创的标识。另外,从文章发布的时间上,新浪科技的文章发布要早于中关村在线,这就完全彻底的可以说明新浪科技的文章是原创。
中关村在线的文章被评论7次,分享37次,新浪科技的文章被评论4次。站在这个角度,我们就会发现百度价值分析系统中“价值”的真正含义。(个人见解,勿喷~)
其实我关心的是,既然下面的两个都标记上原创了,为什么排名却在百度空间的后面……这是不是说明百度依然不会对原创文章有好的排名?
###快照时间才是亮点……都不要瞎扯啊……
###两个标题都是原创吧,呵呵
除去文章发布时间相差或许无几,网站资历都很大——应该是个主要因素吧。
从时间上看新浪科技是最早发布的,那么剩下的都是转载网站。
题主的意思大概是中关村在线的编辑转载新浪科技的文章,还告诉百度这是原创。
一直不明白为什么百度不通过发布时间判断是否为原创文章。
本文来自投稿,不代表微盟圈立场,如若转载,请注明出处:https://www.vm7.com/a/ask/21114.html