衡量流行的关键词研究工具的质量
JROakes通过Google搜索结果中的数据来衡量流行的关键字研究工具的质量,并从GoogleSearchConsole执行页面数据。
您是否想知道某些流行的关键字研究工具的结果如何与GoogleSearchConsole提供的信息叠加?本文着眼于比较谷歌搜索控制台(GSC)搜索分析的数据与着名的关键字研究工具以及您可以从谷歌提取的内容。
作为奖励,您可以使用本文末尾的代码获取相关搜索,并且人们还可以从Google搜索结果中搜索数据结果。
本文并不是要进行科学分析,因为它只包含七个网站的数据。可以肯定的是,我们正在收集一些综合数据:我们选择了来自美国和英国的网站以及不同的垂直网站。
程序
1.开始通过定义各个行业的垂直网站
我们使用SimilarWeb的顶级类别来定义分组并选择以下类别:
艺术和娱乐。
汽车和车辆。
商业和工业。
家和花园。
娱乐和业余爱好。
购物。
参考。
我们从我们的网站样本中提取了匿名数据,并能够从搜索引擎优化专家(SEO)AaronDicks和DanielDzhenev获得未见数据。由于最初的探索性分析涉及到定量和定性的组成部分,因此我们希望花时间了解过程和细微差别,而不是放大分析所需的让步。我们确实认为这种分析可以为内部营销组织提供一个粗略的方法,以便更明智地决定哪种工具可以更好地适应各自的垂直方向。
2.从各个利基网站获取GSC数据
数据是通过编程和使用Jupyter笔记本从GoogleSearchConsole获取的。
Jupyter笔记本是一款开放源代码的Web应用程序,允许您创建和共享包含实时代码,公式,可视化和叙述文本的文档,以便每天从SearchAnalyticsAPI中提取网站级别的数据,从而提供比当前可用的更大的粒度Google的网络界面。
3.为每个网站收集单个内部页面的排名关键字
由于主页倾向于收集许多可能或可能不会与页面的实际内容相关的关键字,因此我们选择了一个已建立且正在执行的内部页面,以便排名更可能与页面内容相关。这也更加现实,因为用户倾向于在特定内容观点的背景下进行关键词研究。
上面的图片是与业务相关的各种查询的主页排名示例,但与页面的内容和意图没有直接关系。
我们删除了品牌字词,并将GoogleSearchConsole查询限制为首页结果。
最后,我们为每个页面选择一个词首。短语“首字词”通常用于表示具有高搜索量的热门关键词。我们选择搜索量相对较高的词汇,但不是绝对最高的搜索量。在展示次数最多的查询中,我们选择了最能代表该网页的查询。
4.在各种关键词工具中进行了关键词研究,并查找了关键词
然后,我们使用上一步中选择的词长来执行三个主要工具中的关键词研究:Ahrefs,Moz和SEMrush。
使用“搜索建议”或“相关搜索”选项,并且保留所有返回的查询,而不管该工具是否指定了建议与首字之间的相关程度。
下面我们列出了每个工具的结果数量。此外,我们从Google搜索中为每个首字词(各个国家/地区)提取了“人们还搜索”和“相关搜索”,并添加了结果数量以给出Google免费赠送的基准。
**这个结果返回了超过5000个结果!它被截断为1,001,这是最大可行的,并按降序排列。
我们编译了每个工具返回的关键字的平均数量:
5.处理数据
然后,我们通过使用一些语言处理技术将单词转换为它们的根形式(例如,“运行”到“运行”),去除了诸如“a”,“the”和“和“扩大收缩,然后排序的话。
例如,这个过程会将“Raleigh中的SEO代理机构”转变为“代理机构Raleigh搜索引擎优化”。这通常会保留重要的单词并将它们排列整齐,以便我们可以比较和删除类似的查询。
然后,我们通过将唯一字词的数量除以工具返回的字词总数创建一个百分比。这应该告诉我们这些工具有多少冗余。
不幸的是,它没有考虑拼写错误,这在关键词研究工具中也可能存在问题,因为它们会在结果中添加额外的粗俗(不必要的,不想要的查询)。多年前,有可能针对网站页面上的术语拼写错误。今天,即使拼写错误,搜索引擎也能很好地理解您输入的内容。
在下表中,SEMrush的搜索建议中唯一查询的比例最高。
这很重要,因为如果1,000个关键字只有70%是唯一的,这意味着300个关键字对于您正在执行的任务基本上没有唯一的值。
接下来,我们想看看各种工具如何发现用于查找这些执行页面的查询。我们采用了以前独特的标准化查询短语,并查看了工具在其结果中查询的GSC查询的百分比。
在下面的图表中,请注意每个工具的平均GSC覆盖率,Moz在这里较高,很可能是因为它为大多数头条件返回了1,000个结果。所有工具的执行效果都比Google抓取的相关查询要好(使用文章最后的代码也可以做到这一点)。
进入矢量空间
在执行之前的分析之后,我们决定将标准化的查询短语转换为向量空间,以便直观地探索各种工具的变化。
分配给矢量空间使用称为预先训练的单词向量的东西,使用称为t分布式随机邻居嵌入(TSNE)的Python库在维度(x和y坐标)中减少。如果您对此不熟悉,请不要担心;通常,单词向量是将单词转换为数字,以便数字表示关键字的固有语义。
将单词转换为数字有助于我们处理,分析和绘制单词。当语义值绘制在坐标平面上时,我们清楚地了解各个关键字之间的关系。分组在一起的点将在语义上更相关,而距离彼此较远的点将更不相关。
购物
这是Moz返回1,000条结果的一个例子,但搜索量和搜索者关键词的变化非常低。这很可能是由于Moz在语义上匹配特定的单词而不是尝试更多地匹配短语的含义。我们要求Moz的RussJones更好地理解Moz如何找到相关的短语:
“Moz使用许多不同的方法来查找相关术语。我们使用一种算法来查找具有相似页面的关键词,并使用另一种ML算法将该短语分解为构成词并找出相关词的组合,从而生成相关短语等。这些算法中的每一个都可以用于不同的目的,具体取决于在你是否想要非常接近或切向主题。您是否希望提高关键字的排名或找到足够明确的关键字来撰写关于该关键字的相关信息?MozExplorer返回的结果是我们试图达到这种平衡。“
Moz确实包含了一个很好的相关性度量,以及一个用于微调关键字匹配的过滤器。对于这种分析,我们只使用了默认设置:
在下面的图片中,查询图显示了每个关键字供应商将坐标平面转换成的返回值。位置和分组可以让您对关键字的相关性有所了解。
在这个例子中,Moz(橙色)产生了大量的各种关键字,而其他工具选择的却少得多(绿色的Ahrefs),但与最初的主题更相关:
汽车和车辆
这是一个有趣的。你可以看到Moz和Ahrefs对这个高额期限的报道很好。Moz通过匹配GoogleSearchConsole实际条款的34%获胜。Moz的结果数量(几乎默认)是Ahrefs的两倍。
SEMrush在这里落后于35个针对具有广泛有用品种的主题的查询。
较大的灰点代表来自GoogleSearchConsole的更多“基本事实”查询。其他颜色是使用的各种工具。没有重叠颜色的灰色点是各种工具不匹配的查询。
互联网和电信
这个图很有意思,因为SEMrush从其他结果中的50-200个范围跳到近5000个结果。您还可以看到(底部)有许多术语,这些页面往往排在这个页面之外,或者对于理解新页面的用户查询需要什么是多余的:
大多数工具分组有点接近头项,虽然您可以看到SEMrush(用紫色粉红色)产生了大量可能更不相关的点,尽管在某些分组中发现了GooglePeopleAlsoSearch。
百货
以下是关键字工具的一个示例,用于查找该页面当前未排名的术语(用黑色圆圈表示的分组)的有趣分组。在审查数据时,我们发现右侧的分组对于此页面有意义:
这两个黑色圆圈有助于形象化以这种方式绘制文本时查找相关查询分组的能力。
分析
具有关键词研究经验的搜索引擎优化专家知道,没有一种工具可以统治所有关键词。根据您需要的数据,您可能需要咨询一些工具才能获取您的信息。
以下是对每种工具进行定性评估后的一般印象:
查询数据和我们分析结果唯一性的数字。
找到真实用户用于查找执行页面的条款的可能性。
莫兹
在原始结果方面,Moz似乎有令人印象深刻的数字,但我们发现在几个案例中缺乏结果的总体质量和相关性。
即使在玩相关性分数时,它也会很快发生切线,提供的查询与我的总词没有任何关系(请参阅上图中的Moz对“NachoLibre”的建议)。
有了这些说明,由于其全面的覆盖面,Moz尤其适用于小型或新型垂直行业的SEO。在很多情况下,为更新的趋势主题找到关键字非常困难,所以更多关键字在这里肯定更好。
GSC的真实用户数据覆盖64%的覆盖率,这对于选定的域名来说是非常令人印象深刻的。这也告诉你,尽管Moz的结果可能会降低兔子洞,但它们往往也有很大的改进。他们已经失去了保真度的全面性。
Ahrefs
Ahrefs在质量方面是我最喜欢的,因为他们的完美结果与最少量的明显无关的查询结合在一起。
本文来自投稿,不代表微盟圈立场,如若转载,请注明出处:https://www.vm7.com/a/zixun/131557.html