[导读]:在网站首页代码 与之间,加入metaname="robots"content="noarchive"代码,此标记禁止搜索引擎抓取网站并显示网页快照。 这是在百度上面搜索到的结果。这个方法是不是真的可以禁止所...
在网站首页代码
与之间,加入<metaname="robots"content="noarchive">代码,此标记禁止搜索引擎抓取网站并显示网页快照。这是在百度上面搜索到的结果。这个方法是不是真的可以禁止所以搜索引擎抓取?
我们只是想禁用网站的某个网页,没法使用robots.txt的方法,所以只能写到html里面。求大神回复。
你的方式只可以做到禁止所以搜索引擎显示页面的快照无法做到禁止搜索引擎抓取本页面。不过有点需要纠正,你说的“网站首页代码”,是不正确的,加了此标签的页面才有效,对于其它的页面是无效的。
如果您不想搜索引擎追踪此网页上的链接,且不传递链接的权重,在
就可以限制所有的搜索引擎建立你的网页快照。
必须了解搜索引起抓取页面相关的命令:
INDEX命令:告诉搜索引擎抓取这个页面
FOLLOW命令:告诉搜索引擎可以从这个页面上找到链接,然后继续访问抓取下去。
NOINDEX命令:告诉搜索引擎不允许抓取这个页面
Nofollow命令:告诉搜索引擎不允许从此页找到链接、拒绝其继续访问。
根据以上的命令,我们就有了一下的四种组合
:可以抓取本页,而且可以顺着本页继续索引别的链接
:不许抓取本页,但是可以顺着本页抓取索引别的链接
:可以抓取本页,但是不许顺着本页抓取索引别的链接
:不许抓取本页,也不许顺着本页抓取索引别的链接。
同时在加上禁止显示快照的代码<metaname="Robots"content="noarchive">就OK###
这个只是相对的,有时候写了Robots 我发现好还是会搜到禁止的内容的,noarchive是禁止搜索引擎建立网页快照,但是不代表你不索引你的网页。也就是说这个noarchive是不能禁止搜索引起抓取你的内容的,要禁止抓取建议采用
###关键搜索引擎也要遵守才是
###只能说防范下,目前无法做到绝对的禁止吧。
本文来自投稿,不代表微盟圈立场,如若转载,请注明出处:https://www.vm7.com/a/ask/28351.html