Google Search Console 警告“已编入索引,尽管遭到 robots.txt 屏蔽” 的处理方案

在《WordPress 屏蔽恶意搜索,防止被搜索引擎收录恶意搜索结果》中,倡萌提到了网站被恶意搜索攻击,已经给出了一些处理方案,但是最近查看 Google Search Console 的覆盖率,看到了“已编入索引,尽管遭到 robots.txt 屏蔽”的警告,一看具体的网址,几万条全部都是恶意搜索结果。

查看了google官方文档《已编入索引,但被 robots.txt 屏蔽了》,了解到通过 robots.txt 并不能阻止Google索引恶意搜索结果:

而是需要通过使用“noindex”阻止搜索引擎编入索引

重要提示:为让 noindex 指令生效,网页不得被 robots.txt 文件屏蔽,并且必须能被抓取工具访问。如果该网页被 robots.txt 文件屏蔽或抓取工具无法访问该网页,那么抓取工具将永远无法看到 noindex 指令,因此该网页可能仍会显示在搜索结果中,例如,如果有其他网页链接到该网页的话。

我们不能在 robots.txt 屏蔽google蜘蛛访问搜索结果网址,但是倡萌并不清楚百度等其他搜索引擎是否会遵循 noindex 指令,所以我们在 robots.txt 中允许谷歌蜘蛛抓取搜索结果页面,但是禁止其他搜索引擎抓取。

按照《WordPress 屏蔽恶意搜索,防止被搜索引擎收录恶意搜索结果》 处理过的恶意搜索结果页面,会返回404状态码,并且源码中包含了 <meta name="robots" content="noindex">

这样一来,google蜘蛛就可以读取到该指令,不再索引被屏蔽关键词的恶意搜索结果页面。

以上步骤处理完以后,在 Google Search Console 覆盖率的警告界面,提交验证,然后耐心等待处理。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
欢迎关注我们的微信公众号:WPDAXUE

倡萌

一个文科IT宅男,喜欢折腾WordPress和被它折腾 ^_^

2 条评论

  1. 哈哈,你也遇到刷搜索了啊,好在我这没收录搜索结果。我上个月在此基础上还封禁了他们的IP,足足8000+个,现在清爽多了。

    1. 是的,最早应该是去年在客户的网站发现这种问题,然后自己的网站也同样受影响,目前基本处理了百度这方面的收录,昨天才看到google的问题,接着处理……

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注