倡萌最近发现一个客户的网站被别人进行了恶意搜索攻击,导致他的网站域名下被收录了很多不良信息数据,如下图所示:
这种恶意搜索攻击,其实非常简单,就是通过既定的网址结构不断对网站发起不良关键词搜索访问,比如WordPress的搜索网址结构为 ,而且可能还会顺便将访问的地址推送到各大搜索引擎,加快这些恶意网址的收录。这样,你的网站就会沦为这些不法之徒传播不良信息的渠道,这对网站排名是非常不利的,甚至可能会直接被搜索引擎K站。
如果网站管理员没有定期检查网站的情况,很可能就会遭殃。
要处理这种恶意搜索攻击,同时还要确保WordPress网站搜索功能的正常使用。操作起来思路是比较明确的,不过步骤和时间可能有些多。
要屏蔽恶意搜索,首先我们需要监控到对方使用什么恶意搜索词,所以我们先安装 Search Analytics 插件,在 仪表盘 – 搜索分析 页面,我们就可以看到搜索词:
知道了搜索词以后,我们就需要做屏蔽。下载并安装倡萌开发的 WPKJ Block Search Words 插件,启用以后,就可以在 设置-阅读 界面,看到【搜索关键词屏蔽】,根据上面的搜索数据提取恶意关键词,然后填进去,保存:
插件采用的是部分匹配机制,填入【微信】,所有包含【微信】的搜索词都会拦截。
然后我们在网站搜索包含已填写的屏蔽词,就会返回如下错误界面,并且这个界面返回的状态码是 404,这样一来,搜索引擎也不会去收录了:
WPKJ Block Search Words 插件已经兼容 Search Analytics 插件,只要搜索内容包含有屏蔽词,就不会在 Search Analytics 的搜索分析中记录,这样一来,你可以很方便地知道,哪些词已经被屏蔽,继续观察一段时间,发现有新的词,就提取填入【搜索关键词屏蔽】。
搜索结果页一般我们都不推荐被收录,所以建议大家还是禁止收录。
现在几乎所有搜索引擎都遵循robots.txt的规则,也就是我们可以通过 robots.txt 定义规则,阻止搜索引擎收录搜索结果页面。我们可以在网站根目录,创建一个robots.txt 文件,填入下面的内容:
上面内容的倒数第1、2条规则,就是禁止收录搜索结果页。
更多robots.txt的介绍,请看:为你的 WordPress 站点添加 robots.txt
禁止收录搜索结果页面的规则已经添加,但是搜索引擎不会马上做出回应的,之前收录的恶意链接,也不会那么快去掉。这时候,我们可以通过百度的死链提交功能,让搜索引擎快点去掉已收录的恶意网址。
首先,我们需要收集恶意网址,访问百度搜索首页,通过 进行搜索,比如 就可以得到你网站下关于这个关键词的结果:
创建一个名为 silian.txt 的文件,然后访问上面的恶意网址,将网址复制到 silian.txt 中,每行一个:
我们可以搜索前面收集到的恶意关键词,尽可能将所有收录数据收集。
然后将这个 silian.txt 文件上传到网站根目录,然后访问 百度搜索资源平台 ,在站点管理中,提交死链网址: