如何防止WordPress网站上的内容被抓取

内容抓取是指用户从你的网站窃取内容并自行重新发布。虽然通常通过你网站的RSS订阅自动完成,但也可以通过复制粘贴手动完成。各种内容都可以被复制,包括文本、图片和视频。

通常,窃贼会把你的内容当作自己的原创内容在网站上展示。有时,用户会添加链接回你的网站。然而,既然他们仍在未经你同意的情况下使用你的内容,这同样令人沮丧。

而且这也是违法的。内容爬取违反了版权法和知识产权,抓取者可能会被原创作者起诉。

抓取者选择窃取内容有很多原因。例如,企业或个人可能通过在其网站上添加高质量信息来确立特定领域的权威。

不过,为了节省时间,他们可能会从你自己的网站上借用想法,甚至整段内容。或者,他们可能会在你的内容中添加广告,利用你的内容来实现自己的网站变现。

如何防止WordPress网站上的内容被抓取

现在你对内容抓取有了更多了解,让我们来看看五种防止它的方法:

文章目录

版权法保护您的知识产权,包括您的品牌名称、标志及其他内容。因此,当抓取者在你的网站上实施内容盗窃时,实际上是在违法。

虽然这可能无法阻止专门的抓取者,但你可以在网站上显示版权声明。无论如何,这种做法仍然是非法的。不过,这样你可以明确表示用户未经许可不得使用你的内容。

在网站页脚加上版权声明是个好主意。或者,您也可以添加完整的条款和条件链接:

星巴克网站使用版权声明来帮助防止内容被抓取。

页脚是放置版权声明的好地方,因为它会显示在所有网页上。

此外,如果你需要提出DMCA投诉以升级问题,版权通知也会非常有用。如果你想更进一步,申请版权注册。不过,你可能需要法律帮助,因为这是一个相当复杂的过程。

2. 对你的RSS订阅源进行修改

正如我们之前提到的,如果抓取器自动窃取你的内容,它们依赖于你网站的RSS订阅。因此,建议对饲料做些小调整以防止刮擦。

最简单的改动是在RSS订阅源中提供每篇帖子的摘要,而不是包含全部内容。在这种情况下,抓取器只能复制你的帖子摘录和元数据,比如日期和作者。

要在WordPress中配置,只需进入设置>仪表盘中的阅读。滚动直到看到“对于每个帖子”,请包含并选择摘录:

将RSS订阅作为摘录显示。

然后,点击“保存更改”以更新您的网站。

3. 屏蔽爬取器的IP地址

防止网站内容被抓取的最简单方法之一就是直接屏蔽恶意IP地址。像Web应用防火墙(WAF)这样的安全插件会自动完成这一点。

WAF的工作原理是监控所有流入你网站的流量。然后,它会识别并屏蔽任何被认为有安全风险的IP地址。

更好的是,有很多免费的选择,比如Sucuri和Wordfence.

不过,如果你是经验丰富的用户,也可以手动屏蔽抓取器的IP地址。你可以通过cPanel仪表盘的Raw Access Logs来实现。或者,你可以通过文件管理器或FTP访问你的.htaccess文件。

找到并打开.htaccess文件后,只需添加以下代码行,将数字替换为你想要屏蔽的IP地址:

Deny from 111.222.333.444.

要阻止多个IP地址,请在文件的同一行输入它们,但用空格分隔。

不过作时要小心。备份你的 .如果你阻止自己访问自己的网站,可以找到HTACCESS文件。

4. 保护你的图片(禁用热链接并添加水印)

虽然可以从你的网站上获取文字,但图片也可以作为目标。因此,你可以关闭热链接,并在图片中添加水印。

热链接是指用户在自己的网站上展示你的图片,但从你的服务器加载图片。因此,它会增加带宽使用,因为它利用了服务器资源来显示图像。

要手动禁用热链接,你需要通过文件管理器或FTP访问你的.htaccess文件。然后,将以下代码粘贴到文件中:

/* Prevent image hotlinking in WordPress */
RewriteCond %{HTTP_REFERER} !^$
RewriteCond %{HTTP_REFERER} !^http(s)?://(www.)?yourwebsite.com [NC]
RewriteCond %{HTTP_REFERER} !^http(s)?://(www.)?google.com [NC]
RewriteCond %{HTTP_REFERER} !^http(s)?://(www.)?facebook.com [NC]
RewriteCond %{HTTP_REFERER} !^http(s)?://(www.)?twitter.com [NC]
RewriteCond %{HTTP_REFERER} !^http(s)?://(www.)?other-websites-go-here.com [NC]
RewriteRule .(jpg|jpeg|png|gif)$ - [F]

该代码禁止任何网站(除 Google、Facebook、Twitter 和您自己的网站)使用您的图片。此外,你可以在最后一行添加或删除文件格式,以决定哪些图片需要应用热链接防护。

现在,你还可以在WordPress图片中加水印,以防止网站内容被盗。注意,这样会稍微遮挡你的图片,因为水印会干扰图片:

iStock水印图片以防止内容抓取。

图片水印是一个免费的WordPress插件,可以自动为你上传的新图片添加水印。同时,它还能让你在网站上批量添加水印。

防止WordPress抓取的最后一个策略是给你的帖子添加大量内部链接。这不会让你的内容难以被抓取,而是确保即使内容被抓取,你仍然能从中受益。

例如,你帖子中的所有内部链接都会为你从抓取者网站获得有价值的反向链接。而且,由于反向链接是任何高质量SEO策略的关键组成部分,这也是提升搜索排名的简单方法。

更重要的是,内部链接还能帮助你将流量从抓取者的网站引导到你自己的网站。然后,你可以通过发布高质量内容、提供快速加载时间和实施便捷的网站导航,确保这些访客留在你的网站上。

我爱主题网 自2012
主题:260+ 销售:1000+
兼容浏览器

电话咨询

7*12服务咨询电话:

1855-626-3292

微信咨询