seo优化之去除重复内容

重复内容是一个经常被忽视的 SEO 问题,它会悄悄地损害您的排名和流量。为了帮助您避免这种问题,在这篇文章中,我将引导您了解什么是重复内容、它是如何发生的、如何在您的网站上识别它,以及清理内容的确切步骤,包括翻译网站引起的重复问题。

什么是重复内容(为什么它很重要)?

重复内容是指以相同或几乎相同的形式出现在互联网上多个位置的文本块。这可以位于您自己wordpress网站的多个页面(内部重复内容)或跨多个域(外部重复内容)。

这对 SEO 来说是一个问题,因为像 Google 这样的搜索引擎希望对不同的内容进行排名。如果他们的热门搜索结果都包含相同的文本,那么对他们的用户不会有太大帮助,不是吗?

Google 搜索页面中的不同结果

因此,当相同的内容出现在多个 URL 中时,搜索引擎可能很难决定要索引和排名哪个版本。因此,他们可能两者都不选择。

这意味着,如果您的wordpress上有重复内容的页面,它们可能会阻碍彼此的搜索可见性,从而导致排名降低、索引页面减少和权威降低。指向您网站的反向链接也可能转到您不打算排名的页面版本,从而削弱其积极影响。此外,内部重复还会浪费本可以转到更重要页面的抓取预算。

其中大部分也适用于外部重复内容。在这里,您面临着被盗内容最终排名可能高于原始内容的额外风险。或者,如果您复制其他人的内容,可能会损害您的整个网站。在极少数情况下,谷歌甚至可能会惩罚以欺骗性方式复制和使用内容的网站。

重复内容从何而来?

出现重复内容问题的原因有很多,其中许多是WordPress主题开发者技术原因。

为您的网站使用不同的域

一个常见原因是您的网站是否可以通过多个域访问。Google 会考虑以下所有独立wordpress网站:

  • http://example.com/
  • http://www.example.com/
  • https://example.com/
  • https://www.example.com/

因此,如果您没有明确指定您的网站是使用“www”、HTTP 还是 HTTPS,那么您实际上会创建包含相同内容的不同网站版本。

如果您为网站的移动版本使用单独的子域,这也适用,如下所示:

  • https://example.com/
  • https://m.example.com/

对于暂存和开发网站也是如此,您可能会意外地让搜索引擎发现这些网站,并且可能存在于单独的 URL 中,例如:

  • https://dev.example.com/
  • https://staging.example.com/

包括 URL 参数

另一个因素是 URL 参数,电子商务网站经常使用该参数来过滤产品变体:

  • http://example.com/shoes/
  • http://example.com/shoes/?color=red

如果设置为索引,这些内容也可以显示相似的内容,但地址不同。

在 Google 搜索中出现在多个类别下的产品

如果您允许搜索引擎为网站上的搜索请求索引结果页面,则也是如此。

这里的秩序也很重要。考虑这两个地址:

  • http://example.com/shoes/?color=red&size=xl
  • http://example.com/shoes/?size=xl&color=red

这些将显示相同的产品,但代表搜索引擎的不同 URL。

导致网址略有不同且内容重复的类似情况是页面、会话 ID 或 UTM 代码的打印友好版本。

CMS 导致的内容重复

CMS 平台有时会通过存档生成重复的页面。WordPress 为类别、标签、作者和日期创建了大量它们。但是,如果您的网站上只有一位作者发布,则您的博客页面和作者存档将包含完全相同的文章。

翻译出版社 尼克·谢弗霍夫 作者档案

WordPress 分页也可能是一个问题,即内容被拆分为具有单独 URL 的多个页面。例如,在 WordPress 中,有一个评论分页选项可以创建如下 URL:

  • https://example.com/sample-post/
  • https://example.com/sample-post/comment-page-2/
  • https://example.com/sample-post/comment-page-3/

每个页面的文章正文都相同,只是评论不同。

手动复制内容

当然,也可以无意或有意地手动创建重复的内容。

例如,您可能会克隆文章以更新它并意外地单独发布它。或者,您参与内容联合,这意味着在不同的地方发布同一篇文章以供曝光。

许多博主在 Medium 上重新发布他们的文章,以接触其受众。如果标记不正确,这可能会在搜索引擎中显示为重复内容。

联合内容的媒介归属

但它也可能更无害,例如重复使用制造商提供的样板产品描述或在不同的企业目录中重复使用相同的文本。

另一种选择是,您有针对不同位置的服务页面,因为您的企业在多个区域运营。您的服务和优惠保持不变,只是页面上提到的位置发生了变化,这使得其余内容非常相似。

定位服务页面

最后,如前所述,有时人们只是复制别人的内容并将其发布到自己的网站上(并不是说你永远不会参与其中)。

错误地翻译 Web 内容

最后一个因素是,多语言网站尤其面临重复内容的风险。翻译您的网站基本上意味着在多个页面上发布相同的内容,只是使用不同的语言。

如果您要迎合共享一种语言的不同市场,例如西班牙、墨西哥和阿根廷,情况会更加复杂。在这种情况下,您可能有三个内容相同的页面:

  • http://www.example.com/es/
  • http://www.example.com/mx/
  • http://www.example.com/ar/

如果您未将其标记为针对不同地区,Google 可能会惩罚您。

如何在您的网站上查找重复的内容

修复您网站上相同内容的第一步是查找是否有任何内容以及它们隐藏在哪里。

一个简单的方法是将您创建的页面数量与 Google 索引中的页面数量进行比较。为此,请参阅在 Google Search Console 中索引>页面

Google Search Console 中已编入索引的页面数量

如果索引中有更多的页面,则它们是从某个地方添加的。Search Console 还会显示尚未编入索引的网页的重复内容问题,以防存在重复内容问题。

未编入索引的页面的原因

除此之外,您还可以使用重复内容检查器,例如 Siteliner。该工具会扫描您的网站并快速突出显示内部重复项。

SiteLiner 重复内容结果

另一种选择是 Screaming Frog SEO Spider。它可以抓取您的网站并标记重复的标题、元描述和内容块。

Semrush 和 Ahrefs 等 SEO 工具也会告诉您类似的问题。

SEMRUSH 重复内容警告

要查找外部重复内容,请使用 Copyscape 或 Duplichecker。

复制 Duplicate 内容结果

或者,从您的热门内容中复制不同的短语,并将它们输入 Google 中,并在它们周围加引号。这将显示索引中使用相同措辞的页面

在 Google 中搜索的重复内容结果,并带引号

修复重复内容问题的 6 种方法

一旦您确定了有问题的页面,有几种行之有效的方法可以解决该问题。正确的解决方案首先取决于导致它的原因。

1. 停止生产

如果您网站的 SEO 问题有明确的根本原因,最合乎逻辑的步骤就是简单地解决它:

  • 确定一种网站域格式并重定向其他网站域格式(下文会详细介绍)
  • 为移动用户使用响应式设计,而不是单独的域
  • 确保您的暂存和开发网站不可发现和索引
  • 在 WordPress 中禁用评论分页
  • 关闭您网站上的某些存档和/或显示摘录而不是完整文章
  • 确保网址参数始终采用相同的格式
  • 从您的 URL 中删除会话 ID 并改用 Cookie
  • 摆脱适合打印的页面并切换到打印样式表

2. 使用 301 重定向

重定向告诉浏览器和搜索引擎页面已移动到新 URL。“301”是指告诉搜索蜘蛛移动是永久性的重定向(与 302 重定向相反,302 重定向仅表示临时移动)。永久重定向将原始页面的几乎所有 SEO 值传递到新位置,有助于保持排名和流量。

重定向最适合不需要保留一个版本的重复内容,例如,如果您要从网站的 www 版本切换到非 www 版本(反之亦然)或从 HTTP 切换到 HTTPS。

除此之外,当两个页面具有相同的目的并且您只想保持一个页面处于活动状态时,使用 301 重定向来修复重复内容,例如:

  • https://example.com/about-us/
  • https://example.com/about/

如果两者都已编入索引,请选择一个并删除并重定向另一个。您可以执行相同的作来清理过时的 URL 或将多个相似的页面合并到一个强大的规范页面中。

重定向在服务器级别,例如通过 .htaccess 或 NGINX 配置。它们看起来像这样:

Redirect 301 /about-us https://example.com/about

WordPress 用户可以使用类似 Redirection 的插件。大多数 SEO 插件还包括设置重定向的功能。

WordPress 重定向插件

避免重定向链和指向重定向 URL 的内部链接。此外,请务必使用 Search Console 中的网址检查工具测试您的重定向,以确保它们按预期工作。

在 Google Search Console 中检查重定向的页面

3. 设置规范标签

规范标签告诉搜索引擎页面的哪个版本是您希望它索引和排名的“主副本”。当您有多个 URL 显示相同或非常相似的内容但无法删除重复项时,例如在 URL 参数或分页的情况下,这一点至关重要。

规范标签如下所示:

<link rel="canonical" href="http://yourdomain/page-you-want-indexed">

它们属于您要排名的页面及其重复项的部分。每个重复项都应指向主页,并且也应指向自身(这称为自引用)。<head>

在 WordPress 中,Yoast 和 Rank Math 等 SEO 插件可以轻松地为每个页面设置规范 URL。

Yoast SEO 中的规范 URL 设置

与重定向一样,在实施后使用 Google Search Console 验证您的规范。

4. 利用 Noindex 标签

noindex 标签告诉搜索引擎不要在其索引中包含特定页面,即使它们可以抓取它。当页面不提供唯一值并可能触发重复内容问题(例如标签存档)时,这非常有用。Noindex 标签如下所示:

<meta name="robots" content="noindex">

它们同样属于页面部分或作为 HTTP 响应标头。或者,大多数 SEO 插件允许您在不接触代码的情况下将单个页面或整个内容类型设置为 noindex。<head>

在 Yoast SEO 中将内容设置为 noindex

您还可以将其与规范标签一起使用,以引导搜索引擎访问您最重要的内容。此外,将页面设置为 noindex,而不是阻止搜索引擎爬虫通过robots.txt访问它们。

5. 重写内容

当两个或多个页面主题相似但需要保持在线时,最好的解决方案是更新其内容以使每个页面独一无二。一个典型的情况是类似的服务或产品页面出现重复内容。

重写并不意味着改变每个单词——专注于添加独特的价值、观点或示例来区分页面。如果可能,使用清晰、原创的标题,并根据特定用例、地点或受众定制内容。

简而言之,创造原创、新鲜和权威的内容。

如果无法重写并且两个页面都没有什么价值,请考虑将它们合并到一个更强大的资源中。不要忘记重定向!

6. 将 hreflang 标签添加到翻译页面

由于不同语言版本而导致内容重复的解决方案是 hreflang 标签。它们告诉搜索爬虫网页应在搜索中显示哪种语言和地理位置。您可以将它们放置在页面部分、HTTP 标头或 XML 站点地图中,它们如下所示:<head>

<link rel="alternate" href="https://example.com/en" hreflang="en-us" />

hreflang 生成器使它们更容易生成。

Hreflang 标签可以引用语言和区域设置(尽管仅一种语言就足够了)。它们允许您向搜索引擎发出信号,表明具有相同翻译内容的页面针对特定地区:

<link rel="alternate" href="https://example.com/ar" hreflang="es-ar" />
<link rel="alternate" href="https://example.com/mx" hreflang="es-mx" />

如果您为不同的语言版本设置了单独的域,则这适用于域:

<link rel="alternate" href="https://example.de" hreflang="de-de" />
<link rel="alternate" href="https://example.br" hreflang="pt-br" />

所有可用的语言版本都需要具有指向每个可用替代方案(包括它们本身)的 hreflang 链接。否则,Google 可能会忽略它们。

7. 处理外部复制的内容

最后,您如何处理其他人窃取并发布在其网站上的外部重复内容?

谷歌通常非常擅长找出内容的原始来源,但并非总是如此。如果这对您来说是一个问题,第一步是考虑在您的 RSS 提要中添加一个链接回您网站的代码段。

RSS 提要中的归因

抓取工具经常使用 RSS 来自动收集内容。当您添加链接时,他们也会抓取链接,让 Google 知道原始链接在哪里。它并非万无一失,但很容易做到,并且可以产生很大的影响。Yoast SEO 使做到这一点变得容易。

在 Yoast SEO 中设置 RSS 归因

下一步,您可以联系使用您内容的网站所有者并要求他们将其删除。这就足够了,因为人们想避免麻烦。

如果没有,您最后的手段是通过 Google 的内容报告工具发布 DMCA(数字版权千年法案)移除。

Google 内容报告工具

Google 需要一段时间来处理该请求,但如果成功,它会从搜索结果中删除重复的内容。

我爱主题网 自2012
主题:260+ 销售:1000+
兼容浏览器

电话咨询

7*12服务咨询电话:

1855-626-3292

微信咨询