Todo lo que necesitas saber sobre Contenido Duplicado

¿Qué es el contenido duplicado?

Se considera contenido duplicado aquel conjunto amplio de texto o código fuente de una página web que coincide completamente o es muy similar al de otra página web. Ya sea dentro de un mismo sitio web (contenido duplicado interno) o de un sitio web con respecto a otro diferente (externo).

¿Por qué me interesa a mí el contenido duplicado?

Es importante evitar el contenido duplicado porque tiene un impacto negativo sobre el posicionamiento orgánico.

Te lo puedo resumir en una frase:

¿Quieres vender online? Pues empieza a pensar en el contenido como pilar de tu estrategia digital.

¿Cómo afecta negativamente al SEO?

El objetivo de los buscadores como Google, es dar con lo que el usuario está buscando. Para poder ofrecerle un buen  abanico de posibilidades que le permita acertar, Google necesita conocer el distinto contenido que va apareciendo a lo largo y ancho de internet e identificar cuál es de calidad para el usuario.

Por eso esto Google descarta el contenido duplicado y se va quedando con las páginas que considera originales y de utilidad para los usuarios.

Cuando hablamos de contenido duplicado en SEO no solamente nos referimos a un contenido que un sitio web ha copiado a otro, sino que también hablamos del contenido que tenemos en las diferentes páginas del mismo sitio web. Es muy frecuente que en una tienda online se produzcan problemas de Thin Content, derivados de paginación o filtros de productos. En el artículo enlazado, puedes encontrar más información sobre este error.

¿El contenido duplicado penaliza?

No, el contenido duplicado no penaliza una web, como ya aclaraban en el blog para webmasters de Google hace años. Lo que ocurre, es que perjudica a tu sitio web en la medida en que tus páginas duplicadas no aparecerán en los primeros resultados. De hecho,  en la herramienta Search Console puedes ver cómo Google va descartando de indexación aquellas páginas que considera duplicadas (Cobertura del  índice > Excluidas).

Google Panda

No podemos atacar el tema del contenido de calidad sin hablar de «Google Panda». Hace unos añitos (y probablemente todavía hoy) muchas páginas copiaban contenido de otros portales para ahorrarse el tiempo, y/o el dinero, que cuesta crear contenido de calidad. Se creaban sitios web como churros sin pensar en ofrecer un valor añadido para el usuario, y estos se posicionaban mejor o peor generalmente utilizando técnicas SEO black hat.

Para combatirlo, Google desarrolló Google Panda, el algoritmo de los resultados de búsqueda que mide la calidad y originalidad del contenido. Si tienes contenido duplicado (o simplemente contenido de baja calidad) ten por seguro que tu web quedará enterrada entre las últimas páginas de los resultados de búsqueda.

Tipos de contenido duplicado

Contenido duplicado externo

Con contenido duplicado externo nos estamos refiriendo al contenido que es copiado entre diferentes sitios web, es decir, dos dominios diferentes que utilizan páginas con el mismo contenido.

Seguro que os habéis encontrado alguna vez el mismo artículo en dos portales diferentes. Lo más habitual es encontrarlo en sitios web basados en la publicación continua de contenido, como diarios o revistas online.

A veces incluso la web con contenido original aparece en los resultados de una búsqueda determinada por debajo de la página que ha copiado el contenido vilmente. Por lo que es un tema que preocupa a muchos webmasters. En estos casos, tienes que saber que Google pone a disposición de los administradores una herramienta para denunciar contenido duplicado por infracción de los derechos de autor.

Cómo denunciar el contenido duplicado a Google

Antes de rellenar el formulario para la retirada de contenido por una infracción de propiedad intelectual hay que tener en cuenta que:

  • Para poder rellenar el formulario es necesario iniciar sesión con una cuenta de Google.
  • No hacer una denuncia falsa bajo ningún concepto. Se exigirá una responsabilidad legal por daños y puede salir muy caro, literalmente hablando. En la propia página explica el caso de una empresa que se vio obligada a pagar 100.000 dólares por este hecho.

¿Qué información debo proporcionar para denunciar contenido plagiado?

  • Información de contacto: Hay que indicar el nombre, apellidos, el nombre de la empresa, el correo electrónico, el país y el titular de los derechos de autor.
  • Material protegido por derechos de autor: A la hora de explicar qué material ha sido copiado es importante que la información que proporcionemos sea lo más precisa posible, cuantos más detalles, mejor. Pueden añadirse hasta diez grupos, cada uno de ellos para cada material que haya sido copiado. Además, se deberán proporcionar la URL con el contenido auténtico y la URL con el contenido copiado.
  • Declaraciones juradas: Deberán marcarse todas las casillas, donde se acepta que:
    • Los materiales que has descrito como infractores no tienen el consentimiento del propietario de los derechos de autor
    • Eres el propietario de esos derechos de autor o tienes la autorización del propietario para realizar la denuncia
    • Las copias de los avisos legales son enviados al proyecto Lumen para su anotación y publicación.

Contenido duplicado interno

El contenido duplicado interno es aquel que se origina dentro del propio sitio web, es decir, hablamos de páginas que se encuentran en el mismo dominio. ¿Cuál es el problema con este tipo de contenido? Que no queremos hacer que Google pierda el tiempo que emplee en nuestro sitio.

Los robots de Google cuentan con un «presupuesto de rastreo» limitado (no pueden examinar todas las páginas cada vez que visitan un sitio web). Por lo que hay que intentar que ese presupuesto lo empleen en páginas optimizadas para SEO y únicas.

Ten en cuenta que, a priori no se sabe cuál es la URL original que se debe indexar, por lo que puede que rastree las páginas de tu sitio que menos te interesan, ocasionando problemas de rastreo e indexación.

Causas del contenido duplicado interno

Como te comentaba al inicio del artículo, el ejemplo más frecuentes de contenido duplicado interno se da en las tiendas online. Este tipo de sitios web tienen varias categorías de productos, cuya estructura y diseño es siempre la misma (solamente cambian los productos que se muestran y los enlaces a estos). Pero la base es la misma. Y lo mismo ocurre con las fichas de producto. Por no hablar de los filtros.

Misma estructura, en muchas páginas, que al robot le cuesta identificar. A los robots les resultad difícil distinguirlas y darle más o menos relevancia. Por eso es importante crear textos originales para las páginas de un ecommerce, de cara a conseguir un buen rendimiento en las búsquedas orgánicas.

Pero, además de por los textos, el contenido duplicado puede darse por cuestiones técnicas de las que no somos conscientes:

Dominio: Tu dominio canónico sería aquel configurado como https://www.ejemplo.com. Sin embargo, es posible que se pueda acceder a tu página con otras versiones del dominio no canónicas (como http://www.ejemplo.com, https://ejemplo.com o http://ejemplo.com). Para solucionar esto habría que establecer redirecciones 301 en las opciones que no sean canónicas.

Filtros: Aunque para quienes visitan la página los filtros son una gran ayuda, para nosotros no lo son tanto. El problema de los filtros es que, cuando hay varias opciones, pueden crear infinitas combinaciones de URLs, todas con el mismo contenido. Para evitar el contenido duplicado habría que utilizar URLs canónicas para cada página sin filtros.

Localización: Se pueden dar problemas de contenido duplicado si utilizas el mismo contenido para dirigirte a distintas regiones que hablan el mismo idioma, o si es el mismo contenido, pero traducido. Para solucionarlo habría que crear enlaces hreflang que informan de que el contenido está dirigido a distintas zonas.

Cómo actuar ante problemas de contenido duplicado interno

Una vez identificado el problema tienes que tomar medidas para solucionar. Te aconsejo que hagas lo siguiente:

  1. Crea contenido original para cada una de las páginas de tu sitio web que te interese que aparezcan en los rankings.
  2. Si tienes que mantener algunas páginas con contenido muy similar, utiliza la canonicalización, para indicarle a Google cuál es la buena.
  3. No permitas que los robots rastreen las páginas que no te interesan, utiliza la metaetiqueta Noindex.
  4. Elimina las páginas que no te interesan y redirecciona a las que te interesan. Para que los robots no desperdicien presupuesto de rastreo en páginas que no interesan lo más rápido es eliminarlas. Pero no te olvides de realizar la redirección correspondiente, para que los robots no se encuentren con un error 404 la próxima vez que intenten rastrear esas URLs.
  5. Utiliza la herramienta para eliminar URLs de los resultados de búsqueda y hacer más rápido el proceso para que Google deje de indexar y examinar dichas páginas.

Herramientas gratuitas para detectar contenido duplicado

Hay varias herramientas que te ayudarán a detectar el contenido duplicado y así poder evitarlo. Las más utilizadas son:

Siteliner

Se trata de una herramienta online que se utiliza para analizar un sitio web en busca de páginas que cuentan con contenido similar o duplicado.  De cara a la optimización de tu sitio web (contenido duplicado interno). Te estima muestra unos porcentajes de duplicidad para que sepas si los problemas son graves o no.

Copyscape

En este caso es una herramienta online que analiza las posibles copias que hay de una página determinada en internet. En este caso, se utiliza para detectar contenido duplicado externo. Funciona como un buscador, nos da como resultados las posibles páginas que están copiando a una URL determinada que introducimos, indicando el porcentaje de palabras iguales que hay para un resultado determinado.

contenido duplicado copyscape

¿No tienes tiempo de crear contenido?

Recuerda que si no tienes tiempo para crear tu propio contenido o simplemente no te vienen las ideas, puedes contratar servicios de redacción de contenidos en el siguiente enlace:

¡Te espero en los comentarios!

7 comentarios en “Todo lo que necesitas saber sobre Contenido Duplicado”

  1. Buenas tardes,

    Gracias por escribir este post, ya que me ha ayudado a saber poner en práctica el SEO en mi web. Aún así, quería preguntarte una cosa y estaría muy agradecida de tu respuesta.

    Hablando sobre la canibalización de keywords, en el caso de los ecommerce, si quieres optimizar la URL añadiendo keywords correspondientes a los productos, si hay productos que son similares ¿Se canibalizan?

    Te pongo un ejemplo:
    http://www.sitioweb.es/mesas/mesa-auxiliar-plegable-exteriores
    http://www.sitioweb.es/mesas/mesa-auxiliar-plegable-interiores

    En este caso ¿La keyword «mesa auxiliar plegable» se canibaliza? ¿Cómo se debería plantear la URL de productos en ecommerce para no canibalizar?

    Muchas gracias,

    Alicia

    Responder
    • ¡Hola Alicia!

      Es correcto, concretamente la keyword «mesa auxiliar plegable» probablemente canibalizaría con esas 2 URLs. Lo que debes hacer es identificar la intención de búsqueda (y su keyword asociada) para optimizar la URL en base a ella. Si tienes dos productos diferentes, que representan dos intenciones diferentes y sabes que hay 2 keywords diferentes una para cada intención (ej. «mesa auxiliar exteriores» y «mesa auxiliar interiores») debes escribir el contenido orientado a cada una en cada página. Y caso de que sean dos productos iguales y dos intenciones de búsqueda iguales, tendrás que poner una como Canónica, y que se rastree y posicione siempre esa. No sé si me explico.

      Un saludo

      Responder
  2. Hola Luis
    Un placer como siempre leerte y por esa claridad que siempre demuestras.
    Como sabes en la página web tengo un blog. Me han propuesto una página Facilisimo que sube blogs el subir mis artículos de blog a su plataforma. Puede haber problema de contenido duplicado Luis?
    Te transcribo lo que ponen en su web:
    Todos los post que se sincronizan automáticamente con tu blog incluyen una etiqueta canonical que indica a los buscadores que el post que se muestra en la plataforma en realidad es una reproducción del tuyo, y noindex para que ese post no aparezca en los buscadores. De esta manera se le traspasa toda la fuerza SEO al post original, el de tu blog. Además, los post incluyen enlaces a tu blog también (además de los que tú hayas incluido), todo ello de manera natural, muy útiles tanto para los usuarios como para los buscadores.

    Algunas personas se extrañan de que en ciertas herramientas (como copyscape y similares) sí aparece como contenido duplicado. Por supuesto, porque esas herramientas lo que buscan es posibles plagios no autorizados y por ello no se fijan en si el post tiene o no canonical, pero los buscadores sí lo tienen en cuenta.
    ¿Qué te parece?

    Responder
    • Hola Rafa,

      ¡Qué alegría leerte por aquí! Muchas gracias por tu comentario.
      Con respecto a la duda que planteas, añadir el blog a Facilisimo es una muy buena opción. Es un enlace potente que te llevará tráfico de gente interesada en tu sector. Precisamente lo que explicas es la opción para que ese contenido no sea un plagio, el citar siempre a la fuente e incluir una etiqueta rel=canonical hacia la fuente original (en este caso tu blog, que será la que Google considere para el ranking). Este sitio lo implementa perfectamente, así que adelante 🙂

      Un abrazo

      Responder
  3. Hola Luis,

    Lo primero, felicidades por este artículo, me ha sido muy útil. Me gustaría hacerte una pregunta. Tengo una tienda online, y me gustaría saber si un mismo producto lo incluyó y una, dos o varias categorías de producto, se consideraría eso contenido duplicado…???

    Muchas gracias de antemano…

    Responder
    • Hola Josep.

      Entiendo que te refieres a tener un producto en varias categorías. ¿Verdad? Aunque pertenezcan a varias categorías, lo que tienes que hacer es que no haya dos URLs distintas para acceder al mismo producto. Es decir, aunque un mismo producto se repita en varios listados, que su ficha no esté repetida en varias URLs, sino que tenga una URL única para acceder a sus descripción. No sé si me explico.

      Un saludo

      Responder

Deja un comentario

Responsable: Luis Revuelto Sevillano
Finalidad: Gestionar los comentarios.
Legitimación: Tu consentimiento.
Destinatarios: Los datos que me facilitas estarán ubicados en los servidores de Cdmon.com - 10dencehispahard S.L. (proveedor de hosting del sitio web luisrevuelto.es) dentro de la UE. Ver política de privacidad de Cdmon.com - 10dencehispahard S.L. (https://www.cdmon.com/es/contratos/aviso-legal-y-politica-de-privacidad-de-datos).
Derechos: Podrás ejercer tus derechos, entre otros, a acceder, rectificar, limitar y suprimir tus datos.