Contenido duplicado

Podría empezar este artículo con las clásicas frases de…”El contenido el rey”, “El contenido es clave del marketing online”, “Tienes que ofrecer un contenido de calidad para mejorar la experiencia del usuario”…etc. Pero lo voy a resumir en una frase:

¿Quieres vender online? Ponte las pilas con el contenido, porque es la base de tu estrategia.

Y si es la base de tu estrategia, ¿por qué ibas a querer copiar contenido de otras webs? ¿por qué ibas a crear diferentes páginas con el mismo contenido?

En definitiva, ¿por qué es tan importante evitar el contenido duplicado?

Te lo explico en los siguientes apartados:

¿Qué es el contenido duplicado?

El contenido duplicado, uno de los problemas con los que una web tiene que luchar constantemente. Se considera contenido duplicado cuando el texto de tu web tiene contenido muy similar, o directamente, es una réplica del texto original.  Cuando hablamos de contenido duplicado en SEO no solamente nos referimos a un contenido que un sitio web ha copiado a otro, sino que también hablamos del contenido que tenemos en las diferentes páginas del mismo sitio web.

¿Cómo afecta negativamente al SEO?

El objetivo de los buscadores como Google, es dar con lo que el usuario está buscando. Para poder ofrecerle un buen  abanico de posibilidades que le permita acertar, Google necesita conocer el distinto contenido que va apareciendo a lo largo y ancho de internet e identificar cuál es de calidad para el usuario.

Por eso esto Google descarta el contenido duplicado y se va quedando con las páginas que considera originales y de utilidad para los usuarios. Ojo, dejamos claro que el contenido duplicado no penaliza, como ya aclaraban en el blog para webmasters de Google hace años. Sino que perjudica a tu sitio web en la medida en que tus páginas duplicadas no aparecerán en los primeros resultados.

Google Panda

Pero no podemos hablar de contenido de calidad sin hablar de “Panda”. Hace unos añitos (y probablemente todavía hoy) muchas páginas copiaban contenido de otros portales para ahorrarse el tiempo ,y/o el dinero, que cuesta crear contenido de calidad. Se creaban sitios web como churros sin pensar en ofrecer un valor añadido para el usuario, y estos se posicionaban mejor o peor generalmente utilizando técnicas SEO black hat.

Para combatirlo, Google desarrolló Google Panda, el algoritmo de los resultados de búsqueda que mide la calidad y originalidad del contenido. Si tienes contenido duplicado (o simplemente contenido de baja calidad) ten por seguro que tu web quedará enterrada entre las últimas páginas de los resultados de búsqueda.

google panda

 

Tipos de contenido duplicado

Contenido duplicado externo

Con contenido duplicado externo nos estamos refiriendo al contenido que es copiado entre diferentes sitios web, es decir, dos dominios diferentes que utilizan páginas con el mismo contenido. Seguro que os habéis encontrado alguna vez el mismo artículo en dos portales diferentes. Lo más habitual es encontrarlo en sitios web basados en la publicación continua de contenido, como diarios o revistas online.

A veces incluso la web con contenido original aparece en los resultados de una búsqueda determinada por debajo de la página que ha copiado el contenido vilmente. Por lo que es un tema que preocupa a muchos webmasters. En estos casos, tienes que saber que Google pone a disposición de los administradores una herramienta para denunciar contenido duplicado por infracción de los derechos de autor.

Contenido duplicado interno

El contenido duplicado interno es aquel que se origina dentro del propio sitio web, es decir, hablamos de páginas que se encuentran en el mismo dominio. ¿Cuál es el problema con este tipo de contenido? Que no queremos hacer que Google pierda el tiempo que emplee en nuestro sitio.

Los robots de Google cuentan con un “presupuesto de rastreo” limitado (no pueden examinar todas las páginas cada vez que visitan un sitio web). Por lo que hay que intentar que ese presupuesto lo empleen en páginas optimizadas para SEO y únicas. Ten en cuenta, que a priori no se sabe cuál es la URL original que se debe indexar, por lo que puede que rastree las páginas de tu sitio que menos te interesan, ocasionando problemas de rastreo e indexación.

El ejemplo más frecuentes de contenido duplicado interno se da en las tiendas online. Este tipo de sitios web tienen varias categorías de productos, cuya estructura y diseño es siempre la misma (solamente cambian los productos que se muestran y los enlaces a estos). Pero la base es la misma. Y lo mismo ocurre con las fichas de producto. Por no hablar de los filtros.

Misma estructura, en muchas páginas, que al robot le cuesta identificar. A los robots les resultad difícil distinguirlas y darle más o menos relevancia. Por eso es importante crear textos originales para las páginas de un ecommerce, de cara a conseguir un buen rendimiento en las búsquedas orgánicas.

gatos gemelos

 

Cómo detectar contenido duplicado, herramientas gratuitas

Hay varias herramientas que te ayudarán a detectar el contenido duplicado y así poder evitarlo. Las más utilizadas son:

Siteliner

Se trata de una herramienta online que se utiliza para analizar un sitio web en busca de páginas que cuentan con contenido similar o duplicado.  De cara a la optimización de tu sitio web (contenido duplicado interno). Te estima muestra unos porcentajes de duplicidad para que sepas si los problemas son graves o no.

Copyscape

En este caso es una herramienta online que analiza las posibles copias que hay de una página determinada en internet. En este caso, se utiliza para detectar contenido duplicado externo. Funciona como un buscador, nos da como resultados las posibles páginas que están copiando a una URL determinada que introducimos, indicando el porcentaje de palabras iguales que hay para un resultado determinado.

contenido duplicado copyscape

Cómo actuar ante problemas de contenido duplicado interno

Una vez identificado el problema tienes que tomar medidas para solucionar. Te aconsejo que hagas lo siguiente:

  1. Crea contenido original para cada una de las páginas de tu sitio web que te interese que aparezcan en los rankings.
  2. Si tienes que mantener algunas páginas con contenido muy similar, utiliza la canonicalización, para indicarle a Google cuál es la buena.
  3. No permitas que los robots rastreen las páginas que no te interesan, utiliza la metaetiqueta Noindex.
  4. Elimina las páginas que no te interesan y redirecciona a las que te interesan. Para que los robots no desperdicien presupuesto de rastreo en páginas que no interesan lo más rápido es eliminarlas. Pero no te olvides de realizar la redirección correspondiente, para que los robots no se encuentren con un error 404 la próxima vez que intenten rastrear esas URLs.
  5. Utiliza la herramienta para eliminar URLs de los resultados de búsqueda y hacer más rápido el proceso para que Google deje de indexar y examinar dichas páginas.

Y recuerda, si tienes poco tiempo para crear tu propio contenido o simplemente no te vienen las ideas, puedes contratar servicios de SEO Copywriting (un poquito de autopromoción que faltaba :D).

¡Te espero en los comentarios y en las valoraciones!

1 estrella2 estrellas3 estrellas4 estrellas5 estrellas (2 votos, promedio: 5,00 de 5)
Cargando…

Deja un comentario

Responsable: Luis Revuelto Sevillano
Finalidad: Gestionar los comentarios.
Legitimación: Tu consentimiento.
Destinatarios: Los datos que me facilitas estarán ubicados en los servidores de Cdmon.com - 10dencehispahard S.L. (proveedor de hosting del sitio web luisrevuelto.es) dentro de la UE. Ver política de privacidad de Cdmon.com - 10dencehispahard S.L. (https://www.cdmon.com/es/contratos/aviso-legal-y-politica-de-privacidad-de-datos).
Derechos: Podrás ejercer tus derechos, entre otros, a acceder, rectificar, limitar y suprimir tus datos.