El Contenido Duplicado o Plagio (Web Scraping)

El contenido duplicado es un problema tanto para el creador de una web como para el que la copia.

Contenido duplicado y plagio es un problema para el SEOEs muy común encontrar sitios web con contenido copiado literalmente de otros sitios para aumentar sus contenidos y en la mayoría de ocasiones conseguían posicionar sus web mucho mejor que las webs de las que copiaban el contenido. Esto causaba que las primeras páginas de resultados de los buscadores se llenaran de spam y webs que no merecían estar ahí por su contenido (copiado)…

Google se encargó de solucionar el problema con un algoritmo llamado Panda que se encarga de rastrear y penalizar las webs o páginas con contenidos duplicados; ahora bien, el algoritmo también puede fallar y creer que un contenido copiado es el original, es por eso que el plagio sigue siendo un problema tanto para el creador del contenido como para el plagiador.

El Plagio en el SEO

Identifica las url’s con contenido duplicado (plagio)

Si tenemos un sitio web en el que hay más de un autor y sospechamos que podemos tener contenido duplicado de otros sitios o que otros sitios hayan copiado nuestro contenido podemos comprobarlo ingresando la url de la que sospechamos en Copyscape.com

  

Si encontramos páginas con contenido copiado de otros sitios web estamos en el “umbral de riesgo”, podemos ser penalizados por el algoritmo de Google con lo que eso conlleva.

Sin embargo, no siempre que una web tiene contenido duplicado se hace a mala fe, incluso hay sitios que no son conscientes de tener contenido duplicado y se encuentran en malas posiciones a pesar de tener muchos enlaces entrantes y un contenido de calidad porque están penalizadas.

Tipos de contenido duplicado

  1. El contenido duplicado puede ser “no malicioso” y por lo tanto no hay que preocuparse porque Google lo reconoce como tal y no requiere acción alguna.
    • Cuando hay contenido duplicado en dos o más sitios de un sitio web pero todas esas url apuntan a una sola y/o mencionamos parte de un contenido en un foro (que es algo lógico y natural) no hay problema alguno y entra dentro de el tipo de contenido duplicado “no malicioso”
  2. Cuando aparecen varios resultados en los buscadores que llevan a páginas diferentes con contenido casi idéntico o copiado y pegado literalmente o cuando encontramos dos o más resultados con distintas url’s que lleven al mismo lugar, por ejemplo www.misitio.es y misitio.es es contenido duplicado.
    • En el segundo caso la solución es sencilla creando una re-dirección 301 en el archivo .htaccess (Documentación aquí)
    • En el primer caso tenemos que crear redirecciones página por página a la url que consideremos que es la que mejor las representa o eliminar el contenido duplicado en caso de que realmente esté copiado de otra web que no sea nuestra.
    • Hay que tener también cuidado con las descripciones, etiquetas y categorías porque también se pude considerar contenido duplicado si hay varias iguales aunque su texto sea diferente; por ejemplo si escribimos una Guía de SEO por en varias páginas y las llamamos “Guía de SEO” a todas… lo mejor sería crear títulos, descripciones y etiquetas diferentes para cada página, aunque solo sea añadiendo “parte 1, parte 2, parte 3, etc…” a los títulos y descripciones.

Conclusión

Esto es un grave problema para el posicionamiento y es necesario controlarlo para evitar situaciones irreversibles en las cuales no tengamos más remedio que dejar el dominio abandonado y empezar la web de nuevo con otro dominio (el peor de los casos).

Soluciones y Recomendaciones de Google aquí