Este documento discute cómo evitar y detectar contenido duplicado en sitios web. Explica que Google penaliza el contenido duplicado malicioso y recomienda evitarlo para mejorar el rendimiento del sitio. Ofrece varias maneras de evitarlo, como no copiar contenido de otros, usar redireccionamientos 301 apropiadamente e indicar la URL canónica. También proporciona herramientas para detectar contenido duplicado como Copyscape y un verificador de páginas similares.
1. Cómo evitar y detectar contenido
duplicado
http://aprendiendoqueesgerundio.wordpress.com/
Presentación:
Elena Andrés Toledano
2. Evitar contenido duplicado (I)
¿Porqué se ha de evitar el contenido duplicado?
Google penaliza el contenido duplicado por prácticas maliciosas,
y recomienda, para que no afecte al rendimiento del sitio web,
evitar el contenido duplicado de un sitio web.
“El contenido duplicado de un sitio no implica que deban tomarse
medidas al respecto a menos que aparentemente el objetivo sea
engañar y manipular los resultados de los motores de búsqueda. Si su
sitio tiene problemas relacionados con contenido duplicado (...),
conocemos muy bien la manera de elegir la versión adecuada para
mostrarla en los resultados de la búsqueda.”
Fuente: http://googlewebmaster-es.blogspot.com/2008/11/desmitificar-la-
penalizacin-por.html
3. Evitar contenido duplicado (II)
¡Hay que evitar las prácticas maliciosas!:
No robando el contenido el de otros (scraping).
No republicando el propio contenido.
No crear dominios, subdominios, sites, etc. con contenido
duplicado.
No publicar páginas sin contenido (doorway pages).
4. Evitar contenido duplicado (III)
¿Cómo evitar el contenido duplicado?
Evitando los despistes:
Utilizar los redireccionamientos 301 adecuadamente.
Indicar con la etiqueta link (dentro de la sección head de la
página con contenido duplicado) cual es la URL canónica.
Indique en Webmaster Tools de Google cual es la URL preferida.
Usar la metaetiqueta “noindex”.
Tener cuidado con la sindicación de contenidos.
5. Detectar contenido duplicado
Antes que nada, utilizar técnicas disuasorias: poner
el símbolo del copyright, creative commons,...
Herramientas para detectar contenido duplicado:
http://copyscape.com/
http://www.webconfs.com/similar-page-checker.php
Pasos a seguir si te han copiado contenido:
Contactar con el webmaster de la página plagiadora.
Presentar “denuncia” en los motores de búsqueda.
¡Google no le da importancia!:
Fuente: http://googlewebmaster-es.blogspot.com/2009/02/contenido-
duplicado-debido-scrapers.html