Importancia de detectar el contenido duplicado y cómo prevenirlo

En este artículo conocerás la importancia de detectar el contenido duplicado y las herramientas para evitarlo.

Como experto de marketing digital, debes haber escuchado de este tema, sobre todo, si cuentas con una plataforma digital en la que realizas publicaciones periódicas. Por lo tanto, es importante que conozcas acerca del contenido duplicado que siempre debes detectar y evitar en tu sitio web.

¿Qué es el contenido duplicado?

Google considera contenidos duplicados cuando existen páginas que tienen diferentes URL, pero tienen el mismo contenido. Esto es posible ya que Google usa algoritmos, los cuales se encargan de revisar los contenidos que suben los usuarios. De esta forma, Google identifica que, si tenemos un 80% de información repetida, nosotros no somos la fuente principal. Por lo que le darán mayor relevancia a la otra fuente, en lugar de a nosotros.

Sin embargo, esto no aplica cuando realizamos una cita entre comillas. Así que no te preocupes si tienes una frase entre comillas, no estarás duplicando ningún contenido. Por otro lado, el duplicado se puede dar entre webs con dominios diferentes o incluso con webs con un mismo dominio. Pero si se tratara de dominios diferentes, se entenderá como un caso de robo o plagio.

Por otro lado, Facebook también viene aplicando esta técnica, pues analiza que los contenidos que se suban a su plataforma, ya sean vídeos, imágenes y post, no se repitan en otros sitios digitales. Para identificar los contenidos duplicados Facebook recurre a sus algoritmos. Pero puedes evitar que marquen a tu empresa de publicar «contenido poco original» puedes realizar algunos cambios significativos, previamente autorizados, en el material.

Tipos de contenidos duplicados en Internet

El primero de estos es el contenido duplicado externo (inter- sites). Hace referencia a cuando los algoritmos de Google detectan el mismo tipo de contenido entre una de nuestras páginas y otra página de Internet. A través de un análisis, los algoritmos determinarán cuál realmente es la fuente, y será precisamente esa la que muestren en los resultados. Las otras las desecharán.

Para realizar este análisis, se usan diferentes variables como la fecha de publicación, la calidad de la información y la autoridad que tenga el sitio. Esto es fácil de identificar, simplemente tienes que hacer una búsqueda en Internet con el título de tu publicación. Verás que en los resultados aparecerán muchas páginas por encima de la tuya. Esto es porque Google ha determinado que no eres la fuente de aquella información.

Este tipo de duplicado externo suele ser difícil de solucionar. Esto se debe a que se requiere de mucho tiempo y esfuerzo para lograr remediar este problema. Aunque, nada es imposible, más aún si se trata de una página que es muy importante para nosotros. Algunas de las cosas que puedes hacer es evitar publicar el mismo contenido en otras plataformas de Internet. Además, cuando publiques en las redes sociales deberás usar una descripción completamente distinta.

Por último, tenemos el contenido duplicado interno (in-site) o en sitio web. Este se da cuando se detecta una misma información en distintas páginas de nuestro sitio web. No obstante, si bien disminuye la valoración del sitio este problema es mucho más fácil de solucionar. Lo único que debes hacer es estar al tanto y coordinar cuáles son las publicaciones que estás haciendo y con esto podrás evitar tener información repetida.

Medidas que te ayudarán a detectar y evitar el contenido duplicado

Ahora que hemos entendido la importancia de este tema, veamos cuáles son las medidas que podemos tomar para evitarlo. Acá encontrarás las acciones que debes adoptar para evitar publicar información repetida en el sitio web.

Evita que tus páginas tengan más de una URL

Es importante que sigas este consejo, porque te salvará de muchos inconvenientes. Para evitar el problema de repetición, tienes que indexar cada URL de tu sitio web en el panel de la herramienta Google Search Console. De esta forma existirá un registro oficial de lo que contiene tu sitio web.

Puedes usar la etiqueta rel=canonical en todas tus páginas

Debes saber que la Rel= Canonical o URL canónica es una etiqueta HTML que permite indicar la dirección exacta de una página web. Los robots de Google que realizan la búsqueda de contenido usan esta etiqueta para determinar cuál es realmente la fuente. De esta manera Google sabrá identificar que contenido indexar y evitará agregar fuentes con contenido similar.

Ten cuidado en repetir el mismo bloque de párrafos

Es importante que evites lo más que puedas la repetición de los mismos bloques de párrafos en diferentes páginas. Asimismo, es totalmente perjudicial para nuestro sitio que repitamos cabeceras o pies de páginas. Si quieres evitar esto, puedes hacer uso de Javascript para configurar diferentes elementos dinámicos en los sitios web.

Bloquea páginas que tengan contenido Similar

Este suele ser un problema frecuente entre las páginas que usan WordPress. Para que evites que esto te vuelva a suceder, puedes usar un archivo robbotos.Txt. Este tipo de archivo indica a qué partes no quieres que accedan los rastreadores de búsqueda. Esto lo puedes usar para bloquear las páginas auxiliares y las etiquetas, de tal forma que no puedan ser indexadas.

Usa la redireccione 301 para evitar problemas de SEO

Si no puedes hacer uso de la etiqueta canónica, puedes utilizar la redirección 301 para avisarle a Google de los cambios permanentes en un sitio web. Sobre todo, cuando has modificado la URL o cuando has establecido un nuevo dominio canónico. Debes saber que el código 301 también se realiza para cuidar el posicionamiento SEO del sitio web. Un ejemplo de esto es cuando realizas una publicación nueva con contenido actualizado de otro artículo ya existente. De esta forma el usuario podrá ser redirigido de la página antigua a la nueva.

Evita la paginación, sobre todo si tienes un sitio de comercio

En especial, esto suele pasar con una página que tiene varias páginas secundarias como los en sitios que se dedican al comercio. No obstante, se puede solucionar usando las etiquetas rel=next y rel=prev para indicarle a Google la secuencia de las páginas. El uso de los atributos rel next y rel prev les indican a los buscadores la relación que hay entre los atributos de paginación para que los muestren de forma organizada.

Evita a toda costa la copia

Este punto es importante tenerlo en cuenta. Por ejemplo, si haces alusiones a contenido con derechos de autor, será mejor que lo pongas entre comillas. Si no lo vas a poner así, será mejor que hagas un breve resumen o parafrasees la cita. Evita copiar el contenido tal cual lo encuentras en la fuente porque esto será penalizado por Google.

¿Cómo detectar el contenido duplicado?

En Internet podrás encontrar algunas herramientas eficientes para detectar el contenido duplicado en tus sitios web.

Copyscape

Esta es una herramienta totalmente gratuita que permite introducir una página y detectar automáticamente si ha sido plagiada. Sin embargo, si quieres realizar una búsqueda mucho más avanzada puedes usar la versión Premium. con ella podrás usar otros factores para determinar el nivel de plagio. También, puedes usar  Copysentry, la cual te permite escanear tu página web diariamente. Además, te avisa inmediatamente cuando alguna URL externa ha usado tu información.

Google Search Console

Esta también está entre las herramientas gratuitas que te permitirán monitorizar tu web. Con el uso de Google Search Console, podrás detectar si dentro de tu web hay algún tipo de información repetida. Lo único que tienes que hacer es crearte una cuenta y abrir el menú de “aspecto de búsqueda” en el lateral derecho. Desde allí podrás encontrar una opción que dice “mejoras de HTML”. En esta opción te saldrán un listado de etiquetas y títulos duplicados.

Screaming Frog

Es una herramienta SEO que puedes tener en tu escritorio. Existen dos versiones para descargar: la gratuita y la Premiun, en la cual puedes ingresar más datos. Con Screaming Frog podrás identificar los contenidos duplicados que se encuentran en tu web. Debes hacer clic en la opción que dice filtro “duplicate” luego elige las pestañas “page titles”, “meta description” y “H1”. Una vez que tengas toda esa información, puedes exportar esos datos en formato Excel (CSV).

Advanced web ranking

También forma parte de las herramientas SEO que son para escritorio. Nos sirve para realizar una auditoria SEO. Los resultados que obtengas pueden ser exportados a formato Excel (CSV). No obstante, solo tienes la oportunidad de probar esta herramienta hasta por 30 días. Por otro lado, si la adquieres solo tendrás que hacer un único pago y tendrás la licencia de por vida.

Conclusión sobre la importancia de detectar contenido duplicado

En resumen, podemos decir que mientras más páginas web y redes sociales tenga una empresa, debe detectar y evitar el contenido duplicado. También es necesario cuidar el contenido que se publica y las URL que se utilizan para indexarlo.

Por otro lado, debemos tener en cuenta las herramientas y pasos para evitar que esto suceda, de tal forma que se reduzcan los problemas de posicionamiento. Si te interesa saber más acerca de este interesante tema puedes inscribirte en el curso de SEO posicionamiento en Buscadores.

Te puede interesar

Adriana Salinas: