Puntos clave:
- El contenido duplicado ocurre cuando contenido idéntico es accesible desde múltiples URLs
- Google no penaliza directamente el contenido duplicado, pero desperdicia presupuesto de rastreo y divide las señales de posicionamiento
- Las etiquetas canonical indican a los buscadores qué versión de URL indexar, consolidando la fuerza de posicionamiento
¿Has notado alguna vez que tus páginas más importantes no posicionan tan bien como esperabas? La causa podría ser contenido duplicado, un problema que muchos propietarios de sitios web subestiman o ni siquiera notan.
Contenido duplicado significa que el mismo contenido o muy similar está disponible bajo diferentes URLs. Esto sucede más rápido de lo que crees: parámetros de URL, HTTP vs. HTTPS, versiones de impresión o variantes de productos a menudo crean páginas duplicadas sin querer. La buena noticia es que este problema se puede resolver de manera fiable con el uso correcto de etiquetas canonical.
Cómo surge el contenido duplicado
Hablamos de contenido duplicado cuando contenido idéntico o casi idéntico es accesible bajo más de una URL. El contenido duplicado interno ocurre dentro de tu propio sitio web por variantes de URL, IDs de sesión o diferentes protocolos. El contenido duplicado externo ocurre cuando contenido idéntico aparece en diferentes dominios, como en artículos sindicados.
| Causa | Ejemplo |
|---|---|
| Parámetros de URL | /producto?color=rojo vs. /producto?color=azul |
| WWW vs. Sin WWW | www.ejemplo.com vs. ejemplo.com |
| HTTP vs. HTTPS | http://ejemplo.com vs. https://ejemplo.com |
| Barra final | /pagina vs. /pagina/ |
| Paginación | /categoria vs. /categoria?page=1 |
Los sitios web de comercio electrónico especialmente luchan con este problema. Cuando un producto está disponible en tres colores y cuatro tallas, pueden surgir rápidamente doce URLs casi idénticas.
Por qué el contenido duplicado perjudica tus rankings
Google ha declarado repetidamente que no hay penalización directa por contenido duplicado. Sin embargo, el contenido duplicado perjudica significativamente tu rendimiento SEO.
Cada sitio web tiene un presupuesto de rastreo limitado. Cuando Googlebot pasa tiempo rastreando el mismo contenido bajo diferentes URLs, queda menos tiempo para tus páginas realmente importantes. Para sitios web grandes, esto puede llevar a que el nuevo contenido se indexe tarde o no se indexe en absoluto.
Cuando otros sitios web enlazan a tu contenido, algunos podrían apuntar a la versión A, otros a la versión B. Los valiosos backlinks se distribuyen entre múltiples URLs en lugar de concentrarse en una. Lo mismo aplica para los compartidos en redes sociales y los enlaces internos. Sin señales claras, Google decide qué versión indexar – y esta decisión no siempre coincide con tus preferencias.
Entender y usar etiquetas Canonical
La etiqueta canonical (rel="canonical") es un elemento HTML en la sección head de una página. Indica a los motores de búsqueda qué URL es la versión preferida de un contenido:
<link rel="canonical" href="https://www.ejemplo.com/producto" />
Esta etiqueta dice: "Aunque hayas encontrado esta página bajo una URL diferente, la versión real está en esta URL." El método más común es insertar la etiqueta en la sección head de cada página. Para documentos no HTML como PDFs, puedes establecer el canonical mediante cabecera HTTP. Las URLs listadas en tu sitemap XML refuerzan adicionalmente la señal.
Un error común es confundir las etiquetas canonical con las redirecciones. Ambas solucionan problemas de contenido duplicado pero de diferentes maneras: usa redirecciones 301 cuando una URL genuinamente ya no debe existir. Las etiquetas canonical son adecuadas cuando ambas URLs deben permanecer accesibles para los usuarios, como con parámetros de filtro en una tienda.
Evitar errores comunes
Incluso SEOs experimentados cometen errores con las etiquetas canonical. Si tu etiqueta canonical apunta a la URL A, los enlaces internos apuntan a la URL B, y el sitemap contiene la URL C, estás confundiendo a los motores de búsqueda. Asegura señales consistentes en todos los elementos técnicos.
Si tu canonical apunta a una página con etiqueta noindex o una bloqueada por robots.txt, creas un conflicto. Google no puede simultáneamente indexar y no indexar. Para contenido paginado, cada página debe tener un self-canonical, no apuntar a la página 1 – la página 2 de una categoría es contenido independiente. Revisa tu estructura de URL para crear una jerarquía clara.
Cuando la página A apunta a B y B apunta a C, creas una cadena de canonical. Google no siempre sigue estas cadenas completamente. Apunta directamente a la URL canónica final.
Etiquetas Canonical en la práctica
En tiendas online, las variantes de productos a menudo crean cientos de URLs similares. Cuando el color y la talla no cambian el contenido principal, establece un canonical a la página base del producto. Sin embargo, si las variantes tienen diferentes descripciones o precios, merecen sus propias URLs canónicas.
Los filtros de categorías de tienda como "solo talla M" o "precio menor a 50 euros" a menudo generan innumerables combinaciones de URLs. Una combinación de etiquetas canonical apuntando a la categoría sin filtrar y control mediante Google Search Console funciona bien aquí. Cuando tu contenido aparece en otros sitios web con permiso, el socio debe establecer un canonical cross-domain a tu URL original.
El monitoreo regular es importante ya que nuevos duplicados pueden surgir en cualquier momento. Search Console muestra URLs excluidas en "Páginas" y la razón. "Duplicado: URL canónica declarada por el usuario" significa que tu canonical está funcionando. "Duplicado: Google eligió una URL canónica diferente" indica problemas. Herramientas como Screaming Frog encuentran automáticamente señales conflictivas.
Siempre enlaza internamente a la misma versión de URL y presta atención al uso consistente de enlaces internos. Si ofreces contenido en múltiples idiomas, usa etiquetas hreflang en lugar de canonicals para conectar versiones de idiomas – cada versión de idioma es contenido independiente, no un duplicado.
Preguntas frecuentes
¿Cada página necesita una etiqueta Canonical?
Cada página debería tener un self-canonical, es decir, una referencia a sí misma. Esto suena redundante pero fortalece las señales y protege contra duplicados no intencionados por parámetros añadidos. La mayoría de plataformas CMS añaden self-canonicals automáticamente.
¿Qué pasa si no establezco un Canonical?
Google elige una versión canónica por sí mismo, basándose en varias señales como enlaces, estado HTTPS y longitud de URL. Esta elección automática no siempre coincide con tus preferencias. Con canonicals explícitos, mantienes el control.
¿Qué tan rápido hacen efecto las etiquetas Canonical?
Puede tomar semanas o meses para que Google procese completamente los cambios de canonical. Monitorea la indexación en Search Console y no esperes resultados inmediatos.
¿Puede Google ignorar mi Canonical?
Sí, los canonicals son recomendaciones, no directivas. Si otras señales contradicen fuertemente, como muchos backlinks apuntando a una URL diferente, Google puede tratar otra versión como canónica.