Creaste 500 páginas. Google solo conoce 300.
Una sorpresa común al auditar un sitio: el sitemap lista menos páginas de las que realmente existen, o incluye páginas que no deberían estar ahí. En cualquier caso, hay una brecha de cobertura — y Google está tomando decisiones con información incompleta.
Qué hace un sitemap XML
Un sitemap XML es un archivo que lista las URLs que quieres que los buscadores conozcan. No es un factor de posicionamiento — es una ayuda para el descubrimiento. Piensa en él como entregarle a Google un mapa de tu sitio.
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://example.com/pagina-uno</loc>
<lastmod>2026-03-15</lastmod>
</url>
</urlset>
Googlebot sigue rastreando mediante enlaces, pero el sitemap le ayuda a encontrar páginas que podrían no estar bien enlazadas internamente — especialmente en sitios grandes o nuevos.
Cuándo los sitemaps importan más
- Sitios grandes — con miles de páginas, algunas inevitablemente estarán mal enlazadas
- Sitios nuevos — aún no tienen muchos enlaces externos o internos
- Sitios con cambios frecuentes de contenido — la etiqueta
lastmodle dice a Google qué re-rastrear - Sitios con mucho JavaScript — donde Google podría tener problemas para descubrir enlaces
Problemas habituales del sitemap
| Problema | Impacto |
|---|---|
| Páginas que faltan en el sitemap | Google podría no descubrirlas nunca |
| El sitemap incluye páginas noindex | Desperdicia presupuesto de rastreo en páginas que no quieres indexar |
| El sitemap incluye URLs con 404 o redirecciones | Señal de un sitio mal mantenido |
| El sitemap no está referenciado en robots.txt | Google podría no encontrar el propio sitemap |
Fechas lastmod desactualizadas | Google pierde confianza en los datos de tu sitemap |
| El sitemap excede 50.000 URLs o 50 MB | Necesita dividirse en múltiples sitemaps |
Qué debe (y qué no) estar en tu sitemap
Incluir:
- Todas las páginas indexables (que devuelven 200, sin noindex)
- Solo las versiones canónicas de las URLs
- Páginas que quieres que Google priorice
Excluir:
- Páginas bloqueadas por robots.txt
- Páginas con noindex
- URLs redirigidas (3xx)
- Páginas de error (4xx, 5xx)
- Contenido duplicado (versiones no canónicas)
- Páginas que requieren inicio de sesión
Cómo auditar la cobertura del sitemap
Una auditoría completa compara tu sitemap con lo que realmente hay en el sitio:
- Páginas en el sitio pero no en el sitemap — cobertura incompleta
- Páginas en el sitemap que devuelven errores — 404, 500, redirecciones
- Páginas noindex en el sitemap — señales contradictorias
- Accesibilidad del sitemap — ¿es alcanzable y tiene el formato correcto?
- Referencia en robots.txt — ¿tu robots.txt apunta al sitemap?
Kaitico compara los resultados de su rastreo con tu sitemap en cada auditoría, señalando brechas de cobertura, URLs con errores e inconsistencias entre lo que tu sitemap declara y lo que tu sitio realmente sirve.