Archivo sitemap.xml: qué es, para qué sirve y cómo crearlo
Si acabas de crear una página web o una tienda online, debes conocer cuál es la función de un archivo sitemap XML y cómo influye en el posicionamiento SEO.
Qué es un sitemap XML
Un sitemap (o mapa de tu sitio) es un archivo que contiene un listado en formato XML de todas las páginas que componen un sitio web.
Estos archivos le son útiles a los robots y a las arañas de los motores de búsqueda, que usarán la información que le damos en este archivo para realizar un rastreo más efectivo del sitio web, lo que llevará a que indexe mejor nuestras páginas y en la mejora de nuestro posicionamiento SEO.
Puedes utilizar herramientas como Google Search Console para monitorizar el rendimiento de tu sitemap. A través de esta, puedes verificar la indexación, identificar errores de rastreo y recibir notificaciones de posibles errores que puedan afectar a tu visibilidad.
Cómo ayuda el sitemap XML al posicionamiento SEO
Esta es la pregunta del millón: ¿realmente importa para el SEO? Y la respuesta es sí.
Es verdad que Google (u otros motores de búsqueda) pueden rastrear e indexar tu sitio sin necesidad de tener un sitemap, pero tenerlo puede ayudarles en el proceso y garantizar que se indexen todas las páginas importantes. Además, también podemos incluir metadatos adicionales, como la frecuencia de actualización y la prioridad, por lo que podemos indicarle a Google cuáles son las páginas más relevantes y cuáles deben rastrearse con mayor frecuencia.
Protocolo del sitemap XML
El archivo viene definido por un protocolo compuesto por una serie de etiquetas XML, un lenguaje que sirve para estructurar la información. Con ese archivo, podemos facilitar de forma opcional a los buscadores datos adicionales de cada una de las páginas que se incluyen en nuestro sitio web:
- URL de la página
- Última fecha de modificación
- Frecuencia de modificación
- Importancia relativa respecto al resto de páginas del sitio.
Este protocolo ha conseguido convertirse en un estándar que los principales buscadores (Google, Yahoo, Bing, etc.) soportan y recomiendan. La inclusión en un dominio de un archivo sitemap no garantiza que los buscadores indexen todas las páginas que listamos en él, pero sí es recomendable su uso para que realicen los rastreos de forma más inteligente, al pasarles en los metadatos información adicional sobre la estructura y actualización de nuestra web.
Las URLs que se establecen en el archivo sitemap han de pertenecer al mismo dominio (no se permiten subdominios), el mismo protocolo (si usamos HTTP no podríamos usar HTTPS) y la misma subcarpeta en caso de encontrarse en un ruta diferente de la raíz (para un sitemap ubicado en https://www.dominio.com/subcarpeta1
no podríamos incluir URLs ubicadas en https://www.dominio.com/subcarpeta2
).
El máximo tamaño del archivo es de 10MB y el máximo número de URLs que puede contener es de 50.000. Como posteriormente explicaremos, en caso de sobrepasar estos valores, se puede utilizar más de un archivo sitemap. Además del formato XML, para reducir el tamaño del archivo podemos comprimirlo en formato GZIP.
Las URLs que no cumplan con los requerimientos no se tienen en cuenta.
Etiquetas del sitemap XML
En la página oficial del protocolo, sitemaps.org, tenemos información detallada del formato que han de seguir los archivos sitemap.
Las etiquetas obligatorias son las siguientes:
-
es la etiqueta de apertura. El archivo finaliza con.
-
se incluye esta etiqueta principal para cada una de las urls que vamos a especificar. -
con ella definimos la URL de la página. Ha de especificar el protocolo (HTTP, HTTPS…) y su máximo tamaño está limitado a 2.048 caracteres.
También de forma opcional podemos incluir las siguientes etiquetas:
-
es la fecha de la última modificación del archivo. El formato a utilizar es el de fecha y hora W3C, aunque se puede omitir la hora y la fecha quedaría en este formato:AAAA-MM-DD
. -
es la frecuencia aproximada con la que la página es modificada. Los valores que puede tener este campo son:-
always
(documento que cambia cada vez que se tiene acceso a él) -
hourly
(cada hora) -
daily
(diariamente) -
weekly
(semanalmente) -
monthly
(mensualmente) -
yearly
(anualmente) -
never
(documentos que no van a ser modificados)
-
-
se usa esta etiqueta para definir la prioridad de una URL de forma relativa respecto a las demás URLs del sitio. Los motores de búsqueda pueden utilizarla para elegir una u otra URL en sus resultados en función de a cual le demos más prioridad. Su valor puede ir de 0,0 a 1,0 y la prioridad predeterminada que se asigna es de 0,5.
Cómo crear un sitemap XML
Cómo crear un sitemap XML automáticamente
La manera más sencilla de crear un sitemap XML es utilizando herramientas automáticas. Si estás usando WordPress como un CMS, debes saber que hay plugins de WordPress (por ejemplo, el plugin Yoast SEO) que generan un mapa de tu sitio de manera automática.
Si quieres profundizar más, aquí puedes encontrar cómo crear un sitemap de WordPress.
Además, el archivo
sitemaps.xml
se genera de automáticamente con los productos de crear tienda online y RankingCoach de Arsys.
Cómo crear un sitemap XML manualmente
La otra opción es crear uno manualmente, pero antes de hacerlo, tendremos que saber qué páginas queremos incluir en él. Por ejemplo, algunas de las páginas que podríamos incluir en nuestro caso son:
- Página de inicio
- Páginas de categorías
- Páginas de productos individuales
- Página de contacto
Y una vez lo tengamos claro, ya podremos estructurar el mapa de nuestro sitio web.
A continuación, te enseñamos un ejemplo.
Recuerda que es importante validar la sintaxis para asegurarnos de que no hayamos cometido ningún error. Existen herramientas online que pueden ayudarte, como XML Sitemap Validator.
Ejemplo de un fichero sitemap XML
El formato que tiene un archivo estándar es el siguiente:
<urlset> <url> <loc>https://www.example.com/</loc> <lastmod>2009-12-01</lastmod> <changefreq>weekly</changefreq> <priority>1</priority> </url> <url> <loc>https://www.example.com/pagina.htm</loc> <lastmod>2009-12-01</lastmod> <changefreq>monthly</changefreq> <priority>0.5</priority> </url> </urlset>
Este sitemap correspondería a un sitio web compuesto por 2 páginas, cuya última modificación es del 2009-12-01. Con este archivo, le estamos diciendo a los buscadores que las páginas las modificamos de forma semanal y mensual, respectivamente, y que la primera de ellas tiene una prioridad que es el doble que la segunda.
Índice de sitemaps
Como hemos visto anteriormente, los archivos sitemap pueden estar:
- En formato XML,
sitemap.xml
- En formato comprimido GZIP,
sitemap.xml.gz
, con lo que rebajaremos su tamaño.
Las limitaciones de este archivo se establecen en un máximo de 50.000 URLs y 10MB de peso.
En caso de sobrepasar estos tamaños, se puede dividir el archivo en varios más pequeños y subirlos por separado. Los archivos sitemap no han de tener un nombre específico, se les puede dar el nombre que se desee. En caso de subir más de uno, habrá que indicarlo en un archivo índice.
Ese archivo deberá tener las etiquetas obligatorias:
-
es la etiqueta de apertura. Se finaliza el archivo con -
se incluye esta etiqueta para especificar cada uno de los sitemaps. -
para la URL del sitemap.
Como opcional se puede incluir la etiqueta:
para la fecha de la última modificación del archivo (fecha y hora W3C), pudiendo omitir la hora y dejar el formato: AAAA-MM-DD
.
Ejemplo del índice de un sitemap XML
<sitemapindex> <sitemap> <loc>https://www.example.com/sitemap1.xml.gz</loc> <lastmod>2009-12-01</lastmod> </sitemap> <sitemap> <loc>https://www.example.com/sitemap2.xml.gz</loc> <lastmod>2009-12-01</lastmod> </sitemap> </sitemapindex>
Dónde encontrar mi sitemap XML
La ubicación recomendada es el directorio raíz del sitio web, pero se puede subir en cualquier otro subdirectorio. Al hacerlo así, no se pueden especificar en él URLs de directorios superiores.
El protocolo sitemap permite otros tipos de archivos, como feeds RSS, Atom y archivos de texto.
Cómo enviar mi sitemap XML a los buscadores
Para informar a los buscadores y que encuentren el archivo sitemap, tenemos normalmente 3 opciones:
Mediante el archivo robots.txt
Podemos usar el archivo robots.txt
incluyendo tantas líneas con la ubicación como archivos sitemap tengamos, de esta forma:
Sitemap: https://www.example.com/sitemap.xml Sitemap: https://www.example.com/sitemap2.xml
Mediante pinging
Mediante http, podemos enviar las notificaciones a los buscadores, lo que se conoce como hacer “ping”:
-
Google:
https://www.google.com/webmasters/tools/ping?sitemap=
-
Yahoo:
https://search.yahooapis.com/SiteExplorerService/V1/ping?sitemap=
-
Bing:
https://www.bing.com/webmaster/ping.aspx?siteMap=
Mediante un formulario
Cada buscador dispone además de una interfaz que nos permite enviar directamente el archivo desde un formulario de forma manual. Algunos de ellos:
- Google: https://www.google.com/webmasters
- Yahoo: https://siteexplorer.search.yahoo.com/mysites
- Bing: https://www.bing.com/webmaster
Conclusiones sobre sitemap XML
El sitemap XML es una herramienta que nos permitirá la indexación de nuestra páginas y proporcionar una estructura más clara para los motores de búsqueda. Y ahora que ya sabes por qué es importante y cómo puedes crearlo, te animamos a ponerlo en práctica para mejorar la visibilidad de tu marca y que aumente así el tráfico orgánico.
Por otro lado, en relación con otros aspectos técnicos, te recomendamos la elección de un dominio personalizado y un hosting web que mejore la accesibilidad y la velocidad de carga de tu página web, pues son elementos que también influyen en el SEO. Y si quieres seguir apostando por un sitio web confiable para tus usuarios, no te olvides de implementar un certificado SSL o realizar un backup web para garantizar su seguridad.