¿Qué es el XML Sitemap?

El XML Sitemap es un archivo que contiene el listado en formato XML de todas las páginas dentro de un sitio web.

Estos archivos son útiles para los robots (conocidos como arañas ya que “tejen la web”) de los motores de búsqueda, debido a que usan la información que encuentren en el archivo sitemap.xml para realizar un rastreo más expedito del sitio web, lo que influirá en que indexe mejor nuestras páginas y mejore nuestro posicionamiento al ahorrarle tiempo de procesamiento a los buscadores.

El archivo de sitemap .xml se crea siguiendo un protocolo definido en http://sitemaps.org y está compuesto por una serie de etiquetas XML. Con este archivo podemos facilitar a los buscadores datos adicionales de cada una de las páginas que se incluyen en nuestro sitio web:

  1. URL de la página
  2. Última fecha de modificación
  3. Frecuencia de modificación
  4. Importancia o jerarquía respecto al resto de páginas del sitio.

Tener un archivo sitemap.xml no garantiza que los buscadores indexen todas las páginas que listamos en él, pero sí ese recomienda su uso para que los robots realicen el rastreos de forma más inteligente, al pasarles en los metadatos información adicional sobre la estructura y actualización de nuestra web.

Es muy importante que las URLs que se definan en el archivo sitemap pertenezcan al mismo dominio (no se permiten subdominios), se use el mismo protocolo (si usamos http no podríamos usar https).

El peso máximo del archivo es de 10MB y el máximo número de URLs que puede contener es de 50,000, para evitar sobrepasar estos límites se puede utilizar más de un archivo sitemap.

Las URLs que no cumplan con los requerimientos no son tomados en cuenta.