Contenidos
Aquí hay una guía de todo lo que necesita saber sobre la generación y optimización de sitemaps XML, incluida una lista de verificación de mejores prácticas.
A medida que evoluciona la web, también lo hacen Google y el SEO.
Esto significa que lo que se considera la mejor práctica a menudo está en proceso de cambio.. Lo que pudo haber sido un buen consejo ayer, no lo es hoy.
Esto es especialmente cierto para los sitemaps, que son casi tan antiguos como el propio SEO.
El problema es que, cuando todos los hombres y sus perros han publicado respuestas en foros, publicado recomendaciones en blogs y amplificado opiniones en las redes sociales, se necesita tiempo para separar los consejos valiosos de la información errónea.
Entonces, aunque la mayoría de nosotros compartimos un entendimiento general de que enviar un sitemap a Google Search Console es importante, es posible que no conozca las complejidades de cómo implementarlos de una manera que impulse los indicadores clave de rendimiento (KPI) de SEO.
Aclaremos la confusión sobre las mejores prácticas para los sitemaps de sitio hoy.
En este artículo cubrimos:
¿Qué es un sitemap XML?
En términos simples, un sitemap XML es una lista de las URL de su sitio web.
Actúa como una hoja de ruta para indicar a los motores de búsqueda qué contenido está disponible y cómo llegar a él.
En el ejemplo anterior, un motor de búsqueda encontrará las nueve páginas en un sitemap con una visita al archivo del sitemap XML.
En el sitio web, tendrá que saltar a través de cinco enlaces internos para encontrar la página 9.
Esta capacidad de un sitemap XML para ayudar a los rastreadores a una indexación más rápida es especialmente importante para los sitios web que:
- Tener miles de páginas y/o una arquitectura de sitio web profunda.
- Agregue con frecuencia nuevas páginas.
- Cambiar con frecuencia el contenido de las páginas existentes.
- Sufre de enlaces internos débiles y páginas huérfanas.
- Carecen de un fuerte perfil de enlace externo.
@nishanthstephen, en general, todo lo que coloque en un sitemap se recogerá antes
@nishanthstephen, en general, todo lo que coloque en un sitemap se recogerá antes @nishanthstephen
— Gary “鯨理” Illyes (@methode) October 13, 2015 October 13, 2015
Nota al margen: enviar un sitemap sin URL indexadas también puede acelerar la desindexación. Esto puede ser más eficiente que eliminar las URL en Google Search Console si tiene muchas que desindexar.. Pero utilícelo con cuidado y asegúrese de agregar dichas URL solo temporalmente a sus sitemaps.
Punto clave
Aunque los motores de búsqueda técnicamente pueden encontrar sus URL sin él, al incluir páginas en unsitemap XML, está indicando que las considera páginas de destino de calidad.
Si bien no hay garantía de que un sitemap XML haga que sus páginas sean rastreadas, y mucho menos indexadas o clasificadas, enviar uno ciertamente aumenta sus posibilidades.
Formato de sitemap XML
Un sitio de una página que use todas las etiquetas disponibles tendría este sitemap XML:
Pero, ¿cómo debe usar un SEO cada una de estas etiquetas?
Loc (también conocido como. Ubicación) Etiqueta
Esta etiqueta obligatoria contiene la versión canónica absoluta de la ubicación de la URL.
Debe reflejar con precisión el protocolo de su sitio (http o https) y si ha elegido incluir o excluir www.
Para sitios web internacionales, aquí también es donde puede implementar su manejo de hreflang. implement your hreflang handling
Al usar el atributo xhtml:link para indicar las variantes de idioma y región para cada URL, reduce el tiempo de carga de la página, algo que las otras implementaciones de elementos de enlace en los encabezados
o HTTP no pueden ofrecer.Yoast tiene una publicación épica sobre hreflang para aquellos que quieran aprender más. post
Lastmod (también conocido como. Última modificación) Etiqueta
Una etiqueta opcional pero muy recomendable que se utiliza para comunicar la fecha y la hora de la última modificación del archivo.
John Mueller reconoció que Google usa los metadatos lastmod para comprender cuándo cambió la página por última vez y si debe rastrearse. Consejos contradictorios de Illyes en 2015. Illyes
La URL + la última fecha de modificación es lo que nos importa para la búsqueda web.
La URL + la última fecha de modificación es lo que nos importa para la búsqueda web.
— ? John ? (@JohnMu) 17 de agosto de 2017 August 17, 2017
La hora de la última modificación es especialmente crítica para los sitios de contenido, ya que ayuda a Google a comprender que usted es el editor original.
También es poderoso para comunicar frescura, pero asegúrese de actualizar la fecha de modificación solo cuando haya realizado cambios significativos.
Intentar engañar a los motores de búsqueda para que su contenido sea nuevo, cuando no lo es, puede resultar en una penalización de Google.
Changefreq (también conocido como. Cambiar frecuencia) Etiqueta
Érase una vez, esta etiqueta opcional insinuaba con qué frecuencia se esperaba que el contenido de la URL cambiara a los motores de búsqueda.
Pero Mueller ha declarado que «la frecuencia de cambio realmente no juega un papel tan importante con los sitemaps» y que «es mucho mejor especificar la marca de tiempo directamente». Mueller has stated
Etiqueta de prioridad
Esta etiqueta opcional que aparentemente le dice a los motores de búsqueda qué tan importante es una página en relación con sus otras URL en una escala de 0.0 a 1.0.
En el mejor de los casos, solo fue una pista para los motores de búsqueda y tanto Mueller como Illyes han declarado claramente que la ignoran. Illyes
Ignoramos la prioridad en los sitemaps.
Ignoramos la prioridad en los sitemaps
— ? John ? (@JohnMu) 17 de agosto de 2017 August 17, 2017
Punto clave
Su sitio web necesita un sitemap XML, pero no necesariamente los metadatos de prioridad y frecuencia de cambio.
Utilice las etiquetas lastmod con precisión y concentre su atención en asegurarse de haber enviado las URL correctas.
Tipos de sitemap
Hay muchos tipos diferentes desitemap. Veamos los que realmente necesita.
Índice del sitemap XML
Los sitemaps XML tienen un par de limitaciones:
- Un máximo de 50.000 URL.
- Un límite de tamaño de archivo sin comprimir de 50 MB.
Los sitemaps se pueden comprimir usando gzip (el nombre del archivo sería algo similar a sitemap.xml.gz) para ahorrar ancho de banda para su servidor. Pero una vez descomprimido, el sitemap aún no puede exceder ninguno de los límites.
Cada vez que exceda cualquiera de los límites, deberá dividir sus URL en varios sitemaps XML.
Esos sitemaps se pueden combinar en un solo archivo de índice de mapa de sitio XML, a menudo llamado sitemap-index.xml. Esencialmente, un mapa de sitio para mapas de sitio.
Para sitios web excepcionalmente grandes que deseen adoptar un enfoque más granular, también puede crear varios archivos de índice de sitemap. Por ejemplo:
- sitemap-index-articles.xml
- sitemap-index-productos.xml
- sitemap-index-categories.xml
Pero tenga en cuenta que no puede anidar archivos de índice de sitemap.
Para que los motores de búsqueda encuentren fácilmente cada uno de los archivos de su mapa del sitio a la vez, querrá:
- Envíe los índices de su mapa del sitio a Google Search Console y Bing Webmaster Tools.
- Especifique la(s) URL(s) del índice de su mapa del sitio en su archivo robots.txt. Apuntando a los motores de búsqueda directamente a su mapa del sitio mientras les da la bienvenida para rastrear.
También puede enviar sitemaps haciéndolos ping a Google.
Pero cuidado:
Google ya no presta atención a las entradas de hreflang en «sitemaps no verificados», que Tom Anthony cree que se refieren a los enviados a través de la URL de ping.
Mapa del sitio de imagen XML
Los sitemaps de imágenes se diseñaron para mejorar la indexación del contenido de las imágenes.
Sin embargo, en el SEO moderno, las imágenes están incrustadas en el contenido de la página, por lo que se rastrearán junto con la URL de la página.
Además, es una buena práctica utilizar el marcado JSON-LD schema.org/ImageObject para llamar las propiedades de la imagen a los motores de búsqueda, ya que proporciona más atributos que un mapa del sitio XML de imagen. schema.org/ImageObject
Debido a esto, un mapa del sitio de imagen XML es innecesario para la mayoría de los sitios web.. Incluir un mapa del sitio de imágenes solo desperdiciaría el presupuesto de rastreo.
La excepción a esto es si las imágenes ayudan a impulsar su negocio, como un sitio web de fotos de archivo o un sitio de comercio electrónico que obtiene sesiones de página de productos de la búsqueda de imágenes de Google.
Sepa que las imágenes no tienen que estar en el mismo dominio que su sitio web para enviarse en un mapa del sitio. Puede usar un CDN siempre que esté verificado en Search Console.
Mapa del sitio de vídeo XML
Al igual que con las imágenes, si los videos son críticos para su negocio, envíe un mapa del sitio de video XML.
Guarde su presupuesto de rastreo para la página en la que está incrustado el video, asegurándose de marcar todos los videos con JSON-LD como schema.org/VideoObject. schema.org/VideoObject
Mapa del sitio de noticias de Google
Solo los sitios registrados en Google News deben usar este mapa del sitio.
Si es así, incluya artículos publicados en los últimos dos días, hasta un límite de 1000 URL por mapa del sitio, y actualice con artículos nuevos tan pronto como se publiquen.
Contrariamente a algunos consejos en línea, los sitemaps de Google News no admiten URL de imagen.
Google recomienda utilizar la imagen schema.org u og:image para especificar la miniatura de su artículo para Google News. Google recommends
Mapa del sitio móvil
Esto no es necesario para la mayoría de los sitios web.
¿Por qué? . No para compatibilidad con teléfonos inteligentes. Mueller confirmed
Por lo tanto, a menos que tenga URL únicas diseñadas específicamente para teléfonos destacados, un mapa del sitio móvil no será de utilidad.
Mapa del sitio HTML
Los sitemaps XML se encargan de las necesidades de los motores de búsqueda. Los sitemaps HTML se diseñaron para ayudar a los usuarios humanos a encontrar contenido.
La pregunta es, si tiene una buena experiencia de usuario y enlaces internos bien elaborados, ¿necesita un mapa del sitio HTML?
Verifique las visitas a la página de su mapa del sitio HTML en Google Analytics. Lo más probable es que sea muy bajo. De lo contrario, es una buena indicación de que necesita mejorar la navegación de su sitio web.
Los sitemaps HTML generalmente están vinculados en los pies de página del sitio web.. Tomando la equidad de enlace de cada página de su sitio web.
Pregúntese. ¿Es ese el mejor uso de esa equidad de enlace?
Si pocos humanos lo usan. Y los motores de búsqueda no lo necesitan, ya que tiene enlaces internos sólidos y un mapa del sitio XML.. ¿Ese mapa del sitio HTML tiene una razón para existir?
Mapa del sitio XML dinámico
Los sitemaps estáticos son fáciles de crear usando una herramienta como Screaming Frog.
El problema es que, tan pronto como crea o elimina una página, su mapa del sitio está desactualizado.. Si modifica el contenido de una página, el mapa del sitio no actualizará automáticamente la etiqueta lastmod.
Por lo tanto, a menos que le guste crear y cargar sitemaps manualmente para cada cambio, es mejor evitar los sitemaps estáticos.
Los sitemaps XML dinámicos, por otro lado, son actualizados automáticamente por su servidor para reflejar los cambios relevantes del sitio web a medida que ocurren.
Para crear un mapa del sitio XML dinámico:
- Pida a su desarrollador que codifique un script personalizado, asegurándose de proporcionar especificaciones claras
- Use una herramienta generadora de sitemapss dinámicos
- Instale un complemento para su CMS, por ejemplo, el complemento Yoast SEO para WordPress
Punto clave
Los sitemaps XML dinámicos y un índice de sitemap son las mejores prácticas modernas. Los sitemaps móviles y HTML no lo son.
Use sitemaps de imágenes, videos y Google News solo si la indexación mejorada de estos tipos de contenido impulsa sus KPI.
Optimización de la indexación del mapa del sitio XML
Ahora viene la parte divertida. ¿Cómo se utilizan los sitemaps XML para impulsar los KPI de SEO?
Incluir solo páginas relevantes para SEO en sitemaps XML
Un mapa del sitio XML es una lista de páginas que recomienda rastrear, que no son necesariamente todas las páginas de su sitio web.
Una araña de búsqueda llega a su sitio web con una «concesión» de cuántas páginas rastreará.
El mapa del sitio XML indica que considera que las URL incluidas son más importantes que aquellas que no están bloqueadas pero que no están en el mapa del sitio.
Lo está utilizando para decirle a los motores de búsqueda: «Realmente apreciaría si se centrara en estas URL en particular».
Esencialmente, lo ayuda a usar el presupuesto de rastreo de manera efectiva.
Al incluir solo páginas relevantes para SEO, ayuda a los motores de búsqueda a rastrear su sitio de manera más inteligente para obtener los beneficios de una mejor indexación.
Debes excluir:
- Páginas no canónicas.
- Páginas duplicadas.
- Páginas paginadas.
- URL basadas en parámetros o ID de sesión.
- Páginas de resultados de búsqueda del sitio.
- Responder a URL de comentarios.
- Compartir a través de direcciones URL de correo electrónico.
- URL creadas por filtrado que no son necesarias para SEO.
- Archivar páginas.
- Cualquier redirección (3xx), páginas faltantes (4xx) o páginas de error del servidor (5xx).
- Páginas bloqueadas por robots.txt.
- Páginas sin índice.
- Páginas de recursos a las que se puede acceder mediante un formulario de generación de clientes potenciales (p. ej., documentos PDF).
- Páginas de utilidad que son útiles para los usuarios, pero que no pretenden ser páginas de destino (página de inicio de sesión, contáctenos, política de privacidad, páginas de cuenta, etc.).
Quiero compartir un ejemplo de Michael Cottam sobre la priorización de páginas: Michael Cottam
Digamos que su sitio web tiene 1000 páginas. 475 de esas 1000 páginas son contenido relevante para SEO. Resalta esas 475 páginas en un mapa del sitio XML, esencialmente pidiéndole a Google que deje de priorizar la indexación del resto.
Ahora, digamos que Google rastrea esas 475 páginas y decide algorítmicamente que 175 son de grado «A», 200 son «B+» y 100 «B» o «B-«.. Esa es una calificación promedio sólida y probablemente indica un sitio web de calidad al que enviar a los usuarios.
Compare eso con el envío de las 1000 páginas a través del mapa del sitio XML. Ahora, Google analiza las 1000 páginas que usted dice que son contenido relevante para SEO y ve que más del 50 por ciento son páginas «D» o «F».. Tu calificación promedio ya no se ve tan bien y eso puede dañar tus sesiones orgánicas.
Pero recuerde, Google utilizará su sitemap XML solo como una pista de lo que es importante en su sitio.
El hecho de que no esté en su mapa del sitio XML no significa necesariamente que Google no indexará esas páginas.
Cuando se trata de SEO, la calidad general del sitio es un factor clave.
Para evaluar la calidad de su sitio, consulte los informes relacionados con el mapa del sitio en Google Search Console (GSC).
Punto clave
Administre el presupuesto de rastreo limitando las URL del mapa del sitio XML solo a las páginas relevantes para SEO e invierta tiempo para reducir la cantidad de páginas de baja calidad en su sitio web.
Aproveche al máximo los informes del mapa del sitio
La sección de sitemapss en la nueva consola de búsqueda de Google no es tan rica en datos como lo que se ofrecía anteriormente.
Su uso principal ahora es confirmar que el índice de su mapa del sitio se ha enviado correctamente.
Si ha optado por utilizar convenciones de nomenclatura descriptivas, en lugar de numéricas, también puede tener una idea de la cantidad de diferentes tipos de páginas de SEO que se han «descubierto», es decir, todas las URL encontradas por Google a través de mapas del sitio, así como otros métodos como
En el nuevo GSC, el área más valiosa para los SEO con respecto a los sitemaps es el informe de cobertura de índice.
El informe se establecerá de forma predeterminada en «Todas las páginas conocidas». Aquí puedes:
- Resuelva cualquier problema de «Error» o «Válido con advertencias». Estos a menudo se derivan de directivas de robots en conflicto. Uno resuelto, asegúrese de validar su solución a través del informe de Cobertura.
- Mire las tendencias de indexación. La mayoría de los sitios agregan continuamente contenido valioso, por lo que las páginas «válidas» (también conocidas como indexadas por Google) deberían aumentar constantemente.. Entender la causa de cualquier cambio dramático.
Luego, limite el informe a las URL relevantes de SEO que ha incluido en su mapa del sitio cambiando el menú desplegable a «Todas las páginas enviadas». Luego verifique los detalles de todas las páginas «Excluidas».
Los motivos para la exclusión de las URL del mapa del sitio se pueden clasificar en cuatro grupos de acción:
Sea cual sea su plan de acción, asegúrese de anotar los KPI de referencia.
La métrica más útil para evaluar el impacto de los esfuerzos de optimización del mapa del sitio es la tasa de indexación de «Todas las páginas enviadas», que se calcula tomando el porcentaje de páginas válidas del total de URL descubiertas.
Trabaje para obtener esto por encima del 80%.
¿Por qué no al 100%?
Nota: si tiene un sitio web más grande que ha optado por dividir su sitio en varios índices del mapa del sitio, podrá filtrar por esos índices. Esto no solo te permitirá:
Punto clave
Además de identificar advertencias y errores, puede usar el informe Cobertura de índice como una herramienta de detección de sitemap XML para aislar problemas de indexación.
Lista de verificación de mejores prácticas de sitemapss XML
Invierta tiempo en:
✓ Incluir etiquetas hreflang en sitemaps XML
✓ Incluya <loc> and <lastmod> tags
✓ Comprimir archivos de sitemap usando gzip
✓ Use un archivo de índice de sitemap
✓ Use mapas de sitios de imágenes, videos y noticias de Google solo si la indexación impulsa sus KPI
✓ Generar dinámicamente mapas de sitio XML
✓ Asegúrese de que las URL se incluyan solo en un solo sitemap
✓ URL de índice de sitemap de referencia en robots.txt
✓ Envíe el índice del sitemap tanto a Google Search Console como a Bing Webmaster Tools
✓ Incluya solo páginas relevantes para SEO en mapas de sitio XML
✓ Reparar todos los errores y advertencias
✓ Analizar tendencias y tipos de páginas válidas
✓ Calcular las tasas de indexación de las páginas enviadas
✓ Abordar las causas de exclusión de las páginas enviadas
Ahora, revisa tu propio sitemap y asegúrate de que lo estás haciendo bien.
Créditos de imagen
Imagen destacada: Paulo BobitaTodas las capturas de pantalla tomadas por el autor
Leer el articulo original en Search Engine Journal.