Gary Illyes, analista de Google, ha destacado un problema importante para los rastreadores: los parámetros de URL.
Durante un episodio reciente del podcast Search Off The Record de Google, Illyes explicó cómo los parámetros pueden crear URL infinitas para una sola página, lo que provoca ineficiencias en el rastreo.
Illyes cubrió los aspectos técnicos, el impacto del SEO y las posibles soluciones. También habló sobre los enfoques pasados de Google e insinuó soluciones futuras.
Esta información es especialmente relevante para sitios grandes o de comercio electrónico.
El problema de la URL infinita
Illyes explicó que los parámetros de URL pueden crear lo que equivale a un número infinito de URL para una sola página.
Él explica:
«Técnicamente, puedes agregar eso en un número casi infinito, bueno, de facto infinito, de parámetros a cualquier URL, y el servidor simplemente ignorará aquellos que no alteren la respuesta».
Esto crea un problema para los rastreadores de los motores de búsqueda.
Si bien estas variaciones pueden conducir al mismo contenido, los rastreadores no pueden saberlo sin visitar cada URL. Esto puede provocar un uso ineficiente de los recursos de rastreo y problemas de indexación.
Sitios de comercio electrónico más afectados
El problema prevalece entre los sitios web de comercio electrónico, que a menudo utilizan parámetros de URL para rastrear, filtrar y ordenar productos.
Por ejemplo, la página de un solo producto puede tener múltiples variaciones de URL para diferentes opciones de color, tamaños o fuentes de referencia.
Illyes señaló:
«Porque simplemente puedes agregarle parámetros de URL… también significa que cuando estás rastreando, y rastreando en el sentido correcto como ‘siguiendo enlaces’, entonces todo se vuelve mucho más complicado».
Contexto histórico
Google lleva años lidiando con este problema. En el pasado, Google ofrecía una herramienta de parámetros de URL en Search Console para ayudar a los webmasters a indicar qué parámetros eran importantes y cuáles podían ignorarse.
Sin embargo, esta herramienta quedó obsoleta en 2022, lo que dejó a algunos SEO preocupados por cómo gestionar este problema.
Soluciones potenciales
Si bien Illyes no ofreció una solución definitiva, insinuó posibles enfoques:
- Google está explorando formas de manejar los parámetros de URL, potencialmente mediante el desarrollo de algoritmos para identificar URL redundantes.
- Illyes sugirió que podría ser útil una comunicación más clara por parte de los propietarios de sitios web sobre la estructura de su URL. «Podríamos simplemente decirles: ‘Está bien, utilicen este método para bloquear ese espacio de URL'», señaló.
- Illyes mencionó que los archivos robots.txt podrían usarse más para guiar a los rastreadores. «Con robots.txt, es sorprendentemente flexible lo que se puede hacer con él», afirmó.
Implicaciones para el SEO
Esta discusión tiene varias implicaciones para el SEO:
- Presupuesto de rastreo: Para sitios grandes, administrar los parámetros de URL puede ayudar a conservar el presupuesto de rastreo, asegurando que las páginas importantes sean rastreadas e indexadas.
- Arquitectura del sitio: Es posible que los desarrolladores deban reconsiderar cómo estructuran las URL, particularmente para grandes sitios de comercio electrónico con numerosas variaciones de productos.
- Navegación facetada: Los sitios de comercio electrónico que utilizan navegación por facetas deben tener en cuenta cómo esto afecta la estructura de la URL y la capacidad de rastreo.
- Etiquetas canónicas: El uso de etiquetas canónicas puede ayudar a Google a comprender qué versión de URL debe considerarse principal.
En resumen
El manejo de los parámetros de URL sigue siendo complicado para los motores de búsqueda.
Google está trabajando en ello, pero aún debes monitorear las estructuras de URL y usar herramientas para guiar a los rastreadores.
Escuche la discusión completa en el episodio del podcast a continuación: