Google publicó un anuncio de servicio público diciendo que no debería permitir que el robot de Google rastree las URL de sus acciones. Gary Illyes de Google publicó en LinkedIn: «Realmente deberías prohibir el rastreo de tus URL de acción. Los rastreadores no comprarán esa vela orgánica con aroma no transgénico, ni les interesa una lista de deseos».
Quiero decir, este no es un consejo nuevo. ¿Por qué dejar que una araña rastree páginas donde realmente no puede realizar ninguna acción? El robot de Google no puede realizar compras, no puede suscribirse a su boletín informativo, etc.
Gary escribió:
Una queja común que recibimos sobre el rastreo es que se rastrea demasiado, lo que utiliza demasiados recursos del servidor (aunque de lo contrario no causa problemas). Si observamos lo que rastreamos de los sitios en las quejas, con demasiada frecuencia se trata de URL de acciones como «agregar al carrito» y «agregar a la lista de deseos». Estos son inútiles para los rastreadores y probablemente no desee que los rastreen.
Si tiene URL como:
https://ejemplo․com/product/scented-candle-v1?add_to_cart
y
https://ejemplo․com/product/scented-candle-v1?add_to_wishlist
¿Cómo deberías bloquear el robot de Google? Dijo: «Probablemente deberías agregar una regla de no permitirlos en tu archivo robots.txt. Convertirlos al método HTTP POST también funciona, aunque muchos rastreadores pueden realizar solicitudes POST y lo harán, así que tenlo en cuenta».
Ahora, hace unos años, informamos que el robot de Google puede agregar productos a su carrito para verificar que el precio sea correcto. Parece ser parte de la función de puntuación de la experiencia de compra del comerciante, por lo que tendría un poco de cuidado con todo esto.
Foro de discusión en LinkedIn.
Nota: Esto fue escrito previamente y programado para publicarse hoy; actualmente estoy desconectado para Shavout.