Amazon Web Services S3 bloqueó el robot de Google en junio: aquí está mi recuperación

Amazon Web Services S3 bloqueó el robot de Google en junio: aquí está mi recuperación


A mediados de junio, noté que Google no mostraba muchas de mis imágenes en la Búsqueda de Google y Discover y también algunos lectores me lo señalaban. Así que utilicé la práctica herramienta de inspección de URL de Google Search Console para descubrir que las URL de S3 que estaba usando para alojar mis imágenes estaban bloqueando el rastreo del robot de Google. Aquí hay un pequeño estudio de caso suyo sobre un problema de indexación/rastreo que tuve para las URL de mis imágenes.

Este error de AWS provocó una caída del 83 % en las impresiones que obtenían mis imágenes de la Búsqueda de Google y de Google Imágenes. Esto provocó una caída del 76% en los clics relacionados con la búsqueda de imágenes en este sitio. Varias semanas después, todavía tengo una caída de aproximadamente un 16 % en impresiones y un 26 % en clics de la búsqueda de imágenes, pero es una gran mejora.

Aquí está el informe de rendimiento de búsqueda de Google Search Console que muestra el gráfico de impresiones y clics a lo largo del tiempo. Verá la caída alrededor del 15 de junio y luego comenzará a recuperarse alrededor del 8 de julio. También verá que el tráfico de mis imágenes aún no ha vuelto completamente a sus números normales antes del error de AWS, incluso después de dos meses:

Imágenes de rendimiento de Google Search Console

Cuando el robot de Google intentaba acceder a las URL de mis imágenes en S3, Google recibía un error 404 no encontrado. Pero cuando visité las URL con mi computadora, se cargaron bien. Estas son las mismas URL de imágenes que he estado usando en este sitio durante más de una década y, ¡puf!, un día AWS decidió bloquear el robot de Google. Me comuniqué con Google y AWS sobre el problema y sospecho que era un problema bastante grande. Muchos sitios utilizan S3 para el almacenamiento de imágenes y archivos, por lo que es probable que el robot de Google recibiera toneladas de errores 404. Lo extraño es que no vi ninguna queja pública sobre el tema.

En cualquier caso, esto es lo que vio el robot de Google cuando intentó rastrear esas URL:

URL de resultados enriquecidos de Google bloqueada

AWS lo solucionó después de varios días:

URL de resultados enriquecidos de Google desbloqueada

Así es como se veían mis imágenes en la herramienta de inspección de URL de Google Search Console:

Gsc Url Inspec imágenes rotas

Debería verse así:

Gsc Url Inspec Imágenes de trabajo

Desde entonces, decidí mover mis imágenes a CloudFront de AWS, un servicio que no estaba disponible cuando creé este sitio por primera vez, razón por la cual usé S3 en ese entonces para las imágenes. El problema de S3 con Googlebot todavía está solucionado y funciona bien. Pero no voy a volver al S3 en busca de imágenes.

Debo agradecer a Glenn Gabe por notar que las imágenes desaparecen desde el principio en Google Discover. Glenn también escribió este artículo sobre migración de imágenes que revisé antes de realizar el cambio de AWS S3 a AWS CloudFront. No migré mis imágenes antiguas, las dejé porque AWS solucionó el problema. Pero desde finales de junio, todas mis imágenes nuevas utilizan CloudFront.

Para ser claros, esto no fue un error de Google, sino un cambio de AWS que llevó a que AWS S3 bloqueara el robot de Google. Ahora está resuelto pero parece que el daño ya está hecho… Si los gráficos cambian más, actualizaré esta historia a continuación para documentar los cambios. Pero hasta ahora, se ha mantenido estable durante las últimas 5 semanas aproximadamente, por lo que no espero grandes cambios en el futuro.

Discusión del foro en X.

Related Posts
Leave a Reply

Your email address will not be published.Required fields are marked *