Si bien los sitios web honestos experimentaron los altibajos de la actualización de Google de marzo de 2024, los SEO y los blogueros de recetas notaron que los sitios de spam con IA llegaron a la cima de los resultados de búsqueda. Un ejemplo hasta ayer obtuvo más de 217.000 consultas, 14,9.000 de las cuales se encuentran entre las 10 primeras, y ese número aumentó un día después. Esto es lo que está pasando y cómo los spammers siguen ganando a Google.
Aumento en marzo de 2024
El sitio clasificado es un subdominio. El dominio principal existe desde el verano de 2020. El subdominio spam fue detectado por primera vez por Internet Archive el 30 de noviembre de 2022, coincidentemente con la fecha de lanzamiento de ChatGPT. El subdominio estuvo a medio terminar y esencialmente inactivo hasta marzo de 2024, cuando se expandió rápidamente e inmediatamente comenzó a clasificarse para miles de consultas de búsqueda.
El miércoles 20 de marzo, el sitio clasificó 14,9 mil consultas de búsqueda entre los 10 primeros. El jueves 21 de marzo, el sitio tuvo 15,6 mil consultas de búsqueda entre los 10 primeros. Aunque Google acaba de concluir su actualización de spam, este sitio en particular (y otros similares) continúan clasificándose para miles de consultas de búsqueda y Google parece incapaz de detenerlas.
Un escritor gastronómico reacciona al spam de IA
Un escritor gastronómico y autor de libros de cocina, Robin Donovan (Instagram), me llamó la atención sobre el sitio de IA y me dijo que otras personas en un grupo privado de Facebook estaban furiosas por el surgimiento de sitios de IA que buscaban recetas.
Es muy obvio que el contenido es generado por IA, incluso las imágenes que acompañan a los artículos son 100% IA. Por lo tanto, es especialmente doloroso para aquellos con experiencia, conocimientos y autoridad ver que el contenido de IA obviamente los supera.
Robin estaba comprensiblemente molesto:
“¿Cómo diablos es este el mejor contenido? Y mientras tanto, los blogueros que son chefs capacitados profesionalmente, desarrolladores de recetas, autores de libros de cocina y otros con décadas de capacitación y experiencia están viendo cómo sus sitios son diezmados con estas actualizaciones. Sitios que han pasado años construyendo con artículos bien investigados y bien escritos (¡escritos por humanos!), recetas que han sido desarrolladas profesionalmente y probadas cuidadosamente, fotografías que han pasado horas preparando y tomando.
Han hecho todo lo que Google les ha dicho que hagan durante años: escribir su propio contenido, tomar sus propias fotografías, desarrollar recetas únicas y de alta calidad, ser un experto en su área temática y tener credenciales para mostrarlo, no No intentes jugar con el sistema, sé genuino, crea contenido ÚTIL. ¿Para qué?»
Detalles sobre el aspecto de los sitios de spam
1. Alojado en Squarespace
El sitio de spam está en un subdominio y tanto el subdominio como el sitio principal están alojados en Squarespace. ¿Por qué Squarespace? Solo una suposición, pero tal vez esa infraestructura tiende a parecerle legítima a Google (o puede que no desempeñe ningún papel).
2. Todas las imágenes son coloridas y sencillas.
Todas las imágenes son generadas por IA, creadas en un estilo plano y colorido similar al que se podría ver en una infografía, lo que indica que se utilizó una plantilla para crear las miles de imágenes que acompañan a los artículos.
Las imágenes son un componente importante de los artículos. Cada artículo presenta alrededor de siete imágenes que se relacionan con el tema general del artículo. Cada artículo contiene los colores de un arcoíris. No sé si las imágenes son intencionalmente brillantes y coloridas, pero el uso de colores fuertes es una buena opción estratégica para las imágenes porque aparecen en las SERP, Google Discover y Google SGE.
Subí una de las imágenes a ChatGPT y le pedí que generara un mensaje basado en la imagen para crear una nueva con el mismo estilo.
A continuación se muestra un ejemplo de una imagen generada por IA con el mismo estilo que los sitios de spam de IA:
Ejemplo de una imagen generada por IA utilizada por un sitio de spam
3. Todos los artículos siguen una plantilla rígida
Los artículos siguen una estructura basada en plantillas, que varía según el tipo de artículo. Los temas de los artículos van desde comparaciones, viajes a destinos locales, estilos de vida, recetas, beneficios para la salud de ciertos alimentos, etc.
Los artículos relacionados con la salud siguen esta estructura de plantilla:
a. Introducción
Presenta el tema conceptual que se está discutiendo y su relevancia para un tema específico relacionado con la salud. El tema conceptual puede ser un alimento en particular, un tipo de dieta, etc.
b. Beneficios de la salud
Después de la introducción, cada uno analiza los beneficios para la salud asociados con el tema del concepto.
C. Fundamentos
Esta sección analiza los conceptos básicos del tema de salud en el que se está enfocando (salud bucal, diabetes…), la importancia de la nutrición y los problemas o enfermedades comunes asociados con el tema de salud.
d. Orientación nutricional y nutrientes clave
mi. Opciones dietéticas e impacto en la salud
F. Consejos y consejos de estilo de vida
gramo. Un resumen de los beneficios.
4. Solicitud subyacente de artículos generados por IA
Tenía curiosidad sobre cómo se vería un mensaje que genera ese contenido, así que le pedí a ChatGPT que creara uno.
Este es un mensaje generalizado que podría haberse utilizado para crear artículos sobre salud y dieta:
“Escribe un artículo que explore la conexión entre [concept of dietary choice] y [specific health focus]siguiendo la siguiente plantilla:
a. Introducción: Comience introduciendo el concepto de [concept of dietary choice]su definición y por qué es relevante para [specific health focus].
Analice su creciente popularidad y cómo se alinea con las tendencias contemporáneas de salud y estilo de vida.
b. Beneficios de la salud:
Detallar los beneficios generales para la salud asociados con [concept of dietary choice]centrándose en su potencial para mejorar [specific health focus].
C. Fundamentos de [Health Topic]:
Proporcionar antecedentes sobre la [specific health focus]incluida la anatomía esencial, la importancia de la nutrición y las condiciones prevalentes que afectan este aspecto de la salud.
d. Nutrientes clave y su impacto:
Detalle los nutrientes cruciales que desempeñan un papel importante en [specific health focus], incluidas sus fuentes y los beneficios para la salud que ofrecen. Resalte la importancia de ciertas vitaminas, minerales y otros compuestos.
mi. Influencia de las opciones dietéticas:
Analizar cómo las elecciones dietéticas específicas influyen en [concept of dietary choice] puede impactar [specific health focus], positiva o negativamente. Recomendar alimentos beneficiosos y desaconsejar ciertos tipos que puedan perjudicar [specific health focus].
F. Consejos prácticos para la dieta y el estilo de vida:
Ofrecer sugerencias prácticas para integrar alimentos beneficiosos en la dieta y realizar ajustes en el estilo de vida para apoyarlos. [specific health focus]. Esto podría incluir consejos sobre la preparación de comidas, el control de las porciones y el equilibrio de los diferentes tipos de alimentos.
gramo. Un mensaje a utilizar para generar una conclusión:
Concluya el artículo resumiendo cómo adoptar [concept of dietary choice] puede contribuir a mejorar [specific health focus].
Enfatice el equilibrio y la variedad de nutrientes que proporciona este enfoque y sus beneficios potenciales más allá [specific health focus]. Asegúrese de que el artículo proporcione una descripción general completa que sea a la vez informativa y atractiva, dirigida a lectores interesados en comprender la relación entre [concept of dietary choice] y [specific health focus].”
5. Contenido probado por herramientas de verificación de IA
Lo extraño de estos artículos es que cada artículo que probé con GPTZero AI Content Detector obtuvo una puntuación del 100% como generado por IA. El verificador de contenido Originality.AI ofreció puntuaciones similares.
Captura de pantalla de la puntuación GPTZero
Captura de pantalla de la puntuación Originality.AI
Las plantillas de Squarespace son profesionales y los artículos en sí tienen un estilo seco que es informativo pero carece de señales de autoría humana, como expresiones de conocimiento o experiencia, y una ausencia total de coloquialismos. Todos los artículos analizados no pasaron las pruebas de detección de IA.
6. ¿Cómo se clasifican los sitios de spam de IA?
Mi hipótesis es que la razón por la que estos sitios de spam se clasifican es que están aprovechando una laguna en los algoritmos de Google que permite que el contenido nuevo reciba un impulso inicial, lo que John Mueller de Google ha descrito como Google probando el sitio o las páginas web. Esto sucede todo el tiempo y entusiasma a las personas cuando publican un sitio nuevo y lo ven clasificado casi de inmediato.
Lo que está sucediendo con este sitio web generado por IA es que publica cantidades masivas de páginas web todos los días y esas páginas reciben un impulso a la parte superior de las páginas de resultados de los motores de búsqueda (SERP) durante las primeras 24 a 48 horas. Luego comienzan a deslizarse entre los diez primeros y, finalmente, a las segundas páginas de las SERP, pero en ese momento hay nuevas páginas que comienzan ese viaje desde el impulso inicial, todos los días. Esta es una estrategia clásica de la vieja escuela conocida como agitar y quemar.
John Mueller ha comentado en el pasado por qué Google clasifica los sitios web nuevos en la parte superior de los resultados de búsqueda.
Él explicó:
“En particular, con sitios web completamente nuevos, una de las dificultades que tenemos es que es posible que no tengamos muchas señales para esos sitios web, por lo que tenemos que hacer estimaciones.
Y dependiendo de cómo hagamos estimaciones, a veces puede significar que al principio mostramos este sitio web de forma un poco más visible de lo que resulta que las señales nos dicen al final.
…Pero eso puede ser en ambos sentidos. Puede ir en la dirección en la que te muestran muy visiblemente al principio.
Y también puede ser que tal vez se muestre de manera menos visible al principio y, a medida que comprendamos su sitio web y cómo encaja con el resto de la web, podremos ajustarlo.
…A veces también aparecen nuevos sitios web que intentamos captar muy rápidamente”.
7. El spam de IA es un problema de larga data con Google
Google tiene un problema de larga data con los sitios generados por IA que dominan ciertos resultados de búsqueda y esta no es la primera vez que Google se ve abrumado por el spam. Este sitio de spam no es el único y no es un caso atípico.
Sospecho que solucionar las lagunas que permiten que ocurra este spam probablemente tenga consecuencias no deseadas que afecten negativamente a los sitios que no son spam y es por eso que Google no lo ha cerrado después de todos estos años.
Pero Google necesita hacer algo al respecto porque afecta a los autores expertos cuando sus sitios son superados por contenido no humano que carece de conocimiento y experiencia. Si no por el bien de los editores, entonces por el bien de ellos mismos, porque el público en general ya tiene la percepción de que Google no puede solucionar su problema de spam.
Lo que hace que este ejemplo sea digno de mención es que se puso en marcha simultáneamente con la actualización de spam de Google y pasó a través de ella sin verse afectado, burlándose de Google. Es una experiencia humillante y desmoralizadora para los miles de blogueros que hacen lo correcto sólo para ver a los tramposos recompensados una vez más.
Imagen destacada de Shutterstock/ViDI Studio