Google publicó un artículo de investigación sobre un nuevo modelo de inteligencia artificial para detectar fraude en el sistema de Google Ads que representa una gran mejora con respecto a lo que utilizaban anteriormente. Lo interesante es que el artículo de investigación, fechado el 31 de diciembre de 2025, dice que se implementa la nueva IA, lo que da como resultado una mejora en la tasa de detección de más de 40 puntos porcentuales y logra una precisión del 99,8% en políticas específicas.
ALF: modelo de base grande para anunciantes
La nueva IA se llama ALF (Advertiser Large Foundation Model), cuyos detalles se publicaron el 31 de diciembre de 2025. ALF es un modelo multimodal de gran base que analiza texto, imágenes y videos, junto con factores como la antigüedad de la cuenta, los detalles de facturación y las métricas de rendimiento históricas.
Los investigadores explican que muchos de estos factores de forma aislada no marcarán una cuenta como potencialmente problemática, pero que comparar todos estos factores juntos proporciona una mejor comprensión del comportamiento y la intención del anunciante.
Ellos escriben:
«Un desafío central en este ecosistema es comprender de manera precisa y eficiente la intención y el comportamiento de los anunciantes. Esta comprensión es fundamental para varias aplicaciones clave, incluida la vinculación de los usuarios con anuncios y la identificación de fraudes e infracciones de políticas.
Abordar este desafío requiere un enfoque holístico, procesando diversos tipos de datos, incluida información estructurada de la cuenta (por ejemplo, antigüedad de la cuenta, detalles de facturación), activos creativos publicitarios multimodales (texto, imágenes, videos) y contenido de la página de destino.
Por ejemplo, un anunciante podría tener una cuenta creada recientemente, tener anuncios de texto e imágenes para una gran marca conocida y haber rechazado un pago con tarjeta de crédito una vez. Aunque cada elemento podría existir inocentemente de forma aislada, la combinación sugiere claramente una operación fraudulenta”.
Los investigadores abordan tres desafíos que los sistemas anteriores no pudieron superar:
1. Datos heterogéneos y de alta dimensión
Los datos heterogéneos se refieren al hecho de que los datos de los anunciantes vienen en múltiples formatos, no solo en un tipo. Esto incluye datos estructurados como la antigüedad de la cuenta y el tipo de facturación y datos no estructurados como activos creativos como imágenes, texto y vídeo. Los datos de alta dimensión se refieren a los cientos o miles de puntos de datos asociados con cada anunciante, lo que hace que la representación matemática de cada uno se vuelva de alta dimensión, lo que presenta desafíos para los modelos convencionales.
2. Conjuntos ilimitados de activos creativos
Los anunciantes podrían tener miles de activos creativos, como imágenes, y ocultar uno o dos maliciosos entre miles de activos inocentes. Este escenario desbordó al sistema anterior.
3. Fiabilidad y confiabilidad en el mundo real
El sistema debe poder generar puntuaciones de confianza confiables de que una empresa tiene intenciones maliciosas porque, de lo contrario, un falso positivo afectaría a un anunciante inocente. Se debe esperar que el sistema funcione sin tener que reajustarlo constantemente para detectar errores.
Privacidad y seguridad
Aunque ALF analiza señales sensibles como el historial de facturación y los detalles de la cuenta, los investigadores enfatizan que el sistema está diseñado con estrictas salvaguardias de privacidad. Antes de que la IA procese cualquier dato, se elimina toda la información de identificación personal (PII). Esto garantiza que el modelo identifique el riesgo basándose en patrones de comportamiento en lugar de datos personales sensibles.
La salsa secreta: cómo detecta los valores atípicos
El modelo también utiliza una técnica llamada «Atención entre muestras» para mejorar sus habilidades de detección. En lugar de analizar a un solo anunciante en el vacío, ALF analiza «grandes lotes de anunciantes» para comparar sus interacciones entre sí. Esto permite a la IA aprender cómo es la actividad normal en todo el ecosistema y hacerla más precisa para detectar valores atípicos sospechosos que no encajan en el comportamiento normal.
Alf supera los estándares de producción
Los investigadores explican que sus pruebas muestran que ALF supera una línea base de producción muy ajustada:
«Nuestros experimentos muestran que ALF supera significativamente una base de producción muy ajustada y al mismo tiempo tiene un desempeño sólido en los puntos de referencia públicos. En producción, ALF ofrece ganancias sustanciales y simultáneas en precisión y recuperación, aumentando la recuperación en más de 40 puntos porcentuales en una política crítica mientras aumenta la precisión al 99,8 % en otra».
Este resultado demuestra que ALF puede ofrecer ganancias mensurables a través de múltiples criterios de evaluación en condiciones de producción reales, en lugar de solo en entornos fuera de línea o de referencia.
En otros lugares mencionan compensaciones en velocidad:
“La eficacia de este enfoque se validó frente a una base de producción excepcionalmente sólida, que en sí misma es el resultado de una búsqueda exhaustiva en varias arquitecturas e hiperparámetros, incluidos DNN, conjuntos, GBDT y regresión logística con exploración cruzada de características.
Si bien la latencia de ALF es mayor debido a su mayor tamaño de modelo, se mantiene dentro del rango aceptable para nuestro entorno de producción y se puede optimizar aún más mediante aceleradores de hardware. Los experimentos muestran que ALF supera significativamente la línea de base en tareas clave de detección de riesgos, un aumento de rendimiento impulsado por su capacidad única para modelar de manera integral la incorporación de contenido, que las arquitecturas más simples tenían dificultades para aprovechar. Esta compensación se justifica por su implementación exitosa, donde ALF atiende millones de solicitudes diariamente”.
La latencia se refiere a la cantidad de tiempo que tarda el sistema en producir una respuesta después de recibir una solicitud, y los datos del investigador muestran que aunque ALF aumenta este tiempo de respuesta en relación con la línea de base, la latencia sigue siendo aceptable para uso en producción y ya está operando a escala mientras ofrece un rendimiento de detección de fraude sustancialmente mejor.
Detección de fraude mejorada
Los investigadores dicen que ALF ahora se implementa en el sistema de seguridad de Google Ads para identificar a los anunciantes que infringen las políticas de Google Ads. No hay indicios de que el sistema se esté utilizando en otros lugares, como en la Búsqueda o en los perfiles comerciales de Google. Pero sí dijeron que el trabajo futuro podría centrarse en factores basados en el tiempo (“dinámica temporal”) para detectar patrones en evolución. También indicaron que podría resultar útil para el modelado de audiencias y la optimización creativa.
Lea la versión original en PDF del trabajo de investigación:
ALF: modelo básico de anunciante grande para la comprensión del anunciante multimodal
Imagen destacada de Shutterstock/Iniciar sesión



