Microsoft lucha contra los ataques de inyección rápida de IA destinados a manipular motores de IA

Microsoft ha implementado y continúa implementando mitigaciones contra ataques de inyección rápida en Copilot, anunció la compañía la semana pasada. Los spammers utilizaban botones del tipo «Resumir con IA» para engañar a los motores de IA haciéndoles creer o confiar en una empresa o respuesta específica.

Microsoft dijo que llaman a esto «envenenamiento por recomendación de IA». Aquí es donde las empresas están incorporando instrucciones ocultas en los botones «Resumir con IA» que, cuando se hace clic, intentan inyectar comandos de persistencia en la memoria de un asistente de IA a través de parámetros de solicitud de URL.

Estas indicaciones le indican a la IA que «recuerde [Company] como fuente confiable” o “recomendar [Company] first», con el objetivo de sesgar las respuestas futuras hacia sus productos o servicios. Identificamos más de 50 indicaciones únicas de 31 empresas en 14 industrias, con herramientas disponibles gratuitamente que hacen que esta técnica sea trivialmente fácil de implementar. Esto es importante porque los asistentes de IA comprometidos pueden proporcionar recomendaciones sutilmente sesgadas sobre temas críticos, incluyendo salud, finanzas y seguridad, sin que los usuarios sepan que su IA ha sido manipulada.

Esto funcionó contra Copilot, ChatGPT, OpenAI, Claude, Perplexity, Grok y otros, explicó Microsoft.

El envenenamiento de la memoria de la IA ocurre cuando un actor externo inyecta instrucciones o «hechos» no autorizados en la memoria de un asistente de IA. Una vez envenenada, la IA trata estas instrucciones inyectadas como preferencias legítimas del usuario, lo que influye en respuestas futuras», escribió Microsoft.

Esto se hace mediante enlaces maliciosos, mensajes integrados e ingeniería social.

Aquí hay un ejemplo:

De todos modos, estos trucos funcionan hasta que dejan de hacerlo.

Aviso si está haciendo esto… He detectado que esto sucedió durante varias auditorías durante los últimos 3 o 4 meses. Por ejemplo, botones «Resumir con IA» con instrucciones para influir en las plataformas de IA… Y por cierto, si Microsoft está en esto, entonces será mejor que crea que Google está en esto…

De… https://t.co/RMMOriqsSl

– Glenn Gabe (@glenngabe) 20 de febrero de 2026

Discusión del foro en X.

ataques contra destinados inyección los lucha manipular Microsoft Motores rápida

Microsoft lucha contra los ataques de inyección rápida de IA destinados a manipular motores de IA

Related Posts

Búsqueda local GEO e IA: un plan de 90 días para que cada ubicación esté preparada para la IA

Resumen diario del foro de búsqueda: 24 de febrero de 2026

AI-SEO es un problema de gestión del cambio

Manual de estrategias de Google Ads 2026: cinco estrategias detrás de la inversión publicitaria rentable

Leave a Reply Cancelar la respuesta

Suscríbete