Investigación SAGE Agentic AI de Google: lo que significa para el SEO

Investigación SAGE Agentic AI de Google: lo que significa para el SEO


Google publicó un artículo de investigación sobre la creación de un conjunto de datos desafiante para capacitar a agentes de IA para una investigación profunda. El artículo ofrece información sobre cómo funciona la investigación profunda de la IA agente, lo que implica información para optimizar el contenido.

El acrónimo SAGE significa Generación de datos agentes orientables para búsqueda profunda con retroalimentación de ejecución.

Pares sintéticos de preguntas y respuestas

Los investigadores notaron que los conjuntos de datos de entrenamiento de IA de última generación anteriores (como Musique y HotpotQA) no requerían más de cuatro pasos de razonamiento para responder las preguntas. En cuanto al número de búsquedas necesarias para responder una pregunta, Musique promedia 2,7 búsquedas por pregunta y HotpotQA promedia 2,1 búsquedas. Otro conjunto de datos de uso común llamado Preguntas Naturales (NQ) solo requirió un promedio de 1,3 búsquedas por pregunta.

Estos conjuntos de datos que se utilizan para capacitar a los agentes de IA crearon una brecha de capacitación para tareas de búsqueda profunda que requerían más pasos de razonamiento y una mayor cantidad de búsquedas. ¿Cómo se puede entrenar a un agente de IA para tareas complejas de búsqueda profunda en el mundo real si los agentes de IA no han sido capacitados para abordar preguntas realmente difíciles?

Los investigadores crearon un sistema llamado SAGE que genera automáticamente pares de preguntas y respuestas complejos y de alta calidad para capacitar a los agentes de búsqueda de IA. SAGE es un sistema de “agente dual” en el que una IA escribe una pregunta y una segunda IA ​​de “agente de búsqueda” intenta resolverla, proporcionando retroalimentación sobre la complejidad de la pregunta.

  • El objetivo de la primera IA es escribir una pregunta que sea difícil de responder y que requiera muchos pasos de razonamiento y múltiples búsquedas para resolverla.
  • El objetivo de la segunda IA ​​es intentar medir si la pregunta tiene respuesta y calcular su dificultad (se requiere un número mínimo de pasos de búsqueda).

La clave de SAGE es que si la segunda IA ​​resuelve la pregunta con demasiada facilidad o se equivoca, los pasos y documentos específicos que encontró (el seguimiento de ejecución) se devuelven a la primera IA. Esta retroalimentación permite a la primera IA identificar uno de los cuatro atajos que permiten a la segunda IA ​​resolver la pregunta en menos pasos.

Son estos atajos los que brindan información sobre cómo clasificar mejor para tareas de investigación profunda.

Cuatro formas en que se evitó la investigación profunda

El objetivo del artículo era crear un conjunto de pares de preguntas y respuestas que fueran tan difíciles que el agente de IA requiriera varios pasos para resolverlos. Los comentarios mostraron cuatro formas que hicieron menos necesario que el agente de IA realizara búsquedas adicionales para encontrar una respuesta.

Cuatro razones por las que la investigación profunda era innecesaria

  1. Co-ubicación de información
    Este es el atajo más común y representa el 35% de las veces en las que no era necesaria una investigación profunda. Esto sucede cuando dos o más datos necesarios para responder una pregunta se encuentran en el mismo documento. En lugar de buscar dos veces, la IA encuentra ambas respuestas de un solo «salto».
  2. Colapso de consultas múltiples
    Esto sucedió en el 21% de los casos. La causa es cuando una única consulta de búsqueda inteligente recupera suficiente información de diferentes documentos para resolver varias partes del problema a la vez. Esto “colapsa” lo que debería haber sido un proceso de varios pasos en uno solo.
  3. Complejidad superficial
    Esto representa el 13% de las veces en las que no fue necesaria una investigación profunda. La pregunta parece larga y complicada para un humano, pero un motor de búsqueda (que está utilizando un agente de IA) puede saltar directamente a la respuesta sin necesidad de razonar los pasos intermedios.
  4. Preguntas demasiado específicas
    El 31% de los fracasos son preguntas que contienen tantos detalles que la respuesta resulta obvia en la primera búsqueda, eliminando la necesidad de una investigación “profunda”.

Los investigadores descubrieron que algunas preguntas parecen difíciles pero en realidad son relativamente fáciles porque la información está «ubicada» en un solo documento. Si un agente puede responder una pregunta de 4 saltos en 1 salto porque un sitio web era lo suficientemente completo como para tener todas las respuestas, ese punto de datos se considera un fracaso para capacitar al agente en el razonamiento, pero aún así es algo que puede suceder en la vida real y el agente aprovechará la posibilidad de encontrar toda la información en una página.

Conclusiones de SEO

Es posible obtener algunas ideas sobre qué tipos de contenido satisfacen la investigación profunda. Si bien estas no son necesariamente tácticas para obtener una mejor clasificación en la búsqueda profunda de IA agente, estos conocimientos sí muestran qué tipos de escenarios causaron que los agentes de IA encontraran todas o la mayoría de las respuestas en una página web.

La “coubicación de información” podría ser una victoria para el SEO
Los investigadores descubrieron que cuando en el mismo documento aparecen múltiples datos necesarios para responder una pregunta, se reduce el número de pasos de búsqueda necesarios. Para un editor, esto significa que consolidar datos «dispersos» en una sola página evita que un agente de IA tenga que «saltar» al sitio de un competidor para encontrar el resto de la respuesta.

Activación del «colapso de consultas múltiples»
Los autores identificaron un fenómeno en el que se puede recuperar información de diferentes documentos mediante una única consulta. Al estructurar el contenido para responder varias subpreguntas a la vez, permite que el agente encuentre la solución completa en su página más rápido, «cortocircuitando» efectivamente la larga cadena de razonamiento que el agente estaba dispuesto a emprender.

Eliminar los “atajos” (la brecha de razonamiento)
El artículo de investigación señala que el generador de datos falla cuando accidentalmente crea un «atajo» a la respuesta. Como SEO, su objetivo es ser ese atajo: proporcionar puntos de datos específicos como cálculos, fechas o nombres que permitan al agente llegar a la respuesta final sin mayor exploración.

El objetivo sigue siendo clasificar en la búsqueda clásica

Para un SEO y un editor, estos atajos subrayan el valor de crear un documento completo porque eliminará la necesidad de que un agente de IA salte a otro lugar. Esto no significa que será útil agregar toda la información en una sola página. Si tiene sentido para un usuario, puede resultar útil vincular una página a otra para obtener información relacionada.

La razón por la que digo esto es porque el agente de IA realiza una búsqueda clásica en busca de respuestas, por lo que el objetivo sigue siendo optimizar una página web para la búsqueda clásica. Además, en esta investigación, el agente de IA extrae de las tres páginas web mejor clasificadas para cada consulta que ejecuta. No sé si así es como funciona la búsqueda de inteligencia artificial en un entorno real, pero es algo a considerar.

De hecho, una de las pruebas que realizaron los investigadores se realizó utilizando la API Serper para extraer resultados de búsqueda de Google.

Entonces, cuando se trata de clasificar en la búsqueda de IA agente, considere estas conclusiones:

  • Puede resultar útil considerar la importancia de clasificarse entre los tres primeros.
  • Optimice las páginas web para la búsqueda clásica.
  • No optimice las páginas web para la búsqueda con IA
  • Si es posible ser exhaustivo, mantenerse dentro del tema y clasificarse entre los tres primeros, entonces hágalo.
  • Enlace a páginas relevantes para ayudarlas a clasificarse en la búsqueda clásica, preferiblemente entre las tres primeras (para estar seguro).

Podría ser que la búsqueda de IA agente considere seleccionar más de los tres primeros en la búsqueda clásica. Pero puede resultar útil establecer el objetivo de clasificarse entre los 3 primeros en la búsqueda clásica y centrarse en clasificar otras páginas que pueden ser parte de la investigación profunda de múltiples saltos.

El artículo de investigación fue publicado por Google el 26 de enero de 2026. Está disponible en formato PDF: SAGE: Steerable Agentic Data Generation for Deep Search with Execution Feedback.

Imagen destacada de Shutterstock/Shutterstock AI Generator

Related Posts
Leave a Reply

Your email address will not be published.Required fields are marked *