IA en innovación [Part 2]: Más información de más de 546 000 resúmenes de IA

IA en innovación [Part 2]: Más información de más de 546 000 resúmenes de IA


Siguiendo con mi primer análisis de más de 546 000 resúmenes de IA, profundicé en tres preguntas:

  1. ¿Cómo se relacionan los datos de rastreo comunes y las descripciones generales de IA?
  2. ¿Cómo cambia la intención del usuario las descripciones generales de la IA?
  3. ¿Cómo se desglosan las 20 primeras posiciones de los dominios que se clasifican en la búsqueda orgánica y son citados en las AIO?

¿Cómo se relacionan los datos de rastreo comunes y las descripciones generales de IA?

La inclusión de rastreo común no afecta tanto la visibilidad de AIO como el tráfico orgánico puro.

Common Crawl, una organización sin fines de lucro que rastrea la web y proporciona datos de forma gratuita, es la mayor fuente de datos de entrenamiento de IA generativa.

Algunos sitios, como Blogspot, aportan muchas más páginas que otros, lo que plantea la cuestión de si eso les da una ventaja en las respuestas de LLM.

Resultado: Me preguntaba si los sitios que ofrecen más páginas que otros también tendrían más visibilidad en AI Overviews. Eso resultó no ser cierto.

Comparé los 500 dominios principales por contribución de página en Common Crawl con los 30.000 dominios principales en mi conjunto de datos y encontré una correlación débil de 0,179.

La razón es que Google probablemente no depende del rastreo común para entrenar e informar las descripciones generales de IA, sino de su propio índice.

Crédito de la imagen: Kevin Indig

Luego analicé la relación entre los 3000 dominios principales por tráfico orgánico de Semrush y los 30 000 dominios principales en mi conjunto de datos y encontré una fuerte relación de 0,714.

En otras palabras, los dominios que reciben mucho tráfico orgánico tienen una alta probabilidad de ser muy visibles en las descripciones generales de IA.

AIO parece recompensar cada vez más lo que funciona en la búsqueda orgánica, pero algunos criterios aún están muy separados.

Es importante señalar que algunos sitios distorsionan la relación.

Al filtrar Wikipedia y YouTube, la relación desciende a una correlación de 0,485, todavía fuerte pero más baja que con los dos gigantes.

La correlación no cambia cuando se eliminan sitios más grandes, lo que solidifica el punto de que hacer cosas que funcionen en la búsqueda orgánica tiene un gran impacto en las descripciones generales de IA.

Como escribí en mi publicación anterior:

Una clasificación más alta en los resultados de búsqueda ciertamente aumenta las posibilidades de ser visible en las AIO, pero no es ni mucho menos el único factor.

Como resultado, las empresas pueden excluir el bot de Common Crawl en robots.txt si no quieren aparecer en conjuntos de datos públicos (y generar IA como Chat GPT) y seguir siendo muy visibles en las descripciones generales de IA de Google.

¿Cómo cambia la intención del usuario las descripciones generales de la IA?

La intención del usuario da forma a la forma y el contenido de las AIO.
En mi análisis anterior, llegué a la conclusión de que la coincidencia exacta de la consulta apenas importa:

Los datos muestran que sólo el 6% de las AIO contienen la consulta de búsqueda.

Ese número es ligeramente mayor en SGE, con un 7%, y menor en los AIO activos, con un 5,1%. Como resultado, satisfacer la intención del usuario en el contenido es mucho más importante de lo que podríamos haber asumido. Esto no debería ser una sorpresa, ya que la intención del usuario ha sido un requisito clave de clasificación en SEO durante muchos años, pero ver los datos es impactante.

Calcular la intención exacta (dominante) del usuario para las 546.000 consultas requeriría una gran cantidad de cálculo, por lo que analicé las abstracciones comunes: informativa, local y transaccional.

Las abstracciones son menos útiles al optimizar el contenido, pero están bien cuando se analizan datos agregados.

Me agrupé:

  • Consultas informativas sobre palabras interrogativas como «qué», «por qué», «cuándo», etc.
  • Consultas transaccionales sobre términos como «comprar», «descargar», «pedir», etc.
  • Consultas locales sobre «cerca», «cerca» o «cerca de mí».
La respuesta de AIO contiene una consulta por intención del usuarioCrédito de la imagen: Kevin Indig

Resultado: Las diferencias en la intención del usuario se reflejan en la forma y la función. La longitud promedio (recuento de palabras) es casi igual en todos los intentos excepto en el local, lo que tiene sentido porque los usuarios quieren una lista de ubicaciones en lugar de texto.

De manera similar, las AIO de compras suelen ser listas de productos con un poco de contexto, a menos que sean preguntas relacionadas con las compras.

Las consultas locales tienen la mayor cantidad de coincidencia exacta entre la consulta y la respuesta; Las consultas informativas tienen las más bajas.

Comprender y satisfacer la intención del usuario ante las preguntas es más difícil, pero también más importante para ser visible en las AIO que, por ejemplo, en los fragmentos destacados.

¿Cómo se desglosan las 20 posiciones orgánicas principales?

En mi último análisis, descubrí que casi el 60% de las URL que aparecen en AIO y resultados de búsqueda orgánicos se ubican fuera de las 20 primeras posiciones.

Para este memorando, desglosé los 20 primeros para comprender si es más probable que las AIO citen URL en posiciones más altas o no.

Desglose de los 20 resultados de búsqueda principales para URL que también son citas AIOCrédito de la imagen: Kevin Indig

Resultado: Resulta que el 40% de las URL en AIO se ubican en las posiciones 11 a 20, y solo la mitad (21,9%) se ubica entre las 3 primeras.

La mayoría, el 60% de las URL citadas en las AIO, todavía se clasifican en la primera página de resultados orgánicos, lo que refuerza el hecho de que una clasificación orgánica más alta tiende a generar una mayor probabilidad de ser citado en las AIO.

Sin embargo, los datos también muestran que es muy imposible estar presente en AIO con un rango orgánico inferior.

Dónde se clasifican los 20 dominios principales que son visibles en las AIO y en los resultados de búsquedaDónde se clasifican los 20 dominios principales que son visibles en las AIO y los resultados de búsqueda (Crédito de la imagen: Kevin Indig)

Escenarios

Trabajaré con mis clientes para coincidir con la intención del usuario de AIO, brindar información única y adaptar el formato. Veo opciones para el progreso de AI Overview que rastrearé y validaré con datos en los próximos meses y años.

Opción 1: Las AIO dependen más de resultados orgánicos de alto rango y satisfacen una mayor intención informativa antes de que los usuarios necesiten hacer clic para acceder a los sitios web. La mayoría de los clics que llegan a los sitios provendrían de usuarios que están considerando o tienen la intención de comprar.

Opción 2: Las AIO continúan brindando respuestas a partir de resultados diversificados y dejan una pequeña posibilidad de que los usuarios aún hagan clic para obtener resultados de primer nivel, aunque en cantidades mucho menores.

¿A qué escenario apuestas?


Imagen de portada: Paulo Bobita/Search Engine Journal

Related Posts
Leave a Reply

Your email address will not be published.Required fields are marked *