Los modelos de lenguajes grandes citan las fuentes de manera diferente a como las clasifica Google.
Search Atlas, una empresa de software de SEO, comparó las citas de GPT de OpenAI, Gemini de Google y Perplexity con los resultados de búsqueda de Google.
El análisis de 18.377 consultas coincidentes encuentra una brecha entre la visibilidad de búsqueda tradicional y las citas de plataformas de inteligencia artificial.
A continuación se ofrece una descripción general de las diferencias clave que encontró Search Atlas.
La perplejidad está más cerca de la búsqueda
Perplexity realiza recuperación web en vivo, por lo que es de esperar que sus citas se parezcan más a resultados de búsqueda. El estudio lo respalda.
En todo el conjunto de datos, Perplexity mostró una superposición mediana de dominios de alrededor del 25% al 30% con los resultados de Google. La superposición media de URL fue cercana al 20%. En total, Perplexity compartió 18.549 dominios con Google, lo que representa alrededor del 43% de los dominios que citó.
ChatGPT y Gemini son más selectivos
ChatGPT mostró una superposición mucho menor con Google. Su superposición mediana de dominios se mantuvo entre el 10% y el 15%. El modelo compartió 1.503 dominios con Google, lo que representa aproximadamente el 21% de sus dominios citados. Las coincidencias de URL normalmente se mantuvieron por debajo del 10%.
Géminis se comportó de manera menos consistente. Algunas respuestas casi no se superponían con los resultados de búsqueda. Otros se alinearon más estrechamente. En general, Gemini compartió sólo 160 dominios con Google, lo que representa alrededor del 4% de los dominios que aparecieron en los resultados de Google, aunque esos dominios representaron el 28% de las citas de Gemini.
Lo que significan los números para la visibilidad
La clasificación en Google no garantiza citas de LLM. Este informe sugiere que los sistemas aprovechan la web de diferentes maneras.
La arquitectura de Perplexity busca activamente en la web y sus patrones de citas siguen más de cerca las clasificaciones de búsqueda tradicionales. Si su sitio ya tiene una buena clasificación en Google, es más probable que vea una visibilidad similar en las respuestas de Perplexity.
ChatGPT y Gemini dependen más del conocimiento previamente capacitado y de la recuperación selectiva. Citan un conjunto más limitado de fuentes y están menos vinculados a las clasificaciones actuales. Las coincidencias a nivel de URL con Google son bajas para ambos.
Limitaciones del estudio
El conjunto de datos favoreció enormemente a Perplexity. Representó el 89% de las consultas coincidentes, con OpenAI el 8% y Gemini el 3%.
Los investigadores compararon las consultas mediante puntuación de similitud semántica. Las consultas emparejadas expresaron necesidades de información similares pero no fueron búsquedas de usuarios idénticas. El umbral fue del 82% de similitud utilizando el modelo de integración de OpenAI.
La ventana de dos meses proporciona sólo una instantánea reciente. Se necesitarían plazos más largos para ver si los mismos patrones de superposición se mantienen a lo largo del tiempo.
Mirando hacia el futuro
Para sistemas basados en recuperación como Perplexity, las señales de SEO tradicionales y la fortaleza general del dominio probablemente sean más importantes para la visibilidad.
Para modelos centrados en el razonamiento como ChatGPT y Gemini, esas señales pueden tener una influencia menos directa sobre qué fuentes aparecen en las respuestas.
Imagen destacada: Ascannio/Shutterstock



