Nuevos datos: principales factores que influyen en las citas de ChatGPT

Nuevos datos: principales factores que influyen en las citas de ChatGPT


SE Ranking analizó 129.000 dominios únicos en 216.524 páginas en 20 nichos para identificar qué factores se correlacionan con las citas de ChatGPT.

El número de dominios de referencia clasificados como el predictor más sólido de probabilidad de citación.

Lo que dicen los datos

Vínculos de retroceso y señales de confianza

La diversidad de enlaces mostró la correlación más clara con las citas. Los sitios con hasta 2500 dominios de referencia promediaron entre 1,6 y 1,8 citas. Aquellos con más de 350.000 dominios de referencia promediaron 8,4 citas.

Los investigadores identificaron un efecto umbral en 32.000 dominios de referencia. En ese momento, las citas casi se duplicaron, de 2,9 a 5,6.

Las puntuaciones de Domain Trust siguieron un patrón similar. Los sitios con Domain Trust por debajo de 43 promediaron 1,6 citas. Los beneficios se aceleraron significativamente en el extremo superior: los sitios con una puntuación de 91 a 96 promediaron 6 citas, mientras que los que obtuvieron una puntuación de 97 a 100 promediaron 8,4.

La confianza en la página importaba menos que las señales a nivel de dominio. Cualquier página con una puntuación de Page Trust de 28 o superior recibió aproximadamente la misma tasa de citas (8,3 en promedio), lo que sugiere que ChatGPT pesa más la autoridad general del dominio que las métricas de las páginas individuales.

Un hallazgo notable: los dominios .gov y .edu no superaron automáticamente a los sitios comerciales. Los dominios gubernamentales y educativos promediaron 3,2 citas, en comparación con 4,0 para los sitios sin designaciones de zonas de confianza.

Los autores escribieron:

«Lo que finalmente importa no es el nombre de dominio en sí, sino la calidad del contenido y el valor que proporciona».

Tráfico y clasificaciones de Google

El tráfico del dominio se clasificó como el segundo factor más importante, aunque la correlación sólo apareció en niveles altos de tráfico.

Los sitios con menos de 190.000 visitantes mensuales promediaron entre 2 y 2,9 citas, independientemente del volumen de tráfico exacto. Un sitio que recibe 20 visitantes orgánicos tuvo un rendimiento similar al de uno que recibió 20.000.

Sólo después de superar los 190.000 visitantes mensuales el tráfico se correlacionó con un aumento de las citaciones. Los dominios con más de 10 millones de visitantes promediaron 8,5 citas.

El tráfico de la página de inicio importaba específicamente. Los sitios con al menos 7900 visitantes orgánicos en su página principal mostraron las tasas de citas más altas.

La posición promedio en el ranking de Google también se rastrea con citas de ChatGPT. Las páginas ubicadas entre las posiciones 1 y 45 tuvieron un promedio de 5 citas. Los que ocupan el puesto 64 a 75 promediaron 3,1.

Los autores señalaron:

«Si bien esto no prueba que ChatGPT se base en el índice de Google, sugiere que ambos sistemas evalúan la autoridad y la calidad del contenido de manera similar».

Profundidad y estructura del contenido

La longitud del contenido mostró una correlación constante. Los artículos de menos de 800 palabras obtuvieron un promedio de 3,2 citas. Las más de 2.900 palabras promediaron 5,1.

La estructura importaba más allá del recuento de palabras sin procesar. Las páginas con secciones de 120 a 180 palabras entre títulos obtuvieron mejores resultados, con un promedio de 4,6 citas. Las secciones extremadamente cortas de menos de 50 palabras obtuvieron un promedio de 2,7 citas.

Las páginas con citas de expertos promediaron 4,1 citas frente a 2,4 de las que no las tenían. El contenido con 19 o más puntos de datos estadísticos promedió 5,4 citas, en comparación con 2,8 para las páginas con datos mínimos.

La frescura del contenido produjo uno de los hallazgos más claros. Las páginas actualizadas en tres meses tuvieron un promedio de 6 citas. El contenido obsoleto promedió 3,6.

Sorprendentemente, los datos brutos mostraron que las páginas con secciones de preguntas frecuentes en realidad recibieron menos citas (3,8) que las que no las tenían (4,1). Sin embargo, los investigadores notaron que su modelo predictivo consideraba la ausencia de una sección de preguntas frecuentes como una señal negativa. Sugieren que esta discrepancia existe porque las preguntas frecuentes suelen aparecer en páginas de soporte más simples que, naturalmente, obtienen menos citas.

El informe también encontró que el uso de títulos con estilo de pregunta (por ejemplo, como H1 o H2) tuvo un rendimiento inferior al de los títulos sencillos, obteniendo 3,4 citas frente a 4,3. Esto contradice los consejos estándar de optimización de la búsqueda por voz, lo que sugiere que los modelos de IA pueden preferir el etiquetado temático directo a los formatos de preguntas.

Señales sociales y plataformas de revisión

Las menciones de marca en las plataformas de discusión mostraron una fuerte correlación con las citas.

Los dominios con presencia mínima en Quora (hasta 33 menciones) promediaron 1,7 citas. La gran presencia de Quora (6,6 millones de menciones) correspondió a 7,0 citas.

Reddit mostró patrones similares. Los dominios con más de 10 millones de menciones promediaron 7 citas, en comparación con 1,8 para aquellos con actividad mínima.

Los autores posicionaron esto como particularmente relevante para sitios más pequeños:

«Para sitios web más pequeños y menos establecidos, participar en Quora y Reddit ofrece una forma de generar autoridad y ganarse la confianza de ChatGPT, similar a lo que logran los dominios más grandes a través de vínculos de retroceso y mucho tráfico».

La presencia en plataformas de reseñas como Trustpilot, G2, Capterra, Sitejabber y Yelp también se correlacionó con un aumento de las citas. Los dominios que figuran en múltiples plataformas de revisión obtuvieron entre 4,6 y 6,3 citas en promedio. Los ausentes de dichas plataformas promediaron 1,8.

Rendimiento técnico

Métricas de velocidad de página correlacionadas con la probabilidad de citación.

Las páginas con First Contentful Paint en menos de 0,4 segundos promediaron 6,7 citas. Las páginas más lentas (más de 1,13 segundos) promediaron 2,1.

El índice de velocidad mostró patrones similares. Los sitios con índices inferiores a 1,14 segundos tuvieron un buen desempeño confiable. Aquellos por encima de 2,2 segundos experimentaron una fuerte caída.

Un hallazgo contradictorio: las páginas con las puntuaciones más rápidas de Interacción con Next Paint (menos de 0,4 segundos) en realidad recibieron menos citas (1,6 en promedio) que aquellas con puntuaciones INP moderadas (0,8 a 1,0 segundos, con un promedio de 4,5 citas). Los investigadores sugirieron que las páginas extremadamente simples o estáticas pueden no indicar la profundidad que ChatGPT busca en fuentes autorizadas.

Optimización de URL y títulos

El informe encontró que las URL amplias que describen temas superaron a las optimizadas para palabras clave.

Las páginas con baja relevancia semántica entre la URL y la palabra clave de destino (rango de 0,00 a 0,57) promediaron 6,4 citas. Aquellos con mayor relevancia semántica (0,84 a 1,00) promediaron sólo 2,7 citas.

Los títulos siguieron el mismo patrón. Los títulos con baja concordancia de palabras clave obtuvieron un promedio de 5,9 citas. Los títulos altamente optimizados para palabras clave obtuvieron un promedio de 2,8.

Los investigadores concluyeron: «ChatGPT prefiere URL que describan claramente el tema general en lugar de aquellas estrictamente optimizadas para una sola palabra clave».

Factores que tuvieron un desempeño inferior

Varias tácticas de optimización de IA comúnmente recomendadas mostraron una correlación mínima o negativa con las citas.

El marcado del esquema de preguntas frecuentes tuvo un rendimiento inferior. Las páginas con esquema de preguntas frecuentes tuvieron un promedio de 3,6 citas. Las páginas sin promediaron 4.2.

Los archivos LLMs.txt mostraron un impacto insignificante. Los enlaces salientes a sitios de alta autoridad también mostraron un efecto mínimo sobre la probabilidad de citación.

Por qué esto importa

Los hallazgos sugieren que su estrategia de SEO existente ya puede cumplir con los objetivos de visibilidad de la IA. Si está creando dominios de referencia, ganando tráfico, manteniendo páginas rápidas y manteniendo el contenido actualizado, está abordando los factores que este informe identificó como más predictivos.

Para sitios más pequeños sin perfiles extensos de vínculos de retroceso, la investigación apunta a la participación de la comunidad en Reddit y Quora como un camino viable para generar señales de autoridad. Los datos también sugieren centrarse en la profundidad del contenido por encima de la densidad de palabras clave.

Los investigadores señalan que los factores son interdependientes. Optimizar una señal e ignorar otras reduce la eficacia general.

Mirando hacia el futuro

SE Ranking analizó ChatGPT específicamente. Otros sistemas de IA pueden ponderar los factores de manera diferente.

SE Ranking no especifica qué versión de ChatGPT o período de tiempo representan los datos, por lo que estos patrones deben tratarse como correlaciones direccionales en lugar de una prueba de cómo funciona el algoritmo de clasificación de ChatGPT.


Imagen de portada: BongkarnGraphic/Shuttersrtock

Related Posts
Leave a Reply

Your email address will not be published.Required fields are marked *