Con la decisión de los remedios de Google Monopoly del otro día, tenemos aún más documentos de la Corte que mencionan más sobre el índice de búsqueda de Google, la puntuación de spam, el PageRank, la calidad de la página, el pegamento y más.
Todo esto se suma a todos los documentos del DOJ que cubrimos anteriormente y esa gran filtración de búsqueda, a la que Google terminó respondiendo. También cubrimos ayer el bit de Google FastSearch en la conexión a tierra para Gemini y las interacciones y datos de los usuarios de hoy.
La mayoría de estos fueron vistos por Marie Haynes, pero quizás cavé un poco más profundo para sacar más referencias que encontré.
Debo tener en cuenta que, solo porque estos documentos judiciales tienen estas declaraciones, no significa que se usen en Google Search hoy y estas declaraciones también fueron dadas por los no portadores:
Índice de búsqueda de Google
¿Qué se almacena en el índice de búsqueda de Google? ID de documento, mapa de URL, marcas de tiempo, puntajes de spam, etc.:
Información súper interesante aquí sobre lo que se almacena en el índice de búsqueda de Google.
– Cada documento tiene un Docid
– Hay un mapa de Docid para URL
– Cada Docid tiene un conjunto de señales, atributos o metadatos, algunos derivados de los datos del usuarioEstos incluyen:
– Popularidad medida por el usuario … pic.twitter.com/mlabmdu8r3– Marie Haynes (@marie_haynes) 3 de septiembre de 2025
Puntuación de spam frente a la calidad de la página
Google determina qué rastreo basado no solo en la puntuación de spam sino también de las señales de calidad y popularidad:
¿No se arrastra? Podría estar relacionado con su puntaje de spam.
Las señales de calidad y popularidad ayudan a Google a determinar con qué frecuencia rastrear las páginas web. pic.twitter.com/fn8wfgbvdk
– Marie Haynes (@marie_haynes) 3 de septiembre de 2025
Página web de PageRank vs
PageRank es una señal de calidad clave que es un componente de la puntuación de calidad, pero «la mayor parte de la señal de calidad de Google se deriva de la página web en sí».
¡Ahora esto es interesante!
PageRank es una señal de calidad clave que es un componente de la puntuación de calidad.
Sin embargo, resulta que «la mayor parte de la señal de calidad de Google se deriva de la página web en sí». pic.twitter.com/3w6cbnix8c
– Marie Haynes (@marie_haynes) 3 de septiembre de 2025
Pegamento
Glue registra la consulta y los datos del usuario para ayudar con las señales y la clasificación:
Glue es un registro de consultas que recopila datos sobre una consulta y la interacción del usuario con la respuesta.
Los datos incluyen:
– texto de la consulta, idioma, ubicación del usuario y tipo de dispositivo
– ¿Qué aparece en el SERP?
– En qué hizo clic el usuario y cuánto tiempo permanecieron … pic.twitter.com/mns1ptc4vq– Marie Haynes (@marie_haynes) 3 de septiembre de 2025
Ber clasificado
Google ha empapado a Bert, que es un modelo de clasificación de aprendizaje que utiliza 70 días de registros de búsqueda más puntajes generados por evaluadores de calidad humana:
Oooh, el siguiente es Rankembed, ahora llamado Rankembed Bert.
Es un modelo de clasificación de aprendizaje profundo que utiliza 70 días de registros de búsqueda más puntajes generados por evaluadores de calidad humana.
Tiene una fuerte comprensión del lenguaje natural que le permite identificar de manera más eficiente los mejores documentos … pic.twitter.com/oxjkkctryr
– Marie Haynes (@marie_haynes) 3 de septiembre de 2025
¿Qué más encontraste en el PDF gobernante de la corte?
Discusión del foro en X.