Forme declaraciones en el foro de Googler en Google Navboost

Forme declaraciones en el foro de Googler en Google Navboost


En mi entrevista con Danny Sullivan, el enlace de búsqueda de Google, traté de obtener más detalles sobre Navboost y cómo desempeña un papel en las actualizaciones principales y las clasificaciones generales. Me derribaron prácticamente (soy un buen perdedor). Dicho esto, aquí hay algunas publicaciones antiguas de ex-Googlers (por lo que puedo decir) sobre el tema de Navboost de los foros de Hacker News.

Esta primera cita es de Greg (gregw134) en Hacker News, una cita que probablemente hayas visto antes:

Ex ingeniero de búsqueda de Google aquí (2019-2023). Sé que muchos de los ingenieros veteranos se molestaron cuando desviaron a Ben Gomes. Probablemente el cambio más grande, por lo que he escuchado, fue perder a Amit Singhal, quien dirigió la Búsqueda hasta 2016. Amit luchó contra la creciente complejidad. Hay un documento interno semifamoso que escribió donde argumentaba contra otros clientes potenciales de búsqueda que Google debería usar menos aprendizaje automático, o al menos contenerlo tanto como sea posible, para que la clasificación siga siendo depurable y comprensible para los ingenieros de búsqueda humanos. Mi impresión es que desde que se fue, la complejidad se disparó y cada equipo lanzó tantos proyectos de aprendizaje profundo como pudo (como lo ha hecho cualquier otra gran empresa de tecnología). Sin embargo, el problema es que los sistemas más antiguos tenían problemas obvios, mientras que los sistemas más nuevos tienen errores ocultos y problemas conceptuales que a menudo no aparecen en las métricas y que se agravan con el tiempo a medida que se añade más complejidad. Por ejemplo: encontré un error de 1 en una fórmula de un lanzamiento anterior que ha estado reordenando los resultados principales para el 15% de las consultas desde 2015. Lo entregué cuando me fui, pero no tengo idea de si alguien realmente lo solucionó o no. .

Escribí todos los errores de búsqueda que conocía en un documento interno llamado «navboost de segunda página», así que si alguien que trabaja en búsquedas en Google lee esto y necesita un lanzamiento, échale un vistazo.

El segundo, no creo que lo hayas visto antes. Es de Kevin Lacker, ahora CTO de Parse, pero era un ingeniero de búsqueda de Google que trabajó en el departamento de calidad de búsqueda de Google desarrollando algoritmos de búsqueda entre enero de 2005 y noviembre de 2009. Publicó hace 9 meses en Hacker News:

Bah, niños de estos días. No es revisionismo. Trabajé en la calidad de la búsqueda durante la era heurística codificada a mano, 2005-2009. Pasé parte de ese tiempo trabajando en el equipo «navboost», que utilizaba datos de clics para alterar los resultados de la búsqueda. Incluso en 2007, los datos de clics eran bastante valiosos y posiblemente eran el componente más importante del algoritmo.

El algoritmo fue codificado a mano, claro. No necesita aprendizaje automático para utilizar datos de clics. Sólo necesita que algunas personas hayan buscado esa consulta en particular antes. Cuando alguien hace clic en un resultado y permanece allí por un tiempo, es un «clic largo» y aumenta el resultado de búsqueda para esa consulta.

Luego encontré estas interesantes referencias de personas en Hacker News de años antes de que los documentos del Departamento de Justicia fueran revelados en Navboost. No estoy seguro de si son de Googlers o no.

totorovirus en Hacker News:

Google ya no utiliza el ranking de páginas. Tienen una señal llamada navboost que es la señal más fuerte en clasificación y recuperación. Y esa idea surge del artículo de Yahoo en el que revelaron las joyas de los algoritmos de los motores de búsqueda (PDF aquí)

Ese PDF es una patente de Yahoo.

elchupanebre en Hacker News:

El reclamo de Sundar a la fama es la barra Google Tool para MSIE. Fue un gran problema en ese momento. Bloqueó la búsqueda de Google en MSIE y finalmente permitió el aumento de navegación en la calidad de la búsqueda.

Luego fue el líder de producto en el equipo de Chrome. No sé si fue él quien presionó a Page para que creara Chrome.

quantumofalpha en Hacker News:

¿qué? Google utiliza clics («navboost») desde aproximadamente siempre, es una de las señales más fuertes para todos los principales motores de búsqueda web. Supongo que la mejor pregunta es por qué no optimizan la clasificación directamente en función de los clics, por qué seguir molestándose con todo ese costoso negocio de los evaluadores humanos… bueno, la optimización en función de los clics ayuda, pero sólo hasta cierto punto más allá del cual empieza a perjudicar la relevancia al promocionar en exceso los datos antiguos. resultados populares y clickbait. Pero como ingrediente de la clasificación general, de una forma u otra, ellos y todos los demás definitivamente utilizan datos de clics.

Grabamos un video sobre este tema esta mañana, nos desviamos un poco de Google sobre este tema en la marca 2:53:

Toma lo que quieras de estas citas, pero las encontré interesantes.

Discusión en el foro en Hacker News.

Actualización: Buen dato aquí:



Related Posts
Leave a Reply

Your email address will not be published.Required fields are marked *