La búsqueda por voz de Google ahora utiliza la función de recuperación de voz (S2R)

Google ha actualizado sus modelos de búsqueda por voz para que funcionen con Speech-to-Retrieval (S2R). Google dijo que esto le permite «obtener respuestas directamente de su consulta hablada sin tener que convertirla primero a texto, lo que resulta en una búsqueda más rápida y confiable para todos».

Inicialmente, Google utilizó una solución de búsqueda por voz llamada reconocimiento automático de voz (ASR) para convertir la entrada de voz en una consulta de texto y luego buscó documentos que coincidieran con esa consulta de texto. Google dijo que esto era «un desafío con este enfoque de modelado en cascada es que cualquier pequeño error en la fase de reconocimiento de voz puede alterar significativamente el significado de la consulta, produciendo resultados incorrectos».

Speech-to-Retrieval (S2R) resolvió este problema. Google dijo: «En esencia, S2R es una tecnología que interpreta y recupera directamente información de una consulta hablada sin el paso intermedio, y potencialmente defectuoso, de tener que crear una transcripción de texto perfecta. Representa un cambio arquitectónico y filosófico fundamental en cómo las máquinas procesan el habla humana».

Esto se publicó en el blog de Google Research, pero se está utilizando ahora, en el mundo real. Google escribió: «El paso a la búsqueda por voz impulsada por S2R no es un ejercicio teórico; es una realidad viva. En una estrecha colaboración entre Google Research y Search, estos modelos avanzados ahora prestan servicio a los usuarios en varios idiomas, lo que ofrece un salto significativo en precisión más allá de los sistemas en cascada convencionales».

Un consejo para Gagan:

🆕 Gran actualización para la búsqueda por voz -> ahora funciona con el motor de recuperación de voz y este nuevo proceso no convierte la voz en una transcripción de texto y luego realiza una búsqueda en la web, sino que esta nueva técnica utiliza un codificador de audio para convertir el sonido en incrustaciones de audio que luego se utiliza para… pic.twitter.com/bCGwIfKNEh

– Gagan Ghotra (@gaganghotra_) 8 de octubre de 2025