Algunos dicen que GPT-4 es «del siguiente nivel» y disruptivo, pero ¿cuál será la realidad?
El CEO Sam Altman responde preguntas sobre el GPT-4 y el futuro de la IA.
¿Indicios de que GPT-4 será una IA multimodal?
En una entrevista de podcast (AI for the Next Era) del 13 de septiembre de 2022, el director ejecutivo de OpenAI, Sam Altman, habló sobre el futuro cercano de la tecnología de IA.
De particular interés es que dijo que un modelo multimodal estaba en un futuro próximo.
Multimodal significa la capacidad de funcionar en múltiples modos, como texto, imágenes y sonidos.
OpenAI interactúa con humanos a través de entradas de texto. Ya sea Dall-E o ChatGPT, es estrictamente una interacción textual.
Una IA con capacidades multimodales puede interactuar a través del habla. Puede escuchar comandos y proporcionar información o realizar una tarea.
Altman ofreció estos detalles tentadores sobre qué esperar pronto:
“Creo que obtendremos modelos multimodales en no mucho más, y eso abrirá cosas nuevas.
Creo que la gente está haciendo un trabajo increíble con agentes que pueden usar computadoras para hacer cosas por ti, usar programas y esta idea de una interfaz de lenguaje donde dices un lenguaje natural: lo que quieres en este tipo de diálogo de ida y vuelta.
Puede iterarlo y refinarlo, y la computadora lo hace por usted.
Ves algo de esto con DALL-E y CoPilot en formas muy tempranas”.
Altman no dijo específicamente que GPT-4 será multimodal. Pero sí insinuó que llegaría dentro de un corto período de tiempo.
De particular interés es que visualiza la IA multimodal como una plataforma para construir nuevos modelos de negocios que no son posibles hoy en día.
Comparó la IA multimodal con la plataforma móvil y cómo eso abrió oportunidades para miles de nuevas empresas y empleos.
altman dijo:
“…Creo que esto va a ser una tendencia masiva, y se construirán empresas muy grandes con esto como interfaz, y más en general [I think] que estos modelos tan potentes serán una de las nuevas plataformas tecnológicas genuinas, que realmente no hemos tenido desde el móvil.
Y siempre hay una explosión de nuevas empresas justo después, así que será genial”.
Cuando se le preguntó cuál era la próxima etapa de evolución de la IA, respondió con lo que dijo que eran características que eran una certeza.
“Creo que conseguiremos que funcionen verdaderos modelos multimodales.
Y, por lo tanto, no solo el texto y las imágenes, sino todas las modalidades que tiene en un modelo, pueden moverse con facilidad y fluidez entre las cosas”.
¿Modelos de IA que mejoran a sí mismos?
Algo de lo que no se habla mucho es que los investigadores de IA quieren crear una IA que pueda aprender por sí misma.
Esta habilidad va más allá de entender espontáneamente cómo hacer cosas como traducir entre idiomas.
La capacidad espontánea de hacer cosas se llama emergencia. Es cuando surgen nuevas habilidades al aumentar la cantidad de datos de entrenamiento.
Pero una IA que aprende por sí misma es algo completamente diferente que no depende de cuán grandes sean los datos de entrenamiento.
Lo que Altman describió es una IA que realmente aprende y actualiza sus habilidades por sí misma.
Además, este tipo de IA va más allá del paradigma de versión que sigue tradicionalmente el software, en el que una empresa lanza la versión 3, la versión 3.5, etc.
Él imagina un modelo de IA que se entrena y luego aprende por sí solo, creciendo por sí mismo hasta convertirse en una versión mejorada.
Altman no indicó que GPT-4 tendrá esta capacidad.
Simplemente puso esto como algo a lo que apuntan, aparentemente algo que está dentro del ámbito de la posibilidad clara.
Explicó una IA con la capacidad de autoaprendizaje:
“Creo que tendremos modelos que aprenden continuamente.
Entonces, en este momento, si usa GPT lo que sea, está atascado en el tiempo en que fue entrenado. Y cuanto más lo usas, no mejora nada y todo eso.
Creo que cambiaremos eso.
Así que estoy muy emocionado por todo eso”.
No está claro si Altman estaba hablando de Inteligencia General Artificial (AGI), pero parece que sí.
Altman desacreditó recientemente la idea de que OpenAI tiene un AGI, que se cita más adelante en este artículo.
El entrevistador le pidió a Altman que explicara cómo todas las ideas de las que estaba hablando eran objetivos reales y escenarios plausibles y no solo opiniones de lo que le gustaría que hiciera OpenAI.
El entrevistador preguntó:
“Entonces, creo que sería útil compartir una cosa: porque la gente no se da cuenta de que en realidad estás haciendo estas predicciones sólidas desde un punto de vista bastante crítico, no solo ‘Podemos tomar esa colina’ …»
Altman explicó que todas estas cosas de las que habla son predicciones basadas en investigaciones que les permiten establecer un camino viable para elegir con confianza el próximo gran proyecto.
El compartió,
«Nos gusta hacer predicciones en las que podemos estar en la frontera, comprender de manera predecible cómo se ven las leyes de escala (o ya hemos realizado la investigación) donde podemos decir: ‘Está bien, esto nuevo va a funcionar y hacer predicciones. de esa manera.’
Y así es como tratamos de ejecutar OpenAI, que es hacer lo siguiente que tenemos por delante cuando tenemos mucha confianza y tomamos el 10 % de la empresa para salir y explorar por completo, lo que ha llevado a grandes ganancias”.
¿Puede OpenAI alcanzar nuevos hitos con GPT-4?
Una de las cosas necesarias para impulsar OpenAI es dinero y cantidades masivas de recursos informáticos.
Microsoft ya ha invertido tres mil millones de dólares en OpenAI y, según el New York Times, está en conversaciones para invertir $10 mil millones adicionales.
The New York Times informó que se espera que GPT-4 se lance en el primer trimestre de 2023.
Se insinuó que GPT-4 podría tener capacidades multimodales, citando a un capitalista de riesgo Matt McIlwain que tiene conocimiento de GPT-4.
El Times informó:
“OpenAI está trabajando en un sistema aún más poderoso llamado GPT-4, que podría lanzarse tan pronto como este trimestre, según el Sr. McIlwain y otras cuatro personas con conocimiento del esfuerzo.
…Construido utilizando la enorme red de Microsoft para centros de datos informáticos, el nuevo chatbot podría ser un sistema muy parecido a ChatGPT que únicamente genera texto. O podría hacer malabarismos con imágenes y texto.
Algunos capitalistas de riesgo y empleados de Microsoft ya han visto el servicio en acción.
Pero OpenAI aún no ha determinado si el nuevo sistema se lanzará con capacidades que involucran imágenes”.
El dinero sigue a OpenAI
Si bien OpenAI no ha compartido detalles con el público, ha estado compartiendo detalles con la comunidad de financiación de empresas.
Actualmente se encuentra en conversaciones que valuarían a la compañía en $ 29 mil millones.
Ese es un logro notable porque OpenAI actualmente no está obteniendo ingresos significativos, y el clima económico actual ha obligado a bajar las valoraciones de muchas empresas de tecnología.
El observador informó:
“Las firmas de capital de riesgo Thrive Capital y Founders Fund se encuentran entre los inversores interesados en comprar un total de $ 300 millones en acciones de OpenAI, informó el Journal. El acuerdo está estructurado como una oferta pública de adquisición, en la que los inversores compran acciones de los accionistas existentes, incluidos los empleados”.
La alta valoración de OpenAI puede verse como una validación del futuro de la tecnología, y ese futuro es actualmente GPT-4.
Sam Altman responde preguntas sobre GPT-4
Sam Altman fue entrevistado recientemente para el programa StrictlyVC, donde confirma que OpenAI está trabajando en un modelo de video, que suena increíble pero que también podría generar resultados negativos graves.
Si bien no se dijo que la parte del video fuera un componente de GPT-4, lo que fue de interés y posiblemente relacionado, es que Altman enfatizó que OpenAI no lanzaría GPT-4 hasta que estuvieran seguros de que era seguro.
La parte relevante de la entrevista ocurre en el minuto 4:37:
El entrevistador preguntó:
«¿Puede comentar si GPT-4 saldrá en el primer trimestre, la primera mitad del año?»
Sam Altman respondió:
“Saldrá en algún momento cuando estemos seguros de que podemos hacerlo de manera segura y responsable.
Creo que, en general, vamos a lanzar tecnología mucho más lentamente de lo que a la gente le gustaría.
Nos vamos a sentar mucho más de lo que a la gente le gustaría.
Y eventualmente la gente estará feliz con nuestro enfoque de esto.
Pero en ese momento me di cuenta de que la gente quiere el juguete brillante y es frustrante y lo entiendo totalmente”.
Twitter está lleno de rumores que son difíciles de confirmar. Un rumor no confirmado es que tendrá 100 billones de parámetros (en comparación con los 175 mil millones de parámetros de GPT-3).
Ese rumor fue desacreditado por Sam Altman en el programa de entrevistas StrictlyVC, donde también dijo que OpenAI no tiene Inteligencia General Artificial (AGI), que es la capacidad de aprender todo lo que un ser humano puede.
Altman comentó:
“Lo vi en Twitter. Es completo b——t.
La fábrica de rumores de GPT es como una cosa ridícula.
…La gente está rogando por estar decepcionada y lo estará.
…No tenemos un AGI real y creo que eso es lo que se espera de nosotros y ya sabes, sí… vamos a decepcionar a esa gente. “
Muchos rumores, pocos hechos
Los dos hechos sobre GPT-4 que son confiables son que OpenAI ha sido críptico sobre GPT-4 hasta el punto de que el público no sabe prácticamente nada, y el otro es que OpenAI no lanzará un producto hasta que sepa que es seguro.
Entonces, en este punto, es difícil decir con certeza cómo se verá GPT-4 y de qué será capaz.
Pero un tweet del escritor de tecnología Robert Scoble afirma que será el siguiente nivel y una interrupción.
Vienen varios que cambiarán por completo el juego. GPT-4 es el siguiente nivel, escuché, por ejemplo.
Se avecina una revolución en la IA.
— Robert Scoble (@Scobleizer) 8 de noviembre de 2022
Se acerca la disrupción.
GPT-4 es mejor de lo que nadie espera.
Y es una de varias IA de este tipo que se enviarán el próximo año.
— Robert Scoble (@Scobleizer) 8 de noviembre de 2022
Sin embargo, Sam Altman ha advertido que no se deben establecer expectativas demasiado altas.
Más recursos:
Imagen destacada: salarko/Shutterstock