OpenAI lanzó el lunes un nuevo modelo de IA y una versión de escritorio de ChatGPT, junto con una interfaz de usuario actualizada, el último esfuerzo de la compañía para ampliar el uso de su popular chatbot.
La actualización lleva GPT-4 a todos, incluidos los usuarios gratuitos de OpenAI, dijo la jefa de tecnología Mira Murati en un evento transmitido en vivo. Añadió que el nuevo modelo, GPT-4o, es “mucho más rápido” y tiene capacidades mejoradas en texto, vídeo y audio. OpenAI dijo que eventualmente planea permitir a los usuarios chatear por video con ChatGPT.
“Esta es la primera vez que realmente estamos dando un gran paso adelante en lo que respecta a la facilidad de uso”, afirmó Murati. El máximo ejecutivo de OpenAI, Sam Altm14an, destacó en X que ChatGPT-4o es «el mejor modelo hasta la fecha», «multimodal» y disponible para todos los usuarios, incluidos los del plan gratuito.
OpenAI, respaldado por Microsoft, ha sido valorada en más de 80 mil millones de dólares por los inversores. La compañía, fundada en 2015, está bajo presión para mantenerse en la cima del mercado de IA generativa mientras encuentra formas de ganar dinero mientras gasta enormes sumas de dinero en procesadores e infraestructura para construir y entrenar sus modelos.
La o en GPT-4o significa omni. El nuevo modelo permite a ChatGPT manejar 50 idiomas diferentes con velocidad y calidad mejoradas, y también estará disponible a través de la API de OpenAI, lo que permitirá a los desarrolladores comenzar a crear aplicaciones utilizando el nuevo modelo hoy, dijo Murati.
Agregó que el GPT-4o es dos veces más rápido que el GPT-4 Turbo y la mitad del costo.
Los miembros del equipo de OpenAI demostraron las capacidades de audio del nuevo modelo, por ejemplo, pidiéndole que ayudara a calmar a alguien antes de un discurso público. El investigador de OpenAI, Mark Chen, dijo que el modelo es capaz de “percibir su emoción”, y agregó que el modelo también puede manejar que los usuarios lo interrumpan. El equipo también le pidió que analizara la expresión facial de un usuario para comentar las emociones que la persona podría estar experimentando.
“Hola, ¿qué pasa? ¿Cómo puedo alegrarte el día hoy?” El modo de audio de ChatGPT decía cuando un usuario lo saludaba.
La compañía planea probar el modo de voz en las próximas semanas, con acceso temprano para suscriptores pagos a ChatGPT Plus, según una publicación de blog. OpenAI también dijo que el nuevo modelo puede responder a las indicaciones de audio de los usuarios “en tan solo 232 milisegundos, con un promedio de 320 milisegundos, que es similar al tiempo de respuesta humana en una conversación”.
Chen demostró la capacidad del modelo para contar un cuento antes de dormir y le pidió que cambiara el tono de su voz para que fuera más dramático o robótico. Incluso le pidió que cantara la historia.
Además, el nuevo modelo de OpenAI puede funcionar como traductor, incluso en modo audio, afirmó la compañía. Chen demostró la capacidad de la herramienta para escuchar a Murati hablar italiano mientras él hablaba inglés y traducir a sus respectivos idiomas mientras conversaban.
Los miembros del equipo también demostraron la capacidad del modelo para resolver ecuaciones matemáticas y ayudar a escribir código, posicionándolo como un competidor más fuerte del GitHub Copilot de Microsoft.
Para OpenAI, el lanzamiento fue uno de los anuncios más importantes de la compañía desde el lanzamiento en agosto de ChatGPT Enterprise, el nivel empresarial del chatbot de IA. Esa herramienta estuvo en desarrollo durante “menos de un año” y contó con la ayuda de más de 20 empresas de diferentes tamaños e industrias, dijo a CNBC en ese momento el director de operaciones de OpenAI, Brad Lightcap.
OpenAI, Microsoft y Googleestán a la cabeza de una fiebre del oro generativa de la IA a medida que empresas de aparentemente todos los sectores compiten por agregar chatbots y agentes impulsados por IA a servicios clave para evitar quedarse atrás por parte de los competidores. A principios de este mes, Anthropic, rival de OpenAI, anunció su primera oferta empresarial y una aplicación gratuita para iPhone.
Según PitchBook, se invirtió una cifra récord de 29.100 millones de dólares en casi 700 acuerdos de IA generativa en 2023, un aumento de más del 260% con respecto al año anterior. Se prevé que el mercado superará el billón de dólares en ingresos en una década.
Algunos en la industria han expresado su preocupación por la velocidad a la que nuevos servicios no probados están llegando al mercado, y académicos y especialistas en ética están preocupados por la tendencia de la tecnología a propagar sesgos.
Después del lanzamiento de ChatGPT en noviembre de 2022, batió récords en ese momento como la aplicación para consumidores de más rápido crecimiento en la historia y ahora tiene alrededor de 100 millones de usuarios activos semanales. OpenAI dice que más del 92% de las empresas Fortune 500 están utilizando la plataforma.
Murati dijo durante el evento del lunes que OpenAI quiere “eliminar parte del misticismo de la tecnología”.
“Durante las próximas semanas, implementaremos estas capacidades para todos”, dijo.
El nuevo modelo se lanzará primero el martes para los clientes de ChatGPT Plus y Team, y luego para Enterprise, según una publicación de blog del lunes. También estará disponible para los usuarios gratuitos de ChatGPT a partir del lunes, con límites de uso. Los usuarios de ChatGPT Plus tendrán cinco veces más capacidad de mensajes que los usuarios gratuitos, y los clientes de ChatGPT Team y Enterprise tendrán límites de uso aún mayores.
Murati concluyó el evento transmitido en vivo agradeciendo al CEO de Nvidia, Jensen Huang, y a su compañía por proporcionar las unidades de procesamiento de gráficos (GPU) necesarias para impulsar la tecnología OpenAI.
“Sólo quiero agradecer al increíble equipo de OpenAI, y también gracias a Jensen y al equipo de Nvidia por traernos las GPU más avanzadas para hacer posible esta demostración hoy”, dijo.
REPOSTEADO DE LA CNBC