13/may/2024
El 13 de mayo de 2024, OpenAI anunció el lanzamiento de su último modelo de inteligencia artificial, GPT-4o. Este nuevo modelo representa un avance significativo en la evolución de ChatGPT, ofreciendo capacidades mejoradas en texto, voz y visión, y está diseñado para ser más rápido y más natural en sus interacciones con los usuarios.
Innovaciones y Capacidades de GPT-4o
Respuestas en Tiempo Real y Traducción Instantánea
Una de las características más destacadas de GPT-4o es su capacidad para ofrecer respuestas en tiempo real, con una latencia mínima de aproximadamente 320 milisegundos, similar al tiempo de respuesta humano. Durante la presentación, dirigida por Mira Murati, directora técnica de OpenAI, se demostró cómo el nuevo modelo puede mantener conversaciones naturales sin la espera prolongada que solía ser necesaria con versiones anteriores.
Además, GPT-4o incorpora la capacidad de traducir conversaciones en tiempo real. En una demostración, Murati habló en italiano mientras otro ingeniero respondía en inglés, y GPT-4o tradujo la conversación de manera instantánea y con contexto, haciendo que la comunicación fuera fluida y comprensible.
Interacción Multimodal
GPT-4o no solo mejora las interacciones textuales y de voz, sino que también incorpora capacidades de visión. Esto permite al modelo analizar imágenes, fotos, documentos y gráficos subidos por los usuarios, manteniendo conversaciones informativas sobre ellos. Por ejemplo, durante el evento de lanzamiento, GPT-4o analizó una ecuación matemática y ofreció pistas para resolverla, demostrando su utilidad en contextos educativos y profesionales.
Nuevas Herramientas y Aplicaciones
OpenAI también presentó una nueva aplicación de escritorio para ChatGPT, disponible inicialmente para usuarios de macOS y próximamente para Windows. Esta aplicación integra las capacidades de GPT-4o, permitiendo interacciones más fluidas y accesibles directamente desde el ordenador. Con una simple combinación de teclas, los usuarios pueden iniciar una conversación con ChatGPT, discutir capturas de pantalla, y utilizar el modo de voz para interacciones más naturales.
Accesibilidad y Usabilidad Mejorada
GPT-4o estará disponible tanto para usuarios gratuitos como para suscriptores de ChatGPT Plus. Los usuarios gratuitos tendrán acceso limitado a las nuevas capacidades, mientras que los suscriptores de pago disfrutarán de un mayor número de interacciones. Esta estrategia de lanzamiento refleja el compromiso de OpenAI de hacer que la inteligencia artificial avanzada sea accesible para una audiencia más amplia.
Implicaciones y Futuro de GPT-4o
La introducción de GPT-4o marca un paso importante en la carrera por la supremacía en inteligencia artificial. Con competidores como Google y Meta desarrollando sus propios modelos avanzados, OpenAI busca mantenerse a la vanguardia ofreciendo un producto que no solo es más rápido y capaz, sino también más accesible y útil para el público general.
El CEO de OpenAI, Sam Altman, destacó la importancia de este avance, señalando que la nueva interfaz de voz y vídeo de GPT-4o ofrece una experiencia que recuerda a la inteligencia artificial de las películas, con tiempos de respuesta y niveles de expresividad que hacen que la interacción sea sorprendentemente real.
En resumen, GPT-4o representa un avance significativo en la evolución de los modelos de lenguaje de inteligencia artificial, ofreciendo una experiencia de usuario mejorada y nuevas capacidades que prometen transformar la manera en que interactuamos con la tecnología. Con su lanzamiento, OpenAI no solo eleva el estándar de lo que es posible con los chatbots, sino que también establece nuevas expectativas para el futuro de la inteligencia artificial.