OpenAI, la empresa de investigación en inteligencia artificial, acaba de presentar el GPT-4o, la cual podrá hablar contigo con un tiempo de 320 milisegundos, contestando con naturalidad en tiempo real e incluso hasta leer las expresiones de una persona
Otra de sus mejores es que tendrá capacidad multimodal, para que pueda procesar y generar información a partir de diferentes formatos, como texto, imágenes, audio y vídeo.
Podrá describir imágenes y vídeos, lo que lo hace ideal para aplicaciones como la accesibilidad o la generación de subtítulos, también creará historias a partir de imágenes. Responder preguntas sobre vídeos: puede ver y comprender vídeos para responder preguntas sobre su contenido, lo que lo convierte en una herramienta útil para la investigación y la educación.
Dicha actualización tendrá la capacidad de aprender de conversaciones anteriores y usar esa información para mejorar sus respuestas en el futuro.