Imagínate un asistente virtual que además de escucharte con atención, también observa lo que ocurre a tu alrededor. Eso es lo que insinúa el futuro del modo de voz avanzado de ChatGPT, según un código descubierto en la versión beta v1.2024.317.
Aunque OpenAI no ha anunciado oficialmente esta evolución, la función llamada «cámara en vivo» parece estar cada vez más cerca de salir a la luz.
De las palabras a la mirada
El viaje de este modo comenzó en mayo, cuando OpenAI deslumbró con una demostración de sus capacidades visuales. Durante la presentación, ChatGPT pudo identificar un perro a través de la cámara del móvil y reconocer otros detalles cuál era la pelota del animal y qué interacción tiene con ella.
En esa misma versión alfa, el usuario Manuel Sainsily jugueteó con estas posibilidades, usando la función para responder preguntas sobre su gatito con la ayuda de señales visuales en tiempo real.
Pero no todo se quedó en la vista. En septiembre, con la llegada de la versión beta, trajo consigo conversaciones fluidas y naturales, donde incluso las emociones de los usuarios no pasaban desapercibidas. Aunque en esta fase inicial las cámaras seguían fuera del juego, el entusiasmo de quienes probaron sus capacidades vocales rompió límites.
Un paso por delante de la competencia
Mientras gigantes tecnológicos como Google y Meta presentan sus propios avances en interacción conversacional, el modo de voz avanzado de ChatGPT parece tomar la delantera. Gemini Live de Google, capaz de hablar más de 40 idiomas, aún no cuenta con visión. Lo mismo ocurre con las herramientas de Meta, presentadas en el evento Connect 2024, que aunque prometen una interacción fluida, carecen de inputs visuales.
De lo móvil al escritorio
Al mismo tiempo, OpenAI ha anunciado la disponibilidad del modo de voz avanzado para las versiones de escritorio de ChatGPT Plus, tanto para Mac como para PC.
Hasta ahora exclusivo para dispositivos móviles, esta expansión amplía las posibilidades de interacción, permitiendo a los usuarios disfrutar de conversaciones más dinámicas directamente desde sus ordenadores.
Con cada actualización, el horizonte de ChatGPT se expande. ¿Estamos a las puertas de una nueva ola de inteligencia artificial conversacional? Todo apunta a que pronto hablaremos de lo que mira ChatGPT.