A pesar de algunos tropiezos iniciales con Bard, su primer intento en IA conversacional, Google aumentó sus esfuerzos y nos presentó Gemini prometiéndolo «el modelo más sofisticado y versátil hasta la fecha». Con la mirada puesta en la expansión y el lanzamiento de una aplicación para Android, Gemini está listo para convertirse en el corazón palpitante de la IA de Google.
Google Gemini brilla con luz propia ✨
La transición de Bard a Gemini no es solo un cambio de nombre. Con el lanzamiento de una «aplicación Gemini» para Android posiblemente para el 7 de febrero, según los rumores, Google también busca ponerse a la par o incluso adelantar a competidores como ChatGPT.
Obviamente, va a tener que lidiar con tediosos retos regulatorios, sobre todo en Europa, Hispanoamérica y Reino Unido. Por ello, su lanzamiento estará limitado inicialmente a Estados Unidos, Corea y Japón.
Según el documento de los rumores, tendrá una suscripción de pago llamada Gemini Advanced con la que ofrecerá a los usuarios acceso al modelo Ultra 1.0 de Gemini, que es «mucho más capaz en tareas altamente complejas como codificación, razonamiento lógico, seguimiento de instrucciones matizadas y colaboración creativa».
Además de la aplicación Gemini, la IA se integrará completamente en Gmail, Maps y YouTube, ofreciendo una experiencia de usuario rica, personalizada y, sobre todo, intuitiva.
Nombrando la última actualización de Bard, el 1 de febrero, ya añadía un montón de nuevas funciones, una de ellas la habilidad de crear imágenes solo con describirlas con palabras.
Con el creador de imágenes puedes escribirle un mini cuento y él te lo ilustrará. Google dice que estas imágenes son de lo mejor: claras, amplias y casi como fotos reales, pero con marca de agua.
Actualización: 16 de febrero 2024
Llega Gemini 1.5 Pro
Google lanza Gemini 1.5 Pro apenas 10 días después de presentar al mundo Gemini 1.0 Ultra. Gemini 1.5 Pro ofrece un «rendimiento dramáticamente mejorado«. A continuación, se detallan las novedades de Gemini 1.5 Pro:
- Gemini 1.5 Pro iguala los resultados de Gemini 1.0 Ultra pero con mayor eficiencia y requisitos computacionales reducidos.
- Incluye el procesamiento avanzado de texto, imágenes, vídeos, audio y código.
- Capaz de manejar hasta un millón de tokens, lo que equivale a más de 700000 palabras, una hora de vídeo, 11 horas de audio y bases de código de más de 30000 líneas. Además, ha sido probado con éxito en versiones que soportan hasta 10 millones de tokens.
- Mantiene alta precisión en consultas con grandes recuentos de tokens, incluso con nuevos datos para aprender.
- Puede razonar sobre detalles complejos, como las transcripciones de la misión lunar Apolo 11 o analizar películas mudas.
- Lanzamiento inicial con capacidad de 128000 tokens, con planes de expandir hasta un millón de consultas de tokens.
- Gemini 1.5 Pro aprende nuevas habilidades a partir de información en indicaciones largas, demostrado en la Traducción automática de One Book.
- Mejora en la realización de tareas de resolución de problemas en bloques de código largos.
- Mantiene el enfoque de implementación responsable, incluyendo el desarrollo de técnicas de formación de equipos rojos para evaluar una variedad de daños potenciales.
Imagen destacada: Juan José Leiva – generada con IA