En la conferencia Google IO 2024, Google presentó una variedad de novedades y avances tecnológicos, abarcando desde el desarrollo de aplicaciones hasta mejoras en sus servicios principales, pero todos ellos con la potencia de sus avances en inteligencia artificial. Comencemos…
Firebase Genkit: Facilitando la integración IA en aplicaciones
Google lanzó Firebase Genkit, un marco de código abierto bajo la licencia Apache 2.0, que facilita a los desarrolladores crear aplicaciones con IA en JavaScript/TypeScript, con soporte futuro para Go. Genkit permite integrar rápidamente capacidades de inteligencia artificial en aplicaciones nuevas y existentes, usando los enfoques habituales de Firebase.
Genkit soporta casos de uso comunes de IA generativa como generación y resumen de contenido, traducción de texto y generación de imágenes. Los desarrolladores pueden implementar procesamiento de lenguaje natural (NLP) y generación de imágenes sin tener que desarrollar estas capacidades desde cero. Genkit permite probar nuevas funciones localmente antes de lanzarlas en producción, utilizando plataformas sin servidor como Cloud Functions para Firebase y Google Cloud Run.
Además, al ser de código abierto, los desarrolladores pueden ampliar Genkit según sea necesario. Actualmente, es compatible con varios proyectos de código abierto de terceros. Por ejemplo, además de los modelos de IA de Google, se pueden usar modelos abiertos a través de Ollama. También admite bases de datos vectoriales como Chrome, Pinecone y pgvector de PostgreSQL, además de Google Cloud Firestore.
El marco está diseñado para ser inclusivo de todos los modelos, almacenes de vectores, incrustadores, evaluadores y otros componentes a través de su sistema de complementos. Esto asegura que Genkit pueda adaptarse y crecer con las necesidades de los desarrolladores. Google también anunció que Project IDX, su entorno de desarrollo basado en web, ahora soporta la interfaz de usuario de Genkit lista para usar, facilitando aún más la integración de IA en las aplicaciones.
LearnLM: Modelos de IA para el aprendizaje
También se presentó en Google IO 2024 una nueva familia de modelos de IA generativa optimizados para el aprendizaje, desarrollados por DeepMind y Google Research, nos referimos a LearnLM. Estos modelos ofrecen tutorías conversacionales a los estudiantes en varios temas.
LearnLM ya se usa en productos como YouTube, Google Search, Google Classroom y las aplicaciones Gemini de Google. En Google Classroom, ayuda a los educadores a planificar lecciones y descubrir contenido mediante el análisis de datos educativos y la generación de ideas, contenido y actividades adaptadas a las necesidades de los estudiantes.
También está detrás de la nueva función Circle to Search en Android, que ayuda a resolver problemas matemáticos y físicos dibujando un círculo alrededor de una fórmula o diagrama para obtener explicaciones detalladas y pasos para resolver el problema. En YouTube, permite hacer preguntas y realizar cuestionarios basados en los videos educativos.
En el futuro, LearnLM permitirá a los usuarios crear chatbots personalizados que actúan como expertos en la materia, proporcionando orientación para el estudio y actividades prácticas adaptadas a las preferencias de cada alumno. Google planea asociarse con instituciones educativas como Columbia Teachers College, Arizona State University, NYU Tisch y Khan Academy para explorar su uso más allá de los productos de Google.
Gemma 2 y PaliGemma: Avances en modelos de IA generativa
Gemma 2, un modelo con 27 mil millones de parámetros, optimizado para ejecutarse en las GPU de Nvidia, un solo host Google Cloud TPU y el servicio administrado Vertex AI. Esto permite a los desarrolladores aprovechar al máximo los recursos computacionales para entrenar y desplegar modelos de IA.
Además, presentaron PaliGemma, una variante para subtitulación de imágenes, etiquetado de imágenes y preguntas y respuestas visuales. Este modelo es útil para aplicaciones que requieren análisis y generación de contenido visual, mejorando la precisión y coherencia de las respuestas generadas.
Novedades en Google Play y Android
En el ámbito de Android y Google Play, en Google IO 2024 se presentaron varias mejoras, incluyendo Engage SDK, que permite a los desarrolladores mostrar contenido personalizado y promociones a los usuarios en una experiencia inmersiva de pantalla completa. También actualizaron el programa de recompensas Play Points y expandieron Google Play Games para PC a más de 140 mercados, con un catálogo de más de 3000 títulos.
La consola SDK de Google Play ahora está abierta a todos los creadores de SDK, mejorando la comunicación y resolución de problemas entre desarrolladores y propietarios de SDK. La API Play Integrity también se actualizó para incluir características como el riesgo de acceso a aplicaciones y el veredicto de Play Protect.
Gemini y la integración de IA en servicios de Google
La familia de modelos de IA generativa Gemini recibió varias actualizaciones, destacando Gemini 1.5 Pro, que puede aceptar hasta 2 millones de tokens para el análisis de documentos, vídeos y audios extensos. Para aplicaciones que requieren alta frecuencia y eficiencia, lanzaron Gemini 1.5 Flash, una versión más pequeña y rápida del modelo principal. También presentaron Gemini Live, una nueva experiencia de chat de voz interactivo.
Avances en Google Photos y Gmail
Google Photos recibió la función experimental Ask Photos, que permite buscar en la colección de fotos utilizando consultas en lenguaje natural. En Gmail, la integración de Gemini permite buscar, resumir y redactar correos electrónicos de manera más eficiente.
IA en búsqueda y navegadores
Google está integrando inteligencia artificial en su motor de búsqueda para mejorar la experiencia del usuario, ofreciendo resúmenes más útiles para consultas complejas. En los navegadores, introdujeron Gemini Nano, la versión más pequeña del modelo de IA, integrada en Chrome para potenciar funciones como la traducción, subtitulado y transcripción de texto.
Project IDX y nuevas herramientas para desarrolladores
Project IDX, el entorno de desarrollo basado en navegador de Google, está en beta abierta, facilitando la creación de aplicaciones habilitadas para IA. IDX se integra con herramientas como Google Maps Platform, Chrome Dev Tools y Lighthouse.
Veo: Generación de vídeo por IA
Google presentó Veo, un modelo de IA que genera videoclips de 1080p de aproximadamente un minuto de duración a partir de indicaciones de texto. Veo puede capturar diferentes estilos visuales y cinematográficos, realizando ediciones y ajustes al metraje generado.
TPU Trillium: La próxima generación de chips IA
Por último, en Google IO 2024 se anunció la sexta generación de sus Unidades de Procesamiento Tensor (TPU), llamadas Trillium, ofreciendo un rendimiento 4,7 veces superior a la generación anterior y un 67% más de eficiencia energética, asegurando infraestructura de alto rendimiento para el entrenamiento y despliegue de modelos de IA.