Las «alucinaciones» de la Inteligencia Artificial, que no son más que fallos comprensibles de una nueva tecnología, son también uno de sus principales problemas. Muchos expertos se preguntan si podrán los sistemas RAG solucionar los problemas de la IA respecto de sus «alucinaciones». ¿De qué se trata y cómo funcionan?
El caso es que los modelos de IA generativa van evolucionando constantemente pero, aún así, tienen ciertos fallos. Para las corporaciones que intentan integrarlos, éste es un inconveniente. No pueden confiar sus operaciones definitivamente, ya que las respuestas que proporciona la Inteligencia Artificial podrían estar erradas.
Algunos creen que los sistemas RAG serán la solución. Nosotros dudamos.
GPT-4.o, la nueva versión IA que mejora en resultados y velocidad, es la última evolución de este modelo.
¿Qué son los sistemas RAG? ¿Cómo evitarán los problemas la IA?
Según la definición del Ministerio para la Transformación Digital y de la Función Pública de España, un sistema RAG o Retrieval Augmented Generation, es «la llave que abre la puerta de la precisión a los modelos del lenguaje«.
Principalmente, RAG es «una técnica extra dentro de los marcos de trabajo de la Inteligencia Artificial, cuyo objetivo es recuperar hechos de una base de conocimientos externa para garantizar que los modelos de lenguaje devuelven información precisa y actualizada». Incluye un LLM, una base de datos y comandos o preguntas concretos.
Los sistemas RAG fueron introducidos por el científico de datos Patrick Lewis, investigador de Meta y de la University College London. Aplicando su modelo, es posible obtener respuestas basadas en documentos probablemente relevantes como páginas de Wikipedia. Para ello, realiza una búsqueda de contexto y palabras clave.
David Wadden, científico investigador de AI2, la división de investigación centrada en IA del Instituto Allen, explicó que cuando interactuamos con plataformas como ChatGPT, obtenemos respuestas basadas en su capacitación sobre datos masivos de la web. Los sistemas RAG aportan referencias para que las respuestas se basen en ellas.
¿Qué tan útiles son los sistemas RAG en este contexto?
Los sistemas RGAN han dado sobradas muestras de su utilidad, permitiendo no sólo obtener respuestas más precisas sino también eludiendo situaciones como las potenciales infracciones de derechos de autor. Por otro lado, facilita que ciertos documentos sean excluidos de las bases de datos con los que se entrenan estas inteligencias. Dicho esto, lamentablemente los sistemas RAG no pueden evitar las «alucinaciones» de esta tecnología.
Eso sí, hay escenarios en los que los sistemas RAG parecen ser más eficientes. Aparentemente, en aquellos que tratan de «conocimiento intensivo». Por ejemplo, si alguien pregunta «¿quién ganó la última edición del Super Bowl?». Como las palabras clave que incluyen la pregunta no suponen otras interpretaciones que las obvias, difícilmente obtengamos una respuesta que no se ajuste a lo que pretendemos. Veremos el nombre del actual campeón.
En realidad lo que más preocupa son las tareas de “razonamiento intensivo”, como la codificación y las matemáticas. En los casos en los que es más complicado ser directo con la consulta es cuando más hacen falta estos sistemas.
Lo que pasa es que la Inteligencia Artificial tiene la tendencia de «distraerse» con contenidos irrelevantes. Considerando las primeras pruebas con sistemas RAG, incluso, suele obviar información precisa.
El precio de la implementación, otro obstáculo
Asimismo, los especialistas advierten que la implementación de RAG no es nada económica. Su precio es elevado, ya que todos los documentos recuperados deben almacenarse en una memoria -aunque sea sólo temporalmente-.
Para una tecnología que ya es conocida por la cantidad de computación y electricidad que requiere incluso para operaciones básicas, hay que mirar con detenimiento cuáles son los potenciales de optimización de búsqueda.
¿ChatGPT no acaba de convencerte? Te enseñamos algunas de las alternativas a la IA de ChatGPT.
Los sistemas RAG pueden mejorar
Tal vez la mejor noticia sea que, si bien los sistemas RAG no pueden evitar las alucinaciones de estas tecnologías, aún queda una amplio margen de mejora que podría representar una bajada de su precio suficiente para que se analice más seriamente su adopción. Una opción interesante, como propuesta momentánea, es crear nuevos modelos que puedan decidir cuándo activar los sistemas RAG y cuándo no activarlos para ahorrar energía.
A pesar de que la Inteligencia Artificial ha evidenciado su capacidad para recuperar documentos basados en palabras clave, está debiéndonos muestras más pruebas de que puede recuperar documentos basados en conceptos más abstractos. Puede que, en no mucho tiempo, sí logremos afirmar la conveniencia de los sistemas RAG.