- La Inteligencia Artificial está haciendo obsoleta la prueba de Turing, o eso parece
- Sus resultados no implican que los programas puedan pensar y razonar como humanos
- ¿Cuáles son limitaciones relacionadas con la prueba de Turing y qué pensaba él al respecto?
La Inteligencia Artificial amenaza con cambiar muchas de las cosas tal y como las conocemos en los próximos años. Sin ir demasiado lejos, la Inteligencia Artificial está haciendo obsoleta la prueba de Turing, o eso parece. ¿Existen formas de mejorar los resultados de este test? ¿Cuánto se ha avanzado en este sentido?
Primero hay que hacerse algunas preguntas que podrían considerarse obvias a esta altura, pero que no lo son:
- Si una máquina de IA iguala o supera la inteligencia humana, ¿puede simular su escritura?
- ¿Cómo podríamos identificar si se trata de Inteligencia Artificial o de inteligencia humana?
Pues bien, a partir de estas cuestiones es que un equipo de investigadores ha propuesto un marco novedoso que funciona como un estudio psicológico para analizar cómo responden estos softwares basados en IA.
Los científicos explican que las pruebas estándar para evaluar la inteligencia de una máquina, como la de Turing, pueden especificar si la máquina es buena para procesar información e imitar las respuestas humanas. Incluso, LaMDA de Google y ChatGPT de OpenAI estuvieron cerca de pasar la prueba de Turing. Pero, ¿qué significa?
No son pocos los que aseguran que los resultados de la prueba no implican que estos programas puedan pensar y razonar como humanos. Por lo tanto, se puede afirmar la eficacia de la prueba de Turing es dudosa. Debido a ello, analizan la posibilidad de dejarla de lado y adoptar nuevas pruebas ya ideadas para la IA.
¿Qué tiene de malo la prueba de Turing?
Al exponer la Inteligencia Artificial a la prueba de Turing, los evaluadores no saben si están enviándole mensajes a un ser humano, a un chatbot, etc. Si los programas de IA tienen éxito en ofrecer respuestas similares a las humanas. Es decir si los evaluadores no pueden distinguir el chatbot de otros humanos, eso podría ser una muestra de su avance. El problema es que la prueba de Turing es subjetiva. Por lo tanto, los datos que desprenden de ella también lo son.
Los investigadores argumentan que existen varias limitaciones relacionadas con la prueba de Turing.
Por ejemplo, cualquiera de los juegos jugados durante la prueba son juegos de imitación diseñados para probar si una máquina puede imitar a un humano. Los evaluadores toman decisiones basándose únicamente en el lenguaje o el tono de los mensajes que reciben. ChatGPT es excelente para imitar el lenguaje humano, incluso en respuestas en las que proporciona información incorrecta. Por lo tanto, la prueba claramente no evalúa el razonamiento humano sino la capacidad de la IA para imitar los procesos de razonamiento. Y eso es insuficiente… de momento.
Los resultados de la prueba de Turing tampoco pueden concluir si una máquina logra hacer una introspección previamente a brindar su respuesta. Y eso significa que no se puede confiar plenamente en sus datos.
Asimismo, la prueba de Turing no se detiene en el potencial para pensar de los programas basados en IA. Recientemente, ChatGPT-4 pudo convencer hasta un 40% del tiempo a los evaluadores de que estaban comunicándose con otros seres humanos. Sin embargo, eso constata ningún razonamiento humano.
Entonces, ¿son inteligentes las máquinas actuales?
Ante la evidencia de que no podemos fiarnos como antes de la prueba de Turing, vale la pena citarle una vez más. Dijo alguna vez que «una computadora merecería ser llamada inteligente si pudiera engañar a un humano haciéndole creer que es humano». Lo curioso es que los ensayos que llevan su nombre sólo cubren ciertos aspectos válidos pero no únicos de la inteligencia humana. La mayoría de los investigadores son de la idea de que los ordenadores jamás podrán alcanzar la inteligencia humana sin incluir esos otros aspectos que no evalúa la prueba de Turing.
Mustafa Suleyman, experto en inteligencia artificial y fundador de DeepAI, ya había señalado que «no está claro si pasar el test de Turing es un hito significativo o no. No nos dice nada sobre lo que un sistema puede comprender, ni sobre si ha establecido monólogos internos complejos o puede planificar en horizontes temporales abstractos, lo cual es clave para la inteligencia humana». Hasta ahora, los ensayos indican que tiene la razón.
¿Coincides en que la IA está haciendo obsoleta la prueba de Turing? ¿Cómo debe evaluarse la Inteligencia Artificial?