¡La Inteligencia Artificial ya puede razonar!

En el vertiginoso avance de la Inteligencia Artificial (IA), donde el razonamiento sigue siendo un importante desafío, Open AI ha vuelto a marcar un hito importante. El 12 de septiembre de 2024, coincidiendo con la celebración del Día del Programador, Open AI presentó su nueva serie de grandes modelos de lenguaje (LLMs por sus siglas en inglés): ChatGPT o1-preview y ChatGPT o1-mini (los modelos o1). Estos nuevos modelos fueron diseñados para simular cierta capacidad de análisis y razonamiento en la generación automática de texto. Open AI destacó en su lanzamiento que estos nuevos modelos pueden “pensar antes de responder”, una diferencia clave con respecto a sus predecesores como ChatGPT 4o. En un análisis anterior titulado “Lo que debes saber antes de usar ChatGPT”, discutimos las debilidades y fortalezas de ChatGPT 4o, señalando que una de las principales limitaciones era su tendencia a proporcionar respuestas incorrectas en situaciones que demandaban razonamiento. Con los nuevos modelos, OpenAI busca abordar directamente esta limitación, ofreciendo una experiencia más cercana al razonamiento humano. En este artículo vamos a analizar estos nuevos modelos de IA.

Para poner a prueba nuestra capacidad de análisis o razonamiento y también la de los nuevos modelos o1 de Open AI, consideremos un problema de matemáticas y lenguaje que es sencillo de comprender, pero que demanda de cierta complejidad a la hora de su resolución: la generación de palíndromos. Un palíndromo se define como una palabra o frase que se lee igual de izquierda a derecha que de derecha a izquierda. Por ejemplo, palíndromos de una sola palabra son “ANILINA” y “RECONOCER”; palíndromos de 2 palabras son “AMO ROMA” y “OJO ROJO”. En estos dos últimos casos, para leer la misma secuencia de letras, debemos ignorar los espacios en blanco que separan las palabras. Finalmente, ejemplos de palíndromos de 3 palabras son “ANULA LA LUNA” y “ATEO POCO POETA”. Como nos podemos dar cuenta, verificar que una palabra o frase sea un palíndromo es un problema sencillo; sin embargo, su generación involucra análisis y razonamiento.

Ahora te planteo el siguiente problema “Crea un palíndromo de 6 palabras en español”. Toma papel y lápiz y deja volar tu imaginación, y capacidad de análisis y razonamiento. Piénsalo bien y mide el tiempo que te demoras resolviendo este problema. Una vez que lo resuelvas, responde la siguiente pregunta ¿Cuán complicado te resultó encontrar una frase con sentido, de 6 palabras, que sea un palíndromo?

Es momento de plantear el mismo problema a ChatGPT 4o, usando como prompt la descripción del problema que definimos arriba entre comillas. El resultado que retorna es “ANITA LLEVA AVE ALLÁ LATINA”, en aproximadamente 1 segundo. La respuesta ha sido generada muy rápidamente; sin embargo, es incorrecta, pues agrupando las letras de esta frase de derecha a izquierda, la única palabra donde hay coincidencia es “ANITA”. Si le pides generar un nuevo palíndromo, lo más probable es que el resultado sea nuevamente incorrecto. Ahora intentemos lo mismo, pero con otro LLM, esta vez Claude de Anthropic. El resultado generado es “AMA LA VIDA, ADIVINA LA AMA”, en aproximadamente 2 segundos. Nuevamente, este resultado, aunque generado rápidamente, es incorrecto. Finalmente, démosle la oportunidad a Gemini, el LLM de Google. La respuesta es “A LA SEÑAL, NADA SE ALÓ”, la cual fue generada en unos 5 segundos porque, aparte de la respuesta, también se generó una explicación. Desafortunadamente, el resultado es incorrecto. Este problema generalizado se debe a que todos estos LLMs generan sus respuestas, palabra por palabra, sin analizar si el texto producido cumple con las condiciones establecidas (en este caso de ser un palíndromo). Estos modelos tampoco “razonan” sus respuestas antes de retornarlas.

Ahora le toca el turno a ChatGPT o1-preview (el modelo que simula cierta capacidad de análisis y razonamiento). Este algoritmo retorna la frase “YO DONO ORO O NO DOY”, en 30 segundos. Esta vez hubo que esperar más tiempo para obtener una respuesta. Sin embargo, esta espera valió la pena porque el resultado es correcto. Te recomiendo comparar este resultado con el que obtuviste gracias a tu capacidad intelectual. Lo más probable es que tu tiempo sea mucho mayor que el que se demoró ChatGPT o1-preview. Ahora surge la pregunta ¿cómo ChatGPT o1-preview llegó a una respuesta correcta? Desafortunadamente, para aquellos que no formamos parte del equipo de Open AI, la maquinaria algorítmica y el procedimiento usado para la implementación de los nuevos modelos o1 es confidencial. Sin embargo, sabemos que los nuevos modelos han sido desarrollados combinando aprendizaje autosupervisado, ajuste fino (fine-tuning) supervisado, aprendizaje por refuerzo, y planificación. Con esta combinación entre técnicas avanzadas de IA, mucha imaginación y creatividad por parte de los ingenieros y científicos de Open AI, gran capacidad de cómputo y enormes volúmenes de datos, hoy contamos con los primeros modelos de IA que pueden analizar y razonar, aunque todavía con una capacidad bastante limitada.

Según datos de Open AI, el modelo ChatGPT o1-preview se especializa en la resolución de problemas complejos en ciencias, matemáticas y programación, integrando un amplio conocimiento del mundo y cierta capacidad de análisis y razonamiento. En particular, este modelo exhibe un mejor desempeño que expertos humanos en la resolución de preguntas de opción múltiple, de nivel de doctorado (Ph.D.), en biología, física, y química. Por su parte, el modelo ChatGPT o1-mini ofrece un procesamiento más rápido y económico, con un enfoque más especializado en la creación y depuración de código, lo cual es útil para el desarrollo de programas computacionales. Por ahora, si deseas acceder a la funcionalidad de estos nuevos modelos de Open AI, debes pagar una suscripción para usar ChatGPT en cualquiera de los siguientes planes: plus, teams, enterprise, edu, o la API de ChatGPT. Afortunadamente, Open AI ha anunciado que eventualmente dará acceso, de forma gratuita, al modelo ChatGPT o1-mini.

Finalmente, aunque los avances realizados por Open AI para desarrollar los modelos o1 que simulan cierta capacidad de análisis y razonamiento son un paso muy importante, aún hay mucho camino por recorrer en el mundo de la IA. Estamos todavía lejos de que estas herramientas puedan realizar análisis y razonamientos profundos, interactuar de manera avanzada con nuestro entorno o plantear soluciones novedosas para una amplia gama de problemas fundamentales para la humanidad. El desafío de alcanzar una inteligencia artificial general (AGI por sus siglas en inglés) sigue siendo monumental. Lo fascinante es que apenas estamos al comienzo de esta revolución tecnológica, y el potencial de estas herramientas de IA es enorme. Sin embargo, también es crucial que los desarrolladores, reguladores y la sociedad en su conjunto guíen este progreso con responsabilidad, asegurando que la IA se convierta en una herramienta transformadora y segura para todos.