La inteligencia artificial (IA) que acapara los titulares y protagoniza los anuncios que recibimos en redes sociales usualmente se refiere a desarrollos para aumentar la productividad y mejorar nuestros ingresos. Sin embargo, existen soluciones tecnológicas donde estas herramientas pueden ponerse al servicio del bienestar, el cuidado y la paz de una sociedad.
Un proyecto nacido en la Pontificia Universidad Javeriana utiliza IA para sistematizar un pasado documentado en millares de páginas y libros, más de 15.000 entrevistas y 16.000 casos e informes recopilados por la Comisión para el Esclarecimiento de la Verdad, la Convivencia y la No Repetición de Colombia. Luis Gabriel Moreno Sandoval, investigador y docente de la Facultad de Ingeniería ha querido aportar “un granito de arena” al enseñarle a una maquina a tratar con algo que le da tanto significado y sentido a nuestra narrativa como colombianos: el conflicto armado.
Moreno Sandoval compartió los aprendizajes de este proyecto en el XVIII Congreso La investigación en la Pontificia Universidad Javeriana: Investigar con esperanza para un futuro mejor. El pasado 16 de septiembre, la programación del Congreso estuvo orientada a entender la investigación ante la inteligencia artificial, sus aspectos éticos y los retos en sostenibilidad.
Un proyecto a varias manos y algoritmos
Ayudar a construir una comprensión común de lo que la Comisión de la Verdad documentó constituye un reto importante dado el volumen de información con el que se esta tratando. Al finalizar su mandato, la Comisión entregó un Informe Final dividido en 11 tomos, para cuya elaboración los comisionados y sus equipos dedicaron 23.000 horas de trabajo y analizaron 130 terabytes de información. Ahora, 11.632 páginas de documentos, entre los volúmenes del informe y entrevistas, pueden ser consultados a través de un chatbot.
Luis Gabriel Moreno Sandoval dice que, “la idea es que las personas puedan navegar fácilmente entre estos libros y estas entrevistas que la Comisión de la Verdad nos ha facilitado”, y ello requiere de un gran esfuerzo tecnológico, académico y logístico que fue posible gracias a la alianza creada entre la Javeriana y la Universidad de Notre Dame (Estados Unidos), a través de dos de sus centros de pensamiento: el Instituto Kroc, para estudios internacionales de paz, y el Instituto de la familia Lucy para datos y sociedad.
Gracias a la financiación obtenida desde la división de IA de la compañía tecnológica IBM fue posible poner en marcha el proyecto. Durante dos años, se involucró a investigadores de ambas instituciones, así como a estudiantes de maestría y doctorado, en la construcción de una herramienta de IA rigurosa y éticamente fundamentada al servicio de la memoria histórica de nuestro país.
El equipo de investigación logró crear un modelo de generación aumentada por recuperación (RAG por sus siglas en inglés), “entrenado desde cero”, explica Moreno Sandoval. Esta misma metodología es la que permite a los modelos de lenguaje grandes (LLM) acceder a fuentes de información puntuales y generar una respuesta, como ocurre con la herramienta de Google NotebookLM. La clave aquí es la recuperación, continua el profesor, no es un modelo que invente, sino que busca información en una base de datos concreta, que para el caso son los textos de la Comisión, y luego genera la respuesta basándose solo en eso.
El modelo RAG funciona en este contexto como un bibliotecario altísimamente sofisticado y riguroso que solo responde a las consultas con información disponible en su biblioteca. Esto es crucial para poder confiar en la herramienta como un medio que permita acceder a “evidencia concreta sobre investigaciones concretas”, dice Moreno, que en este caso son las que realizó la Comisión de la Verdad.
El gran reto fue conseguir la mayor precisión. Evitar las respuestas inventadas que generan los modelos de lenguaje que usamos a diario (conocidas como alucinaciones) y garantizar que, si el modelo no encuentra algo en los archivos, pueda decir “no lo sé”. Es decir, que no improvise.
Una evaluación ética para la máquina
Para asegurar la conexión entre los documentos y la interfaz del modelo, cada respuesta viene con un identificador que remite al libro o entrevista de donde proviene el texto generado. De esta manera la herramienta no se sale del contexto de los documentos de la Comisión y realmente puede ser confiable.
Al ser un tema tan complejo, fue necesario comprobar que funcionara bien en la práctica comenta Moreno Sandoval, por lo que llevaron a cabo una evaluación con un panel de expertos usando el método Delphi, que consiste en lograr un consenso de opiniones entre los participantes a través de la iteración sucesiva de las mismas preguntas. Así, expertos conocedores del tema que habían estado en la Comisión de la Verdad, en la Jurisdicción Especial para la Paz (JEP) y en otras entidades de justicia transicional, evaluaron a la máquina y le hicieron (muchas) preguntas difíciles.
Incluso, comenta el profesor Moreno Sandoval, le pidieron que adoptara roles para ver cómo respondía o le preguntaron por la naturaleza de la verdad de los archivos para ver si emitía juicios. Todo esto sirvió para calibrar las instrucciones básicas que seguirá el modelo.
Inteligencia artificial para el futuro humano
Trabajos como el de Luis Gabriel Moreno Sandoval son ejemplos de investigaciones que impactan directamente en lo humano y permiten pensar en una IA orientada al cuidado y el fortalecimiento de la autonomía de las personas. Para esto es necesario invertir en Ciencia, tecnología e innovación, comenta el profesor, y nombra el caso de Chile que está invirtiendo fuertemente en computación para desarrollar un modelo de lenguaje grande propio dentro del proyecto LatamGPT.
“Eso se llama soberanía de datos, soberanía en la inteligencia artificial”, comenta. Y explica que esta decisión para él significa “estar en la historia de la inteligencia artificial, aportando”. No obstante, Colombia está “absolutamente relegada”. Si bien Sandoval y su equipo aportaron el corpus público de su proyecto a LatamGPT para ayudar a que estos modelos entiendan mejor los matices de Colombia, como país aún no se generan esfuerzos para avanzar tecnológicamente hacia el futuro.
“Nosotros debemos ayudar a que la ciencia sea transparente, más humilde, construir sobre los avances alcanzados y no para un beneficio particular”
Luis Gabriel Moreno Sandoval
Más allá del optimismo mediático que traen estos desarrollos tecnológicos y la discusión alrededor de la soberanía de los datos, Moreno invita a pensar cómo el uso de esta herramienta puede contribuir a crear un consenso social sólido sobre el pasado, basado en hechos y testimonios documentados. No en debates e idas y vueltas de opiniones y lograr, quizás, usar ese pasado para sanar y mirar hacia adelante.
Luis Gabriel Moreno Sandoval lo explica como la posibilidad de tener un álbum de fotos familiar, pero que contenga la historia del país, poder mirarlo y aceptarlo. No quedarnos enganchados en discusiones y poder pasar página.