Si uno le pregunta a Siri o algún asistente virtual sobre el conflicto armado colombiano, es posible que su respuesta incluya fechas, actores y eventos. Puede incluso contener alguna frase sobre la necesidad de “abordar las causas subyacentes del conflicto para construir una sociedad más justa y equitativa” (así finaliza la respuesta de ChatGPT).
Pero estas respuestas están lejos de transmitir una comprensión amplia de lo que el conflicto les ha hecho a sus víctimas, la manera como ha transformado el tejido social y los impactos que a diario siguen presentando.
En el actual escenario de desarrollos tecnológicos con grandes modelos de lenguaje natural, Luis Gabriel Moreno Sandoval, profesor e investigador de la Facultad de Ingeniería y del Departamento de Ingeniería de Sistemas de la Pontificia Universidad Javeriana trabaja en una herramienta que aspira aportar a la construcción de memoria y comprensión del conflicto en nuestro país.
Un modelo basado en lenguaje
El profesor Luis Gabriel Moreno Sandoval participó en el trabajo de la Comisión de la Verdad de Colombia analizando los testimonios que víctimas del conflicto armado entregaron a esta institución. Con cientos de líneas de texto transcrito se realizó un análisis para comprender cómo las víctimas enfrentaron sus experiencias y el dolor de sus pérdidas.
Este trabajo integró conocimientos de historia, lingüística, física y ciencia de datos para tener una mirada completa de una historia difícil de contar solamente a través de datos y estadísticas, y que necesitaba también ser contada como una experiencia de país.
Producto del trabajo de la Comisión de la Verdad, se acumuló una gran cantidad de información sensible que fue clasificada como de orden privado o público y que hoy se encuentra resguardada en el Archivo General de la Nación. Fue con la información abierta al público, con la que Luis Gabriel Moreno Sandoval estuvo trabajando en sus análisis testimonios.
Cuando la comisión de la verdad cumplió su mandato en 2022, buscó una entidad legataria que pudiera custodiar y continuar el trabajo con los testimonios recuperados. La Universidad de Notre Dame, con su Instituto Kroc de Estudios Internacionales de Paz y el Instituto Lucy de investigación de datos para abordar problemas de la sociedad, fue seleccionada debido a su experiencia en procesos de paz y manejo de testimonios de comisiones de la verdad a nivel global.
En esta transición, Luis Gabriel Moreno Sandoval apoyó en la transferencia de información para asegurar que el legado de la Comisión no se perdiera y siguiera siendo fuente de análisis y reflexiones sobre los procesos de paz en el mundo. Durante esta colaboración, en el proceso de transferencia, se creó un vínculo académico entre investigadores que seguiría creciendo.
Usar la Inteligencia Artificial para construir memoria
En el contexto de la inteligencia artificial, explica el profesor Luis Gabriel Moreno Sandoval, no solo se discute qué tan buenos son los modelos que genera la industria y la academia. También se reflexiona sobre los escenarios éticos que enfrenta su adopción e implementación.
Se analizan, por ejemplo, los impactos ambientales que puede tener su uso, evaluando el consumo energético o la contaminación del agua necesaria para refrigerar los grandes servidores que soportan la operación de estas herramientas.
Es en este escenario donde el trabajo del investigador Javeriano conecta con los intereses de investigadores de la Universidad de Notre Dame y surge el equipo interdisciplinar e internacional que consigue financiar una nueva etapa de este ejercicio de investigación y de acciones relacionadas con la paz.
El premio lo otorga el laboratorio de ética tecnológica del Centro de Ética Tecnológica de Notre Dame en Estados Unidos, cuya misión es promover valores humanos en la tecnología a través de investigación aplicada sobre el tema.
El laboratorio financia propuestas de investigación sobre uso ético de modelos computacionales capaces de analizar grandes volúmenes de información. La propuesta de Luis Gabriel Moreno Sandoval y su equipo de dar un paso más en la manera de analizar los testimonios de las víctimas, logró hacerse con el reconocimiento.
El proyecto busca crear un sistema de preguntas y respuestas basado en modelos de lenguaje para procesar las entrevistas públicas de la Comisión de la verdad. Esto se logrará a partir de la creación de modelos avanzados de procesamiento de lenguaje natural (la misma base funcional de ChatGPT), que están diseñados para comprender y generar texto basado en el lenguaje humano.
A partir de un entrenamiento con una gran cantidad de información, el sistema aprende patrones y estructuras de lenguaje. En el caso de la investigación de Moreno, la información de entrenamiento serán los testimonios de las víctimas.
Este trabajo implica construir una arquitectura tecnológica adecuada para procesar los textos y asegurar la precisión y claridad de las respuestas. Esto para evitar errores o invenciones en las respuestas generadas por el sistema.
Para el investigador el funcionamiento de la futura herramienta sería similar a tener conversación con una persona que entendiera de primera mano las complejidades y la diversidad de experiencias que la historia de nuestro país ha instalado en nuestras narrativas personales.
Modelos de lenguaje para construir memoria
Las narraciones de acceso público de la Comisión son narraciones de personas que sufrieron hechos victimizantes como violaciones, masacres, maltratos y despojos. En esas narraciones, explica el profesor Luis Gabriel Moreno Sandoval, hay uno de los recursos más valiosos que generó la Comisión de la Verdad: una taxonomía de las violencias.
Esta taxonomía es una clasificación sistematizada de las violencias ocurridas en el conflicto, que las clasifica en categorías, identifica actores involucrados, proporciona información de los contextos donde ocurrieron los hechos y hace un análisis del impacto emocional de las violencias en las víctimas. La taxonomía también ofrece información sobre la manera como se expresan y se entienden estas experiencias a nivel del discurso.
A partir de esa taxonomía, construida por lingüistas, historiadores, científicos de datos y por supuesto, las víctimas que aportaron los relatos, se podrá crear un agente conversacional que permita consultar detalles específicos del conflicto.
Este proyecto no es comercial, como la mayoría de los bots y chats con los que interactuamos a diario (incluso cuando son gratuitos). Estará destinado a cualquier persona interesada en entender el conflicto armado en Colombia a través de las narraciones de las víctimas, de la riqueza emocional y subjetiva de los testimonios y de detalles precisos y contextuales sobre el conflicto.
El equipo del investigador Moreno utilizará tecnologías como motores vectoriales y modelos de lenguaje que cada día son más populares y cercanos, para aportar desde el uso de las inteligencias artificiales a la reconstrucción del tejido social.
Luis Gabriel Moreno Sandoval será uno de los invitados del próximo Café Pesquisa: Inteligencia Artificial y Medicina – Avances, Desafíos e Impacto Social. En este espacio compartiremos un café y hablaremos con expertos sobre la manera en que las inteligencias artificiales están transformando la medicina y la vida de todos. Nos vemos este jueves 30 de mayo a las 4:30 pm en el restaurante La Quiche (Cll 44 # 7-15).