En cualquier grupo de amigos se encuentra quien tiene la risa contagiosa, aquella persona carismática que fácilmente convierte una situación en algo divertido y transmite su emoción al grupo que termina riendo también. Este fenómeno emocional también ocurre en el mundo digital cuando comenzamos a interactuar e intercambiar información con usuarios que piensan parecido a nosotros.
La necesidad de agruparnos —conocida como homofilia— nos permite acercarnos, reconocernos en lo que se parece a nosotros y hace que nos comportemos de cierta forma. De manera similar ocurre en lo digital, lo que buscamos y lo que vemos nos va haciendo parte de comunidades, unas más pequeñas que otras y que integran en su conjunto un escenario social. En este contexto no existen las barreras físicas ni las reglas implícitas de las interacciones frente a frente, por lo que cruzar límites de lo que se considera aceptable es más fácil y comprender tonos o gestos, que en lo físico facilitan las interacciones, en lo digital se queda corto. Es insuficiente.
Luis Gabriel Moreno Sandoval, docente de ingeniería industrial y candidato a Doctor en Ingeniería en la Pontificia Universidad Javeriana se interesa por este universo de interacciones sociales en lo digital. La importancia de su trabajo radica en la posibilidad de entender en el lenguaje escrito, las emociones y las intenciones que acompañan nuestro lenguaje verbal y que pueden llegar a ser difíciles de transmitir e interpretar en un texto.
¿Cuántas veces nos ha ocurrido que un mensaje mal interpretado tuvo una reacción inesperada? O, ¿cuántas veces hemos renunciado a interactuar con los asistentes virtuales —chatbots— y preferimos hablar con el operador? El lenguaje ya es un campo de estudio inmenso y Moreno, con su apuesta, no solo trata de comprender el lenguaje en entornos digitales en español, sino en español colombiano.
El trabajo de Luis Gabriel Moreno Sandoval se centra en la ciencia de datos, una disciplina reciente que busca hacer que las máquinas comprendan aspectos de la realidad, como el lenguaje.
Moreno se encuentra vinculado como investigador en la alianza CAOBA, un centro de excelencia y apropiación que apoya el uso de las tecnologías de Big Data y Data Analytics. Esta alianza está constituida por diferentes empresas y universidades y su ejecutor es la Pontificia Universidad Javeriana. Desde este grupo se avanza en el estudio de textos en plataformas digitales a partir de la creación de programas de computador que logran analizar grandes cantidades de información en poco tiempo.
Un reto de magnitudes difíciles de imaginar
Cuando pensamos en el número de amigos que tenemos en lo “físico”, podemos hacer cuentas —con esfuerzo— de veinte o treinta personas, mientras que en Facebook es fácil llegar a los mil contactos. En lo físico no es posible escuchar con atención a mil personas y esto genera retos diferentes a la hora de identificar las emociones en el lenguaje que transita por plataformas digitales.
Cuando se habla con alguien en lo físico hay claves corporales y gestuales -muecas de asco o asentimientos- que acompañan el mensaje. Pero en lo digital debemos acudir a otros recursos para transmitir el mismo mensaje, por ejemplo, el uso de emoticones, caracteres y numerales para señalar la intencionalidad de los mensajes.
¿Cómo analizar los emojis y otros recursos para entender la intención detrás de los mensajes? Para eso Gabriel Moreno usa conceptos de disciplinas académicas que se integran al mundo digital, entre ellas, la lingüística y la sociología computacional. La primera analiza la manera en que expresamos ideas y emociones subjetivas —de forma individual—; y la segunda estudia cómo establecemos vínculos y cómo nos vuelven parte de un grupo o de una comunidad.
Gracias a estas herramientas el investigador entiende lo digital como una réplica de la vida real, de los roles que juegan ciertos actores respecto a un tema y sus implicaciones en la comunicación. Gracias a los computadores y su capacidad de procesamiento, se puede considerar un panorama con miles de millones de voces hablando -o escribiendo- al mismo tiempo.
Las redes de interacción en el mundo digital
Durante la crisis de reputación que tuvo Hidroituango hace unos años, muchas personas hablaron sobre el tema en plataformas digitales. Este caso permitió demostrar uno de los postulados del profesor Moreno: es posible analizar la subjetividad colectiva y detallar en ella los roles y organizaciones que se establecen alrededor de un tema de interés.
Tomando datos de redes sociales, específicamente de comentarios y publicaciones realizadas en la plataforma Twitter, los investigadores diseñaron programas de computador que les permitió entender cómo se estaban dando las interacciones y la importancia de algunos actores frente a lo que estaba sucediendo con la reputación de la empresa. Los investigadores calcularon las valoraciones positivas y negativas presentes en los comentarios. Esto se conoce como polaridad, un indicador de cómo se organiza la subjetividad, los pensamientos y emociones del grupo que se está estudiando.
Pero estos escenarios cambian todo el tiempo, al igual que las personas. Quienes hoy pertenecen al grupo de los solteros y mañana al grupo de los padres que trabajan, transforman sus temas de interés. De la misma forma, la investigación del profesor Gabriel Moreno busca entender la manera en que emergen, se construyen y desaparecen estas redes de interacción en el mundo digital.
Esta configuración de redes de interacción permite a los investigadores entender la manera en que se agrupan las personas en entornos digitales y, a partir de ahí, construir análisis que infieran desde temas de interés, opiniones y posturas, hasta el clima emocional de los grupos. La forma de estudiar estas características en los grupos es a partir del análisis de textos que compartimos en una plataforma digital como Twitter o de los comentarios que acompañan nuestras reacciones a las intervenciones de otras personas.
Aprendizaje de las máquinas
Para crear un programa de computador capaz de evaluar la polaridad de un comentario en Twitter es necesario “enseñarle” a la máquina a “entender” los sentimientos en un texto. Primero, hay que encontrar una forma de hacer compatible el lenguaje de las máquinas con el humano. Esto se logra mediante el lenguaje de programación, una suerte de idioma intermedio que utilizan los programadores para establecer un canal de intercambio de información con la máquina.
El segundo paso es ingresar información del lenguaje escrito y, en el caso del profesor Moreno, enseñarle al computador español colombiano, a esto se le llama entrenamiento. “Uno escribe un programa para que ella (la máquina) logre entenderlo y para ello se utilizan algoritmos matemáticos y estadísticos”, para interpretar lo que significan los textos escritos, explica Moreno.
Enseñarle a la máquina español colombiano implica, por ejemplo, que la palabra carrusel no solo haga referencia al juego infantil, sino también a un evento relacionado con corrupción política y económica. Esto se logra haciendo un estudio profundo del lenguaje colombiano. El profesor Moreno y su grupo de investigación asegura que han avanzado bastante, pues han logrado que la máquina entienda, no solo la polaridad de una discusión (si es positiva o negativa), sino que identifique el actor o actores que son importantes en cada escenario.
En 2019 Gabriel Moreno y su equipo fueron segundos en una competencia mundial para el análisis de lenguaje escrito.
A mayor cantidad de volumen de datos que tenga la máquina, será más eficiente a la hora de reconocer el valor de una palabra o frase. Como gana experticia, aumenta su eficacia para hallar entre grandes volúmenes de información lo que el investigador está buscando. Este proceso se conoce como aprendizaje de las máquinas o Machine Learning.
Esta forma de procesamiento del lenguaje permite que, una vez establecida la fase de entrenamiento, la máquina tome decisiones acerca del texto que está procesando. Las “decisiones de la máquina” se basan en procesos matemáticos y estadísticos, y ocurren en cuestión de milésimas de segundos y luego de analizar millones de datos.
El resultado es una interpretación del clima emocional de lo que está sucediendo en el escenario estudiado. Esto significa que, en caso de tener una crisis reputacional, las estrategias de comunicación no deberían dirigirse a toda la población sino a los líderes de opinión, a quienes mueven la conversación. Es en este nivel que el análisis de subjetividad ayuda a tomar decisiones e implementar mejores estrategias de manejo.
Hoy, el grupo de investigación de Moreno tiene la capacidad de calcular las emociones de un grupo respecto a cierto tema, reconocer en el texto características de los individuos como su género, edad, origen sociodemográfico, rasgos psicológicos y del comportamiento, así como la valoración que le otorga o puede llegar a otorgarle al tema en discusión.
Tener la capacidad de analizar el español colombiano puede ayudar a mejorar las experiencias que tenemos con los chatbots, por ejemplo. Muchos de nosotros preferimos todavía hablar directamente con el operador porque el robot no nos entiende, y esto se debe, en gran parte, al nivel de comprensión del lenguaje que todavía limita a estos sistemas.
El lenguaje como fenómeno humano está vivo, evoluciona de manera permanente, por lo que las necesidades de análisis y de procesamiento cambian todo el tiempo. Moreno afirma que es necesario discriminar cronolectos, —el lenguaje por edades—, geolectos, —el lenguaje por ubicación geográfica—, idiolectos, —la forma en que habla un grupo de personas como los ingenieros o los médicos—, y estos son solo algunos elementos que el procesamiento de lenguaje tiene en cuenta para funcionar. Por eso “tenemos que reentrenar constantemente las máquinas… Si nosotros logramos evolucionar, imagínate los chatbots o sistemas automáticos entendiendo bien a una persona”, dice. Así la experiencia de interacción en lo digital cambiaría radicalmente.