{"id":11852,"date":"2018-08-01T15:21:21","date_gmt":"2018-08-01T20:21:21","guid":{"rendered":"http:\/\/www.javeriana.edu.co\/pesquisa\/?p=11852"},"modified":"2022-05-17T01:14:45","modified_gmt":"2022-05-17T06:14:45","slug":"una-mina-de-datos","status":"publish","type":"post","link":"http:\/\/www.javeriana.edu.co\/pesquisa\/una-mina-de-datos\/","title":{"rendered":"Una mina de datos"},"content":{"rendered":"<p>Internet se ha convertido en un aut\u00e9ntico y descontrolado monstruo sin forma alguna. Aquella concepci\u00f3n rom\u00e1ntica de una autopista donde la informaci\u00f3n flu\u00eda libremente y donde una persona pod\u00eda contactarse con otra a millones de kil\u00f3metros de distancia, ha desaparecido para siempre en el inconmensurable oc\u00e9ano de informaci\u00f3n y contenidos de hoy en d\u00eda. Una idea de esto la arroja <a href=\"https:\/\/www.internetlivestats.com\/\" target=\"_blank\" rel=\"noopener\">Internet Live Stats<\/a>, proyecto de investigadores y analistas inform\u00e1ticos para intentar ilustrar todo lo que ocurre en esta especie de universo paralelo.<\/p>\n<p>Sus cifras asustan: se calcula que hay alrededor de 4.000 millones de usuarios activos en la red (de ellos, el 57% comparte contenidos en Facebook), que consultan los m\u00e1s de 1.900 millones de p\u00e1ginas disponibles en ella, que en un d\u00eda promedio env\u00edan 110.000 millones de correos electr\u00f3nicos, realizan m\u00e1s de 315 millones de comentarios en la red social Twitter, suben 35 millones de fotos a Instagram y ven m\u00e1s de 3.000 millones de videos en YouTube.<\/p>\n<p>Y con toda esa actividad, cada uno de ellos deja un rastro de informaci\u00f3n que, en principio, deber\u00eda estar protegida por las empresas que ofrecen servicios de correo electr\u00f3nico y producci\u00f3n de contenido en p\u00e1ginas web y redes sociales. Sin embargo, la realidad ha demostrado que no es as\u00ed: algunas firmas han tenido acceso a toda esta informaci\u00f3n personal y han utilizado para sus prop\u00f3sitos comerciales, desde convencer a los usuarios de comprar sus productos hasta influir en elecciones populares.<\/p>\n<p>El acceso y an\u00e1lisis a este tipo de informaci\u00f3n se conoce como <em>big data<\/em>, y ha generado hondas preocupaciones en los gobiernos del mundo sobre la privacidad de sus ciudadanos; asimismo, ha dado pie a ingeniosas colaboraciones entre academia, gobierno y la empresa privada encaminadas a fortalecer las econom\u00edas locales. Una de ellas es Alianza Caoba, iniciativa impulsada por la Pontificia Universidad Javeriana y dirigida por Alexandra Pomares, profesora de la Facultad de Ingenier\u00eda.<\/p>\n<p>Para conocer sus alcances y todo lo que implica el manejo y an\u00e1lisis de la informaci\u00f3n, <span style=\"text-decoration: underline;\">Pesquisa Javeriana<\/span> habl\u00f3 con Rafael Gonz\u00e1lez, doctor en Tecnolog\u00eda, Pol\u00edtica y Administraci\u00f3n, profesor titular del Departamento de Ingenier\u00eda de Sistemas de la universidad y uno de los art\u00edfices de este proyecto.<\/p>\n<p><strong><br \/>\nPesquisa Javeriana: \u00bfQu\u00e9 es el <em>big data<\/em>? \u00bfC\u00f3mo est\u00e1 siendo utilizado?<\/strong><\/p>\n<p><strong>Rafael Gonz\u00e1lez: <\/strong><em>Big data <\/em>quiere decir que tenemos un gran volumen de datos y estos, por su cantidad, son muy diversos. Esto se debe a que cada vez se genera m\u00e1s informaci\u00f3n que puede duplicarse a diario. Hay un crecimiento exponencial de informaci\u00f3n.<\/p>\n<p>Lo que hoy tenemos son capacidades que hace algunos a\u00f1os no exist\u00edan para hacer el an\u00e1lisis de un gran volumen de datos, por ejemplo, utilizar un <em>hardware<\/em> que hace poco no estaba disponible para almacenar toda esta informaci\u00f3n. Lo que s\u00ed exist\u00eda desde hace tiempo son las t\u00e9cnicas de inteligencia artificial, de procesamiento de bases y miner\u00eda de datos que cada vez son m\u00e1s inteligentes; hoy tenemos la posibilidad de articular esas t\u00e9cnicas a una infraestructura abierta, distribuida y masiva.<\/p>\n<p><strong><br \/>\nPJ: Es decir, con cada click se est\u00e1 generando una gran cantidad de informaci\u00f3n.&nbsp; \u00bfD\u00f3nde se almacena y para qu\u00e9 tipo de prop\u00f3sitos?<\/strong><\/p>\n<p><strong>RG: <\/strong>El almacenamiento hace parte del reto. No solo se guarda la informaci\u00f3n con cada click sino que, si t\u00fa ten\u00edas un blog hace 10 a\u00f1os, eso tambi\u00e9n est\u00e1 guardado o los correos que borraste hace dos a\u00f1os Google tambi\u00e9n los tiene, as\u00ed no tengas acceso a ello. Hoy el t\u00e9rmino utilizado es en la nube, pero esto quiere decir que para el usuario es transparente el lugar donde est\u00e1 la informaci\u00f3n.<\/p>\n<p>Sin embargo, \u00bfd\u00f3nde est\u00e1 ese video que est\u00e1s viendo? No solo en la nube: existen, en t\u00e9rminos de infraestructura, granjas de servidores y lo son porque, literalmente, abarcan hect\u00e1reas. De hecho, compa\u00f1\u00edas como Google, Microsoft, Amazon ya no tienen cuartos de c\u00f3mputo grandes sino estas granjas que \u00ad\u2013generalmente\u2013 est\u00e1n ubicadas en lugares fr\u00edos como Alaska, Islandia y Siberia. Y en parte, est\u00e1n all\u00e1 porque es m\u00e1s barato, pues no hay que refrigerarlos. De hecho, es tan importante la existencia de las granjas hoy que casi es un proceso pol\u00edtico ir a convencer a Google y ofrecerle ventajas tributarias para que lo coloque en su pa\u00eds.<\/p>\n<p>Ahora existen dos intereses simult\u00e1neos. Primero est\u00e1 el industrial-comercial y all\u00ed es donde las organizaciones quieren aprovechar la informaci\u00f3n y distinguir entre lo que tiene valor y lo que no; tambi\u00e9n, conocer la percepci\u00f3n del p\u00fablico sobre la empresa, qu\u00e9 hablan los consumidores acerca de los productos y qu\u00e9 hablan de la competencia para as\u00ed tomar las mejores decisiones y generar nuevos productos o servicios.<\/p>\n<p>El segundo inter\u00e9s es estatal, que es muy interesante porque all\u00ed lo que buscan es c\u00f3mo proveer servicios p\u00fablicos. Hablo de salud, educaci\u00f3n, impuestos, transporte, entonces, si yo tengo informaci\u00f3n de los ciudadanos, puedo dise\u00f1ar mejores pol\u00edticas p\u00fablicas, por ejemplo, en la prevalencia de enfermedades espec\u00edficas y en cu\u00e1nto le va a costar al pa\u00eds, o en materia de impuestos para detectar el fraude, etc.<\/p>\n<p><strong><br \/>\nPJ: En el Tour de Francia, el equipo Movistar tiene un departamento de <em>big data <\/em>para analizar informaci\u00f3n, entre otras, sobre el rendimiento de sus ciclistas. \u00bfEn qu\u00e9 otros campos el <em>big data<\/em> est\u00e1 dejando su huella?<\/strong><\/p>\n<p><strong>RG: <\/strong>El<em> big data<\/em> est\u00e1 sonando m\u00e1s en pol\u00edtica. Lo utilizan para predecir cu\u00e1les son las tendencias que la gente prefiere a la hora de votar, pero hay otra v\u00eda y es tratar de descubrir c\u00f3mo tengo que enviarle el mensaje a la gente para que voten por m\u00ed. Eso ya conduce a implicaciones \u00e9ticas de uso del <em>big data<\/em> porque puede utilizarse para manipular al p\u00fablico: en la medida en que conocen las preferencias de sus consumidores, las empresas pueden apuntarle a un p\u00fablico determinado y despertar en ellos un gatillo emocional, de ah\u00ed, que en Facebook y Twitter existan robots o <em>bots<\/em> que generan opiniones falsas a partir de patrones dise\u00f1ados. Por eso, cada vez que Trump genera un <em>tweet<\/em> hay un mont\u00f3n de <em>bots<\/em> \u2013no son seres humanos\u2013 que lo est\u00e1n aplaudiendo o, por el contrario, lo critican.<\/p>\n<figure id=\"attachment_11856\" aria-describedby=\"caption-attachment-11856\" style=\"width: 3696px\" class=\"wp-caption aligncenter\"><img fetchpriority=\"high\" decoding=\"async\" class=\"size-full wp-image-11856\" src=\"http:\/\/www.javeriana.edu.co\/pesquisa\/wp-content\/uploads\/2018\/08\/alianza-caoba-6.jpg\" alt=\"Profesor\" width=\"3696\" height=\"2448\"><figcaption id=\"caption-attachment-11856\" class=\"wp-caption-text\">Rafael Gonz\u00e1lez, docente del Departamento de Ingenier\u00eda de Sistemas e integrante de Alianza Caoba.<\/figcaption><\/figure>\n<p><strong><br \/>\nPJ: Barack Obama, Mariano Rajoy y David Cameron, entre otros, utilizaron en sus campa\u00f1as electorales el <em>big data, <\/em>pero en su&nbsp; momento no gener\u00f3 pol\u00e9mica<em>. <\/em>Este a\u00f1o los diarios <em>The Guardian<\/em> y <em>The New York Times<\/em> revelaron c\u00f3mo Cambridge Analytica, una empresa de comunicaci\u00f3n y&nbsp; an\u00e1lisis de informaci\u00f3n, habr\u00eda tomado los datos de 50 millones de usuarios de Facebook y los habr\u00eda utilizado para favorecer la campa\u00f1a presidencial de Donald Trump en 2016. \u00bfC\u00f3mo prevenir casos como \u00e9ste? \u00bfQu\u00e9 retos plantea entonces el manejo del <em>big data<\/em>?<\/strong><\/p>\n<p><strong>RG: <\/strong>Obama fue el primero que populariz\u00f3 esto porque gan\u00f3 y fue sorpresivo, de alguna manera, que hubiera ganado pero lo hizo de manera \u00e9tica, utiliz\u00f3&nbsp; Facebook para movilizar a la comunidad particularmente joven a trav\u00e9s de t\u00e9cnicas m\u00e1s tradicionales, como convencerlos e ir puerta a puerta para hacer activismo pol\u00edtico.<\/p>\n<p>En otros casos, como en el de Trump, no se us\u00f3 la informaci\u00f3n para movilizar a la gente sino para generar informaci\u00f3n falsa o enga\u00f1osa, para as\u00ed despertar emociones que hicieran que la toma de decisiones en pol\u00edtica no fuera racional sino puramente basada en emociones. Entonces no tiene nada de malo analizar patrones o tendencias, conocer al p\u00fablico, pero cuando utilizas eso para manipularlo o enga\u00f1arlo, entonces ah\u00ed ya cruzaste la raya.<\/p>\n<p>A partir del caso de Cambridge Analytica y otros recientes se ha empezado a fortalecer la regulaci\u00f3n o se han hecho m\u00e1s expl\u00edcitas las reglas sobre confidencialidad de la informaci\u00f3n. Esto est\u00e1 sucediendo en parte porque la ley les exige a las empresas proteger la informaci\u00f3n que les brindan sus usuarios, pero as\u00ed lo hagan eso no resuelve el problema, de hecho, existen personas que no pueden cerrar sus cuentas en redes sociales porque las necesitan para conseguir empleo, e incluso para arrendar un apartamento. Entonces, se volvi\u00f3 un mal necesario, pero lo que terminar\u00e1 ocurriendo es que, como cultura, aprendamos qu\u00e9 significa privacidad en este orden del mundo y c\u00f3mo ser m\u00e1s responsables en el manejo de la informaci\u00f3n. No creo que haya una soluci\u00f3n tecnol\u00f3gica ni pol\u00edtico-legal, sino m\u00e1s bien cultural.<\/p>\n<p>De hecho, Facebook reconoce que no puede mirar en sus contenidos qu\u00e9 es cierto y qu\u00e9 no. Entonces lo que hizo fue contratar ej\u00e9rcitos, literalmente, de personas para que con su criterio determinaran si la informaci\u00f3n es falsa. Sin embargo, reconoce que por m\u00e1s personal que tenga en esta labor lo que realmente se necesita es entrenar a lectores y ciudadanos para que sean m\u00e1s cr\u00edticos en el procesamiento de informaci\u00f3n, m\u00e1s responsables y conscientes en la publicaci\u00f3n de informaci\u00f3n.<\/p>\n<p><strong><br \/>\nPJ: \u00bfEn qu\u00e9 consisti\u00f3 el proyecto Alianza Caoba y qu\u00e9 resultados encontraron?<\/strong><\/p>\n<p><strong>RG: <\/strong>El mundo identific\u00f3 que el<em> big data<\/em> iba&nbsp; a movilizar la tecnolog\u00eda, la investigaci\u00f3n y la industria desde el punto de vista inform\u00e1tico, por eso varios pa\u00edses invirtieron en estas tecnolog\u00edas. El Ministerio de las TIC abri\u00f3 una convocatoria para conformar centros de excelencia en<em> big data <\/em>y anal\u00edtica.<\/p>\n<p>Uno de nuestros trabajos fue con Nutresa \u2013una de las empresas ancla\u2013 en donde particip\u00f3 la Javeriana Bogot\u00e1 y Cali. Con este proyecto la intenci\u00f3n era segmentar clientes potenciales de Nutresa, o sea identificar, dentro de una base de datos, por ejemplo, qu\u00e9 tipo de consumidores hay para asociarlos con el tipo de producto que ofrece Nutresa para que haya un encuentro, o <em>match<\/em>.<em>&nbsp; <\/em>Por otro lado, para generar estrategias de comunicaci\u00f3n efectivas para que esos productos le lleguen al p\u00fablico objetivo. Lo que hicimos fue procesar la informaci\u00f3n de Twitter a nivel&nbsp; nacional y mirar qu\u00e9 est\u00e1 opinando la gente en t\u00e9rminos de alimentaci\u00f3n, de qu\u00e9 alimentos hablan, cu\u00e1ndo lo hacen, qu\u00e9 emociones y sentimientos hay en esas discusiones, qu\u00e9 palabras est\u00e1n utilizando;&nbsp; con esto generamos informes gr\u00e1ficos y anal\u00edticos para que tomen mejores decisiones para el \u00e1rea de mercadeo.<\/p>\n<p><strong><br \/>\nPJ:<\/strong> <strong>Alianza Caoba re\u00fane a algunas universidades del pa\u00eds, como la Javeriana, los Andes, Icesi y Eafit, tambi\u00e9n a empresas del sector privado y a entidades del Gobierno. \u00bfC\u00f3mo ha sido la articulaci\u00f3n de estos tres sectores?<\/strong><\/p>\n<p><strong>RG: <\/strong>La \u00fanica manera para desarrollar capacidades para el pa\u00eds era sumando esfuerzos y, al hacerlo, ah\u00ed si estamos en condiciones de competir y participar a nivel mundial. Con esto lo que hicimos fue establecer un mecanismo a trav\u00e9s del cual Estado, academia e industria se reunieron para generar esas capacidades.<\/p>\n<p>El&nbsp; rol de la industria \u2013llamado empresas ancla\u2013 es el de proveer los datos y necesidades; la idea es que no se estudie en un laboratorio para publicar art\u00edculos sino que parta de las necesidades y datos reales para contribuir a solucionar problemas locales.<\/p>\n<p>Desde el punto de la vista de la universidad, la intenci\u00f3n es generar investigaci\u00f3n aplicada a estos temas. En este proceso de investigaci\u00f3n se est\u00e1n formando estudiantes de maestr\u00eda y doctorado que, por un lado, estudian las t\u00e9cnicas del <em>big data<\/em> y, por el otro, participan en el desarrollo de las empresas ancla. Y desde el punto de vista de las empresas l\u00edderes (SAS, IBM, EMC<sup>2<\/sup>), son proveedores de tecnolog\u00eda que se suman al ecosistema o a la alianza para proveer <em>software<\/em> y <em>hardware<\/em>.<\/p>\n<p>Hemos establecido relaciones de confianza que, para m\u00ed, es solo uno de los logros de Alianza Caoba, porque esto genera unas capacidades importantes de maduraci\u00f3n para el pa\u00eds. Nuestra intenci\u00f3n ha sido la sostenibilidad del centro para que, eventualmente en dos a\u00f1os, sigamos adelante sin la financiaci\u00f3n del Estado, generando nuevos proyectos de investigaci\u00f3n, de consultor\u00eda e integrando nuevos sectores. La idea es que otras empresas ancla y otras universidades se vinculen a Caoba y, con eso, fortalecer la capacidad de <em>big data<\/em> en el pa\u00eds.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>La Alianza Caoba, el primer centro de investigaci\u00f3n de excelencia y apropiaci\u00f3n de big data en Colombia, present\u00f3 sus avances tras dos a\u00f1os de funcionamiento. Pesquisa Javeriana convers\u00f3 con Rafael Gonz\u00e1lez, profesor titular del  Departamento de Ingenier\u00eda de Sistemas y miembro del proyecto, sobre los desaf\u00edos que hoy plantea el manejo de datos.<\/p>\n","protected":false},"author":40,"featured_media":21154,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[48,373],"tags":[1446,1447,1444,1449,1445,874,1448,602],"class_list":{"0":"post-11852","1":"post","2":"type-post","3":"status-publish","4":"format-standard","5":"has-post-thumbnail","7":"category-entrevistas","8":"category-sociedad","9":"tag-alianza-caoba","10":"tag-analisis-de-informacion","11":"tag-big-data","12":"tag-cliente","13":"tag-informacion","14":"tag-mercadeo","15":"tag-privacidad","16":"tag-redes-sociales"},"_links":{"self":[{"href":"http:\/\/www.javeriana.edu.co\/pesquisa\/wp-json\/wp\/v2\/posts\/11852","targetHints":{"allow":["GET"]}}],"collection":[{"href":"http:\/\/www.javeriana.edu.co\/pesquisa\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/www.javeriana.edu.co\/pesquisa\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/www.javeriana.edu.co\/pesquisa\/wp-json\/wp\/v2\/users\/40"}],"replies":[{"embeddable":true,"href":"http:\/\/www.javeriana.edu.co\/pesquisa\/wp-json\/wp\/v2\/comments?post=11852"}],"version-history":[{"count":7,"href":"http:\/\/www.javeriana.edu.co\/pesquisa\/wp-json\/wp\/v2\/posts\/11852\/revisions"}],"predecessor-version":[{"id":31344,"href":"http:\/\/www.javeriana.edu.co\/pesquisa\/wp-json\/wp\/v2\/posts\/11852\/revisions\/31344"}],"wp:featuredmedia":[{"embeddable":true,"href":"http:\/\/www.javeriana.edu.co\/pesquisa\/wp-json\/wp\/v2\/media\/21154"}],"wp:attachment":[{"href":"http:\/\/www.javeriana.edu.co\/pesquisa\/wp-json\/wp\/v2\/media?parent=11852"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/www.javeriana.edu.co\/pesquisa\/wp-json\/wp\/v2\/categories?post=11852"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/www.javeriana.edu.co\/pesquisa\/wp-json\/wp\/v2\/tags?post=11852"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}