Santiago, Chile. Mayo, 2024.- En junio de 2024, las miradas de todos los especialistas en data science a nivel global estarán puestas en Chile. Durante seis días de trabajo intensivo se llevará a cabo en Santiago la conferencia ACM SIGMOD/PODS 2024, en la que más de 800 científicos provenientes de universidades, centros de investigación y empresas de Chile y el extranjero abordarán –tanto a nivel teórico como aplicado– los desafíos en el manejo de grandes volúmenes de datos.
Pablo Barceló y Nayat Sánchez-Pi son los general chairs del ACM SIGMOD/PODS 2024 y han logrado traer a América Latina y Chile por primera vez la conferencia que reunirá a centenas de investigadores.
Verbatim
No es por azar que se escogió a Chile como sede. Hace ya varias décadas que la comunidad chilena tiene una importante presencia en esta conferencia, con al menos 10 investigadoras e investigadores que viven en el país y que habitualmente presentan sus resultados científicos en SIGMOD/PODS. Varios de estos trabajos han recibido importantes premios en este encuentro.
Director del Instituto de Ingeniería Matemática y Computacional de la Pontificia Universidad Católica de Chile, Investigador IMFD y Cenia, y general chair de SIGMOD/PODS 2024
Verbatim
El esfuerzo de traer esta SIGMOD/PODS a Chile no ha sido menor y el que lo hayamos logrado es un reconocimiento al trabajo de científicos que son considerados como líderes en la región y el mundo. Ese prestigio ganado por años ha hecho que nuestro país sea sede de esta conferencia, un hito que nos permitirá impulsar aún más el posicionamiento de Chile en el área de datos
Directora de Inria Chile y general chair de SIGMOD/PODS 2024
Barceló agrega que “es desde Chile de donde han surgido investigaciones que hoy permiten, por ejemplo, extraer información para entender el comportamiento en redes sociales en tan solo segundos”.
Ciencia hecha en Chile en ACM SIGMOD/PODS 2024
De las cuatro conferencias magistrales del evento, dos están a cargo de chilenos. Ricardo Baeza-Yates, profesor titular de la Universidad de Chile e investigador sénior del Instituto Milenio Fundamentos de los Datos (IMFD), abordará los desafíos y limitaciones en el campos de los datos y el machine learning. En tanto, Marcelo Arenas, profesor titular de la Pontificia Universidad Católica de Chile e investigador asociado del Instituto Milenio Fundamentos de los Datos (IMFD), hablará sobre su reciente trabajo en cómo proveer explicaciones a las decisiones tomadas por los modelos de inteligencia artificial.
También se presentarán los resultados de innovadoras aplicaciones y estudios hechos por científicos de nuestro país. Los trabajos chilenos se enfocan en las bases de datos de grafos, modelos que almacenan información interconectada entre sí, lo que permite que –al hacer consultas– los resultados sean más rápidos y precisos.
Una de las presentaciones mostrará avances que buscan mejorar los sistemas de búsqueda sobre bases de datos de grafos, para que arrojen no sólo información precisa, sino también más rica en profundidad y matices. Los investigadores son Diego Arroyuelo y Juan Reutter (Pontificia Universidad Católica de Chile, IMFD); Benjamín Bustos, Aidan Hogan y Gonzalo Navarro (Universidad de Chile, IMFD), y Adrián Gómez-Brandón (Universidade da Coruña, España, IMFD).
También se presentará MillenniumDB, un nuevo motor de búsquedas para bases de datos de grafos que ya ha demostrado ser de dos a 10 veces más rápido que otros sistemas en uso actualmente (como los de Amazon o Neo4j). En el desarrollo de esta innovación participan 14 académicos, investigadores e ingenieros, y fue liderado por Domagoj Vrgoč y Carlos Rojas (Pontificia Universidad Católica de Chile, IMFD).
Aidan Hogan (Universidad de Chile, IMFD) y Domagoj Vrgoč (Pontificia Universidad Católica de Chile, IMFD) estarán a cargo de una sesión tutorial en donde mostrarán cómo hacer consultas a bases de datos de grafos a gran escala.
Otra innovación que se presentará es REmatch, una herramienta con la capacidad de extraer información a partir de un patrón desde documentos de texto. REmatch fue desarrollada por Cristian Riveros y Domagoj Vrgoč, junto con Vicente Calisto, Gustavo Toro y Nicolás Van Sint Jan, todos de la Pontificia Universidad Católica de Chile, y Kyle Bossonney (Universidad de Oxford).
Inria en la organización de ACM SIGMOD/PODS 2024
Además de la directora de Inria Chile, Nayat Sánchez-Pi quién es general chair de ACM SIGMOD/PODS 2024 y co-lidera a nivel local la organización de este evento, otros investigadores de Inria tanto de Francia como de Chile participarán del evento.
En la organización de la conferencia, destaca en particular la investigadora Ioana Manolescu, investigadora senior en el centro Inria de Saclay dónde dirige el equipo-proyecto CEDAR, que se centra en el análisis de datos en la nube. También es presidenta de BDA, la asociación científica nacional francesa dedicada a la gestión de datos. En ACM SIGMOD/PODS 2024 Ioana Manolescu co-dirige la organización de las Demostraciones SIGMOD.
También participa Luis Martí, director científico de Inria Chile e investigador especialista en inteligencia artificial. En ACM SIGMOD/PODS 2024 Luis Martí co-dirige la organización de los sponsorships de la conferencia
El impacto de la web y las redes sociales
En los 90, la aparición de la world wide web generó nuevos campos de investigación, como –por ejemplo– la creación de sistemas para extraer e intercambiar información desde datos a gran escala, en donde confluían millones de usuarios. Creado en el CERN (Organización Europea para la Investigación Nuclear) en 1989 como un sistema de gestión de la información para los investigadores, se desarrolló a lo largo de los años 90, apoyado por una red de empresas y centros de investigación el Consorcio World Wide Web (W3C). Inria fue uno de los creadores de la iniciativa, convirtiéndose en su anfitrión europeo en 1995, al ser elegido en 1995 como socio del MIT dentro del W3C (World Wide Web Consortium) responsable de la estandarización de las tecnologías de la Web. El W3C reúne hoy a más de 450 miembros, instituciones académicas y de investigación y agentes económicos, desde pequeñas empresas de nueva creación hasta grandes grupos y Bruno Sportisse, presidente y director general de Inria, es también presidente del nodo europeo del W3C.
“Los 2000s es la década donde se acuñó el término Big Data y se identifican los desafíos que conlleva su manejo, como volumen de la información, velocidad de producción y diversidad de los datos. Esto impulsa el trabajo en nuevos métodos y sistemas para campos como la astronomía o la secuenciación del ADN”, explica Pablo Barceló.
Desde 2010 en adelante, la irrupción de poderosos algoritmos de inteligencia artificial (IA) que utilizan como base grandes repositorios de datos ha hecho que parte de la comunidad de científicos que se reúnen en torno a SIGMOD/PODS se esté enfocando en el gran desafío del sesgo en IA.
“Se ha hecho urgente la necesidad de desarrollar investigación en el uso de datos y en IA de manera responsable, que se haga cargo de los riesgos que tiene la manipulación de grandes volúmenes de información para tomar decisiones. Muchos de los trabajos presentados en SIGMOD/PODS abordan de manera teórica y aplicada estos desafíos”, concluye Nayat Sánchez.