Práctica comunidades globales de Plancton a través del Análisis Topológico de Datos

Changed on 09/11/2023

Inria, el instituto francés de investigación en ciencias digitales, promueve la excelencia científica y la transferencia de tecnología para maximizar su impacto al enfrentar los desafíos de la informática y las matemáticas, a menudo en la interfaz de otras disciplinas y aplicadas a la astronomía, la ecología marina, la agricultura inteligente, el medio ambiente, el clima, entre otras.

Si te apasiona el conocimiento tecnológico-científico y buscas contribuir al desarrollo de proyectos de alto impacto esta oportunidad en Inria Chile es para ti:

¿Por qué ser parte de nuestro equipo Inria Chile?

  • Somos una organización que promueve el aprendizaje constante.
  • Valoramos la diversidad y la inclusión.
  • Hacemos hincapié en un equilibrio saludable entre vida y trabajo.
  • Somos colaborativos y transparentes.
  • Somos amigables.
  • Inria Chile se enorgullece de ser un empleador que ofrece plena igualdad de oportunidades.

¿Qué buscamos?

Buscamos una persona que le gusten los desafíos, muestre interés en el aprendizaje, trabaje en equipo, pueda apoyar el estudio y aplicación de algoritmos recientes para el análisis topológico de datos ómicos como metagenomas y metatranscriptomas. El análisis topológico de datos (TDA) es un campo que utiliza técnicas derivadas de Topología Algebraica y Geometría Diferencial para obtener características topológicas de un conjunto de datos. Las herramientas más empeladas en este campo incluyen Homología Persistente y Mapper. La Homología Persistente se basa en la construcción de complejos simpliciales asociados a los datos y en la invariancia topológica de la homología. Esta técnica permite detectar características topológicas persistentes en un conjunto de datos, como agujeros, cavidades y componentes conectados. Por otra parte el algoritmo Mapper permite construir una representación simplificada de un conjunto de datos en términos de una red de nodos y aristas,  basado en la construcción de una partición del espacio de los datos y en la asignación de cada punto a un nodo de la red.

Uno de nuestro colaboradores más importantes es la Fundación Tara Ocean, quienes han organizados expediciones océanicas alrededor del mundo desde el año 2006, colectando muestras a diferentes profundidades con el propósito de medir variables fisicoquímicas del agua, además de secuenciar ADN y ARN para descifrar la composición metagenómica y metatranscriptómica de las comunidades de plancton con tamaños desde 0.02 μm hasta 1 m.

En particular para esta pasantía, buscamos extender el trabajo ya realizado, desarrollando y aplicando TDA, empleando como input datos ómicos de plancton para entender y caracterizar su relación con el cambio climático, en el contexto del proyecto OcéanIA.

El pasante trabajará junto con el equipo de ciencia de Inria Chile, en particular con expertos en Machine Learning y Bioinformática.

 

Aprenderás  sobre:

  • Modelos de TDA recientemente aplicados a este tipo de tareas y su conexión con modelos de Deep Learning.
  • Intentar mejorar resultados actuales, por ejemplo, mediante optimización de hiperparámetros del algoritmo actual.
  • Implementar/aplicar técnicas del estado del arte a nuestro problema.

 

Perfil del estudiante:

  • Áreas de interés:
    • Lo principal es interés por el Análisis Topológico de Datos y su combinación con modelos de Machine Learning/Deep Learning aplicado en Genómica.
    • El fruto de este trabajo podría implicar la publicación de un artículo científico con el pasante como uno de los autores por lo que un interés científico también es recomendable.
    • Si bien el foco del trabajo es en Ciencias de la Computación / Inteligencia Artificial, si el pasante tiene interés por la Topología Computacional Aplicada a datos de secuenciación masiva de ADN, este trabajo podría ser aún más interesante.
  • Carreras: Ingeniería con mención en Computación, Matemáticas, Bioinformática, Biotecnología, Bioquimica o carreras afines (con experiencia en ciencia de datos, inteligencia computacional, etc.).
  • Motivación por aprender.
  • Prolijidad.
  • Proactividad en la resolución de problemas.
  • Autonomía.

 

Conocimientos técnicos:

  • Lenguaje de programación Python.
  • Bases teóricas de Machine Learning y Deep Learning en particular.
  • Bases teóricas de TDA  (deseable, pero no obligatorio).
  • Bases teóricas de Genómica (deseable, pero no obligatorio).
  • Procesamiento de datos para machine learning (ej. usando scikit-learn).
  • Nociones básicas de programación en algún framework de Deep Learning como PyTorch.

¿Qué ofrecemos?

  • Distribución de horas de prácticas entre diciembre 2023 y marzo 2024, según lo requerido por tu universidad.
  • Modalidad: presencial
  • Ubicación: oficinas Inria Chile, Avda. Apoquindo 2827, piso 12, Las Condes, Santiago (metro Tobalaba).
  • Se entregará una compensación por concepto de colación y movilización de $350.000 pesos brutos.

¿Cómo postular?

Escríbenos una carta de motivación contándonos sobre tus habilidades e intereses, queremos conocerte, además indicanos:

  • ¿Por qué quieres ser parte de nuestro equipo?
  • ¿En qué fecha podrías comenzar tu práctica?
  • ¿Cuántos meses puedes colaborar con nosotros?
  • ¿Cuántas horas de prácticas debes realizar?

 

Contesta a este formulario y sube tu carta de motivación junto a tu CV.

Recibiremos postulaciones hasta el 26 de Noviembre del 2023.