Aplicación de LLMs pre-entrenados con genomas para descifrar el rol del microbioma marino en la captura de carbono en el contexto del cambio climático

Changed on 14/11/2024

Inria, el instituto francés de investigación en ciencias y tecnologías digitales, promueve la excelencia científica y la transferencia de tecnología para maximizar su impacto al enfrentar los desafíos de la informática y las matemáticas, a menudo en la interfaz de otras disciplinas y aplicadas a la astronomía, la ecología marina, la agricultura inteligente, el medio ambiente, el clima, entre otras.

 

Si te apasiona el conocimiento tecnológico-científico y buscas contribuir al desarrollo de proyectos de alto impacto, esta oportunidad en Inria Chile es para ti:

¿Por qué ser parte de nuestro equipo Inria Chile?

  • Somos una organización que promueve el aprendizaje constante.

  • Valoramos la diversidad y la inclusión.

  • Hacemos hincapié en un equilibrio saludable entre vida y trabajo.

  • Somos colaborativos y transparentes.

  • Somos amigables.

  • Inria Chile se enorgullece de ser un empleador que ofrece plena igualdad de oportunidades.

Descripción de la pasantía

Esta pasantía explora el uso de modelos de lenguaje grandes (LLMs) pre-entrenados con datos masivos (meta)genómicos para identificar patrones y asociaciones en secuencias de ADN, mejorando así la comprensión de funciones moleculares y su relación con el medio ambiente.

 Objetivos de la pasantía: 

  • Realizar revisión bibliográfica de LLMs en Genómica, y sus requerimientos de infraestructura computacional.

  • Implementar LLMs pre-entrenados en la identificación de patrones en datos genómicos.

  • Evaluar la precisión y relevancia de los modelos en tareas de clasificación y predicción genómica.

Tareas principales

  • Recibir capacitación en el uso de infraestructura de HPC.

  • Preparar y procesar datos genómicos (secuencias) para entrenamiento y evaluación.

  • Entrenar y ajustar LLMs para el análisis de secuencias genómicas.

  • Comparar y documentar el desempeño de diferentes LLMs.

  • Elaborar reporte técnico final en base al trabajo realizado.

Perfil del estudiante: 

  • Áreas de interés: Inteligencia Artificial, NLP, LLMs, Genómica.

  • Carrera: Ingeniería en Computación, Informática, Matemática, Biotecnología o afines.

  • Capacidad de trabajo autónomo.

  • Motivación para la resolución de problemas complejos.

  • Habilidades de análisis y síntesis de resultados.

  • Interés en IA aplicada en NLP/Genómica.

Conocimientos técnicos:

  • Programación en Python.

  • Conocimientos básicos de modelos de lenguaje (NLP/LLMs).

  • Nociones básicas de genómica y procesamiento de secuencias (deseable).

  • Experiencia con frameworks de deep learning (ej., PyTorch).

¿Qué ofrecemos?

  • Distribución de horas de prácticas entre enero y marzo 2025, según lo requerido por tu universidad. 

  • Modalidad: presencial.

  • Ubicación: oficinas Inria Chile, Avda. Apoquindo 2827, piso 12, Las Condes, Santiago (metro Tobalaba). 

  • Se entregará una compensación por concepto de colación y movilización de $350.000 pesos brutos.

¿Cómo postular?

Escríbenos una carta de motivación contándonos sobre tus habilidades e intereses, queremos conocerte, además indicanos:

  • ¿Por qué quieres ser parte de nuestro equipo?

  • ¿En qué fecha podrías comenzar tu práctica? 

  • ¿Cuántos meses puedes colaborar con nosotros?

  • ¿Cuántas horas de prácticas debes realizar? 

Contesta a este formulario y sube tu carta de motivación junto a tu CV.

Recibiremos postulaciones hasta el 08 de diciembre 2024.