Desarrollando un Traductor Español-Mapudungun

Changed on 14/11/2024

Inria, el instituto francés de investigación en ciencias y tecnologías digitales, promueve la excelencia científica y la transferencia de tecnología para maximizar su impacto al enfrentar los desafíos de la informática y las matemáticas, a menudo en la interfaz de otras disciplinas y aplicadas a la astronomía, la ecología marina, la agricultura inteligente, el medio ambiente, el clima, entre otras.

 

Si te apasiona el conocimiento tecnológico-científico y buscas contribuir al desarrollo de proyectos de alto impacto, esta oportunidad en Inria Chile es para ti:  

¿Por qué ser parte de nuestro equipo Inria Chile?

  • Somos una organización que promueve el aprendizaje constante.

  • Valoramos la diversidad y la inclusión.

  • Hacemos hincapié en un equilibrio saludable entre vida y trabajo.

  • Somos colaborativos y transparentes.

  • Somos amigables.

  • Inria Chile se enorgullece de ser un empleador que ofrece plena igualdad de oportunidades.

Descripción de la pasantía

El objetivo de esta pasantía es contribuir al desarrollo de un traductor automático español-mapudungun, abordando los desafíos específicos del procesamiento de lenguajes con pocos recursos digitales. Este proyecto se basa en un trabajo previo desarrollado en Inria Chile, el que utiliza aprendizaje por transferencia para entrenar modelos con un corpus de 260.000 frases en mapudungun, junto con sus traducciones al español. El modelo actual está diseñado para capturar las particularidades lingüísticas del mapudungun, como su estructura polisintética y aglutinante. Durante la pasantía, el estudiante investigará el estado del arte en traducción automática para lenguas de pocos recursos y propondrá nuevas estrategias que puedan mejorar los resultados del sistema.

Objetivos de la pasantía: 

  • Estudiar el estado del arte en traducción automática para lenguas con pocos recursos digitales.

  • Proponer e implementar estrategias innovadoras para mejorar la traducción español-mapudungun mediante el uso de aprendizaje por transferencia.

Tareas principales

  • Revisar trabajos relevantes sobre traducción automática y aprendizaje por transferencia aplicado a lenguas con pocos recursos.

  • Analizar el corpus actual y evaluar las limitaciones del modelo de traducción existente.

  • Proponer modificaciones o estrategias alternativas para mejorar el desempeño del modelo.

  • Implementar y experimentar con las nuevas estrategias en el modelo de traducción.

  • Evaluar los resultados obtenidos y redactar un informe con conclusiones y recomendaciones para futuras investigaciones.

Perfil del estudiante: 

  • Áreas de Interés: NLP, Language models, Machine Learning Translation, Low Resources Languages

  • Carrera: Ingeniería Civil con menciones en Computación, Eléctrica, Industrial

  • Interés en el desarrollo e implementación de tecnologías relacionadas a modelos de lenguaje

  • Puede ser un plus para el estudiante tener interés en el lenguaje mapudungun en particular

  • Autonomía

  • Proactividad en la resolución de problemas

  • Prolijidad

  • Motivación por aprender

 Conocimientos técnicos:

  • Python

  • PyTorch

  • Bases teóricas de Deep Learning, en particular en procesamiento de lenguaje natural

  • (Deseable) Conocimiento de técnicas de transfer learning, fine-tuning y uso de la plataforma HuggingFace.

¿Qué ofrecemos?

  • Distribución de horas de prácticas entre enero y marzo 2025, según lo requerido por tu universidad. 

  • Modalidad: presencial

  • Ubicación: oficinas Inria Chile, Avda. Apoquindo 2827, piso 12, Las Condes, Santiago (metro Tobalaba). 

  • Se entregará una compensación por concepto de colación y movilización de $350.000 pesos brutos.

¿Cómo postular?

Escríbenos una carta de motivación contándonos sobre tus habilidades e intereses, queremos conocerte, además indicanos:

  • ¿Por qué quieres ser parte de nuestro equipo?

  • ¿En qué fecha podrías comenzar tu práctica? 

  • ¿Cuántos meses puedes colaborar con nosotros?

  • ¿Cuántas horas de prácticas debes realizar? 

Contesta a este formulario y sube tu carta de motivación junto a tu CV.

Recibiremos postulaciones hasta el 08 de diciembre 2024.