En el año 2022, Inria Chile y la Universidad Diego Portales (UDP) sellaron un Acuerdo Estratégico de Colaboración que marcó el inicio de una ambiciosa travesía científica en la frontera de la inteligencia artificial y la astrofísica. Esta alianza ha permitido que el Centro trabaje codo a codo con la Facultad de Ingeniería y Ciencias y el Programa de Doctorado en Astrofísica de la UDP, para abordar uno de los desafíos centrales de la astronomía moderna mediante el uso intensivo de datos y modelos computacionales.
En este ecosistema de investigación nace el proyecto "Modelado de atmósferas estelares basado en inteligencia artificial", una iniciativa que no solo representa un avance técnico, sino que constituye el núcleo de la tesis doctoral del investigador de Inria Chile-Universidad Diego Portales, Theosamuele Signor, desarrollada bajo la dirección de las investigadoras Nayat Sánchez-Pi, de Inria Chile, y Paula Jofré, del Instituto de Estudios Astrofísicos de la Universidad Diego Portales. Iniciada en marzo de 2022, Theosamuele defendió la tesis “Physics-constrained machine learning in stellar spectroscopy” el 11 de mayo de 2026 en Santiago de Chile, obteniendo el grado de Doctor en Astrofísica.
La investigación se articula en torno a una pregunta metodológica central: ¿cómo se codifica e infiere la información física y química de las estrellas a partir de sus espectros, en una era dominada por grandes catálogos observacionales y modelos de aprendizaje automático?
Una mirada crítica al matrimonio entre IA y astrofísica
La espectroscopía estelar moderna vive una paradoja: los catálogos observacionales crecen aceleradamente —con catálogos que producen espectros para millones de estrellas—, mientras que su interpretación sigue dependiendo de modelos teóricos de atmósferas estelares limitados por el coste computacional o por supuestos físicos simplificadores. El aprendizaje automático supervisado se ha consolidado como marco dominante para procesar este volumen de datos, pero sus predicciones permanecen condicionadas por las mismas suposiciones de los modelos teóricos con los que fue entrenado.
La tesis aborda este problema desde una perspectiva metodológica, examinando cómo se codifica la estructura física dentro de los marcos de inferencia espectroscópica. Lo hace a través de tres estudios complementarios que cubren todo el espectro del problema: desde los límites de lo que los datos químicos pueden revelar, pasando por nuevas formas de extraer significado físico sin etiquetas externas, hasta los desafíos de simular atmósferas estelares en 3D mediante redes neuronales.
Verbatim
Esta colaboración estratégica con la Universidad Diego Portales refleja nuestra visión de la 'IA para la Ciencia' como un motor de descubrimiento transformador. A través de la codirección de esta tesis doctoral, impulsamos la frontera del conocimiento en astrofísica, utilizando la astronomía como un laboratorio excepcional para aplicar modelos avanzados de inteligencia artificial. Al integrarse con las leyes de la física, estas herramientas permiten expandir los límites científicos y potenciar el análisis de datos complejos en una de las áreas más destacadas de la ciencia en Chile. Ello refleja plenamente nuestro compromiso con el avance científico —en particular en nuestra línea de trabajo de ´IA para la Ciencia´ y con la formación de talentos, en colaboración con nuestros socios en Chile como la Universidad Diego Portales.
Directora de Inria Chile y del Centro Binacional Franco Chileno de Inteligencia Artificial
Un equipo binacional para una pregunta global
El desarrollo de esta investigación es liderado por Theosamuele Signor, investigador de Inria Chile y candidato a doctor de la UDP. La dirección de su tesis doctoral ha sido compartida por la Dra. Paula Jofré Pfeil, académica del Instituto de Estudios Astrofísicos de la UDP, y por la Dra. Nayat Sánchez-Pi, Directora de Inria Chile y del Centro Binacional Franco-Chileno de Inteligencia Artificial.
El jurado de la defensa, tras cuatro años de investigación, reunió a científicos de instituciones chilenas e internacionales: además de sus supervisoras, participaron el Dr. James Jenkins (Universidad Diego Portales, Chile), Dr. Szabolcs Mészáros (Gothard Astrophysical Observatory, Hungría) y Dr. Karteek Alahari (Director Científico Delegado a Inteligencia Artificial de Inria, Francia). Esta composición refleja el carácter intrínsecamente interdisciplinario e internacional del trabajo, que se sitúa en la intersección entre la astrofísica observacional, el aprendizaje automático y la simulación numérica.
Verbatim
Este trabajo marca un hito importante para el programa de doctorado en astrofísica de la UDP, un programa joven que busca posicionarse en el mundo con astronomía de vanguardia y colaboraciones novedosas. Supervisar este trabajo junto con Inria-Chile ha sido una aventura muy entretenida, he aprendido a conocer un mundo amplio donde la ciencia se filtra en todo tipo de ambientes, y agradezco como Inria me ha abierto las puertas a ese espacio. Además, gracias al trabajo atrevido de Theo hemos podido explorar, en equipo, territorios desconocidos tanto en la IA como en la astrofísica, lo que para mí es uno de los aspectos más fascinantes de la ciencia.
Astrónoma del Instituto de Estudios Astrofísicos y directora del programa de doctorado en astrofísica, Universidad Diego Portales
Hacia una visión estelar más precisa, gracias a la IA
-
Los límites empíricos del ‘etiquetado químico’
Una idea central en la arqueología galáctica sostiene que las estrellas que nacieron juntas comparten una huella química característica —análoga a un ‘ADN estelar’— que permitiría reconstruir, a posteriori, sus entornos de nacimiento. El primer estudio evalúa la viabilidad real de esta estrategia, conocida como strong chemical tagging, utilizando cúmulos abiertos con membresía co-natal conocida como banco de pruebas controlado.
El resultado es claro: bajo las incertidumbres observacionales actuales, el rendimiento del etiquetado químico está limitado fundamentalmente por la precisión con que se miden las abundancias, y no por el método estadístico utilizado para identificar los cúmulos. Este hallazgo redirige el debate de la comunidad: no es un mejor algoritmo lo que falta, sino mejores datos.
-
Aprender la química estelar sin etiquetas: una nueva forma de mirar los espectros
El segundo estudio desarrolla un marco original de aprendizaje autosupervisado con restricciones físicas capaz de extraer variables latentes químicamente significativas directamente de los espectros estelares, sin recurrir a etiquetas de abundancias derivadas de modelos teóricos. Mediante una arquitectura encoder–multidecoder y un control selectivo del flujo de gradientes que actúa como sesgo inductivo físico, distintos componentes latentes se especializan en contribuciones químicas diferenciadas.
El resultado, demostrado sobre datos sintéticos, es notable: la estructura química emerge desde el propio objetivo de reconstrucción, sin necesidad de supervisar el modelo con abundancias preexistentes. Esto reposiciona el rol del aprendizaje automático en astrofísica: en lugar de emular modelos teóricos, los métodos pueden empezar a descubrir estructura física guiados por los datos y por sesgos físicos cuidadosamente diseñados.
-
Redes neuronales informadas por la física para atmósferas estelares 3D: un diagnóstico riguroso
El tercer eje aborda una pregunta de gran interés práctico: ¿pueden las redes neuronales informadas por la física (PINNs) sustituir o acelerar a los costosos códigos de simulación radiación–hidrodinámica que hoy se usan para modelar atmósferas estelares en tres dimensiones? Las simulaciones 3D actuales requieren entre 10⁴ y 10⁵ horas-CPU por modelo, lo que vuelve inviable su aplicación masiva.
Mediante experimentos numéricos cuidadosamente diseñados, esta investigación identifica limitaciones estructurales fundamentales en la formulación basada en residuos de las PINNs cuando se aplican a las ecuaciones que gobiernan las atmósferas estelares: las redes pueden alcanzar residuos pequeños permaneciendo lejos de la solución correcta —y, a la inversa, soluciones físicamente precisas pueden producir residuos grandes—. El paisaje de optimización resulta anisotrópico y mal condicionado, lo que descarrila el entrenamiento.
Lejos de ser un resultado negativo, este diagnóstico constituye una contribución metodológica de primer orden: delimita con precisión por qué las PINNs, en su forma actual, no pueden aún reemplazar a los solucionadores tradicionales en este dominio, y traza una agenda concreta para el desarrollo de nuevas formulaciones del aprendizaje informado por la física que tengan en cuenta la rigidez de los operadores y el condicionamiento numérico de las ecuaciones. Es, en otras palabras, una hoja de ruta basada en evidencia para la próxima generación de modelos físicos asistidos por IA.
Verbatim
Existe mucho entusiasmo en torno al uso de inteligencia artificial en física, pero una parte importante del trabajo científico consiste en evaluar rigurosamente qué problemas estas herramientas pueden resolver realmente y cuáles siguen fuera de su alcance. Esta tesis intenta contribuir precisamente a esa discusión, combinando aprendizaje automático, espectroscopía estelar y análisis numérico desde una perspectiva metodológica.
¿Por qué importa este trabajo?
La tesis se inscribe plenamente en la línea programática ‘IA para la Ciencia’ que estructura la actividad de Inria Chile y del Centro Binacional Franco-Chileno de Inteligencia Artificial. Su contribución va más allá de la astrofísica: las cuestiones que aborda —cómo imponer restricciones físicas en sistemas de aprendizaje, cómo extraer representaciones físicamente significativas sin supervisión, cómo diagnosticar sistemáticamente las limitaciones de las arquitecturas neuronales en problemas con ecuaciones diferenciales rígidas— son directamente relevantes para muchas otras áreas científicas donde se intenta combinar modelos físicos con aprendizaje automático.
Con la próxima generación de catálogos espectroscópicos masivos en el horizonte (SDSS-V, 4MOST, WEAVE, MSE, DESI y la cuarta liberación de datos de Gaia), la pregunta sobre cómo integrar leyes físicas, aprendizaje estadístico y condicionamiento numérico en un marco coherente se vuelve estratégica. El trabajo de Signor, codirigido entre Inria Chile y la UDP, aporta tanto resultados positivos —nuevas formas de aprender química estelar sin etiquetas— como un mapa preciso del terreno todavía por conquistar.
