De nouvelles recherches indiquent que l’apprentissage par transfert peut accélérer considérablement la recherche d’une nouvelle physique, réduisant ainsi le besoin de simulations coûteuses. Cependant, selon une étude publiée dans le Journal of Cosmology and Astroparticle Physics (JCAP), l’IA risque de s’appuyer sur des modèles établis pour négliger des phénomènes véritablement nouveaux.
Le modèle standard de cosmologie, connu sous le nom de ΛCDM, explique de nombreuses caractéristiques de l’univers mais n’est pas exhaustif. De nouvelles observations ont soulevé des questions concernant des concepts tels que les neutrinos massifs, la gravité modifiée et l’évolution de l’énergie noire. Leur enquête nécessite des simulations informatiques approfondies, qui sont à la fois coûteuses en termes de calcul et prennent du temps.
L’équipe de recherche visait à déterminer si l’apprentissage par transfert pouvait améliorer l’efficacité de la simulation. L’apprentissage par transfert permet à une IA d’appliquer des connaissances de tâches plus simples à des tâches plus complexes, réduisant ainsi les coûts. Initialement, l’IA a été formée sur des simulations de base ΛCDM avant de passer à des modèles plus complexes intégrant une nouvelle physique potentielle.
Adrian Bayer, co-auteur du Flatiron Institute et de l’Université de Princeton, a décrit cette méthode comme un raccourci vers la formation traditionnelle en IA. « Habituellement, les gens entraînent l’IA directement sur les simulations les plus coûteuses en termes de calcul. À la place, nous utilisons d’abord des simulations ΛCDM plus simples et moins coûteuses pour donner à l’IA une idée de ce qui se passe », a déclaré Bayer.
Cette stratégie de pré-formation a aidé l’IA à gérer la complexité sans se laisser submerger. L’étude a révélé que l’apprentissage par transfert réduisait de plus de dix fois le nombre de simulations coûteuses nécessaires dans certains cas.
Les chercheurs ont également identifié un problème appelé transfert négatif, qui se produit lorsque l’IA interprète mal de nouvelles informations sur la base de ses connaissances préexistantes. L’IA avait souvent du mal à discerner de nouveaux effets lorsqu’ils ressemblaient à des modèles alignés sur les paramètres ΛCDM existants. Cela était évident dans les simulations impliquant des neutrinos massifs, où l’IA avait du mal à différencier les nouvelles signatures de celles qu’elle avait déjà associées à des paramètres connus.
Veena Krishnaraj, l’auteur principal de l’étude, a expliqué que le transfert négatif résulte de dégénérescences physiques sous-jacentes dans les modèles. « Différents processus physiques peuvent produire des signatures observables très similaires », a-t-elle noté, soulignant la nécessité d’être prudent dans l’interprétation des résultats de l’IA.
L’étude met l’accent à la fois sur les avantages potentiels et les limites de l’apprentissage par transfert dans le domaine de la physique. Même si la pré-formation peut accélérer l’analyse des données, elle peut entraver la capacité de l’IA à reconnaître les découvertes révolutionnaires. La prochaine phase consistera à appliquer la technique d’apprentissage par transfert à des observations astronomiques réelles.
Les chercheurs prévoient que l’apprentissage par transfert sera essentiel pour les prochaines enquêtes cosmologiques destinées à collecter des données de haute précision. L’article intitulé « Transfer Learning Beyond the Standard Model », rédigé par Veena Krishnaraj et ses collègues, est désormais publié dans JSTAT.





