Programme informatique crucial pour la physique des particules à risque d'obsolescence PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

Programme informatique crucial pour la physique des particules menacé d'obsolescence

Introduction

Récemment, j'ai regardé un collègue physicien des particules parler d'un calcul qu'il avait poussé à un nouveau niveau de précision. Son outil ? Un programme informatique des années 1980 appelé FORM.

Les physiciens des particules utilisent certaines des équations les plus longues de toute la science. Pour rechercher des signes de nouvelles particules élémentaires dans les collisions au Large Hadron Collider, par exemple, ils dessinent des milliers d'images appelées diagrammes de Feynman qui décrivent les résultats possibles des collisions, chacune codant une formule compliquée pouvant comporter des millions de termes. Il est impossible de résumer des formules comme celles-ci avec un stylo et du papier ; même les ajouter avec des ordinateurs est un défi. Les règles d'algèbre que nous apprenons à l'école sont assez rapides pour les devoirs, mais pour la physique des particules, elles sont terriblement inefficaces.

Des programmes appelés systèmes de calcul formel s'efforcent de gérer ces tâches. Et si vous voulez résoudre les plus grandes équations du monde, depuis 33 ans un programme se démarque : FORM.

Développé par le physicien des particules néerlandais José Vermaseren, FORM est un élément clé de l'infrastructure de la physique des particules, nécessaire pour les calculs les plus difficiles. Cependant, comme pour de nombreux éléments essentiels de l'infrastructure numérique, la maintenance de FORM repose en grande partie sur une seule personne : Vermaseren lui-même. Et à 73 ans, Vermaseren a commencé à prendre du recul par rapport au développement de FORM. En raison de la structure incitative du milieu universitaire, qui récompense les articles publiés, et non les outils logiciels, aucun successeur n'a émergé. Si la situation ne change pas, la physique des particules pourrait être forcée de ralentir considérablement.

FORM a fait ses débuts au milieu des années 1980, lorsque le rôle des ordinateurs évoluait rapidement. Son prédécesseur, un programme appelé Schoonschip créé par Martinus Veltman, a été publié sous la forme d'une puce spécialisée que vous avez branchée sur le côté d'un ordinateur Atari. Vermaseren voulait créer un programme plus accessible pouvant être téléchargé par les universités du monde entier. Il a commencé à le programmer dans le langage informatique FORTRAN, qui signifie Formula Translation. Le nom FORM était un riff là-dessus. (Il est ensuite passé à un langage de programmation appelé C.) Vermaseren a sorti son logiciel en 1989. Au début des années 90, plus de 200 institutions à travers le monde l'avaient téléchargé, et le nombre ne cessait d'augmenter.

Depuis 2000, un article sur la physique des particules qui cite FORM est publié tous les quelques jours, en moyenne. "La plupart des résultats [de haute précision] que notre groupe a obtenus au cours des 20 dernières années étaient fortement basés sur le code FORM", a déclaré Thomas Gehrman, professeur à l'Université de Zurich.

Une partie de la popularité de FORM est venue des algorithmes spécialisés qui ont été construits au fil des ans, comme une astuce pour multiplier rapidement certains éléments d'un diagramme de Feynman et une procédure pour réorganiser les équations afin d'avoir le moins de multiplications et d'additions possible. Mais l'avantage le plus ancien et le plus puissant de FORM est la façon dont il gère la mémoire.

Tout comme les humains ont deux types de mémoire, à court terme et à long terme, les ordinateurs en ont deux types : principal et externe. La mémoire principale - la RAM de votre ordinateur - est facile d'accès à la volée mais de taille limitée. Les périphériques de mémoire externes tels que les disques durs et les disques SSD contiennent beaucoup plus d'informations mais sont plus lents. Pour résoudre une longue équation, vous devez la stocker dans la mémoire principale afin de pouvoir travailler facilement avec.

Dans les années 80, les deux types de mémoire étaient limités. "FORM a été conçu à une époque où il n'y avait presque pas de mémoire, et aussi pas d'espace disque - fondamentalement, il n'y avait rien", a déclaré Ben Ruijl, un ancien étudiant de Vermaseren et développeur de FORM qui est maintenant chercheur postdoctoral à l'Ecole polytechnique fédérale de Zurich. Cela posait un défi : les équations étaient trop longues pour être gérées par la mémoire principale. Pour en calculer un, votre système d'exploitation devait également traiter votre disque dur comme s'il s'agissait de la mémoire principale. Le système d'exploitation, ne sachant pas quelle taille attendre de votre équation, stockait les données dans une collection de "pages" sur le disque dur, passant fréquemment de l'une à l'autre au fur et à mesure que différentes pièces étaient nécessaires - un processus inefficace appelé échange.

FORM contourne l'échange et utilise sa propre technique. Lorsque vous travaillez avec une équation dans FORM, le programme attribue à chaque terme une quantité fixe d'espace sur le disque dur. Cette technique permet au logiciel de suivre plus facilement l'emplacement des éléments d'une équation. Cela permet également de ramener facilement ces pièces dans la mémoire principale lorsqu'elles sont nécessaires sans accéder au reste.

La mémoire a augmenté depuis les débuts de FORM, passant de 128 kilo-octets de RAM dans l'Atari 130XE en 1985 à 128 giga-octets de RAM dans mon bureau gonflé - une amélioration d'un million de fois. Mais les astuces développées par Vermaseren restent cruciales. Alors que les physiciens des particules parcourent des pétaoctets de données du Grand collisionneur de hadrons pour rechercher des preuves de nouvelles particules, leur besoin de précision, et donc la longueur de leurs équations, s'allonge.

"Ces choses resteront à jamais pertinentes, quelle que soit la taille de la mémoire, car il y a toujours un problème physique qui peut la pousser au-delà de la taille de la mémoire", a déclaré Ruijl.

Les capacités informatiques ont connu une croissance à peu près exponentielle, doublant environ tous les deux ans. Mais il existe des formes de croissance plus rapides que la croissance exponentielle. Considérez la tâche d'écrire trois lettres - a, b et c - dans tous les ordres possibles. Il y a trois choix pour la première lettre (a, b ou c), deux pour la seconde et un pour la troisième. Le problème évolue comme une factorielle, une relation mathématique qui croît encore plus vite que la croissance exponentielle. Les factorielles apparaissent souvent lorsque vous essayez de compter les combinaisons possibles de choses, comme tous les différents diagrammes de Feynman que vous pouvez dessiner pour un ensemble de particules en collision. La croissance factorielle de ces calculs de physique des particules dépasse la croissance exponentielle de la puissance de calcul.

Aussi crucial que soit un logiciel comme FORM pour la physique, l'effort pour le développer est souvent sous-évalué. Vermaseren a eu la chance d'avoir un poste permanent à l'Institut national de physique subatomique aux Pays-Bas et un patron qui a apprécié le projet. Mais une telle chance est difficile à trouver. Stefano Laporta, un physicien italien qui a développé un algorithme de simplification crucial pour le domaine, a passé la majeure partie de sa carrière sans financement pour les étudiants ou l'équipement. Les universités ont tendance à suivre les dossiers de publication des scientifiques, ce qui signifie que ceux qui travaillent sur des infrastructures critiques sont souvent ignorés pour l'embauche ou la permanence.

« J'ai constaté au fil des ans, de manière constante, que les personnes qui passent beaucoup de temps sur les ordinateurs n'obtiennent pas un emploi permanent en physique », a déclaré Vermaseren.

"Il est peut-être plus prestigieux de produire des résultats physiques que de travailler sur des outils", a déclaré Ruijl.

Alors que quelques jeunes physiciens comme Ruijl travaillent sporadiquement sur FORM, pour le bien de leur carrière, ils doivent consacrer la plupart de leur temps à d'autres recherches. Cela laisse une grande partie de la responsabilité du développement de FORM entre les mains de Vermaseren, qui est maintenant pour la plupart à la retraite.

Sans développement continu, FORM deviendra de moins en moins utilisable - uniquement capable d'interagir avec du code informatique plus ancien, et non aligné sur la façon dont les étudiants d'aujourd'hui apprennent à programmer. Les utilisateurs expérimentés s'y tiendront, mais les jeunes chercheurs adopteront des programmes d'algèbre informatique alternatifs comme Mathematica qui sont plus conviviaux mais des ordres de grandeur plus lents. En pratique, bon nombre de ces physiciens décideront que certains problèmes sont hors limites — trop difficiles à gérer. Ainsi, la physique des particules stagnera, avec seulement quelques personnes capables de travailler sur les calculs les plus difficiles.

En avril, Vermaseren organise un sommet des utilisateurs de FORM pour planifier l'avenir. Ils discuteront de la façon de maintenir FORM en vie : comment le maintenir et l'étendre, et comment montrer à une nouvelle génération d'étudiants tout ce qu'il peut faire. Avec de la chance, un travail acharné et un financement, ils pourraient préserver l'un des outils les plus puissants de la physique.

Horodatage:

Plus de Quantamamagazine