Avgjørende dataprogram for partikkelfysikk i fare for foreldelse PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Avgjørende dataprogram for partikkelfysikk med fare for foreldelse

Introduksjon

Nylig så jeg en medpartikkelfysiker snakke om en beregning han hadde presset til en ny presisjonshøyde. Verktøyet hans? Et dataprogram fra 1980-tallet kalt FORM.

Partikkelfysikere bruker noen av de lengste ligningene i all vitenskap. For å se etter tegn på nye elementærpartikler i kollisjoner ved Large Hadron Collider, for eksempel, tegner de tusenvis av bilder kalt Feynman-diagrammer som viser mulige kollisjonsutfall, hver av dem koder for en komplisert formel som kan være millioner av termer lange. Å summere formler som disse med penn og papir er umulig; selv å legge dem til med datamaskiner er en utfordring. Algebrareglene vi lærer på skolen er raske nok for lekser, men for partikkelfysikk er de sørgelig ineffektive.

Programmer kalt dataalgebra-systemer streber etter å håndtere disse oppgavene. Og hvis du vil løse de største ligningene i verden, har ett program skilt seg ut i 33 år: FORM.

Utviklet av den nederlandske partikkelfysikeren Jos Vermaseren, FORM er en sentral del av infrastrukturen til partikkelfysikk, nødvendig for de vanskeligste beregningene. Men som med overraskende mange viktige deler av digital infrastruktur, hviler FORMs vedlikehold i stor grad på én person: Vermaseren selv. Og med sine 73 år har Vermaseren begynt å trekke seg tilbake fra FORM-utviklingen. På grunn av insentivstrukturen til akademia, som premierer publiserte artikler, ikke programvareverktøy, har ingen etterfølger dukket opp. Hvis situasjonen ikke endrer seg, kan partikkelfysikken bli tvunget til å bremse dramatisk.

FORM startet på midten av 1980-tallet, da datamaskinens rolle endret seg raskt. Forgjengeren, et program kalt Schoonschip laget av Martinus Veltman, ble utgitt som en spesialbrikke som du plugget inn på siden av en Atari-datamaskin. Vermaseren ønsket å lage et mer tilgjengelig program som kunne lastes ned av universiteter over hele verden. Han begynte å programmere den på dataspråket FORTRAN, som står for formeloversettelse. Navnet FORM var et riff på det. (Senere byttet han til et programmeringsspråk kalt C.) Vermaseren ga ut programvaren sin i 1989. På begynnelsen av 90-tallet hadde over 200 institusjoner rundt om i verden lastet den ned, og antallet fortsatte å klatre.

Siden 2000 har en partikkelfysikkartikkel som siterer FORM blitt publisert med noen få dager i gjennomsnitt. "De fleste av [høypresisjons] resultatene som vår gruppe oppnådde de siste 20 årene var sterkt basert på FORM-kode," sa Thomas Gehrmann, professor ved universitetet i Zürich.

Noe av FORMs popularitet kom fra spesialiserte algoritmer som ble bygget opp gjennom årene, for eksempel et triks for raskt å multiplisere visse deler av et Feynman-diagram, og en prosedyre for å omorganisere ligninger for å ha så få multiplikasjoner og addisjoner som mulig. Men FORMs eldste og kraftigste fordel er hvordan den håndterer minne.

Akkurat som mennesker har to typer minne, kortsiktig og langsiktig, har datamaskiner to typer: hoved og ekstern. Hovedminnet – datamaskinens RAM – er lett tilgjengelig på farten, men begrenset i størrelse. Eksterne minneenheter som harddisker og solid-state-stasjoner inneholder mye mer informasjon, men er tregere. For å løse en lang ligning må du lagre den i hovedminnet slik at du enkelt kan jobbe med den.

På 80-tallet var begge typer minne begrenset. "FORM ble bygget i en tid da det nesten ikke var noe minne, og heller ingen diskplass - i utgangspunktet var det ingenting," sa Ben Ruijl, en tidligere student av Vermaseren og FORM-utvikler som nå er postdoktor ved Swiss Federal Institute of Technology Zürich. Dette utgjorde en utfordring: Ligningene var for lange til at hovedminnet kunne håndtere. For å beregne en, måtte operativsystemet behandle harddisken din som om den også var hovedminne. Operativsystemet, uten å vite hvor stor det kan forventes at ligningen din skal være, ville lagre dataene i en samling av "sider" på harddisken, og byttet ofte mellom dem ettersom forskjellige deler var nødvendig - en ineffektiv prosess kalt bytte.

FORM går utenom bytting og bruker sin egen teknikk. Når du jobber med en ligning i FORM, tildeler programmet hvert ledd en fast mengde plass på harddisken. Denne teknikken lar programvaren lettere holde styr på hvor delene av en ligning er. Det gjør det også enkelt å bringe disse brikkene tilbake til hovedminnet når de trengs uten å få tilgang til resten.

Minnet har vokst siden FORMs tidlige dager, fra 128 kilobyte RAM i Atari 130XE i 1985 til 128 gigabyte RAM på min oppskrudde skrivebord - en million ganger forbedring. Men triksene Vermaseren utviklet er fortsatt avgjørende. Etter hvert som partikkelfysikere porerer gjennom petabyte med data fra Large Hadron Collider for å søke etter bevis på nye partikler, blir behovet deres for presisjon, og dermed lengden på ligningene, lengre.

"Disse tingene vil for alltid være relevante, uansett hvor stort minnet vokser, fordi det alltid er et fysikkproblem som kan presse det utover størrelsen på minnet," sa Ruijl.

Datakapasiteten har vokst omtrent eksponentielt, og dobles omtrent hvert annet år. Men det finnes raskere former for vekst enn eksponentiell vekst. Vurder oppgaven med å skrive tre bokstaver - a, b og c - i alle mulige rekkefølger. Det er tre valg for den første bokstaven (a, b eller c), to for den andre og en for den tredje. Problemet skalerer som en faktoriell, en matematisk sammenheng som vokser enda raskere enn eksponentiell vekst. Faktorer dukker ofte opp når du prøver å telle mulige kombinasjoner av ting, for eksempel alle de forskjellige Feynman-diagrammene du kan tegne for et sett med kolliderende partikler. Faktorveksten til disse partikkelfysikkberegningene overgår den eksponentielle veksten av datakraft.

Like viktig som programvare som FORM er for fysikk, er innsatsen for å utvikle den ofte undervurdert. Vermaseren var heldig ved at han hadde en fast stilling ved National Institute for Subatomic Physics i Nederland, og en sjef som satte pris på prosjektet. Men slik flaks er vanskelig å få. Stefano Laporta, en italiensk fysiker som utviklet en avgjørende forenklingsalgoritme for feltet, har tilbrakt mesteparten av sin karriere uten finansiering av studenter eller utstyr. Universiteter har en tendens til å spore forskernes publikasjonsposter, noe som betyr at de som jobber med kritisk infrastruktur ofte blir forbigått for ansettelse eller ansettelse.

"Jeg har sett gjennom årene, konsekvent, at folk som bruker mye tid på datamaskiner, ikke får en fast jobb i fysikk," sa Vermaseren.

"Det er kanskje mer prestisjefylt å faktisk produsere fysiske resultater enn å jobbe med verktøy," sa Ruijl.

Mens noen få yngre fysikere som Ruijl jobber sporadisk med FORM, må de for karrierens skyld bruke mesteparten av tiden på annen forskning. Dette overlater mye av ansvaret for å utvikle FORM i hendene på Vermaseren, som nå stort sett er pensjonist.

Uten pågående utvikling vil FORM bli mindre og mindre brukbar — kun i stand til å samhandle med eldre datakode, og ikke på linje med hvordan dagens elever lærer å programmere. Erfarne brukere vil holde seg til det, men yngre forskere vil ta i bruk alternative dataalgebraprogrammer som Mathematica som er mer brukervennlige, men størrelsesordener langsommere. I praksis vil mange av disse fysikerne bestemme at visse problemer er forbudt - for vanskelig å håndtere. Så partikkelfysikk vil stoppe, med bare noen få personer som kan jobbe med de vanskeligste beregningene.

I april holder Vermaseren et toppmøte med FORM-brukere for å planlegge for fremtiden. De vil diskutere hvordan man holder FORM i live: hvordan man opprettholder og utvider den, og hvordan man viser en ny generasjon studenter hvor mye den kan gjøre. Med flaks, hardt arbeid og finansiering kan de bevare et av de kraftigste verktøyene innen fysikk.

Tidstempel:

Mer fra Quantamagazin