Nvidia avslører en liten GPU for arbeidsstasjoner med strømforbruk

Nvidia avslører en liten GPU for arbeidsstasjoner med strømforbruk

Nvidia avduker en liten arbeidsstasjon med GPU PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Nvidia utvidet sin GPU-portefølje på mandag med et lite tynt arbeidsstasjonskort som det hevder gir en betydelig økning i ytelse mens de bare nyter kraft, relativt sett.

Med 2,816 16 CUDA-kjerner og 6 GB GDDRXNUMX ECC-minne, RTX 2000 Ada er kanskje ikke Nvidias kraftigste arbeidsstasjonsbrikke, men dens to-spor, halvhøyde formfaktor gjør den til en av de minste basert på Nvidias Ada Lovelace-mikroarkitektur.

Dette er ikke første gang vi har sett denne formfaktoren fra Nvidia. GPU-slingerens 12 GB RTX A2000, som debuterte i 2021, hadde en lignende blåser-stil design som var i stand til å passe inn i noen alvorlig små systemer, som HPs Z2 G9 Mini.

Mens Ada-oppdateringen opprettholder det samme strømbudsjettet på 70 W som forgjengeren, hevder Nvidia at det nye kortet er omtrent 30 prosent raskere i grafikkarbeidsbelastninger, og opptil 50 prosent raskere i en rekke gjengivelses- og AI-arbeidsbelastninger, som Stable Diffusion-bildegenereringsmodellen .

Når det gjelder rå ytelse, hevder Nvidia at kortet er i stand til å presse rundt 12 teraFLOPS med enkel presisjon eller omtrent 192 teraFLOPS sparsom FP8 fra AD107 GPU-dysen.

Hvis den terningen høres kjent ut, er den den samme som brukes i $299 Nvidia RTX 4060 gaming GPUer, som vi så på forrige vår. Det er ikke uvanlig at Nvidia (eller de fleste brikkehus) resirkulerer dies for bruk i flere produktfamilier, endrer minnekonfigurasjonen og/eller aktiverer/deaktiverer funksjoner for å skape differensiering. For eksempel bruker Nvidias L40 samme GPU-matris som RTX 4090.

Det er en lignende historie for RTX 2000 Ada, som i tillegg til å være mye mindre enn RTX 4060, har dobbelt så mye minne og en mye lavere TDP, slik at den kan kjøres helt av PCIe-sporet. RTX 2000 Ada har færre CUDA-kjerner, og antagelig lavere klokker, men kortet er ikke designet med tanke på spilling.

I stedet er Nvidias RTX-arbeidsstasjonslinje – det den pleide å kalle Quadro GPU-ene – sertifisert for bruk med profesjonelle arbeidsbelastninger, som Solidworks, og hvorfor den har ting som ECC-minne.

Når vi snakker om minne, bør RTX 2000 Adas større rammebuffer også være nyttig for de som utvider sine kreative eller designmessige arbeidsmengder med generative AI-modeller. Med 16 GB vRAM innebygd, bør kortet enkelt kunne romme 13 milliarder parametermodeller på FP8 og potensielt enda større når man drar nytte av teknikker som kvantisering.

Når det er sagt, kan kortets 128-bits minnebuss vise seg å være noe begrensende når det gjelder ytelse. Du kan se hele spesifikasjonsarket her..

Men hvis alt du leter etter er mer minne for å kjøre store språkmodeller lokalt, finnes det billigere og/eller mer ytelsesdyktige alternativer der ute, spesielt hvis du kan gi avkall på Nvidias arbeidsstasjonsfunksjoner. Nvidias RTX 4070 TI Super og AMDs RX 7600XT grafikkort, som lansert på CES forrige måned, har også 16 GB DRAM. Sistnevnte kan fås for $329, noe som gjør den betydelig billigere enn RTX 2000 Ada til $625.

Hvis du tilfeldigvis er på utkikk etter et lite arbeidsstasjonskort med overflødig vRAM, er RTX 2000 Ada tilgjengelig nå fra en rekke Nvidia-kortpartnere, inkludert Arrow Electronics, PNY og Ingram Micro. Kortet vil også bli solgt i forhåndsbygde arbeidsstasjoner fra HP, Dell Tech og Lenovo fra og med april. ®

Tidstempel:

Mer fra Registeret