Nvidia afslører lille power-sipping workstation GPU

Nvidia afslører lille power-sipping workstation GPU

Nvidia unveils small power-sipping workstation GPU PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Nvidia udvidede sin GPU-portefølje mandag med et itsy-bitsy workstation-kort, som det hævder leverer en betragtelig løft i ydeevnen, mens den relativt set bare nyder strøm.

Med 2,816 CUDA-kerner og 16 GB GDDR6 ECC-hukommelse, RTX 2000 Ada er måske ikke Nvidias mest kraftfulde workstation-chip, men dens to-slot, halvhøjde formfaktor gør den til en af ​​de mindste baseret på Nvidias Ada Lovelace-mikroarkitektur.

Det er ikke første gang, vi har set denne formfaktor fra Nvidia. GPU-slingerens 12GB RTX A2000, som debuterede i 2021, indeholdt et lignende blæser-stil design, der var i stand til at passe ind i nogle alvorligt små systemer, såsom HP's Z2 G9 Mini.

Mens Ada-opdateringen opretholder det samme strømbudget på 70 W som sin forgænger, hævder Nvidia, at det nye kort er cirka 30 procent hurtigere i grafikbelastninger og op til 50 procent hurtigere i en række forskellige gengivelses- og AI-arbejdsbelastninger, som f.eks. stabil diffusions-billedgenereringsmodellen .

Med hensyn til rå ydeevne fremhæver Nvidia, at kortet er i stand til at presse omkring 12 teraFLOPS med enkelt præcision eller omkring 192 teraFLOPS sparsom FP8 fra sin AD107 GPU-matrice.

Hvis den terning lyder bekendt, er det den samme, der blev brugt i $299 Nvidia RTX 4060 gaming GPU'erne, som vi set på sidste forår. Det er ikke ualmindeligt, at Nvidia (eller de fleste chiphuse) genbruger matricer til brug i flere produktfamilier, ændrer hukommelseskonfigurationen og/eller aktiverer/deaktiverer funktioner for at skabe differentiering. For eksempel bruger Nvidias L40 samme GPU-matrice som RTX 4090.

Det er en lignende historie for RTX 2000 Ada, som udover at være meget mindre end RTX 4060, har dobbelt så meget hukommelse og en meget lavere TDP, hvilket gør det muligt at køre helt uden for PCIe-slottet. RTX 2000 Ada har færre CUDA-kerner og formodentlig lavere ure, men kortet er ikke designet med gaming i tankerne.

I stedet er Nvidias RTX-arbejdsstationslinje - hvad den plejede at kalde sine Quadro GPU'er - certificeret til brug med professionelle arbejdsbelastninger, såsom Solidworks, og hvorfor den har ting som ECC-hukommelse.

Apropos hukommelse, så burde RTX 2000 Adas større rammebuffer også være praktisk for dem, der udvider deres kreative eller designmæssige arbejdsbelastninger med generative AI-modeller. Med 16 GB vRAM ombord skulle kortet nemt kunne rumme 13 milliarder parametermodeller på FP8 og potentielt endnu større, når man udnytter teknikker som kvantisering.

Når det er sagt, kan kortets 128-bit hukommelsesbus vise sig at være noget begrænsende med hensyn til ydeevne. Du kan se hele specifikationsarket link..

Men hvis alt du leder efter er mere hukommelse til at køre store sprogmodeller lokalt, er der billigere og/eller mere effektive muligheder derude, især hvis du kan undvære Nvidias arbejdsstationsfunktioner. Nvidias RTX 4070 TI Super og AMDs RX 7600XT grafikkort, som lanceret på CES i sidste måned, har også 16 GB DRAM. Sidstnævnte kan fås for $329, hvilket gør den betydeligt billigere end RTX 2000 Ada til $625.

Hvis du tilfældigvis er på udkig efter et lille arbejdsstationskort med overskydende vRAM, så er RTX 2000 Ada tilgængelig nu fra en række Nvidia-kortpartnere, inklusive Arrow Electronics, PNY og Ingram Micro. Kortet vil også blive solgt i præfabrikerede arbejdsstationer fra HP, Dell Tech og Lenovo fra og med april. ®

Tidsstempel:

Mere fra Registret