Nvidia lança pequena GPU para estação de trabalho que consome muita energia

Nvidia lança pequena GPU para estação de trabalho que consome muita energia

Nvidia unveils small power-sipping workstation GPU PlatoBlockchain Data Intelligence. Vertical Search. Ai.

A Nvidia expandiu seu portfólio de GPU na segunda-feira com uma pequena placa de estação de trabalho que afirma oferecer um aumento considerável no desempenho enquanto apenas consome energia, relativamente falando.

Com 2,816 núcleos CUDA e 16 GB de memória GDDR6 ECC, o RTX 2000 Ada pode não ser o chip de estação de trabalho mais poderoso da Nvidia, mas seu formato de slot duplo e meia altura o torna um dos menores baseado na microarquitetura Ada Lovelace da Nvidia.

Esta não é a primeira vez que vemos este formato da Nvidia. O RTX A12 de 2000 GB do GPU slinger, que estreou em 2021, apresentava um design estilo soprador semelhante que era capaz de caber em alguns sistemas realmente pequenos, como o da HP Z2 G9 Mini.

Embora a atualização Ada mantenha o mesmo orçamento de energia de 70 W de seu antecessor, a Nvidia afirma que a nova placa é aproximadamente 30% mais rápida em cargas de trabalho gráficas e até 50% mais rápida em uma variedade de cargas de trabalho de renderização e IA, como o modelo de geração de imagem Stable Diffusion .

Em termos de desempenho bruto, a Nvidia considera a placa capaz de extrair cerca de 12 teraFLOPS com precisão única ou cerca de 192 teraFLOPS de FP8 esparso de sua GPU AD107.

Se esse dado parece familiar, é o mesmo usado nas GPUs para jogos Nvidia RTX 299 de US $ 4060, que nós olhou última primavera. Não é incomum para a Nvidia (ou a maioria das empresas de chips) reciclar matrizes para uso em várias famílias de produtos, alterando a configuração da memória e/ou ativando/desativando recursos para criar diferenciação. Por exemplo, o L40 da Nvidia usa o mesma matriz de GPU como o RTX 4090.

A história é semelhante para o RTX 2000 Ada, que além de ser bem menor que o RTX 4060, possui o dobro de memória e um TDP bem menor, permitindo que funcione inteiramente no slot PCIe. A RTX 2000 Ada tem menos núcleos CUDA e presumivelmente clocks mais baixos, mas a placa não foi projetada pensando nos jogos.

Em vez disso, a linha de estações de trabalho RTX da Nvidia – o que costumava chamar de GPUs Quadro – é certificada para uso com cargas de trabalho profissionais, como Solidworks, e por que possui recursos como memória ECC.

Falando em memória, o buffer de quadros maior do RTX 2000 Ada também deve ser útil para aqueles que aumentam suas cargas de trabalho criativas ou de design com modelos generativos de IA. Com 16 GB de vRAM integrado, a placa deve ser facilmente capaz de acomodar 13 bilhões de modelos de parâmetros no FP8 e potencialmente ainda maiores ao aproveitar técnicas como quantização.

Dito isto, o barramento de memória de 128 bits da placa pode ser um tanto limitante em termos de desempenho. Você pode ver a folha de especificações completa SUA PARTICIPAÇÃO FAZ A DIFERENÇA.

Mas, se tudo o que você procura é mais memória para executar modelos de linguagem grandes localmente, existem opções mais baratas e/ou com melhor desempenho, especialmente se você puder renunciar aos recursos de estação de trabalho da Nvidia. Placas gráficas RTX 4070 TI Super da Nvidia e RX 7600XT da AMD, que lançado na CES no mês passado, também apresentam 16 GB de DRAM. Este último pode ser adquirido por US$ 329, tornando-o consideravelmente mais barato que o RTX 2000 Ada por US$ 625.

Se você estiver procurando por uma pequena placa de estação de trabalho com excesso de vRAM, o RTX 2000 Ada já está disponível em vários parceiros de placas da Nvidia, incluindo Arrow Electronics, PNY e Ingram Micro. A placa também será vendida em estações de trabalho pré-construídas da HP, Dell Tech e Lenovo a partir de abril. ®

Carimbo de hora:

Mais de O registro