Chipmaker Nvidia har introduceret H200-chipsættet, som vil øge ydeevnen for store sprogmodeller (LLM'er) og håndtere større AI-systemer.
Den nye chip er en væsentlig opgradering fra H100, med næsten dobbelt ydelseshastighed samt højere kapaciteter. Nvidia har indikeret, at den opgraderede chip vil begynde at rulle ud i 2024.
Detaljerne
Den nye chip afløser den nuværende H100 chipset med betydelige opgraderinger, især hukommelse med høj båndbredde, et væsentligt element, der definerer databehandlingshastighed.
H200 kommer i form af hukommelse, bliver den første GPU at komme med HBM3e-teknologi. Den er indlejret med 141 GB hukommelse med 4.8 terabyte i sekundet, hvilket er meget større end H100 med 80 GB kapacitet.
Ifølge Nvidia, en større hukommelsesplads og højhastighedsbehandlingselementer er beregnet til at muliggøre bedre og hurtigere svar fra AI-tjenester.
Nvidia navngav ikke nogen hukommelsesleverandør til det nye chipset, men mulige konkurrenter som Micron Technology kan have leveret hukommelsen, iflg. Engelsk Jagran.
Mens AI-løbet fortsætter, blev H200-chippen designet til at imødekomme høj efterspørgsel efter bedre effektivitet og stærkere kapaciteter.
Baseret på NVIDIA Hopper-arkitekturen har NVIDIA HGX H200 NVIDIA H200 Tensor Core GPU med avanceret hukommelse til at håndtere enorme mængder data til generativ AI og #HPC arbejdsbelastninger. #SC23
— NVIDIA Data Center (@NVIDIADC) November 13, 2023
Store navne i pipelinen
Microsoft Azure, Oracle cloud-infrastruktur, Google Cloud og Amazon Web Services udgør de første cloud-tjenesteudbydere, som vil tilbyde adgang til den H200-baserede chip i andet kvartal af 2024. Dette er ud over specialiserede AI-sky-udbydere Lambda, CoreWeave , og Vultr.
"Når man ser på, hvad der sker på markedet, udvides modelstørrelserne hurtigt... Det er en anden af os, der fortsætter med hurtigt at introducere den nyeste og bedste teknologi," Dion Harris, chef for datacenterproduktmarketing hos Nvidia, blev citeret for at sige.
Ifølge chipproducenten vil den nye H200 føre til et "ydeevneboost, der vil omfatte næsten en fordobling af interferenshastigheden på Metas Llama 2."
Læs også: China International Import Expo viser AI og Metaverse-enheder
Betydningen
Den nye H200 kommer midt USA's eksportrestriktioner på high-end chips, hvilket kan påvirke chipsfremstillingsgiganten.
Dette kommer, fordi anslået 20% til 25% af Nvidias datacenterindtægter kommer fra Kina. Men det har virksomheden sat nye AI-chipordrer på pause fra den asiatiske økonomi og omdirigeret sine systemer til andre markeder.
Efter annonceringen af H200-chipsættet, sprang Nvidias aktier med så meget som 1.5% og nåede 486 dollars den 13. november, hvilket var 12 dollars i forhold til dets rekordhøje niveau på 502 dollars.
På årsbasis er tælleren hoppet med over 250 %. Virksomhedens vækstbane er også forblevet robust, og den projicerer 16 milliarder dollars i omsætning for sit skattemæssige tredje kvartal, hvilket er ca. en stigning på 170% i forhold til det foregående år.
Nvidia kontrollerer omkring 80% af globale marked til AI-chips. Virksomheder som ChatGPT-producenten OpenAI og Stability AI er stærkt afhængige af Nvidia-teknologi.
[Indlejret indhold]
- SEO Powered Content & PR Distribution. Bliv forstærket i dag.
- PlatoData.Network Vertical Generative Ai. Styrk dig selv. Adgang her.
- PlatoAiStream. Web3 intelligens. Viden forstærket. Adgang her.
- PlatoESG. Kulstof, CleanTech, Energi, Miljø, Solenergi, Affaldshåndtering. Adgang her.
- PlatoHealth. Bioteknologiske og kliniske forsøgs intelligens. Adgang her.
- Kilde: https://metanews.com/nvidia-unveils-h200-with-advanced-ai-capabilities/
- :har
- :er
- :ikke
- $OP
- 1
- 10
- 13
- 2024
- 8
- 80
- 9
- a
- Om
- adgang
- Ifølge
- Desuden
- adresse
- fremskreden
- AI
- AI-tjenester
- AI-systemer
- næsten
- også
- Amazon
- Amazon Web Services
- Midt
- beløb
- an
- ,
- Fondsbørsmeddelelse
- En anden
- enhver
- arkitektur
- ER
- AS
- asiatisk
- At
- Azure
- grundlag
- Bedre
- større
- Billion
- boost
- men
- by
- kapaciteter
- center
- ChatGPT
- Kina
- chip
- Chips
- Cloud
- sky infrastruktur
- Kom
- kommer
- Virksomheder
- selskab
- Selskabs
- konkurrenter
- indhold
- fortsætter
- fortsættende
- kontrol
- Core
- kunne
- Counter
- Nuværende
- data
- Data Center
- databehandling
- definerer
- Efterspørgsel
- konstrueret
- DID
- fordobling
- økonomi
- effektivitet
- element
- elementer
- indlejret
- muliggøre
- især
- anslået
- Expo
- eksport
- hurtigere
- Funktionalitet
- Fornavn
- Fiscal
- Til
- formular
- fra
- generative
- Generativ AI
- kæmpe
- Google Cloud
- GPU
- større
- størst
- Vækst
- håndtere
- Happening
- Have
- hoved
- stærkt
- Høj
- High-End
- højere
- HTML
- HTTPS
- KIMOs Succeshistorier
- importere
- in
- omfatter
- angivet
- Infrastruktur
- initial
- Interferens
- internationalt
- indføre
- introduceret
- IT
- ITS
- sprang
- Sprog
- stor
- seneste
- føre
- ligesom
- Llama
- Se
- lave
- maker
- Marked
- Marketing
- Markeder
- massive
- Kan..
- betød
- Hukommelse
- metaverse
- micron
- model
- modeller
- meget
- navn
- navne
- Ny
- ny chip
- november
- Nvidia
- of
- tilbyde
- on
- OpenAI
- oracle
- Andet
- ud
- i løbet af
- per
- ydeevne
- plato
- Platon Data Intelligence
- PlatoData
- mulig
- tidligere
- forarbejdning
- Produkt
- projekter
- forudsat
- udbydere
- Kvarter
- Løb
- hurtigt
- nå
- Læs
- stole
- forblevet
- reaktioner
- indtægter
- robust
- Rullende
- siger
- Anden
- andet kvartal
- tjeneste
- service-udøvere
- Tjenester
- Aktier
- vige
- signifikant
- størrelser
- Space
- særligt
- Specialty
- hastighed
- Stabilitet
- starte
- stærkere
- sådan
- leverandør
- hurtigt
- Systemer
- Teknologier
- end
- at
- Tredje
- denne
- til
- bane
- sand
- Løfter sløret
- opgradering
- opgraderet
- opgraderinger
- us
- var
- web
- webservices
- GODT
- som
- WHO
- vilje
- med
- år
- Du
- youtube
- zephyrnet