Chipmaker Nvidia har introdusert H200-brikkesettet, som vil øke ytelsen for store språkmodeller (LLM) og håndtere større AI-systemer.
Den nye brikken er en betydelig oppgradering fra H100, med nesten dobbel ytelseshastighet samt høyere muligheter. Nvidia har indikert at den oppgraderte brikken vil begynne å rulle ut i 2024.
Det spesifikke
Den nye brikken erstatter gjeldende H100 brikkesett med betydelige oppgraderinger, spesielt minne med høy båndbredde, et betydelig element som definerer databehandlingshastighet.
H200 kommer i form av minne, blir den første GPUen å komme med HBM3e-teknologi. Den er innebygd med 141 GB minne med 4.8 terabyte per sekund, som er mye større enn H100 med 80 GB kapasitet.
Ifølge Nvidia, større minneplass og høyhastighetsbehandlingselementer er ment å muliggjøre bedre og raskere svar fra AI-tjenester.
Nvidia nevnte ingen minneleverandør for det nye brikkesettet, men mulige konkurrenter som Micron Technology kan ha levert minnet, iht. Engelsk Jagran.
Ettersom AI-kappløpet fortsetter, ble H200-brikken designet for å møte høy etterspørsel etter bedre effektivitet og sterkere evner.
Basert på NVIDIA Hopper-arkitekturen, har NVIDIA HGX H200 NVIDIA H200 Tensor Core GPU med avansert minne for å håndtere enorme mengder data for generativ AI og #HPC arbeidsbelastninger. #SC23
— NVIDIA Data Center (@NVIDIADC) November 13, 2023
Store navn i pipelinen
Microsoft Azure, Oracle cloud infrastructure, Google Cloud og Amazon Web Services utgjør de første skytjenesteleverandørene som vil tilby tilgang til den H200-baserte brikken i andre kvartal 2024. Dette kommer i tillegg til spesialitet AI-skyleverandørene Lambda, CoreWeave , og Vultr.
"Når du ser på hva som skjer i markedet, utvides modellstørrelsene raskt... Det er en annen av oss som fortsetter å raskt introdusere den nyeste og beste teknologien," Dion Harris, leder for datasenterproduktmarkedsføring hos Nvidia, ble sitert som sagt.
I følge brikkeprodusenten vil den nye H200 føre til et "ytelsesløft som vil inkludere nesten dobling av interferenshastigheten på Metas Llama 2."
Les også: China International Import Expo viser frem AI og Metaverse-enheter
Betydningen
Den nye H200 kommer midt USAs eksportrestriksjoner på avanserte sjetonger, noe som kan påvirke sjetongergiganten.
Dette kommer ettersom anslagsvis 20% til 25% av Nvidias datasenterinntekter kommer fra Kina. Men det har selskapet stoppet nye AI-brikkeordrer fra den asiatiske økonomien og omdirigerte systemene til andre markeder.
Etter kunngjøringen av H200-brikkesettet, hoppet Nvidias aksjer med så mye som 1.5 %, og nådde 486 dollar den 13. november, som var 12 dollar unna sin all-time high på 502 dollar.
På årsbasis har telleren hoppet med over 250 %. Selskapets vekstbane har også holdt seg robust, og det projiserer 16 milliarder dollar i inntekter for tredje kvartal, som er ca. en økning på 170% i løpet av året før.
Nvidia kontrollerer omtrent 80% av globalt marked for AI-brikker. Selskaper som ChatGPT-produsenten OpenAI og Stability AI er avhengige av Nvidia-teknologi.
[Innebygd innhold]
- SEO-drevet innhold og PR-distribusjon. Bli forsterket i dag.
- PlatoData.Network Vertical Generative Ai. Styrk deg selv. Tilgang her.
- PlatoAiStream. Web3 Intelligence. Kunnskap forsterket. Tilgang her.
- PlatoESG. Karbon, CleanTech, Energi, Miljø, Solenergi, Avfallshåndtering. Tilgang her.
- PlatoHelse. Bioteknologisk og klinisk etterretning. Tilgang her.
- kilde: https://metanews.com/nvidia-unveils-h200-with-advanced-ai-capabilities/
- : har
- :er
- :ikke
- $OPP
- 1
- 10
- 13
- 2024
- 8
- 80
- 9
- a
- Om oss
- adgang
- Ifølge
- tillegg
- adresse
- avansert
- AI
- AI-tjenester
- AI-systemer
- nesten
- også
- Amazon
- Amazon Web Services
- Amid
- beløp
- an
- og
- Kunngjøring
- En annen
- noen
- arkitektur
- ER
- AS
- asiatisk
- At
- Azure
- basis
- Bedre
- større
- Milliarder
- øke
- men
- by
- evner
- sentrum
- ChatGPT
- Kina
- chip
- chips
- Cloud
- sky infrastruktur
- Kom
- kommer
- Selskaper
- Selskapet
- Selskapets
- konkurrenter
- innhold
- fortsetter
- fortsetter
- kontroller
- Kjerne
- kunne
- Motvirke
- Gjeldende
- dato
- Datasenter
- databehandling
- definerer
- Etterspørsel
- designet
- gJORDE
- dobling
- økonomi
- effektivitet
- element
- elementer
- innebygd
- muliggjøre
- spesielt
- anslått
- Expo
- eksportere
- raskere
- Egenskaper
- Først
- skatt
- Til
- skjema
- fra
- generative
- Generativ AI
- giganten
- Google Cloud
- GPU
- større
- størst
- Vekst
- håndtere
- Skjer
- Ha
- hode
- tungt
- Høy
- High-End
- høyere
- HTML
- HTTPS
- Påvirkning
- importere
- in
- inkludere
- indikert
- Infrastruktur
- innledende
- Forstyrrelser
- internasjonalt
- introdusere
- introdusert
- IT
- DET ER
- hoppet
- Språk
- stor
- siste
- føre
- i likhet med
- Llama
- Se
- gjøre
- maker
- marked
- Marketing
- Markets
- massive
- Kan..
- ment
- Minne
- metaverse
- micron
- modell
- modeller
- mye
- navn
- navn
- Ny
- ny brikke
- november
- Nvidia
- of
- tilby
- on
- OpenAI
- orakel
- Annen
- ut
- enn
- for
- ytelse
- plato
- Platon Data Intelligence
- PlatonData
- mulig
- forrige
- prosessering
- Produkt
- prosjekter
- forutsatt
- tilbydere
- Fjerdedel
- Race
- raskt
- nå
- Lese
- avhengige
- forble
- svar
- inntekter
- robust
- rullende
- sier
- Sekund
- andre kvartal
- tjeneste
- tjenestetilbydere
- Tjenester
- Aksjer
- viker
- signifikant
- størrelser
- Rom
- spesiell
- Spesialitet
- fart
- Stabilitet
- Begynn
- sterkere
- slik
- leverandør
- raskt
- Systemer
- Teknologi
- enn
- Det
- De
- Tredje
- denne
- til
- bane
- sant
- avduker
- oppgradering
- oppgradert
- oppgraderinger
- us
- var
- web
- webtjenester
- VI VIL
- hvilken
- HVEM
- vil
- med
- år
- Du
- youtube
- zephyrnet