AWS har fundet frem til en ny penge-ordning - lader kunder desperat efter GPU-ressourcer betale for at reservere dem til planlagte datoer og tidspunkter, betalt på forhånd og uden ordreændring tilladt.
Den nye forbrugsmodel er kendt som Amazon Elastic Compute Cloud (EC2) Kapacitetsblokke til ML. Det giver kunder adgang til meget efterspurgt GPU-beregning for at køre korte maskinlærings-arbejdsbelastninger.
Væksten i efterspørgslen efter GPU-kapacitet til at træne og inferere maskinlæringsmodeller har overhalet udbuddet i hele industrien, hvilket gør GPU'er til en knap ressource.
Hvad AWS selvfølgelig ikke indrømmer, er, at det skyldes, at hyperscalere står forrest i køen til GPU'er, og opsuger forsyningen, inklusive AWS selv. Nvidia efter sigende sagde 22 procent af dens kalender Q2-omsætning blev drevet af en enkelt cloud-tjenesteudbyder.
EC2 Capacity Blocks er oprindeligt tilgængelige til Amazon EC2 P5 virtuelle maskine instanser, hvoraf der i øjeblikket kun er én type, p5.48xlarge. Dette har 192 vCPU'er, 2 TB systemhukommelse og otte af Nvidias H100 GPU'er, hvilket gør det til en ret heftig instans.
Ifølge AWS fungerer EC2 Capacity Block-reservationer som hotelværelsesreservationer. Du angiver datoen og varigheden og størrelsen på dit værelse. På samme måde lader AWS dig vælge dato og varighed, du skal bruge GPU-forekomster og antallet af nødvendige forekomster.
Kunder kan reservere en EC2-kapacitetsblok, der kun omfatter en enkelt forekomst eller op til 64, og disse kan reserveres i en til 14 dage efter behov. AWS vil tillade, at disse reserveres op til otte uger i forvejen, og hævder, at kunderne derefter kan planlægge deres maskinlæringsimplementeringer med sikkerhed, velvidende, at de vil have GPU-kapaciteten, når de har brug for det.
AWS siger, at EC2 Capacity Block-priser er dynamiske og afhænger af de samlede tilgængelige niveauer af udbud og efterspørgsel på det tidspunkt, hvor kunden køber. AWS hævder, at det vil vise det laveste tilbud, der er tilgængeligt, der opfylder det interval, som kunden har angivet. EN screenshot på virksomhedens blog viser et eksempel på, at en enkelt instans for en enkelt dag koster 2,344 USD.
Men her er kickeren: de samlede omkostninger for en EC2-kapacitetsblok debiteres på forhånd, faktureres til din konto inden for 12 timer, og AWS tillader ikke, at de bliver ændret eller annulleret efter købet. Så du må hellere være sikker på, at du virkelig har brug for den GPU-kapacitet på disse datoer.
Og når din tid er gået, vil din arbejdsbyrde blive standset uden ceremoniel. EC2 udsender en hændelse gennem Amazon EventBridge for at advare om, at reservationen afsluttes, så brugeren kan kontrollere arbejdsbelastningen. Kørende forekomster vil gå i en lukketilstand 30 minutter før reservationen slutter, men når tiden udløber, vil alle forekomster, der stadig kører, blive afsluttet.
EC2-kapacitetsblokke er tilgængelige nu, men i første omgang kun i AWS US East (Ohio)-regionen. Tilgængelighed er planlagt for yderligere regioner og lokale zoner i fremtiden, sagde AWS.
Skyen biz rapporteret omsætning på 23 milliarder USD for 3. kvartal i år, op fra 20.5 milliarder USD et år tidligere, hvilket afspejler den fortsatte vækst på cloud-markedet, men i et langsommere tempo, da kunderne søger måder at tøjle forbruget på. Ligesom de andre store skyer ser AWS efterspørgsel efter AI-tjenester som en måde at bekæmpe denne tendens på. ®
- SEO Powered Content & PR Distribution. Bliv forstærket i dag.
- PlatoData.Network Vertical Generative Ai. Styrk dig selv. Adgang her.
- PlatoAiStream. Web3 intelligens. Viden forstærket. Adgang her.
- PlatoESG. Kulstof, CleanTech, Energi, Miljø, Solenergi, Affaldshåndtering. Adgang her.
- PlatoHealth. Bioteknologiske og kliniske forsøgs intelligens. Adgang her.
- Kilde: https://go.theregister.com/feed/www.theregister.com/2023/11/01/aws_reserve_gpu_time/
- :har
- :er
- :ikke
- $OP
- 12
- 14
- 22
- 30
- a
- adgang
- Konto
- Yderligere
- indrømme
- fremme
- Efter
- AI
- AI-tjenester
- Alert
- tillade
- tilladt
- Amazon
- Amazon EC2
- an
- ,
- enhver
- ER
- AS
- At
- tilgængelighed
- til rådighed
- AWS
- BE
- fordi
- før
- Bedre
- Big
- Billion
- biz
- Bloker
- Blocks
- men
- Buys
- by
- Kalender
- CAN
- Kapacitet
- sikkerhed
- opladet
- hævder
- fordringer
- Cloud
- CO
- bekæmpe
- Kom
- selskab
- omfattende
- Compute
- forbrug
- fortsatte
- Koste
- Kursus
- For øjeblikket
- kunde
- Kunder
- Dato
- Datoer
- dag
- Dage
- Efterspørgsel
- implementeringer
- gør
- gør ikke
- drevet
- varighed
- dynamisk
- tidligere
- Øst
- slutter
- ender
- begivenhed
- eksempel
- Funktionalitet
- Til
- fra
- forsiden
- fremtiden
- Go
- GPU
- GPU'er
- Vækst
- Have
- link.
- stærkt
- Hotel
- HOURS
- HTTPS
- in
- Herunder
- i første omgang
- instans
- ind
- IT
- ITS
- selv
- jpg
- lige
- Kendskab til
- kendt
- læring
- lad
- Lets
- udlejning
- niveauer
- ligesom
- lokale
- maskine
- machine learning
- Making
- Marked
- opfylder
- Hukommelse
- minutter
- model
- modeller
- modificeret
- at tjene penge
- Behov
- Ny
- ingen
- nu
- nummer
- Nvidia
- of
- tilbyde
- Ohio
- on
- engang
- ONE
- kun
- or
- ordrer
- Andet
- Tempo
- betalt
- Betal
- procent
- fly
- planlagt
- plato
- Platon Data Intelligence
- PlatoData
- smuk
- Priser
- udbyder
- køb
- Q2
- Q3
- rækkevidde
- virkelig
- afspejler
- Refunderinger
- region
- regioner
- påkrævet
- Booking
- Reserve
- forbeholdes
- ressource
- Ressourcer
- indtægter
- Værelse
- Kør
- kører
- s
- Said
- samme
- siger
- Knappe
- planlagt
- Ordningen
- Søg
- Sees
- tjeneste
- Tjenesteudbyder
- Tjenester
- Kort
- Vis
- Shows
- enkelt
- Størrelse
- So
- specificeret
- udgifterne
- Tilstand
- Stadig
- forsyne
- Udbud og efterspørgsel
- sikker
- systemet
- at
- deres
- Them
- derefter
- Der.
- Disse
- de
- denne
- i år
- dem
- Gennem
- tid
- gange
- til
- I alt
- Tog
- Trend
- typen
- us
- Bruger
- Virtual
- virtuel maskine
- var
- Vej..
- måder
- uger
- hvornår
- som
- vilje
- med
- inden for
- Arbejde
- år
- Du
- Din
- zephyrnet
- zoner