AWS har kommit med ett nytt system för att tjäna pengar – som låter kunder som är desperata efter GPU-resurser betala för att reservera dem för schemalagda datum och tider, betalas i förskott och utan att beställningsändringar är tillåtna.
Den nya konsumtionsmodellen är känd som Amazon Elastic Compute Cloud (EC2) Kapacitetsblock för ML. Det ger kunder tillgång till mycket eftertraktade GPU-beräkningar för att köra korta maskininlärningsbelastningar.
Tillväxten i efterfrågan på GPU-kapacitet för att träna och sluta sig till maskininlärningsmodeller har överträffat utbudet i branschen, vilket gör GPU:er till en knapp resurs.
Vad AWS naturligtvis inte medger är att detta beror på att hyperskalare står längst fram i kön för GPU:er, och samlar upp utbudet, inklusive AWS själv. Nvidia enligt uppgift sa att 22 procent av intäkterna för andra kvartalet i kalendern drevs av en enda molntjänstleverantör.
EC2 Capacity Blocks är initialt tillgängliga för Amazon EC2 P5 virtuella maskininstanser, varav det för närvarande bara finns en typ, p5.48xlarge. Den har 192 vCPU:er, 2 TB systemminne och åtta av Nvidias H100 GPU:er, vilket gör det till en ganska rejäl instans.
Enligt AWS fungerar EC2 Capacity Block-reservationer som bokningar av hotellrum. Du anger datum och varaktighet och storlek på ditt rum. På samma sätt låter AWS dig välja datum och varaktighet du behöver GPU-instanser och antalet instanser som krävs.
Kunder kan reservera ett EC2 Capacity Block som bara omfattar en enstaka instans, eller upp till 64, och dessa kan reserveras för en till 14 dagar efter behov. AWS kommer att tillåta dessa att reserveras upp till åtta veckor i förväg, och hävdar att kunderna sedan kan planera för sina maskininlärningsinstallationer med säkerhet, i vetskap om att de kommer att ha GPU-kapaciteten när de behöver den.
AWS säger att priserna på EC2 Capacity Block är dynamiska och beror på de totala tillgängliga nivåerna av utbud och efterfrågan vid den tidpunkt då kunden köper. AWS hävdar att det kommer att visa det lägsta prissatta erbjudandet som är tillgängligt som motsvarar det intervall som kunden har specificerat. A skärmdump på företagets blogg visar ett exempel på en enstaka instans för en enda dag som kostar $2,344 XNUMX.
Men här är kickern: den totala kostnaden för ett EC2 Capacity Block debiteras i förväg, faktureras ditt konto inom 12 timmar, och AWS tillåter inte att de ändras eller avbryts efter köpet. Så du bör vara säker på att du verkligen behöver den GPU-kapaciteten på dessa datum.
Och när din tid väl är ute kommer din arbetsbörda att stoppas utan ceremonier. EC2 kommer att sända en händelse genom Amazon EventBridge för att varna om att reservationen avslutas så att användaren kan kontrollera arbetsbelastningen. Pågående instanser kommer att stängas av 30 minuter innan bokningen slutar, men när tiden löper ut kommer alla instanser som fortfarande körs att avslutas.
EC2 Capacity Blocks är tillgängliga nu, men initialt endast i AWS US East (Ohio)-regionen. Tillgänglighet är planerad för ytterligare regioner och lokala zoner i framtiden, sa AWS.
Molnbiz rapporterade intäkter på 23 miljarder USD för tredje kvartalet i år, upp från 3 miljarder USD ett år tidigare, vilket återspeglar den fortsatta tillväxten på molnmarknaden men i en långsammare takt när kunderna letar efter sätt att tygla utgifterna. Precis som de andra stora molnen ser AWS efterfrågan på AI-tjänster som ett sätt att bekämpa den trenden. ®
- SEO-drivet innehåll och PR-distribution. Bli förstärkt idag.
- PlatoData.Network Vertical Generative Ai. Styrka dig själv. Tillgång här.
- PlatoAiStream. Web3 Intelligence. Kunskap förstärkt. Tillgång här.
- Platoesg. Kol, CleanTech, Energi, Miljö, Sol, Avfallshantering. Tillgång här.
- PlatoHealth. Biotech och kliniska prövningar Intelligence. Tillgång här.
- Källa: https://go.theregister.com/feed/www.theregister.com/2023/11/01/aws_reserve_gpu_time/
- : har
- :är
- :inte
- $UPP
- 12
- 14
- 22
- 30
- a
- tillgång
- Konto
- Annat
- erkänna
- avancera
- Efter
- AI
- AI-tjänster
- Varna
- tillåter
- tillåts
- amason
- Amazon EC2
- an
- och
- vilken som helst
- ÄR
- AS
- At
- tillgänglighet
- tillgänglig
- AWS
- BE
- därför att
- innan
- Bättre
- Stor
- Miljarder
- biz
- Blockera
- Block
- men
- buys
- by
- Kalender
- KAN
- Kapacitet
- säkerhet
- laddad
- hävdar
- hävdar
- cloud
- CO
- bekämpa
- komma
- företag
- innefattande
- Compute
- konsumtion
- fortsatte
- Pris
- Kurs
- För närvarande
- kund
- Kunder
- Datum
- Datum
- dag
- Dagar
- Efterfrågan
- distributioner
- gör
- doesn
- driven
- varaktighet
- dynamisk
- Tidigare
- öster
- slutar
- slutar
- händelse
- exempel
- Funktioner
- För
- från
- främre
- framtida
- Go
- GPU
- GPUs
- Tillväxt
- Har
- här.
- höggradigt
- hotell
- ÖPPETTIDER
- HTTPS
- in
- Inklusive
- initialt
- exempel
- in
- IT
- DESS
- sig
- jpg
- bara
- Menande
- känd
- inlärning
- Låt
- Lets
- uthyrning
- nivåer
- tycka om
- lokal
- Maskinen
- maskininlärning
- Framställning
- marknad
- möter
- Minne
- minuter
- modell
- modeller
- modifierad
- tjäna pengar
- Behöver
- Nya
- Nej
- nu
- antal
- Nvidia
- of
- erbjuda
- Ohio
- on
- gång
- ONE
- endast
- or
- beställa
- Övriga
- Fred
- betalas
- Betala
- procent
- Planen
- planeras
- plato
- Platon Data Intelligence
- PlatonData
- pretty
- Priser
- leverantör
- inköp
- Q2
- Q3
- område
- verkligen
- reflekterande
- Bidragen
- region
- regioner
- Obligatorisk
- Bokning
- Reserv
- reserverad
- resurs
- Resurser
- intäkter
- Rum
- Körning
- rinnande
- s
- Nämnda
- Samma
- säger
- Knappa
- planerad
- ordningen
- Seek
- ser
- service
- Leverantör
- Tjänster
- Kort
- show
- Visar
- enda
- Storlek
- So
- specificerade
- Spendera
- Ange
- Fortfarande
- leverera
- Utbud och efterfrågan
- säker
- system
- den där
- Smakämnen
- deras
- Dem
- sedan
- Där.
- Dessa
- de
- detta
- i år
- de
- Genom
- tid
- gånger
- till
- Totalt
- Tåg
- Trend
- Typ
- us
- Användare
- Virtuell
- virtuell maskin
- var
- Sätt..
- sätt
- veckor
- när
- som
- kommer
- med
- inom
- Arbete
- år
- Om er
- Din
- zephyrnet
- zoner