AWS a venit cu o nouă schemă de a face bani – permițând clienților disperați după resursele GPU să plătească pentru a le rezerva pentru datele și orele programate, plătite în avans și fără modificarea comenzii permise.
Noul model de consum este cunoscut sub numele de Amazon Elastic Compute Cloud (EC2) Blocuri de capacitate pentru ML. Le permite clienților să acceseze un proces GPU foarte căutat pentru a rula sarcini de lucru scurte de învățare automată.
Creșterea cererii pentru capacitatea GPU de a antrena și de a deduce modele de învățare automată a depășit oferta la nivel de industrie, făcând GPU-urile o resursă limitată.
Ceea ce AWS nu admite, desigur, este că acest lucru se datorează faptului că hyperscaler-ul se află în fruntea cozii pentru GPU-uri, ridicând oferta, inclusiv AWS însuși. Nvidia relatărilor a spus că 22% din veniturile din T2 calendaristic au fost conduse de un singur furnizor de servicii cloud.
Blocurile de capacitate EC2 sunt disponibile inițial pentru Amazon EC2 Instanțele de mașină virtuală P5, dintre care în prezent există un singur tip, p5.48xlarge. Acesta dispune de 192 de procesoare virtuale, 2 TB de memorie de sistem și opt dintre GPU-urile H100 de la Nvidia, ceea ce îl face o instanță destul de puternică.
Potrivit AWS, rezervările EC2 Capacity Block funcționează ca și rezervările de camere de hotel. Specificați data și durata și dimensiunea camerei dvs.. În același mod, AWS vă permite să selectați data și durata de care veți avea nevoie de instanțe GPU și numărul de instanțe necesare.
Clienții pot rezerva un bloc de capacitate EC2 care cuprinde doar o singură instanță sau până la 64, iar acestea pot fi rezervate pentru una până la 14 zile, după caz. AWS va permite ca acestea să fie rezervate cu până la opt săptămâni în avans, susținând că clienții își pot planifica apoi implementările de învățare automată cu siguranță, știind că vor avea capacitatea GPU atunci când au nevoie.
AWS spune că prețurile EC2 Capacity Block sunt dinamice și depind de nivelurile totale disponibile de ofertă și cerere în momentul în care clientul cumpără. AWS susține că va afișa oferta disponibilă la cel mai mic preț, care corespunde intervalului specificat de client. A captură de ecran pe blogul companiei arată un exemplu de o singură instanță pentru o singură zi care costă 2,344 USD.
Dar iată care este motivul: costul total al unui bloc de capacitate EC2 este taxat în avans, facturat în contul dvs. în termen de 12 ore, iar AWS nu permite modificarea sau anularea acestora după cumpărare. Așa că ar fi bine să fii sigur că ai nevoie cu adevărat de acea capacitate GPU la acele date.
Și odată ce timpul tău expiră, volumul tău de muncă va fi oprit fără ceremonie. EC2 va emite un eveniment prin Amazon EventBridge pentru a alerta că rezervarea se încheie, astfel încât utilizatorul să poată controla volumul de lucru. Instanțele în execuție vor intra într-o stare de închidere cu 30 de minute înainte de încheierea rezervării, dar odată ce expiră timpul, orice instanță care încă rulează va fi încheiată.
Blocurile de capacitate EC2 sunt disponibile acum, dar inițial numai în regiunea AWS SUA de Est (Ohio). Disponibilitatea este planificată pentru regiuni și zone locale suplimentare în viitor, a spus AWS.
Compania cloud venituri raportate de 23 de miliarde de dolari pentru T3 al acestui an, în creștere față de 20.5 miliarde de dolari cu un an mai devreme, reflectând creșterea continuă a pieței cloud, dar într-un ritm mai lent, pe măsură ce clienții caută modalități de a reduce cheltuielile. La fel ca și ceilalți nori mari, AWS consideră cererea de servicii AI ca o modalitate de a combate această tendință. ®
- Distribuție de conținut bazat pe SEO și PR. Amplifică-te astăzi.
- PlatoData.Network Vertical Generative Ai. Împuterniciți-vă. Accesați Aici.
- PlatoAiStream. Web3 Intelligence. Cunoștințe amplificate. Accesați Aici.
- PlatoESG. carbon, CleanTech, Energie, Mediu inconjurator, Solar, Managementul deșeurilor. Accesați Aici.
- PlatoHealth. Biotehnologie și Inteligență pentru studii clinice. Accesați Aici.
- Sursa: https://go.theregister.com/feed/www.theregister.com/2023/11/01/aws_reserve_gpu_time/
- :are
- :este
- :nu
- $UP
- 12
- 14
- 22
- 30
- a
- acces
- Cont
- Suplimentar
- admite
- avansa
- După
- AI
- Servicii AI
- Alerta
- permite
- permis
- Amazon
- Amazon EC2
- an
- și
- Orice
- SUNT
- AS
- At
- disponibilitate
- disponibil
- AWS
- BE
- deoarece
- înainte
- Mai bine
- Mare
- Miliard
- biz
- Bloca
- Blocuri
- dar
- buys
- by
- Calendar
- CAN
- Capacitate
- certitudine
- încărcat
- revendicare
- creanțe
- Cloud
- CO
- combaterea
- cum
- companie
- care cuprinde
- Calcula
- consum
- a continuat
- A costat
- Curs
- În prezent
- client
- clienţii care
- Data
- Date
- zi
- Zi
- Cerere
- implementări
- face
- nu
- condus
- durată
- dinamic
- Mai devreme
- Est
- sfârșit
- se încheie
- eveniment
- exemplu
- DESCRIERE
- Pentru
- din
- faţă
- viitor
- Go
- GPU
- unități de procesare grafică
- Creștere
- Avea
- aici
- extrem de
- hotel
- ORE
- HTTPS
- in
- Inclusiv
- inițial
- instanță
- în
- IT
- ESTE
- în sine
- jpg
- doar
- Cunoaștere
- cunoscut
- învăţare
- lăsa
- Permite
- închiriere
- nivelurile de
- ca
- local
- maşină
- masina de învățare
- Efectuarea
- Piață
- se intalneste
- Memorie
- minute
- model
- Modele
- modificată
- a face bani
- Nevoie
- Nou
- Nu.
- acum
- număr
- Nvidia
- of
- oferind
- Ohio
- on
- dată
- ONE
- afară
- or
- comandă
- Altele
- Pace
- plătit
- Plătește
- la sută
- plan
- planificat
- Plato
- Informații despre date Platon
- PlatoData
- destul de
- Prețuri
- furnizorul
- cumpărare
- Q2
- Q3
- gamă
- într-adevăr
- reflectând
- Restituirile
- regiune
- regiuni
- necesar
- Rezervare
- Rezervă
- rezervat
- resursă
- Resurse
- venituri
- Cameră
- Alerga
- funcţionare
- s
- Said
- acelaşi
- spune
- Rar
- programată
- schemă
- Căuta
- vede
- serviciu
- Furnizor de servicii
- Servicii
- Pantaloni scurți
- Arăta
- Emisiuni
- singur
- Mărimea
- So
- specificată
- Cheltuire
- Stat
- Încă
- livra
- Cerere și ofertă
- sigur
- sistem
- acea
- lor
- Lor
- apoi
- Acolo.
- Acestea
- ei
- acest
- în acest an
- aceste
- Prin
- timp
- ori
- la
- Total
- Tren
- tendință
- tip
- us
- Utilizator
- Virtual
- mașină virtuală
- a fost
- Cale..
- modalități de
- săptămâni
- cand
- care
- voi
- cu
- în
- Apartamente
- an
- Tu
- Ta
- zephyrnet
- zone