AWS on kehittänyt uuden rahan ansaitsemisjärjestelmän – GPU-resursseja epätoivoisesti kaipaavien asiakkaiden annetaan maksaa varatakseen ne ajoitettuihin päivämääriin ja kellonaikaan, maksetaan etukäteen ja tilauksen muuttaminen ei ole sallittua.
Uusi kulutusmalli tunnetaan nimellä Amazon Elastic Compute Cloud (EC2) Kapasiteettilohkot ML:lle. Sen avulla asiakkaat voivat käyttää erittäin haluttua GPU-laskentaa lyhyiden koneoppimistyökuormien suorittamiseksi.
GPU-kapasiteetin kysynnän kasvu koneoppimismallien kouluttamiseen ja päättelemiseen on ylittänyt alan laajuisen tarjonnan, mikä tekee GPU:ista niukat resurssit.
AWS ei tietenkään myönnä, että tämä johtuu siitä, että hyperskaalaajat ovat GPU-jonon etuosassa ja nostavat tarjontaa, mukaan lukien itse AWS. Nvidia kuulemma sanoi, että 22 prosenttia sen kalenterin toisen vuosineljänneksen liikevaihdosta tuli yhdeltä pilvipalveluntarjoajalta.
EC2 Capacity Blocks ovat alun perin saatavilla Amazon EC2:lle P5 virtuaalikoneen ilmentymät, jota on tällä hetkellä vain yksi tyyppi, p5.48xlarge. Siinä on 192 vCPU:ta, 2 Tt järjestelmämuistia ja kahdeksan Nvidian H100 GPU:ta, joten se on melko mojova esimerkki.
AWS:n mukaan EC2 Capacity Block -varaukset toimivat kuten hotellihuonevaraukset. Voit määrittää päivämäärän ja keston sekä huoneesi koon. Samalla tavalla AWS antaa sinun valita päivämäärän ja keston, jolloin tarvitset GPU-esiintymiä sekä tarvittavien esiintymien lukumäärän.
Asiakkaat voivat varata EC2 Capacity Blockin, joka sisältää vain yhden esiintymän tai jopa 64 kappaletta, ja niitä voidaan varata yhdestä 14 päivään tarpeen mukaan. AWS sallii näiden varauksen jopa kahdeksan viikkoa etukäteen, ja väittää, että asiakkaat voivat sitten suunnitella koneoppimisen käyttöönottoja varmuudella tietäen, että heillä on käytettävissään GPU-kapasiteetti, kun he sitä tarvitsevat.
AWS sanoo, että EC2 Capacity Blockin hinnat ovat dynaamisia ja riippuvat tarjonnan ja kysynnän kokonaistasosta asiakkaan ostohetkellä. AWS väittää, että se näyttää halvimman saatavilla olevan tarjouksen, joka vastaa asiakkaan määrittämää valikoimaa. A kuvakaappaus yrityksen blogissa näyttää esimerkin yhdestä yksittäisestä päivästä, joka maksaa 2,344 XNUMX dollaria.
Mutta tässä on kicker: EC2 Capacity Blockin kokonaishinta veloitetaan etukäteen, laskutetaan tililtäsi 12 tunnin kuluessa, eikä AWS salli niitä muokata tai peruuttaa oston jälkeen. Joten sinun on parempi olla varma, että tarvitset todella GPU-kapasiteettia näinä päivinä.
Ja kun aikasi loppuu, työmääräsi keskeytetään ilman seremoniaa. EC2 lähettää tapahtuman Amazon EventBridgen kautta varoittaakseen varauksen päättymisestä, jotta käyttäjä voi tarkistaa työkuorman. Käynnissä olevat ilmentymät siirtyvät sammutustilaan 30 minuuttia ennen varauksen päättymistä, mutta kun aika umpeutuu, kaikki vielä käynnissä olevat ilmentymät lopetetaan.
EC2 Capacity Blocks ovat saatavilla nyt, mutta aluksi vain AWS US East (Ohio) -alueella. AWS sanoi, että saatavuus on suunniteltu jatkossa muille alueille ja paikallisille vyöhykkeille.
Pilviliike raportoidut tulot 23 miljardia dollaria tämän vuoden kolmannella vuosineljänneksellä, kun se edellisvuonna oli 3 miljardia dollaria, mikä kuvastaa pilvimarkkinoiden jatkuvaa kasvua, mutta hitaampaa tahtia asiakkaiden etsiessä tapoja hillitä kulutustaan. Kuten muutkin suuret pilvet, AWS näkee tekoälypalvelujen kysynnän keinona torjua tätä kehitystä. ®
- SEO-pohjainen sisällön ja PR-jakelu. Vahvista jo tänään.
- PlatoData.Network Vertical Generatiivinen Ai. Vahvista itseäsi. Pääsy tästä.
- PlatoAiStream. Web3 Intelligence. Tietoa laajennettu. Pääsy tästä.
- PlatoESG. hiili, CleanTech, energia, ympäristö, Aurinko, Jätehuolto. Pääsy tästä.
- PlatonHealth. Biotekniikan ja kliinisten kokeiden älykkyys. Pääsy tästä.
- Lähde: https://go.theregister.com/feed/www.theregister.com/2023/11/01/aws_reserve_gpu_time/
- :on
- :On
- :ei
- $ YLÖS
- 12
- 14
- 22
- 30
- a
- pääsy
- Tili
- lisä-
- myöntää
- edistää
- Jälkeen
- AI
- Tekoälyn palvelut
- Hälytys
- sallia
- sallittu
- Amazon
- Amazon EC2
- an
- ja
- Kaikki
- OVAT
- AS
- At
- saatavuus
- saatavissa
- AWS
- BE
- koska
- ennen
- Paremmin
- Iso
- Miljardi
- biz
- Tukkia
- Blocks
- mutta
- Ostaa
- by
- Kalenteri
- CAN
- Koko
- varmuus
- peritään
- väittäen
- vaatimukset
- pilvi
- CO
- torjumiseksi
- Tulla
- yritys
- joka käsittää
- Laskea
- kulutus
- jatkui
- Hinta
- Kurssi
- Tällä hetkellä
- asiakas
- Asiakkaat
- Päivämäärä
- Päivämäärät
- päivä
- päivää
- Kysyntä
- käyttöönotot
- ei
- doesnt
- ajanut
- kesto
- dynaaminen
- Aikaisemmin
- Itään
- pääte
- päättyy
- tapahtuma
- esimerkki
- Ominaisuudet
- varten
- alkaen
- etuosa
- tulevaisuutta
- Go
- GPU
- GPU
- Kasvu
- Olla
- tätä
- erittäin
- hotelli
- TUNTIA
- HTTPS
- in
- Mukaan lukien
- ensin
- esimerkki
- tulee
- IT
- SEN
- itse
- jpg
- vain
- tietäen
- tunnettu
- oppiminen
- antaa
- Lets
- kerroit
- tasot
- pitää
- paikallinen
- kone
- koneoppiminen
- Tekeminen
- markkinat
- Meets
- Muisti
- minuuttia
- malli
- mallit
- muokattu
- tuottoisa
- Tarve
- Uusi
- Nro
- nyt
- numero
- Nvidia
- of
- tarjoamalla
- Ohio
- on
- kerran
- ONE
- vain
- or
- tilata
- Muut
- Rauha
- maksettu
- Maksaa
- prosentti
- suunnitelma
- suunnitteilla
- Platon
- Platonin tietotieto
- PlatonData
- aika
- Hinnat
- toimittaja
- osto
- Q2
- Q3
- alue
- ihan oikeesti
- heijastava
- Palautukset
- alue
- alueet
- tarvitaan
- Varaus
- Varanto
- varattu
- resurssi
- Esittelymateriaalit
- tulot
- Huone
- ajaa
- juoksu
- s
- Said
- sama
- sanoo
- Niukka
- suunniteltu
- järjestelmä
- etsiä
- näkee
- palvelu
- Palveluntarjoaja
- Palvelut
- Lyhyt
- näyttää
- Näytä
- single
- Koko
- So
- määritelty
- menot
- Osavaltio
- Yhä
- toimittaa
- Tarjonta ja kysyntä
- varma
- järjestelmä
- että
- -
- heidän
- Niitä
- sitten
- Siellä.
- Nämä
- ne
- tätä
- Tämä vuosi
- ne
- Kautta
- aika
- kertaa
- että
- Yhteensä
- Juna
- Trend
- tyyppi
- us
- käyttäjä
- Virtual
- virtuaalikone
- oli
- Tapa..
- tavalla
- viikkoa
- kun
- joka
- tulee
- with
- sisällä
- Referenssit
- vuosi
- Voit
- Sinun
- zephyrnet
- alueet