AWS opracowało nowy sposób zarabiania pieniędzy – umożliwia klientom desperacko potrzebującym zasobów GPU płacenie za rezerwację ich na zaplanowane daty i godziny, płatne z góry i bez możliwości modyfikowania zamówienia.
Nowy model konsumpcji znany jest jako Amazon Elastic Compute Cloud (EC2) Bloki pojemnościowe dla ML. Umożliwia klientom dostęp do bardzo poszukiwanych mocy obliczeniowych GPU w celu wykonywania krótkich zadań związanych z uczeniem maszynowym.
Wzrost zapotrzebowania na moc obliczeniową procesorów graficznych do uczenia i wnioskowania modeli uczenia maszynowego przekroczył podaż w całej branży, co sprawia, że procesory graficzne są zasobem deficytowym.
To, czego AWS oczywiście nie przyznaje, to fakt, że dzieje się tak dlatego, że hiperskalery znajdują się na czele kolejki po procesory graficzne, pochłaniając podaż, w tym sam AWS. Nvidia podobno stwierdziła, że 22 procent jej przychodów kalendarzowych w drugim kwartale pochodzi od jednego dostawcy usług w chmurze.
Bloki pojemności EC2 są początkowo dostępne dla Amazon EC2 Instancje maszyn wirtualnych P5, którego obecnie istnieje tylko jeden typ, p5.48xlarge. Zawiera 192 procesory wirtualne, 2 TB pamięci systemowej i osiem procesorów graficznych Nvidia H100, co czyni go dość potężną instancją.
Według AWS rezerwacje bloków pojemności EC2 działają jak rezerwacje pokoi hotelowych. Ty określasz datę, czas trwania i rozmiar swojego pokoju. W ten sam sposób AWS pozwala wybrać datę i czas, w którym będziesz potrzebować instancji GPU, oraz liczbę wymaganych instancji.
Klienci mogą zarezerwować blok wydajności EC2 obejmujący tylko jedną instancję lub maksymalnie 64 i można je zarezerwować na okres od jednego do 14 dni, w zależności od potrzeb. AWS umożliwi ich rezerwację z ośmiotygodniowym wyprzedzeniem, twierdząc, że klienci będą mogli wówczas z pewnością zaplanować wdrożenia uczenia maszynowego, wiedząc, że będą mieli moc procesora graficznego, kiedy będą jej potrzebować.
AWS twierdzi, że ceny bloków pojemnościowych EC2 są dynamiczne i zależą od całkowitego dostępnego poziomu podaży i popytu w momencie zakupu przez klienta. AWS twierdzi, że pokaże najtańszą dostępną ofertę, która spełnia zakres określony przez klienta. A zrzut ekranu na blogu firmowym pokazuje przykład pojedynczej instancji na jeden dzień, która kosztuje 2,344 USD.
Ale tu jest problem: całkowity koszt bloku pojemności EC2 jest pobierany z góry i obciąża Twoje konto w ciągu 12 godzin, a AWS nie pozwala na ich modyfikację ani anulowanie po zakupie. Więc lepiej upewnij się, że naprawdę potrzebujesz tej mocy GPU w tych dniach.
A kiedy Twój czas się skończy, Twoje obciążenie pracą zostanie bezceremonialnie wstrzymane. EC2 wyemituje zdarzenie za pośrednictwem Amazon EventBridge, aby powiadomić o zakończeniu rezerwacji, aby użytkownik mógł sprawdzić obciążenie pracą. Działające instancje przejdą w stan wyłączenia na 30 minut przed zakończeniem rezerwacji, ale po upływie tego czasu wszystkie nadal działające instancje zostaną zakończone.
Bloki pojemności EC2 są już dostępne, ale początkowo tylko w regionie AWS US East (Ohio). AWS poinformowało, że w przyszłości planowana jest dostępność dla dodatkowych regionów i stref lokalnych.
Biznes w chmurze raportowane przychody w wysokości 23 miliardów dolarów w trzecim kwartale tego roku, w porównaniu z 3 miliarda dolarów rok wcześniej, co odzwierciedla ciągły wzrost rynku chmury, ale w wolniejszym tempie, w miarę jak klienci szukają sposobów na ograniczenie wydatków. Podobnie jak inne duże chmury, AWS postrzega popyt na usługi AI jako sposób na walkę z tym trendem. ®
- Dystrybucja treści i PR oparta na SEO. Uzyskaj wzmocnienie już dziś.
- PlatoData.Network Pionowe generatywne AI. Wzmocnij się. Dostęp tutaj.
- PlatoAiStream. Inteligencja Web3. Wiedza wzmocniona. Dostęp tutaj.
- PlatonESG. Węgiel Czysta technologia, Energia, Środowisko, Słoneczny, Gospodarowanie odpadami. Dostęp tutaj.
- Platon Zdrowie. Inteligencja w zakresie biotechnologii i badań klinicznych. Dostęp tutaj.
- Źródło: https://go.theregister.com/feed/www.theregister.com/2023/11/01/aws_reserve_gpu_time/
- :ma
- :Jest
- :nie
- $W GÓRĘ
- 12
- 14
- 22
- 30
- a
- dostęp
- Konto
- Dodatkowy
- przyznać
- awansować
- Po
- AI
- Usługi AI
- Alarm
- dopuszczać
- dozwolony
- Amazonka
- Amazon EC2
- an
- i
- każdy
- SĄ
- AS
- At
- dostępność
- dostępny
- AWS
- BE
- bo
- zanim
- Ulepsz Swój
- Duży
- Miliard
- biz
- Blokować
- Bloki
- ale
- Kupuje
- by
- Kalendarz
- CAN
- Pojemność
- pewność
- naładowany
- twierdząc,
- roszczenia
- Chmura
- CO
- zwalczania
- jak
- sukcesy firma
- obejmujący
- obliczać
- konsumpcja
- nadal
- Koszty:
- Kurs
- Obecnie
- klient
- Klientów
- Data
- Daty
- dzień
- Dni
- Kreowanie
- wdrożenia
- robi
- robi
- napędzany
- czas trwania
- dynamiczny
- Wcześniej
- Wschód
- kończący się
- kończy się
- wydarzenie
- przykład
- Korzyści
- W razie zamówieenia projektu
- od
- z przodu
- przyszłość
- Go
- GPU
- GPU
- Wzrost
- Have
- tutaj
- wysoko
- hotel
- GODZINY
- HTTPS
- in
- Włącznie z
- początkowo
- przykład
- najnowszych
- IT
- JEGO
- samo
- jpg
- właśnie
- Wiedząc
- znany
- nauka
- niech
- pozwala
- najmu
- poziomy
- lubić
- miejscowy
- maszyna
- uczenie maszynowe
- Dokonywanie
- rynek
- Spełnia
- Pamięć
- minut
- model
- modele
- zmodyfikowano
- robienie pieniędzy
- Potrzebować
- Nowości
- Nie
- już dziś
- numer
- Nvidia
- of
- oferuje
- Ohio
- on
- pewnego razu
- ONE
- tylko
- or
- zamówienie
- Inne
- Pokój
- płatny
- Zapłacić
- procent
- krok po kroku
- planowany
- plato
- Analiza danych Platona
- PlatoDane
- bardzo
- Cennik
- dostawca
- zakup
- Q2
- Q3
- zasięg
- naprawdę
- odzwierciedlając
- Zwroty
- region
- regiony
- wymagany
- Rezerwacja
- rezerwować
- zarezerwowany
- Zasób
- Zasoby
- dochód
- Pokój
- run
- bieganie
- s
- Powiedział
- taki sam
- mówią
- Rzadki
- zaplanowane
- schemat
- Szukajcie
- widzi
- usługa
- Usługodawca
- Usługi
- Short
- pokazać
- Targi
- pojedynczy
- Rozmiar
- So
- określony
- Spędzanie
- Stan
- Nadal
- Dostawa
- Podaż i popyt
- pewnie
- system
- że
- Połączenia
- ich
- Im
- następnie
- Tam.
- Te
- one
- to
- w tym roku
- tych
- Przez
- czas
- czasy
- do
- Kwota produktów:
- Pociąg
- Trend
- rodzaj
- us
- Użytkownik
- Wirtualny
- Maszyna wirtualna
- była
- Droga..
- sposoby
- tygodni
- jeśli chodzi o komunikację i motywację
- który
- będzie
- w
- w ciągu
- Praca
- rok
- You
- Twój
- zefirnet
- Strefy