AWS telah menghadirkan skema penghasil uang baru – memungkinkan pelanggan yang sangat membutuhkan sumber daya GPU membayar untuk memesannya pada tanggal dan waktu yang dijadwalkan, dibayar di muka, dan tanpa modifikasi pesanan yang diizinkan.
Model konsumsi baru dikenal sebagai Amazon Elastic Compute Cloud (EC2) Blok Kapasitas untuk ML. Hal ini memungkinkan pelanggan mengakses komputasi GPU yang sangat dicari untuk menjalankan beban kerja pembelajaran mesin yang singkat.
Pertumbuhan permintaan akan kapasitas GPU untuk melatih dan model pembelajaran mesin inferensi telah melampaui pasokan di seluruh industri, sehingga menjadikan GPU sebagai sumber daya yang langka.
Tentu saja, yang tidak diakui oleh AWS adalah bahwa hal ini terjadi karena hyperscaler berada di barisan terdepan dalam antrean GPU, menyedot pasokan, termasuk AWS itu sendiri. Nvidia kabarnya mengatakan 22 persen pendapatan kalender Q2 didorong oleh satu penyedia layanan cloud.
Blok Kapasitas EC2 awalnya tersedia untuk Amazon EC2 Mesin virtual P5, yang saat ini hanya ada satu jenis, yaitu p5.48xlarge. Ini memiliki 192 vCPU, memori sistem 2 TB, dan delapan GPU H100 Nvidia, menjadikannya contoh yang cukup besar dan kuat.
Menurut AWS, reservasi Blok Kapasitas EC2 berfungsi seperti reservasi kamar hotel. Anda menentukan tanggal dan durasi serta ukuran ruangan Anda.. Dengan cara yang sama, AWS memungkinkan Anda memilih tanggal dan durasi yang Anda perlukan instans GPU dan jumlah instans yang diperlukan.
Pelanggan dapat memesan Blok Kapasitas EC2 yang hanya terdiri dari satu instans, atau hingga 64, dan ini dapat dicadangkan untuk satu hingga 14 hari sesuai kebutuhan. AWS akan mengizinkan pencadangan ini hingga delapan minggu sebelumnya, dengan mengklaim bahwa pelanggan kemudian dapat merencanakan penerapan pembelajaran mesin mereka dengan pasti, mengetahui bahwa mereka akan memiliki kapasitas GPU saat mereka membutuhkannya.
AWS mengatakan harga Blok Kapasitas EC2 bersifat dinamis dan bergantung pada total tingkat pasokan dan permintaan yang tersedia pada saat pelanggan membeli. AWS mengklaim akan menampilkan penawaran dengan harga terendah yang tersedia dan memenuhi kisaran yang ditentukan pelanggan. A tangkapan layar di blog perusahaan menunjukkan contoh satu instans untuk satu hari seharga $2,344.
Namun yang menarik: total biaya Blok Kapasitas EC2 dibebankan di muka, ditagihkan ke akun Anda dalam waktu 12 jam, dan AWS tidak mengizinkannya untuk diubah atau dibatalkan setelah pembelian. Jadi sebaiknya pastikan Anda benar-benar membutuhkan kapasitas GPU tersebut pada tanggal tersebut.
Dan begitu waktu Anda habis, beban kerja Anda akan dihentikan begitu saja. EC2 akan mengeluarkan peristiwa melalui Amazon EventBridge untuk memperingatkan bahwa reservasi telah berakhir sehingga pengguna dapat memeriksa beban kerja. Instance yang berjalan akan masuk ke status dimatikan 30 menit sebelum reservasi berakhir, namun setelah waktunya habis, semua instance yang masih berjalan akan dihentikan.
Blok Kapasitas EC2 tersedia sekarang, namun awalnya hanya di Wilayah AWS US East (Ohio). Ketersediaan direncanakan untuk Wilayah dan Zona Lokal tambahan di masa depan, kata AWS.
Bisnis cloud pendapatan yang dilaporkan sebesar $23 miliar pada Q3 tahun ini, naik dari $20.5 miliar pada tahun sebelumnya. Hal ini mencerminkan pertumbuhan pasar cloud yang berkelanjutan namun lebih lambat karena pelanggan mencari cara untuk mengendalikan pengeluaran. Seperti cloud besar lainnya, AWS melihat permintaan akan layanan AI sebagai cara untuk melawan tren tersebut. ®
- Konten Bertenaga SEO & Distribusi PR. Dapatkan Amplifikasi Hari Ini.
- PlatoData.Jaringan Vertikal Generatif Ai. Berdayakan Diri Anda. Akses Di Sini.
- PlatoAiStream. Intelijen Web3. Pengetahuan Diperkuat. Akses Di Sini.
- PlatoESG. Karbon, teknologi bersih, energi, Lingkungan Hidup, Tenaga surya, Penanganan limbah. Akses Di Sini.
- PlatoHealth. Kecerdasan Uji Coba Biotek dan Klinis. Akses Di Sini.
- Sumber: https://go.theregister.com/feed/www.theregister.com/2023/11/01/aws_reserve_gpu_time/
- :memiliki
- :adalah
- :bukan
- $NAIK
- 12
- 14
- 22
- 30
- a
- mengakses
- Akun
- Tambahan
- mengakui
- memajukan
- Setelah
- AI
- Layanan AI
- Waspada
- mengizinkan
- diizinkan
- Amazon
- Amazon EC2
- an
- dan
- Apa pun
- ADALAH
- AS
- At
- tersedianya
- tersedia
- AWS
- BE
- karena
- sebelum
- Lebih baik
- Besar
- Milyar
- biz
- Memblokir
- Blok
- tapi
- Beli
- by
- Kalender
- CAN
- Kapasitas
- kepastian
- dibebankan
- mengklaim
- klaim
- awan
- CO
- memerangi
- bagaimana
- perusahaan
- terdiri
- menghitung
- konsumsi
- terus
- Biaya
- Kelas
- Sekarang
- pelanggan
- pelanggan
- Tanggal
- Tanggal
- hari
- Hari
- Permintaan
- penyebaran
- tidak
- doesn
- didorong
- lamanya
- dinamis
- Terdahulu
- Timur
- akhir
- berakhir
- Acara
- contoh
- Fitur
- Untuk
- dari
- depan
- masa depan
- Go
- GPU
- GPU
- Pertumbuhan
- Memiliki
- di sini
- sangat
- hotel
- JAM
- HTTPS
- in
- Termasuk
- mulanya
- contoh
- ke
- IT
- NYA
- Diri
- jpg
- hanya
- Mengetahui
- dikenal
- pengetahuan
- membiarkan
- Lets
- membiarkan
- adalah ide yang bagus
- 'like'
- lokal
- mesin
- Mesin belajar
- Membuat
- Pasar
- Memenuhi
- Memori
- menit
- model
- model
- dimodifikasi
- menghasilkan uang
- Perlu
- New
- tidak
- sekarang
- jumlah
- Nvidia
- of
- menawarkan
- Ohio
- on
- sekali
- ONE
- hanya
- or
- urutan
- Lainnya
- Perdamaian
- dibayar
- Membayar
- persen
- rencana
- berencana
- plato
- Kecerdasan Data Plato
- Data Plato
- cukup
- harga
- pemberi
- membeli
- Q2
- Q3
- jarak
- benar-benar
- mencerminkan
- Pengembalian
- wilayah
- daerah
- wajib
- Pemesanan
- Cadangan
- dilindungi
- sumber
- Sumber
- pendapatan
- Kamar
- Run
- berjalan
- s
- Tersebut
- sama
- mengatakan
- Langka
- dijadwalkan
- skema
- Mencari
- melihat
- layanan
- Service Provider
- Layanan
- Pendek
- Menunjukkan
- Pertunjukkan
- tunggal
- Ukuran
- So
- ditentukan
- Pengeluaran
- Negara
- Masih
- menyediakan
- Penawaran dan Permintaan
- yakin
- sistem
- bahwa
- Grafik
- mereka
- Mereka
- kemudian
- Sana.
- Ini
- mereka
- ini
- tahun ini
- itu
- Melalui
- waktu
- kali
- untuk
- Total
- Pelatihan VE
- kecenderungan
- mengetik
- us
- Pengguna
- maya
- mesin virtual
- adalah
- Cara..
- cara
- minggu
- ketika
- yang
- akan
- dengan
- dalam
- Kerja
- tahun
- Kamu
- Anda
- zephyrnet.dll
- zona