AWS ได้คิดค้นแผนการสร้างรายได้รูปแบบใหม่ โดยให้ลูกค้าที่ขาดแคลนทรัพยากร GPU ชำระเงินเพื่อจองตามวันที่และเวลาที่กำหนด ชำระเงินล่วงหน้า และไม่อนุญาตให้แก้ไขคำสั่งซื้อ
โมเดลการใช้งานใหม่เรียกว่า Amazon Elastic Compute Cloud (EC2) บล็อกความจุสำหรับ ML. ช่วยให้ลูกค้าสามารถเข้าถึงการประมวลผล GPU ที่เป็นที่ต้องการอย่างมากเพื่อรันปริมาณงานการเรียนรู้ของเครื่องที่สั้นลง
ความต้องการที่เพิ่มขึ้นสำหรับความจุของ GPU เพื่อฝึกฝนและอนุมานโมเดลการเรียนรู้ของเครื่องได้แซงหน้าอุปทานทั่วทั้งอุตสาหกรรม ทำให้ GPU เป็นทรัพยากรที่หายาก
แน่นอนว่าสิ่งที่ AWS ไม่ยอมรับก็คือ นี่เป็นเพราะว่าไฮเปอร์สเกลเลอร์อยู่แถวหน้าของคิวสำหรับ GPU และกำลังกักตุนอุปทาน รวมถึง AWS เองด้วย เอ็นวิเดีย ตามข่าว กล่าวว่า 22 เปอร์เซ็นต์ของรายรับในไตรมาสที่ 2 ของปฏิทินนั้นขับเคลื่อนโดยผู้ให้บริการคลาวด์รายเดียว
EC2 Capacity Blocks พร้อมใช้งานสำหรับ Amazon EC2 ในตอนแรก อินสแตนซ์เครื่องเสมือน P5ซึ่งปัจจุบันมีอยู่ประเภทเดียวเท่านั้นคือ p5.48xlarge คุณสมบัตินี้มี 192 vCPU, หน่วยความจำระบบ 2 TB และ GPU H100 ของ Nvidia แปดตัว ทำให้เป็นอินสแตนซ์ที่ค่อนข้างหนัก
จากข้อมูลของ AWS การจอง EC2 Capacity Block ทำงานเหมือนกับการจองห้องพักในโรงแรม คุณระบุวันที่ ระยะเวลา และขนาดห้องของคุณ.. ในทำนองเดียวกัน AWS ให้คุณเลือกวันที่และระยะเวลาที่คุณต้องการอินสแตนซ์ GPU และจำนวนอินสแตนซ์ที่ต้องการ
ลูกค้าสามารถจอง EC2 Capacity Block ที่ประกอบด้วยอินสแตนซ์เดียวหรือสูงสุด 64 รายการ และสามารถจองได้หนึ่งถึง 14 วันตามต้องการ AWS จะอนุญาตให้จองสิ่งเหล่านี้ล่วงหน้าได้สูงสุดแปดสัปดาห์ โดยอ้างว่าลูกค้าสามารถวางแผนการใช้งานการเรียนรู้ของเครื่องได้อย่างมั่นใจ โดยรู้ว่าพวกเขาจะมีความจุ GPU เมื่อพวกเขาต้องการ
AWS กล่าวว่าราคา EC2 Capacity Block เป็นแบบไดนามิกและขึ้นอยู่กับระดับอุปสงค์และอุปทานที่มีอยู่ทั้งหมด ณ เวลาที่ลูกค้าซื้อ AWS อ้างว่าจะแสดงข้อเสนอราคาต่ำสุดที่มีอยู่ซึ่งตรงตามช่วงที่ลูกค้าระบุ ก ภาพหน้าจอในบล็อกของบริษัท แสดงตัวอย่างอินสแตนซ์เดียวสำหรับวันเดียวซึ่งมีราคา 2,344 ดอลลาร์
แต่ข้อดีคือ ค่าใช้จ่ายรวมของ EC2 Capacity Block จะถูกเรียกเก็บล่วงหน้า โดยจะเรียกเก็บเงินไปยังบัญชีของคุณภายใน 12 ชั่วโมง และ AWS ไม่อนุญาตให้แก้ไขหรือยกเลิกหลังการซื้อ ดังนั้นคุณควรแน่ใจว่าคุณต้องการความจุ GPU นั้นจริงๆ ในวันที่เหล่านั้น
และเมื่อเวลาของคุณหมดลง ภาระงานของคุณจะถูกระงับอย่างไม่ตั้งใจ EC2 จะปล่อยเหตุการณ์ผ่าน Amazon EventBridge เพื่อแจ้งเตือนว่าการจองกำลังจะสิ้นสุดลง เพื่อให้ผู้ใช้สามารถตรวจสอบปริมาณงานได้ อินสแตนซ์ที่ทำงานอยู่จะเข้าสู่สถานะปิดการทำงาน 30 นาทีก่อนที่การจองจะสิ้นสุดลง แต่เมื่อเวลาหมดลง อินสแตนซ์ใดๆ ที่ยังคงทำงานอยู่จะสิ้นสุดลง
EC2 Capacity Blocks พร้อมใช้งานแล้ว แต่ในขั้นต้นเฉพาะในภูมิภาค AWS สหรัฐอเมริกาฝั่งตะวันออก (โอไฮโอ) เท่านั้น มีการวางแผนความพร้อมใช้งานสำหรับภูมิภาคและโซนท้องถิ่นเพิ่มเติมในอนาคต AWS กล่าว
ธุรกิจคลาวด์ รายงานรายได้ 23 พันล้านดอลลาร์ในไตรมาสที่ 3 ของปีนี้ เพิ่มขึ้นจาก 20.5 พันล้านดอลลาร์ในปีก่อนหน้า สะท้อนให้เห็นถึงการเติบโตอย่างต่อเนื่องของตลาดคลาวด์ แต่ในอัตราที่ช้าลง เนื่องจากลูกค้ามองหาวิธีควบคุมการใช้จ่าย เช่นเดียวกับคลาวด์ขนาดใหญ่อื่นๆ AWS มองว่าความต้องการบริการ AI เป็นหนทางในการต่อสู้กับแนวโน้มดังกล่าว ®
- เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
- PlatoData.Network Vertical Generative Ai เพิ่มพลังให้กับตัวเอง เข้าถึงได้ที่นี่.
- เพลโตไอสตรีม. Web3 อัจฉริยะ ขยายความรู้ เข้าถึงได้ที่นี่.
- เพลโตESG. คาร์บอน, คลีนเทค, พลังงาน, สิ่งแวดล้อม แสงอาทิตย์, การจัดการของเสีย. เข้าถึงได้ที่นี่.
- เพลโตสุขภาพ เทคโนโลยีชีวภาพและข่าวกรองการทดลองทางคลินิก เข้าถึงได้ที่นี่.
- ที่มา: https://go.theregister.com/feed/www.theregister.com/2023/11/01/aws_reserve_gpu_time/
- :มี
- :เป็น
- :ไม่
- $ ขึ้น
- 12
- 14
- 22
- 30
- a
- เข้า
- ลงชื่อเข้าใช้
- เพิ่มเติม
- ยอมรับ
- ความก้าวหน้า
- หลังจาก
- AI
- บริการ AI
- เตือนภัย
- อนุญาต
- อนุญาตให้
- อเมซอน
- Amazon EC2
- an
- และ
- ใด
- เป็น
- AS
- At
- ความพร้อมใช้งาน
- ใช้ได้
- AWS
- BE
- เพราะ
- ก่อน
- ดีกว่า
- ใหญ่
- พันล้าน
- Biz
- ปิดกั้น
- Blocks
- แต่
- ซื้อ
- by
- ปฏิทิน
- CAN
- ความจุ
- ความแน่นอน
- การเรียกเก็บเงิน
- อ้าง
- การเรียกร้อง
- เมฆ
- CO
- การต่อสู้
- อย่างไร
- บริษัท
- ประกอบไปด้วย
- คำนวณ
- การบริโภค
- อย่างต่อเนื่อง
- ราคา
- คอร์ส
- ขณะนี้
- ลูกค้า
- ลูกค้า
- วันที่
- วันที่
- วัน
- วัน
- ความต้องการ
- การใช้งาน
- ทำ
- doesn
- ขับเคลื่อน
- ระยะเวลา
- พลวัต
- ก่อน
- ตะวันออก
- สิ้นสุด
- สิ้นสุด
- เหตุการณ์
- ตัวอย่าง
- คุณสมบัติ
- สำหรับ
- ราคาเริ่มต้นที่
- ด้านหน้า
- อนาคต
- Go
- GPU
- GPUs
- การเจริญเติบโต
- มี
- โปรดคลิกที่นี่เพื่ออ่านรายละเอียดเพิ่มเติม
- อย่างสูง
- ส่งไปโรงแรม
- ชั่วโมง
- HTTPS
- in
- รวมทั้ง
- ในขั้นต้น
- ตัวอย่าง
- เข้าไป
- IT
- ITS
- ตัวเอง
- jpg
- เพียงแค่
- รู้ดี
- ที่รู้จักกัน
- การเรียนรู้
- ให้
- ช่วยให้
- การให้
- ระดับ
- กดไลก์
- ในประเทศ
- เครื่อง
- เรียนรู้เครื่อง
- การทำ
- ตลาด
- มีคุณสมบัติตรงตาม
- หน่วยความจำ
- นาที
- แบบ
- โมเดล
- การแก้ไข
- การทำเงิน
- จำเป็นต้อง
- ใหม่
- ไม่
- ตอนนี้
- จำนวน
- Nvidia
- of
- การเสนอ
- โอไฮโอ
- on
- ครั้งเดียว
- ONE
- เพียง
- or
- ใบสั่ง
- อื่นๆ
- ก้าว
- ต้องจ่าย
- ชำระ
- เปอร์เซ็นต์
- แผนการ
- การวางแผน
- เพลโต
- เพลโตดาต้าอินเทลลิเจนซ์
- เพลโตดาต้า
- สวย
- ราคา
- ผู้จัดหา
- ซื้อ
- Q2
- Q3
- พิสัย
- จริงๆ
- สะท้อนให้เห็นถึง
- การคืนเงิน
- ภูมิภาค
- ภูมิภาค
- จำเป็นต้องใช้
- การสำรอง
- สำรอง
- ลิขสิทธิ์
- ทรัพยากร
- แหล่งข้อมูล
- รายได้
- ห้อง
- วิ่ง
- วิ่ง
- s
- กล่าวว่า
- เดียวกัน
- พูดว่า
- หายาก
- ที่กำหนดไว้
- โครงการ
- แสวงหา
- เห็น
- บริการ
- ผู้ให้บริการ
- บริการ
- สั้น
- โชว์
- แสดงให้เห็นว่า
- เดียว
- ขนาด
- So
- ที่ระบุไว้
- การใช้จ่าย
- สถานะ
- ยังคง
- จัดหาอุปกรณ์
- อุปทานและอุปสงค์
- แน่ใจ
- ระบบ
- ที่
- พื้นที่
- ของพวกเขา
- พวกเขา
- แล้วก็
- ที่นั่น
- ล้อยางขัดเหล่านี้ติดตั้งบนแกน XNUMX (มม.) ผลิตภัณฑ์นี้ถูกผลิตในหลายรูปทรง และหลากหลายเบอร์ความแน่นหนาของปริมาณอนุภาคขัดของมัน จะทำให้ท่านได้รับประสิทธิภาพสูงในการขัดและการใช้งานที่ยาวนาน
- พวกเขา
- นี้
- ในปีนี้
- เหล่านั้น
- ตลอด
- เวลา
- ครั้ง
- ไปยัง
- รวม
- รถไฟ
- เทรนด์
- ชนิด
- us
- ผู้ใช้งาน
- เสมือน
- เครื่องเสมือน
- คือ
- ทาง..
- วิธี
- สัปดาห์ที่ผ่านมา
- เมื่อ
- ที่
- จะ
- กับ
- ภายใน
- งาน
- ปี
- คุณ
- ของคุณ
- ลมทะเล
- โซน