ในปี 2021 เราได้เปิดตัว AWS สนับสนุนบริการเชิงรุก เป็นส่วนหนึ่งของ การสนับสนุน AWS Enterprise วางแผน. นับตั้งแต่เปิดตัว เราได้ช่วยลูกค้าหลายร้อยรายเพิ่มประสิทธิภาพปริมาณงาน กำหนดแนวป้องกัน และปรับปรุงการมองเห็นค่าใช้จ่ายและการใช้งานของปริมาณงานแมชชีนเลิร์นนิง (ML)
ในโพสต์ชุดนี้ เราได้แชร์บทเรียนเกี่ยวกับการปรับต้นทุนให้เหมาะสม อเมซอน SageMaker. ในโพสต์นี้ เรามุ่งเน้นไปที่การประมวลผลข้อมูลล่วงหน้าโดยใช้ การประมวลผล Amazon SageMaker และ Amazon SageMaker ข้อมูล Wrangler งาน
การประมวลผลข้อมูลล่วงหน้ามีบทบาทสำคัญในแนวทาง AI ที่เน้นข้อมูลเป็นศูนย์กลาง อย่างไรก็ตาม การเตรียมข้อมูลดิบสำหรับการฝึกอบรมและการประเมิน ML มักจะเป็นงานที่น่าเบื่อและต้องใช้ความพยายามมากในแง่ของทรัพยากรการประมวลผล เวลา และความพยายามของมนุษย์ การเตรียมข้อมูลโดยทั่วไปจำเป็นต้องผสานรวมจากแหล่งที่มาต่างๆ และจัดการกับค่าที่ขาดหายไปหรือค่าที่รบกวน ค่าผิดปกติ และอื่นๆ
นอกจากนี้ นอกเหนือจากงานแยก แปลง และโหลด (ETL) ทั่วไปแล้ว ทีม ML ยังต้องการความสามารถขั้นสูงเพิ่มเติมในบางครั้ง เช่น การสร้างโมเดลด่วนเพื่อประเมินข้อมูลและสร้างคะแนนความสำคัญของคุณลักษณะ หรือการประเมินโมเดลหลังการฝึกอบรมซึ่งเป็นส่วนหนึ่งของไปป์ไลน์ MLOps
SageMaker นำเสนอสองคุณสมบัติที่ออกแบบมาโดยเฉพาะเพื่อช่วยแก้ไขปัญหาเหล่านี้: การประมวลผลของ SageMaker และ Data Wrangler การประมวลผลของ SageMaker ช่วยให้คุณสามารถเรียกใช้การประมวลผลล่วงหน้า การประมวลผลภายหลัง และการประเมินโมเดลได้อย่างง่ายดายบนโครงสร้างพื้นฐานที่มีการจัดการเต็มรูปแบบ Data Wrangler ช่วยลดเวลาที่ใช้ในการรวบรวมและเตรียมข้อมูลโดยลดความซับซ้อนของกระบวนการรวมแหล่งข้อมูลและวิศวกรรมคุณสมบัติโดยใช้อินเทอร์เฟซแบบภาพเดียวและสภาพแวดล้อมการประมวลผลข้อมูลแบบกระจายทั้งหมด
ฟีเจอร์ SageMaker ทั้งสองมอบความยืดหยุ่นที่ยอดเยี่ยมพร้อมตัวเลือกมากมายสำหรับ I/O ที่เก็บข้อมูล และการคำนวณ อย่างไรก็ตาม การตั้งค่าตัวเลือกเหล่านั้นไม่ถูกต้องอาจทำให้เสียค่าใช้จ่ายโดยไม่จำเป็น โดยเฉพาะอย่างยิ่งเมื่อต้องจัดการกับชุดข้อมูลขนาดใหญ่
ในโพสต์นี้ เราจะวิเคราะห์ปัจจัยด้านราคาและให้คำแนะนำการปรับต้นทุนให้เหมาะสมสำหรับงาน SageMaker Processing และ Data Wrangler
การประมวลผล SageMaker
SageMaker Processing เป็นโซลูชันที่มีการจัดการเพื่อรันการประมวลผลข้อมูลและปริมาณงานการประเมินโมเดล คุณสามารถใช้ในขั้นตอนการประมวลผลข้อมูล เช่น วิศวกรรมฟีเจอร์ การตรวจสอบข้อมูล การประเมินโมเดล และการตีความโมเดลในเวิร์กโฟลว์ ML ด้วย SageMaker Processing คุณสามารถนำสคริปต์การประมวลผลแบบกำหนดเองของคุณเองและเลือกที่จะสร้างคอนเทนเนอร์แบบกำหนดเองหรือใช้คอนเทนเนอร์ที่มีการจัดการของ SageMaker ที่มีเฟรมเวิร์กทั่วไป เช่น scikit-learn, Lime, Spark และอื่นๆ
SageMaker Processing จะเรียกเก็บเงินจากคุณสำหรับประเภทอินสแตนซ์ที่คุณเลือก โดยขึ้นอยู่กับระยะเวลาการใช้งานและพื้นที่จัดเก็บที่จัดเตรียมไว้ซึ่งแนบมากับอินสแตนซ์นั้น ในตอนที่ 1 เราได้แสดงวิธีเริ่มต้นใช้งาน AWS Cost Explorer เพื่อระบุโอกาสในการเพิ่มประสิทธิภาพต้นทุนใน SageMaker
คุณสามารถกรองค่าใช้จ่ายในการดำเนินการได้โดยใช้ตัวกรองกับประเภทการใช้งาน ชื่อของประเภทการใช้งานเหล่านี้มีดังนี้:
REGION-Processing:instanceType
(ตัวอย่างเช่น,USE1-Processing:ml.m5.large
)REGION-Processing:VolumeUsage.gp2
(ตัวอย่างเช่น,USE1-Processing:VolumeUsage.gp2
)
หากต้องการตรวจสอบต้นทุนการประมวลผล SageMaker ของคุณใน Cost Explorer ให้เริ่มด้วยการกรองด้วย SageMaker สำหรับ Serviceและสำหรับ ประเภทการใช้งานคุณสามารถเลือกชั่วโมงการทำงานอินสแตนซ์การประมวลผลทั้งหมดได้โดยป้อน processing:ml
คำนำหน้าและเลือกรายการบนเมนู
หลีกเลี่ยงค่าใช้จ่ายในการดำเนินการและการพัฒนาไปป์ไลน์
ก่อนปรับขนาดที่เหมาะสมและเพิ่มประสิทธิภาพระยะเวลาดำเนินการของงาน SageMaker Processing เราจะตรวจสอบตัวชี้วัดระดับสูงเกี่ยวกับการเรียกใช้งานในอดีต คุณสามารถเลือกจากสองวิธีในการทำเช่นนี้
ขั้นแรก คุณสามารถเข้าถึง การประมวลผล หน้าบนคอนโซล SageMaker
หรือคุณสามารถใช้ list_processing_jobs API.
สถานะงานการประมวลผลสามารถเป็นได้ InProgress
, Completed
, Failed
, Stopping
,หรือ Stopped
.
งานที่ล้มเหลวจำนวนมากเป็นเรื่องปกติเมื่อพัฒนาไปป์ไลน์ MLOps ใหม่ อย่างไรก็ตาม คุณควรทดสอบและพยายามทุกวิถีทางเพื่อตรวจสอบความถูกต้องของงานก่อนที่จะเปิดใช้งานบน SageMaker เนื่องจากมีค่าใช้จ่ายสำหรับทรัพยากรที่ใช้ เพื่อจุดประสงค์ดังกล่าว คุณสามารถใช้ SageMaker Processing ใน โหมดท้องถิ่น. โหมดโลคัลเป็นคุณลักษณะ SageMaker SDK ที่ช่วยให้คุณสามารถสร้างตัวประมาณ ตัวประมวลผล และไปป์ไลน์ และปรับใช้กับสภาพแวดล้อมการพัฒนาโลคัลของคุณ นี่เป็นวิธีที่ยอดเยี่ยมในการทดสอบสคริปต์ของคุณก่อนที่จะเรียกใช้ในสภาพแวดล้อมที่มีการจัดการของ SageMaker โหมดโลคัลได้รับการสนับสนุนโดยคอนเทนเนอร์ที่มีการจัดการของ SageMaker และคอนเทนเนอร์ที่คุณจัดหาเอง หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับวิธีใช้โหมดโลคัลด้วย ท่อส่ง Amazon SageMaker, เอ่ยถึง โหมดท้องถิ่น.
ปรับค่าใช้จ่ายที่เกี่ยวข้องกับ I/O ให้เหมาะสม
งานการประมวลผลของ SageMaker ให้การเข้าถึงแหล่งข้อมูลสามแหล่งซึ่งเป็นส่วนหนึ่งของการจัดการ อินพุตการประมวลผล: บริการจัดเก็บข้อมูลอย่างง่ายของ Amazon (อเมซอน เอส3) อเมซอน อาเธน่าและ อเมซอน Redshift. สำหรับข้อมูลเพิ่มเติม โปรดดูที่ กำลังประมวลผล S3Input, AthenaDatasetDefinitionและ RedshiftDatasetDefinitionตามลำดับ
ก่อนที่จะดูการปรับให้เหมาะสม สิ่งสำคัญคือต้องทราบว่าแม้ว่างาน SageMaker Processing จะสนับสนุนแหล่งข้อมูลเหล่านี้ แต่ก็ไม่ได้บังคับ ในรหัสการประมวลผลของคุณ คุณสามารถใช้วิธีใดก็ได้ในการดาวน์โหลดข้อมูลการเข้าถึงจากแหล่งใดก็ได้ (โดยมีเงื่อนไขว่าอินสแตนซ์การประมวลผลสามารถเข้าถึงได้)
เพื่อให้ได้รับข้อมูลเชิงลึกที่ดีขึ้นเกี่ยวกับประสิทธิภาพการประมวลผลและตรวจหาโอกาสในการเพิ่มประสิทธิภาพ เราขอแนะนำให้ปฏิบัติตาม การบันทึกแนวทางปฏิบัติที่ดีที่สุด ในสคริปต์ประมวลผลของคุณ SageMaker เผยแพร่บันทึกการประมวลผลของคุณไปที่ อเมซอน คลาวด์วอตช์.
ในบันทึกการใช้งานตัวอย่างต่อไปนี้ เราเห็นว่าการประมวลผลสคริปต์ใช้เวลา 15 นาที (ระหว่าง Start custom script
และ End custom script
).
อย่างไรก็ตาม บนคอนโซล SageMaker เราพบว่างานใช้เวลาเพิ่มอีก 4 นาที (เกือบ 25% ของรันไทม์ทั้งหมดของงาน)
นี่เป็นเพราะความจริงที่ว่านอกเหนือจากเวลาที่สคริปต์ประมวลผลของเราใช้เวลาแล้ว การดาวน์โหลดและอัปโหลดข้อมูลที่จัดการโดย SageMaker ยังใช้เวลานานอีกด้วย (4 นาที) หากสิ่งนี้พิสูจน์ได้ว่าเป็นส่วนสำคัญของค่าใช้จ่าย ให้พิจารณาวิธีอื่นเพื่อเพิ่มความเร็วในการดาวน์โหลด เช่น การใช้ Boto3 API ที่มีการประมวลผลหลายตัวเพื่อดาวน์โหลดไฟล์พร้อมกัน หรือใช้ไลบรารีของบุคคลที่สามเป็น WebDataset หรือ s5cmd เพื่อให้ดาวน์โหลดจาก Amazon S3 ได้เร็วขึ้น . สำหรับข้อมูลเพิ่มเติม โปรดดูที่ การเทียบเคียงปริมาณงาน S3 ด้วย s5cmd. โปรดทราบว่าวิธีการดังกล่าวอาจก่อให้เกิดการเรียกเก็บเงินใน Amazon S3 เนื่องจาก การถ่ายโอนข้อมูล.
รองรับงานการประมวลผลด้วย โหมดท่อ. ด้วยวิธีนี้ SageMaker จะสตรีมข้อมูลอินพุตจากแหล่งที่มาโดยตรงไปยังคอนเทนเนอร์การประมวลผลของคุณไปยังไพพ์ที่มีชื่อโดยไม่ต้องใช้โวลุ่มพื้นที่จัดเก็บ ML ซึ่งช่วยลดเวลาในการดาวน์โหลดข้อมูลและปริมาณดิสก์ที่น้อยลง อย่างไรก็ตาม สิ่งนี้ต้องการรูปแบบการเขียนโปรแกรมที่ซับซ้อนกว่าการอ่านจากไฟล์บนดิสก์เพียงอย่างเดียว
ตามที่กล่าวไว้ก่อนหน้านี้ SageMaker Processing ยังรองรับ Athena และ Amazon Redshift เป็นแหล่งข้อมูลอีกด้วย เมื่อตั้งค่างานการประมวลผลด้วยแหล่งข้อมูลเหล่านี้ SageMaker จะคัดลอกข้อมูลไปยัง Amazon S3 โดยอัตโนมัติ และอินสแตนซ์การประมวลผลจะดึงข้อมูลจากตำแหน่ง Amazon S3 อย่างไรก็ตาม เมื่องานเสร็จสิ้น จะไม่มีกระบวนการล้างข้อมูลที่มีการจัดการ และข้อมูลที่คัดลอกจะยังคงอยู่ใน Amazon S3 และอาจมีค่าบริการพื้นที่จัดเก็บที่ไม่ต้องการ ดังนั้น เมื่อใช้แหล่งข้อมูล Athena และ Amazon Redshift ตรวจสอบให้แน่ใจว่าได้ใช้ขั้นตอนการล้างข้อมูล เช่น ฟังก์ชัน Lambda ที่ ทำงานตามกำหนดเวลา หรือใน แลมบ์ดาสเต็ป เป็นส่วนหนึ่งของไปป์ไลน์ SageMaker
เช่นเดียวกับการดาวน์โหลด การอัปโหลดอาร์ติแฟกต์การประมวลผลอาจเป็นโอกาสในการเพิ่มประสิทธิภาพ เมื่อเอาต์พุตของงานการประมวลผลได้รับการกำหนดค่าโดยใช้ ProcessingS3Output
พารามิเตอร์ คุณสามารถระบุได้ว่า S3UploadMode
ใช้. S3UploadMode
ค่าเริ่มต้นของพารามิเตอร์คือ EndOfJob
ซึ่งจะทำให้ SageMaker อัปโหลดผลลัพธ์หลังจากงานเสร็จสิ้น อย่างไรก็ตาม หากงานการประมวลผลของคุณสร้างไฟล์หลายไฟล์ คุณสามารถตั้งค่าได้ S3UploadMode
ไปยัง Continuous
จึงเปิดใช้งานการอัปโหลดอาร์ติแฟกต์พร้อมกันในขณะที่การประมวลผลดำเนินต่อไป และลดรันไทม์ของงาน
อินสแตนซ์งานการประมวลผลขนาดที่เหมาะสม
การเลือกประเภทและขนาดอินสแตนซ์ที่เหมาะสมเป็นปัจจัยหลักในการเพิ่มประสิทธิภาพต้นทุนของงาน SageMaker Processing คุณสามารถปรับขนาดอินสแตนซ์ให้ถูกต้องโดยการย้ายไปยังเวอร์ชันอื่นภายในกลุ่มอินสแตนซ์เดียวกันหรือโดยการย้ายไปยังกลุ่มอินสแตนซ์อื่น เมื่อย้ายข้อมูลภายในกลุ่มอินสแตนซ์เดียวกัน คุณจะต้องคำนึงถึง CPU/GPU และหน่วยความจำเท่านั้น สำหรับข้อมูลเพิ่มเติมและคำแนะนำทั่วไปในการเลือกทรัพยากรการประมวลผลที่เหมาะสม โปรดดูที่ ตรวจสอบทรัพยากรการประมวลผลที่มีประสิทธิภาพบน Amazon SageMaker.
ในการปรับแต่งการเลือกอินสแตนซ์อย่างละเอียด เราเริ่มต้นด้วยการวิเคราะห์เมตริกงานการประมวลผลใน CloudWatch สำหรับข้อมูลเพิ่มเติม โปรดดูที่ ตรวจสอบ Amazon SageMaker ด้วย Amazon CloudWatch.
CloudWatch รวบรวมข้อมูลดิบจาก SageMaker และประมวลผลเป็นเมตริกที่อ่านได้เกือบจะเรียลไทม์ แม้ว่าสถิติเหล่านี้จะถูกเก็บไว้เป็นเวลา 15 เดือน แต่คอนโซล CloudWatch จะจำกัดการค้นหาเฉพาะเมตริกที่อัปเดตในช่วง 2 สัปดาห์ที่ผ่านมา (เพื่อให้แน่ใจว่าจะแสดงเฉพาะงานปัจจุบันเท่านั้น) เมตริกงานการประมวลผลสามารถพบได้ในเนมสเปซ /aws/sagemaker/ProcessingJobs และเมตริกที่รวบรวมได้แก่ CPUUtilization
, MemoryUtilization
, GPUUtilization
, GPUMemoryUtilization
และ DiskUtilization
.
ภาพหน้าจอต่อไปนี้แสดงตัวอย่างใน CloudWatch ของงานการประมวลผลที่เราเห็นก่อนหน้านี้
ในตัวอย่างนี้ เราจะเห็นค่า CPU และหน่วยความจำเฉลี่ย (ซึ่งเป็นค่าเริ่มต้นใน CloudWatch): การใช้งาน CPU เฉลี่ยคือ 0.04% หน่วยความจำ 1.84% และการใช้ดิสก์ 13.7% เพื่อให้มีขนาดที่เหมาะสม ให้พิจารณาการใช้งาน CPU และหน่วยความจำสูงสุดเสมอ (ในตัวอย่างนี้ การใช้งาน CPU สูงสุดคือ 98% ในช่วง 3 นาทีแรก) ตามกฎทั่วไป หากการใช้ CPU และหน่วยความจำสูงสุดของคุณน้อยกว่า 40% อย่างต่อเนื่อง คุณสามารถลดเครื่องลงได้อย่างปลอดภัย ตัวอย่างเช่น หากคุณใช้อินสแตนซ์ ml.c5.4xlarge คุณสามารถย้ายไปที่ ml.c5.2xlarge ซึ่งสามารถลดค่าใช้จ่ายของคุณได้ 50%
งาน Data Wrangler
Data Wrangler เป็นคุณสมบัติของ สตูดิโอ Amazon SageMaker ที่ให้โซลูชันที่ทำซ้ำได้และปรับขนาดได้สำหรับการสำรวจและประมวลผลข้อมูล คุณใช้อินเทอร์เฟซ Data Wrangler เพื่อนำเข้า วิเคราะห์ แปลง และแสดงข้อมูลของคุณแบบโต้ตอบ ขั้นตอนเหล่านี้บันทึกไว้ในสูตรอาหาร (ไฟล์ .flow) ซึ่งคุณสามารถใช้ในงาน Data Wrangler ได้ วิธีนี้ช่วยให้คุณนำการแปลงข้อมูลเดิมไปใช้ซ้ำกับข้อมูลของคุณ และยังปรับขนาดเป็นงานประมวลผลข้อมูลแบบกระจาย ไม่ว่าจะเป็นส่วนหนึ่งของไปป์ไลน์ ML หรือแยกกัน
สำหรับคำแนะนำในการเพิ่มประสิทธิภาพแอป Data Wrangler ใน Studio โปรดดูส่วนที่ 2 ในซีรี่ส์นี้
ในส่วนนี้ เรามุ่งเน้นไปที่การปรับงาน Data Wrangler ให้เหมาะสม
Data Wrangler ใช้ งานการประมวลผล SageMaker Spark ด้วยคอนเทนเนอร์ที่จัดการโดย Data Wrangler คอนเทนเนอร์นี้รันคำสั่งจากไฟล์ .flow ในงาน เช่นเดียวกับงานประมวลผลอื่นๆ Data Wrangler จะเรียกเก็บเงินจากคุณสำหรับอินสแตนซ์ที่คุณเลือก โดยขึ้นอยู่กับระยะเวลาการใช้งานและพื้นที่จัดเก็บที่จัดเตรียมไว้ซึ่งแนบมากับอินสแตนซ์นั้น
ใน Cost Explorer คุณสามารถกรองต้นทุนงานของ Data Wrangler ได้โดยใช้ตัวกรองกับประเภทการใช้งาน ชื่อของประเภทการใช้งานเหล่านี้คือ:
REGION-processing_DW:instanceType
(ตัวอย่างเช่น,USE1-processing_DW:ml.m5.large
)REGION-processing_DW:VolumeUsage.gp2
(ตัวอย่างเช่น,USE1-processing_DW:VolumeUsage.gp2
)
หากต้องการดูต้นทุน Data Wrangler ของคุณใน Cost Explorer ให้กรองบริการเพื่อใช้ SageMaker และสำหรับ ประเภทการใช้งาน, เลือก processing_DW
คำนำหน้าและเลือกรายการบนเมนู นี่จะแสดงให้คุณเห็นทั้งค่าใช้จ่ายที่เกี่ยวข้องกับการใช้งานอินสแตนซ์ (ชั่วโมง) และปริมาณพื้นที่จัดเก็บ (GB) (หากคุณต้องการดูค่าใช้จ่ายของ Studio Data Wrangler คุณสามารถกรองประเภทการใช้งานตาม Studio_DW
คำนำหน้า)
อินสแตนซ์งาน Data Wrangler ขนาดที่เหมาะสมและกำหนดเวลา
ในขณะนี้ Data Wrangler รองรับเฉพาะอินสแตนซ์ m5 ที่มีขนาดอินสแตนซ์ต่อไปนี้: ml.m5.4xlarge, ml.m5.12xlarge และ ml.m5.24xlarge คุณสามารถใช้คุณลักษณะการกระจายงานเพื่อปรับต้นทุนงานของคุณอย่างละเอียด ตัวอย่างเช่น สมมติว่าคุณต้องการประมวลผลชุดข้อมูลที่ต้องใช้ 350 GiB ใน RAM 4xlarge (128 GiB) และ 12xlarge (256 GiB) อาจไม่สามารถประมวลผลได้ และจะนำคุณไปใช้อินสแตนซ์ m5.24xlarge (768 GiB) อย่างไรก็ตาม คุณสามารถใช้อินสแตนซ์ m5.12xlarge สองอินสแตนซ์ (2 * 256 GiB = 512 GiB) และลดค่าใช้จ่ายลง 40% หรือสามอินสแตนซ์ m5.4xlarge (3 * 128 GiB = 384 GiB) และประหยัด 50% ของ m5.24xlarge ค่าอินสแตนซ์ คุณควรทราบว่าสิ่งเหล่านี้เป็นค่าประมาณ และการประมวลผลแบบกระจายอาจเพิ่มโอเวอร์เฮดบางอย่างที่จะส่งผลต่อรันไทม์โดยรวม
เมื่อเปลี่ยนประเภทอินสแตนซ์ ตรวจสอบให้แน่ใจว่าคุณอัปเดต การกำหนดค่าจุดประกาย ตามนั้น ตัวอย่างเช่น หากคุณมีงานอินสแตนซ์ ml.m5.4xlarge เริ่มต้นที่กำหนดค่าด้วยคุณสมบัติ spark.driver.memory
ตั้งเป็น 2048 และ spark.executor.memory
ตั้งค่าเป็น 55742 และต่อมาปรับขนาดเป็น ml.m5.12xlarge ค่าการกำหนดค่าเหล่านั้นจำเป็นต้องเพิ่มขึ้น มิฉะนั้นจะเป็นปัญหาคอขวดในงานประมวลผล คุณสามารถอัปเดตตัวแปรเหล่านี้ได้ใน Data Wrangler GUI หรือในไฟล์การกำหนดค่าที่ต่อท้ายพาธการกำหนดค่า (ดูตัวอย่างต่อไปนี้)
คุณลักษณะที่น่าสนใจอีกอย่างหนึ่งใน Data Wrangler คือความสามารถในการ กำหนดงานที่กำหนดไว้. หากคุณกำลังประมวลผลข้อมูลเป็นระยะ คุณสามารถสร้างกำหนดการเพื่อเรียกใช้งานการประมวลผลโดยอัตโนมัติ ตัวอย่างเช่น คุณสามารถสร้างกำหนดการที่เรียกใช้งานการประมวลผลโดยอัตโนมัติเมื่อคุณได้รับข้อมูลใหม่ (ดูตัวอย่าง ส่งออกไปยัง Amazon S3 or ส่งออกไปยัง Amazon SageMaker Feature Store). อย่างไรก็ตาม คุณควรทราบว่าเมื่อคุณสร้างกำหนดการ Data Wrangler จะสร้าง eventRule
ใน EventBridge ซึ่งหมายความว่าคุณจะถูกเรียกเก็บเงินสำหรับกฎเหตุการณ์ที่คุณสร้างขึ้น (เช่นเดียวกับอินสแตนซ์ที่ใช้ในการเรียกใช้งานการประมวลผล) สำหรับข้อมูลเพิ่มเติม โปรดดูที่ ราคา Amazon EventBridge.
สรุป
ในโพสต์นี้ เราได้ให้คำแนะนำเกี่ยวกับการวิเคราะห์ต้นทุนและแนวทางปฏิบัติที่ดีที่สุดเมื่อดำเนินการล่วงหน้า
ข้อมูลโดยใช้งาน SageMaker Processing และ Data Wrangler เช่นเดียวกับการประมวลผลล่วงหน้า มีตัวเลือกและการตั้งค่ามากมายในการสร้าง ฝึกอบรม และใช้งานโมเดล ML ซึ่งอาจนำไปสู่ค่าใช้จ่ายที่ไม่จำเป็น ดังนั้น เมื่อแมชชีนเลิร์นนิงกลายเป็นเครื่องมือที่ทรงพลังในอุตสาหกรรมต่างๆ ปริมาณงาน ML จึงจำเป็นต้องรักษาต้นทุนอย่างคุ้มค่า
SageMaker นำเสนอชุดคุณลักษณะที่กว้างและลึกสำหรับการอำนวยความสะดวกในแต่ละขั้นตอนในไปป์ไลน์ ML
ความแข็งแกร่งนี้ยังให้โอกาสในการปรับต้นทุนให้เหมาะสมอย่างต่อเนื่องโดยไม่สูญเสียประสิทธิภาพหรือความคล่องตัว
เกี่ยวกับผู้เขียน
ทีปาลี ราจาเล เป็นผู้เชี่ยวชาญด้าน AI/ML อาวุโสที่ AWS เธอทำงานร่วมกับลูกค้าองค์กรโดยให้คำแนะนำด้านเทคนิคพร้อมแนวทางปฏิบัติที่ดีที่สุดสำหรับการปรับใช้และการบำรุงรักษาโซลูชัน AI/ML ในระบบนิเวศ AWS เธอได้ทำงานร่วมกับองค์กรต่างๆ มากมายเกี่ยวกับกรณีการใช้งานการเรียนรู้เชิงลึกต่างๆ ที่เกี่ยวข้องกับ NLP และการมองเห็นด้วยคอมพิวเตอร์ เธอหลงใหลในการเสริมศักยภาพให้องค์กรต่าง ๆ เพื่อใช้ประโยชน์จาก AI เชิงสร้างสรรค์เพื่อปรับปรุงประสบการณ์การใช้งาน ในเวลาว่าง เธอชอบดูภาพยนตร์ ดนตรี และวรรณกรรม
ยูริ โรเซนเบิร์ก เป็นผู้จัดการด้านเทคนิคของ AI & ML Specialist ประจำยุโรป ตะวันออกกลาง และแอฟริกา Uri ซึ่งตั้งอยู่ที่ประเทศอิสราเอลทำงานเพื่อให้อำนาจแก่ลูกค้าองค์กรในทุกสิ่งที่ ML ในการออกแบบ สร้าง และดำเนินการตามขนาด ในเวลาว่าง เขาชอบขี่จักรยาน เดินป่า และชมพระอาทิตย์ตกดิน (อย่างน้อยวันละครั้ง)
- เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
- เพลโตไอสตรีม. ข้อมูลอัจฉริยะ Web3 ขยายความรู้ เข้าถึงได้ที่นี่.
- การสร้างอนาคตโดย Adryenn Ashley เข้าถึงได้ที่นี่.
- ซื้อและขายหุ้นในบริษัท PRE-IPO ด้วย PREIPO® เข้าถึงได้ที่นี่.
- ที่มา: https://aws.amazon.com/blogs/machine-learning/part-3-analyze-amazon-sagemaker-spend-and-determine-cost-optimization-opportunities-based-on-usage-part-3-processing-and-data-wrangler-jobs/
- :มี
- :เป็น
- :ไม่
- $ ขึ้น
- 1
- 100
- 13
- 15%
- 2021
- 7
- a
- ความสามารถ
- สามารถ
- เกี่ยวกับเรา
- เข้า
- การเข้าถึง
- ข้าม
- นอกจากนี้
- เพิ่มเติม
- สูง
- มีผลต่อ
- แอฟริกา
- หลังจาก
- AI
- AI / ML
- ทั้งหมด
- ช่วยให้
- ด้วย
- แม้ว่า
- เสมอ
- อเมซอน
- อเมซอน Redshift
- อเมซอน SageMaker
- Amazon Web Services
- an
- การวิเคราะห์
- วิเคราะห์
- วิเคราะห์
- และ
- อื่น
- ใด
- API
- app
- การประยุกต์ใช้
- เข้าใกล้
- เป็น
- AS
- At
- อัตโนมัติ
- เฉลี่ย
- AWS
- ตาม
- BE
- เพราะ
- ก่อน
- ที่ดีที่สุด
- ปฏิบัติที่ดีที่สุด
- ดีกว่า
- ระหว่าง
- ใหญ่
- ทั้งสอง
- นำมาซึ่ง
- สร้าง
- การก่อสร้าง
- by
- CAN
- ความสามารถในการ
- ถูกจับกุม
- กรณี
- เปลี่ยนแปลง
- การเรียกเก็บเงิน
- โหลด
- ตรวจสอบ
- Choose
- เลือก
- ไคลเอนต์
- รหัส
- ร่วมกัน
- อย่างธรรมดา
- จับใจ
- เสร็จสิ้น
- ซับซ้อน
- ประนีประนอม
- การคำนวณ
- คำนวณ
- คอมพิวเตอร์
- วิสัยทัศน์คอมพิวเตอร์
- องค์ประกอบ
- พิจารณา
- ปลอบใจ
- ภาชนะ
- ภาชนะบรรจุ
- อย่างต่อเนื่อง
- ต่อเนื่องกัน
- ราคา
- ค่าใช้จ่ายที่มีประสิทธิภาพ
- ค่าใช้จ่าย
- ได้
- สร้าง
- สร้าง
- การสร้าง
- ปัจจุบัน
- ประเพณี
- ลูกค้า
- ตัด
- ข้อมูล
- การเตรียมข้อมูล
- การประมวลผล
- ชุดข้อมูล
- วัน
- จัดการ
- การซื้อขาย
- ลึก
- การเรียนรู้ลึก ๆ
- ค่าเริ่มต้น
- เรียกร้อง
- ปรับใช้
- ปรับใช้
- ออกแบบ
- ได้รับการออกแบบ
- กำหนด
- ที่กำลังพัฒนา
- พัฒนาการ
- ต่าง
- โดยตรง
- กระจาย
- do
- ดาวน์โหลด
- คนขับรถ
- สอง
- ระยะเวลา
- แต่ละ
- ก่อน
- อย่างง่ายดาย
- ตะวันออก
- ระบบนิเวศ
- ที่มีประสิทธิภาพ
- ความพยายาม
- ทั้ง
- การกำจัด
- ให้อำนาจ
- เพิ่มขีดความสามารถ
- ช่วยให้
- การเปิดใช้งาน
- ชั้นเยี่ยม
- เสริม
- เพื่อให้แน่ใจ
- การป้อน
- Enterprise
- สิ่งแวดล้อม
- โดยเฉพาะอย่างยิ่ง
- ก่อตั้ง
- ประมาณการ
- ยุโรป
- ประเมินค่า
- การประเมินผล
- เหตุการณ์
- ทุกๆ
- ตัวอย่าง
- ตัวอย่าง
- ประสบการณ์
- การสำรวจ
- นักสำรวจ
- สารสกัด
- อำนวยความสะดวก
- ความจริง
- ปัจจัย
- ปัจจัย
- ล้มเหลว
- ครอบครัว
- เร็วขึ้น
- ลักษณะ
- คุณสมบัติ
- เนื้อไม่มีมัน
- ไฟล์
- กรอง
- กรอง
- ชื่อจริง
- ความยืดหยุ่น
- ไหล
- โฟกัส
- ดังต่อไปนี้
- ดังต่อไปนี้
- สำหรับ
- พบ
- กรอบ
- ราคาเริ่มต้นที่
- อย่างเต็มที่
- ฟังก์ชัน
- ได้รับ
- General
- กำเนิด
- กำเนิด AI
- ได้รับ
- ยิ่งใหญ่
- คำแนะนำ
- ครึ่ง
- มี
- he
- ช่วย
- ช่วย
- จะช่วยให้
- เธอ
- จุดสูง
- ระดับสูง
- ของเขา
- ประวัติศาสตร์
- ถือ
- ชั่วโมง
- สรุป ความน่าเชื่อถือของ Olymp Trade?
- ทำอย่างไร
- อย่างไรก็ตาม
- HTML
- ที่ http
- HTTPS
- เป็นมนุษย์
- ร้อย
- แยกแยะ
- if
- การดำเนินการ
- นำเข้า
- ความสำคัญ
- สำคัญ
- ปรับปรุง
- in
- อย่างไม่ถูกต้อง
- เพิ่มขึ้น
- อิสระ
- อุตสาหกรรม
- ข้อมูล
- โครงสร้างพื้นฐาน
- แรกเริ่ม
- อินพุต
- ข้อมูลเชิงลึก
- ตัวอย่าง
- แบบบูรณาการ
- บูรณาการ
- อินเตอร์เฟซ
- การตีความ
- เข้าไป
- แนะนำ
- บทนำ
- ที่เกี่ยวข้องกับ
- อิสราเอล
- ปัญหา
- IT
- ITS
- ตัวเอง
- การสัมภาษณ์
- งาน
- jpg
- เก็บไว้
- ใหญ่
- ชื่อสกุล
- ต่อมา
- เปิดตัว
- การเปิดตัว
- นำ
- เรียนรู้
- ได้เรียนรู้
- การเรียนรู้
- น้อยลง
- บทเรียน
- บทเรียนที่ได้รับ
- เลฟเวอเรจ
- ห้องสมุด
- กดไลก์
- มะนาว
- ขีด จำกัด
- รายการ
- วรรณคดี
- โหลด
- ในประเทศ
- ที่ตั้ง
- เข้าสู่ระบบ
- ที่ต้องการหา
- เครื่อง
- เรียนรู้เครื่อง
- การบำรุงรักษา
- สำคัญ
- ทำ
- การจัดการ
- ผู้จัดการ
- จำเป็น
- หลาย
- สูงสุด
- อาจ..
- วิธี
- หน่วยความจำ
- กล่าวถึง
- เมนู
- วิธี
- วิธีการ
- ตัวชี้วัด
- กลาง
- ตะวันออกกลาง
- อาจ
- การโยกย้าย
- ขั้นต่ำ
- นาที
- หายไป
- ML
- ม.ป.ป
- โหมด
- แบบ
- โมเดล
- ขณะ
- เดือน
- ข้อมูลเพิ่มเติม
- ย้าย
- Movies
- หลาย
- ดนตรี
- ที่มีชื่อ
- ชื่อ
- จำเป็นต้อง
- ความต้องการ
- ใหม่
- NLP
- ไม่
- จำนวน
- of
- เสนอ
- เสนอ
- มักจะ
- on
- ครั้งเดียว
- คน
- เพียง
- ทำงาน
- โอกาส
- โอกาส
- การเพิ่มประสิทธิภาพ
- เพิ่มประสิทธิภาพ
- การเพิ่มประสิทธิภาพ
- Options
- or
- ใบสั่ง
- องค์กร
- มิฉะนั้น
- ของเรา
- ออก
- เอาท์พุต
- ทั้งหมด
- ของตนเอง
- พารามิเตอร์
- ส่วนหนึ่ง
- หลงใหล
- เส้นทาง
- การปฏิบัติ
- ท่อ
- เป็นจุดสำคัญ
- แผนการ
- เพลโต
- เพลโตดาต้าอินเทลลิเจนซ์
- เพลโตดาต้า
- โพสต์
- โพสต์
- ที่มีประสิทธิภาพ
- การปฏิบัติ
- การจัดเตรียม
- เตรียมการ
- การเตรียมความพร้อม
- การตั้งราคา
- เชิงรุก
- กระบวนการ
- กระบวนการ
- การประมวลผล
- โปรเซสเซอร์
- ก่อ
- การเขียนโปรแกรม
- คุณสมบัติ
- พิสูจน์
- ให้
- ให้
- ให้
- การให้
- เผยแพร่
- วัตถุประสงค์
- รวดเร็ว
- แรม
- พิสัย
- ดิบ
- การอ่าน
- สูตร
- แนะนำ
- ลด
- ลด
- ที่เกี่ยวข้อง
- ยังคง
- ทำซ้ำได้
- ต้องการ
- ต้อง
- แหล่งข้อมูล
- ตามลำดับ
- ผลสอบ
- ทบทวน
- ขวา
- ความแข็งแรง
- บทบาท
- กฎ
- กฎระเบียบ
- วิ่ง
- วิ่ง
- อย่างปลอดภัย
- sagemaker
- เดียวกัน
- ลด
- ที่ปรับขนาดได้
- ขนาด
- กำหนด
- ที่กำหนดไว้
- scikit เรียนรู้
- สคริปต์
- SDK
- ค้นหา
- Section
- เห็น
- การเลือก
- การเลือก
- ระดับอาวุโส
- ชุด
- บริการ
- บริการ
- ชุด
- การตั้งค่า
- การตั้งค่า
- หลาย
- Share
- เธอ
- น่า
- โชว์
- แสดงให้เห็นว่า
- แสดง
- แสดงให้เห็นว่า
- คล้ายคลึงกัน
- ง่าย
- ลดความซับซ้อน
- ง่ายดาย
- พร้อมกัน
- ตั้งแต่
- เดียว
- ขนาด
- ขนาด
- มีขนาดเล็กกว่า
- So
- ทางออก
- โซลูชัน
- บาง
- แหล่ง
- แหล่งที่มา
- จุดประกาย
- ผู้เชี่ยวชาญ
- เฉพาะ
- ความเร็ว
- ใช้จ่าย
- เริ่มต้น
- ข้อความที่เริ่ม
- สถิติ
- Status
- ขั้นตอน
- ขั้นตอน
- ยังคง
- การเก็บรักษา
- ลำธาร
- สตูดิโอ
- อย่างเช่น
- จัดหาอุปกรณ์
- สนับสนุน
- สนับสนุนเชิงรุก
- ที่สนับสนุน
- รองรับ
- ใช้เวลา
- งาน
- งาน
- ทีม
- วิชาการ
- เงื่อนไขการใช้บริการ
- ทดสอบ
- กว่า
- ที่
- พื้นที่
- ที่มา
- ของพวกเขา
- พวกเขา
- แล้วก็
- ที่นั่น
- ดังนั้น
- ดังนั้น
- ล้อยางขัดเหล่านี้ติดตั้งบนแกน XNUMX (มม.) ผลิตภัณฑ์นี้ถูกผลิตในหลายรูปทรง และหลากหลายเบอร์ความแน่นหนาของปริมาณอนุภาคขัดของมัน จะทำให้ท่านได้รับประสิทธิภาพสูงในการขัดและการใช้งานที่ยาวนาน
- พวกเขา
- สิ่ง
- ของบุคคลที่สาม
- นี้
- เหล่านั้น
- สาม
- เวลา
- ไปยัง
- เอา
- เครื่องมือ
- รวม
- การฝึกอบรม
- แปลง
- การแปลง
- สอง
- ชนิด
- ชนิด
- ที่ไม่พึงประสงค์
- บันทึก
- ให้กับคุณ
- อัปโหลด
- การใช้
- ใช้
- มือสอง
- ใช้
- การใช้
- ตรวจสอบความถูกต้อง
- การตรวจสอบ
- ความคุ้มค่า
- ความคุ้มค่า
- ต่างๆ
- รุ่น
- รายละเอียด
- ความชัดเจน
- วิสัยทัศน์
- ปริมาณ
- ต้องการ
- คือ
- ชม
- ทาง..
- วิธี
- we
- เว็บ
- บริการเว็บ
- สัปดาห์ที่ผ่านมา
- ดี
- คือ
- เมื่อ
- ที่
- กว้าง
- ช่วงกว้าง
- จะ
- กับ
- ภายใน
- ไม่มี
- ทำงาน
- ขั้นตอนการทำงาน
- โรงงาน
- คุณ
- ของคุณ
- ด้วยตัวคุณเอง
- ลมทะเล