ขณะนี้การปรับแต่งโมเดลอัตโนมัติของ Amazon SageMaker รองรับเกณฑ์การเสร็จสิ้นใหม่สามเกณฑ์สำหรับการเพิ่มประสิทธิภาพไฮเปอร์พารามิเตอร์

เผยแพร่ซ้ำโดยเพลโต

ผู้ติดตาม: 0

อเมซอน SageMaker มี ประกาศ การรองรับเกณฑ์ความสมบูรณ์ใหม่สามข้อสำหรับ Amazon SageMaker การปรับรุ่นอัตโนมัติให้ชุดคันโยกเพิ่มเติมแก่คุณเพื่อควบคุมเกณฑ์การหยุดของงานปรับแต่งเมื่อค้นหาการกำหนดค่าไฮเปอร์พารามิเตอร์ที่ดีที่สุดสำหรับโมเดลของคุณ

ในโพสต์นี้ เราจะพูดถึงเกณฑ์การสำเร็จใหม่เหล่านี้ ควรใช้เมื่อใด และประโยชน์บางประการที่ได้รับ

การปรับโมเดลอัตโนมัติของ SageMaker

การปรับรูปแบบอัตโนมัติ เรียก การปรับไฮเปอร์พารามิเตอร์ค้นหาเวอร์ชันที่ดีที่สุดของโมเดลที่วัดโดยเมตริกที่เราเลือก มันหมุนงานการฝึกอบรมจำนวนมากบนชุดข้อมูลที่ให้มา โดยใช้อัลกอริทึมที่เลือกและช่วงไฮเปอร์พารามิเตอร์ที่ระบุ งานฝึกอบรมแต่ละงานสามารถเสร็จสิ้นก่อนเวลาได้เมื่อเมตริกวัตถุประสงค์ไม่ได้รับการปรับปรุงอย่างมีนัยสำคัญ ซึ่งเรียกว่าการหยุดก่อนกำหนด

จนถึงขณะนี้ มีวิธีจำกัดในการควบคุมงานปรับแต่งโดยรวม เช่น การระบุจำนวนงานฝึกอบรมสูงสุด อย่างไรก็ตาม การเลือกค่าพารามิเตอร์นี้เป็นฮิวริสติกที่ดีที่สุด ค่าที่มากขึ้นจะเพิ่มค่าใช้จ่ายในการปรับแต่ง และค่าที่น้อยลงอาจไม่ได้ผลลัพธ์ของรุ่นที่ดีที่สุดตลอดเวลา

การปรับโมเดลอัตโนมัติของ SageMaker แก้ปัญหาความท้าทายเหล่านี้โดยให้เกณฑ์การสำเร็จหลายรายการสำหรับงานปรับแต่ง มันถูกนำไปใช้ที่ระดับการปรับแต่งมากกว่าที่ระดับงานฝึกอบรมแต่ละงาน ซึ่งหมายความว่ามันทำงานในชั้นนามธรรมที่สูงขึ้น

ประโยชน์ของการปรับเกณฑ์การจบงาน

ด้วยการควบคุมที่ดีขึ้นเมื่องานปรับแต่งจะหยุดลง คุณจะได้รับประโยชน์จากการประหยัดต้นทุนโดยไม่ต้องใช้งานเป็นระยะเวลานานและมีค่าใช้จ่ายสูงในการคำนวณ นอกจากนี้ยังหมายความว่าคุณสามารถมั่นใจได้ว่างานจะไม่หยุดเร็วเกินไป และคุณได้รับแบบจำลองที่มีคุณภาพดีเพียงพอและตรงตามวัตถุประสงค์ของคุณ คุณสามารถเลือกที่จะหยุดงานปรับแต่งเมื่อโมเดลไม่ได้รับการปรับปรุงอีกต่อไปหลังจากชุดของการทำงานซ้ำ หรือเมื่อการปรับปรุงที่เหลือโดยประมาณไม่สอดคล้องกับทรัพยากรและเวลาในการคำนวณ

นอกเหนือจากเกณฑ์การสำเร็จงานฝึกอบรมจำนวนสูงสุดที่มีอยู่แล้ว จำนวนงานฝึกอบรมสูงสุดการปรับโมเดลอัตโนมัติจะแนะนำตัวเลือกเพื่อหยุดการปรับตามเวลาการปรับสูงสุด การตรวจสอบการปรับปรุง และการตรวจจับการบรรจบกัน

ลองสำรวจแต่ละเกณฑ์เหล่านี้

เวลาปรับแต่งสูงสุด

ก่อนหน้านี้ คุณมีตัวเลือกในการกำหนดจำนวนสูงสุดของงานการฝึกอบรมเป็นการตั้งค่าขีดจำกัดของทรัพยากรเพื่อควบคุมการปรับงบประมาณในแง่ของทรัพยากรการประมวลผล อย่างไรก็ตาม สิ่งนี้สามารถนำไปสู่ระยะเวลาการฝึกที่นานขึ้นหรือสั้นลงโดยไม่จำเป็นหรือน้อยกว่าที่ต้องการ

ด้วยการเพิ่มเกณฑ์เวลาในการปรับแต่งสูงสุด ตอนนี้คุณสามารถจัดสรรงบประมาณการฝึกอบรมของคุณในแง่ของระยะเวลาเพื่อเรียกใช้งานการปรับแต่งและยุติงานโดยอัตโนมัติหลังจากเวลาที่กำหนดเป็นวินาที

"ResourceLimits": { "MaxParallelTrainingJobs": 10, "MaxNumberOfTrainingJobs": 100 "MaxRuntimeInSeconds": 3600
}

ดังที่เห็นข้างต้น เราใช้ MaxRuntimeInSeconds เพื่อกำหนดเวลาการปรับจูนเป็นวินาที การตั้งค่าขีดจำกัดเวลาการปรับช่วยให้คุณจำกัดระยะเวลาของงานปรับแต่งและรวมถึงต้นทุนที่คาดการณ์ไว้ของการทดสอบ

ต้นทุนรวมก่อนส่วนลดตามสัญญาสามารถประมาณได้ด้วยสูตรต่อไปนี้:
EstimatedComputeSeconds= MaxRuntimeInSeconds * MaxParallelTrainingJobs * InstanceCost

รันไทม์สูงสุดเป็นวินาทีสามารถใช้ผูกต้นทุนและรันไทม์ได้ กล่าวอีกนัยหนึ่งก็คือเกณฑ์การควบคุมงบประมาณให้เสร็จสมบูรณ์

คุณลักษณะนี้เป็นส่วนหนึ่งของเกณฑ์การควบคุมทรัพยากร และไม่คำนึงถึงการบรรจบกันของแบบจำลอง ดังที่เราเห็นในโพสต์นี้ เกณฑ์นี้สามารถใช้ร่วมกับเกณฑ์การหยุดอื่นๆ เพื่อให้บรรลุการควบคุมต้นทุนโดยไม่ต้องเสียสละความแม่นยำ

เมตริกเป้าหมายที่ต้องการ

อีกเกณฑ์ที่แนะนำก่อนหน้านี้คือการกำหนดเป้าหมายวัตถุประสงค์ล่วงหน้า เกณฑ์จะตรวจสอบประสิทธิภาพของแบบจำลองที่ดีที่สุดตามเมตริกวัตถุประสงค์เฉพาะ และหยุดการปรับเมื่อแบบจำลองถึงเกณฑ์ที่กำหนดซึ่งสัมพันธ์กับเมตริกวัตถุประสงค์ที่ระบุ

กับ TargetObjectiveMetricValue ตามเกณฑ์ เราสามารถสั่งให้ SageMaker หยุดปรับแต่งโมเดลหลังจากที่เมตริกวัตถุประสงค์ของโมเดลที่ดีที่สุดถึงค่าที่ระบุ:

{ "TuningJobCompletionCriteria": { "TargetObjectiveMetricValue": 0.95 }, "HyperParameterTuningJobObjective": { "MetricName": "validation:auc", "Type": "Maximize" }, }

ในตัวอย่างนี้ เราได้รับคำสั่งให้ SageMaker หยุดปรับแต่งโมเดลเมื่อเมตริกวัตถุประสงค์ของโมเดลที่ดีที่สุดมีค่าถึง 0.95

วิธีนี้มีประโยชน์เมื่อคุณมีเป้าหมายเฉพาะที่คุณต้องการให้โมเดลของคุณไปถึง เช่น ความแม่นยำ ความแม่นยำ การเรียกคืน คะแนน F1 AUC การสูญเสียบันทึก และอื่นๆ ในระดับหนึ่ง

กรณีการใช้งานทั่วไปสำหรับเกณฑ์นี้สำหรับผู้ใช้ที่คุ้นเคยกับประสิทธิภาพของโมเดลตามเกณฑ์ที่กำหนดอยู่แล้ว ผู้ใช้ในระยะการสำรวจอาจปรับแต่งโมเดลด้วยชุดย่อยขนาดเล็กของชุดข้อมูลขนาดใหญ่ก่อน เพื่อระบุเกณฑ์เมตริกการประเมินที่น่าพอใจเพื่อกำหนดเป้าหมายเมื่อฝึกกับชุดข้อมูลแบบเต็ม

การตรวจสอบการปรับปรุง

เกณฑ์นี้ตรวจสอบการบรรจบกันของโมเดลหลังจากการวนซ้ำแต่ละครั้ง และหยุดการปรับแต่งหากโมเดลไม่ปรับปรุงหลังจากงานการฝึกตามจำนวนที่กำหนด ดูการกำหนดค่าต่อไปนี้:

"TuningJobCompletionCriteria": { "BestObjectiveNotImproving":{ "MaxNumberOfTrainingJobsNotImproving":10 }, }

ในกรณีนี้ เราตั้งค่า MaxNumberOfTrainingJobsNotImproving ถึง 10 ซึ่งหมายความว่าหากเมตริกวัตถุประสงค์หยุดปรับปรุงหลังจากงานฝึกอบรม 10 งาน การปรับแต่งจะหยุดลงและรายงานโมเดลและเมตริกที่ดีที่สุด

ควรใช้การตรวจสอบการปรับปรุงเพื่อปรับแต่งการแลกเปลี่ยนระหว่างคุณภาพของแบบจำลองและระยะเวลาเวิร์กโฟลว์โดยรวมในลักษณะที่น่าจะถ่ายโอนระหว่างปัญหาการปรับให้เหมาะสมที่แตกต่างกัน

การตรวจจับการบรรจบกัน

การตรวจจับการบรรจบกันเป็นเกณฑ์ความสมบูรณ์ที่ช่วยให้การปรับแต่งโมเดลอัตโนมัติตัดสินใจได้ว่าจะหยุดการปรับแต่งเมื่อใด โดยทั่วไป การปรับโมเดลอัตโนมัติจะหยุดการปรับเมื่อประเมินว่าไม่สามารถปรับปรุงที่สำคัญได้ ดูการกำหนดค่าต่อไปนี้:

"TuningJobCompletionCriteria": { "ConvergenceDetected":{ "CompleteOnConvergence":"Enabled" },
}

เกณฑ์นี้เหมาะสมที่สุดเมื่อคุณไม่ทราบว่าการตั้งค่าการหยุดใดให้เลือก

นอกจากนี้ยังมีประโยชน์หากคุณไม่ทราบว่าเมตริกวัตถุประสงค์เป้าหมายใดที่สมเหตุสมผลสำหรับการคาดคะเนที่ดีเมื่อพิจารณาจากปัญหาและชุดข้อมูลในมือ และต้องการให้งานปรับแต่งเสร็จสมบูรณ์เมื่อไม่มีการปรับปรุงอีกต่อไป

ทดลองเปรียบเทียบเกณฑ์การสำเร็จ

ในการทดลองนี้ เราทำการทดสอบการถดถอย 3 ครั้งเพื่อหาโมเดลที่เหมาะสมที่สุดภายในพื้นที่การค้นหา 2 ไฮเปอร์พารามิเตอร์ซึ่งมีการกำหนดค่าไฮเปอร์พารามิเตอร์ทั้งหมด 200 รายการโดยใช้ ชุดข้อมูลการตลาดทางตรง.

โดยที่ทุกอย่างเท่าเทียมกัน โมเดลแรกได้รับการปรับแต่งด้วย BestObjectiveNotImproving เกณฑ์การเสร็จสิ้น รุ่นที่สองถูกปรับด้วย CompleteOnConvergence และรุ่นที่สามได้รับการปรับแต่งโดยไม่มีการกำหนดเกณฑ์ความสมบูรณ์

เมื่ออธิบายแต่ละงาน เราสามารถสังเกตว่าการตั้งค่า BestObjectiveNotImproving เกณฑ์ได้นำไปสู่ทรัพยากรและเวลาที่เหมาะสมที่สุดเมื่อเทียบกับเมตริกวัตถุประสงค์โดยมีงานที่รันน้อยลงอย่างมาก

พื้นที่ CompleteOnConvergence เกณฑ์ยังสามารถหยุดการปรับจูนได้ครึ่งทางของการทดสอบ ส่งผลให้งานฝึกอบรมน้อยลงและเวลาฝึกอบรมสั้นลงเมื่อเทียบกับการไม่กำหนดเกณฑ์

Amazon SageMaker Automatic Model Tuning now supports three new completion criteria for hyperparameter optimization PlatoBlockchain Data Intelligence. Vertical Search. Ai.

แม้ว่าการไม่กำหนดเกณฑ์ความสมบูรณ์จะส่งผลให้เกิดการทดสอบที่มีค่าใช้จ่ายสูง แต่การกำหนด MaxRuntimeInSeconds เนื่องจากส่วนหนึ่งของทรัพยากรที่จำกัดจะเป็นวิธีหนึ่งในการลดต้นทุน

ผลลัพธ์ด้านบนแสดงให้เห็นว่าเมื่อกำหนดเกณฑ์ความสมบูรณ์ Amazon SageMaker สามารถหยุดกระบวนการปรับแต่งได้อย่างชาญฉลาดเมื่อตรวจพบว่าโมเดลนั้นมีโอกาสน้อยที่จะปรับปรุงเกินกว่าผลลัพธ์ปัจจุบัน

โปรดทราบว่าเกณฑ์ความสมบูรณ์ที่สนับสนุนในการปรับโมเดลอัตโนมัติของ SageMaker นั้นไม่ได้แยกออกจากกัน และสามารถใช้พร้อมกันได้เมื่อปรับแต่งโมเดล

เมื่อมีการกำหนดเกณฑ์ความสมบูรณ์มากกว่าหนึ่งเกณฑ์ งานปรับแต่งจะเสร็จสมบูรณ์เมื่อตรงตามเกณฑ์ใดๆ

ตัวอย่างเช่น การรวมกันของเกณฑ์การจำกัดทรัพยากร เช่น เวลาการปรับสูงสุดกับเกณฑ์การบรรจบกัน เช่น การเฝ้าติดตามการปรับปรุงหรือการตรวจจับการบรรจบกัน อาจสร้างการควบคุมต้นทุนที่เหมาะสมที่สุดและการวัดวัตถุประสงค์ที่เหมาะสมที่สุด

สรุป

ในโพสต์นี้ เราได้พูดถึงวิธีที่ตอนนี้คุณสามารถหยุดงานปรับแต่งของคุณอย่างชาญฉลาดโดยการเลือกชุดของเกณฑ์ความสมบูรณ์ที่เพิ่งนำมาใช้ใน SageMaker เช่น เวลาในการปรับแต่งสูงสุด การตรวจสอบการปรับปรุง หรือการตรวจจับการบรรจบกัน

เราแสดงให้เห็นด้วยการทดลองว่าการหยุดอย่างชาญฉลาดตามการสังเกตการปรับปรุงตลอดการวนซ้ำอาจนำไปสู่การปรับงบประมาณและการจัดการเวลาให้เหมาะสมอย่างมากเมื่อเทียบกับการไม่กำหนดเกณฑ์การทำให้เสร็จ

นอกจากนี้ เรายังแสดงให้เห็นว่าเกณฑ์เหล่านี้ไม่ได้แยกออกจากกัน และสามารถใช้พร้อมกันเมื่อปรับแต่งโมเดล เพื่อใช้ประโยชน์จากทั้งสองอย่าง การควบคุมงบประมาณและการบรรจบกันที่เหมาะสมที่สุด

สำหรับรายละเอียดเพิ่มเติมเกี่ยวกับวิธีการกำหนดค่าและเรียกใช้การปรับแต่งโมเดลอัตโนมัติ โปรดดูที่ ระบุการตั้งค่างานปรับแต่งไฮเปอร์พารามิเตอร์.

เกี่ยวกับผู้เขียน

ดั๊ก เอ็มบาย่า เป็นสถาปนิกโซลูชันคู่ค้าอาวุโสที่เน้นข้อมูลและการวิเคราะห์ Doug ทำงานอย่างใกล้ชิดกับคู่ค้าของ AWS ช่วยผสานรวมข้อมูลและโซลูชันการวิเคราะห์ในระบบคลาวด์

Amazon SageMaker Automatic Model Tuning now supports three new completion criteria for hyperparameter optimization PlatoBlockchain Data Intelligence. Vertical Search. Ai. ไชยทรา มธุรส เป็น Principal Solutions Architect ที่ AWS เธอแนะนำลูกค้าและคู่ค้าในการสร้างโซลูชันที่ปรับขนาดได้สูง เชื่อถือได้ ปลอดภัย และคุ้มค่าบน AWS เธอหลงใหลเกี่ยวกับแมชชีนเลิร์นนิงและช่วยลูกค้าแปลความต้องการด้าน ML ให้เป็นโซลูชันโดยใช้บริการ AWS AI/ML เธอมีใบรับรอง 5 ใบรวมถึงใบรับรอง ML Specialty ในเวลาว่าง เธอชอบอ่านหนังสือ เล่นโยคะ และใช้เวลากับลูกสาว

iaroslav ภาพ ยาโรสลาฟ เชอร์บาตี เป็นวิศวกรการเรียนรู้ของเครื่องที่ AWS เขาทำงานเกี่ยวกับการปรับปรุงแพลตฟอร์ม Amazon SageMaker เป็นหลัก และช่วยให้ลูกค้าใช้คุณลักษณะต่างๆ ได้ดีที่สุด ในเวลาว่าง เขาชอบไปยิม เล่นกีฬากลางแจ้ง เช่น สเก็ตน้ำแข็งหรือเดินป่า และติดตามการวิจัย AI ใหม่ๆ

เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
เพลโตบล็อคเชน Web3 Metaverse ข่าวกรอง ขยายความรู้. เข้าถึงได้ที่นี่.
ที่มา: https://aws.amazon.com/blogs/machine-learning/amazon-sagemaker-automatic-model-tuning-now-supports-three-new-completion-criteria-for-hyperparameter-optimization/

ประทับเวลา: กุมภาพันธ์ 7, 2023

ประกาศการทำงานพร้อมกันที่จัดเตรียมไว้สำหรับ Amazon SageMaker Serverless Inference | บริการเว็บอเมซอน

คลัสเตอร์ต้นทาง:

AWS Machine Learning AWS

โหนดต้นทาง: 1835572

ประทับเวลา: May 9, 2023

ขณะนี้ Amazon SageMaker Automatic Model Tuning รองรับเกณฑ์ความสมบูรณ์ใหม่สามเกณฑ์สำหรับการปรับไฮเปอร์พารามิเตอร์ให้เหมาะสม

เผยแพร่ซ้ำโดยเพลโต

การปรับโมเดลอัตโนมัติของ SageMaker

ประโยชน์ของการปรับเกณฑ์การจบงาน

เวลาปรับแต่งสูงสุด

เมตริกเป้าหมายที่ต้องการ

การตรวจสอบการปรับปรุง

การตรวจจับการบรรจบกัน

ทดลองเปรียบเทียบเกณฑ์การสำเร็จ

สรุป

เกี่ยวกับผู้เขียน

เพิ่มเติมจาก AWS Machine Learning AWS

การประมวลผลข้อมูลแบบขนานด้วย RStudio บน Amazon SageMaker

ใช้การค้นหาข้อความและรูปภาพแบบรวมเป็นหนึ่งด้วยโมเดล CLIP โดยใช้ Amazon SageMaker และ Amazon OpenSearch Service

เพิ่มประสิทธิภาพการแพร่กระจายที่เสถียรสูงสุดและลดต้นทุนการอนุมานด้วย AWS Inferentia2 | บริการเว็บอเมซอน

The Chefz เสิร์ฟอาหารที่สมบูรณ์แบบด้วย Amazon Personalize อย่างไร

สร้างเสียงสำหรับเนื้อหาในหลายภาษาด้วยบุคลิกเสียง TTS เดียวกันใน Amazon Polly

เกี่ยวกับเรา

การค้นหาแนวตั้ง & Ai

ระบบปฏิบัติการ

การติดต่อ

ลงชื่อเข้าใช้