สร้างและประเมินโมเดลการเรียนรู้ของเครื่องด้วยการกำหนดค่าขั้นสูงโดยใช้กระดานผู้นำโมเดล SageMaker Canvas

เผยแพร่ซ้ำโดยเพลโต

ผู้ติดตาม: 0

ผืนผ้าใบ Amazon SageMaker เป็นพื้นที่ทำงานแบบไม่ต้องเขียนโค้ดที่ช่วยให้นักวิเคราะห์และนักวิทยาศาสตร์ข้อมูลพลเมืองสามารถสร้างการคาดการณ์การเรียนรู้ของเครื่อง (ML) ที่แม่นยำสำหรับความต้องการทางธุรกิจของตนได้ ตั้งแต่วันนี้เป็นต้นไป SageMaker Canvas รองรับการกำหนดค่าการสร้างโมเดลขั้นสูง เช่น การเลือกวิธีการฝึกฝน (การเพิ่มประสิทธิภาพทั้งชุดหรือไฮเปอร์พารามิเตอร์) และอัลกอริธึม การปรับแต่งอัตราส่วนการแบ่งข้อมูลการฝึกและการตรวจสอบความถูกต้อง และการตั้งค่าขีดจำกัดในการวนซ้ำ autoML และเวลารันงาน จึงช่วยให้ผู้ใช้สามารถปรับแต่งได้ การกำหนดค่าการสร้างแบบจำลองโดยไม่ต้องเขียนโค้ดแม้แต่บรรทัดเดียว ความยืดหยุ่นนี้สามารถให้การพัฒนาแบบจำลองที่แข็งแกร่งและลึกซึ้งยิ่งขึ้น ผู้มีส่วนได้ส่วนเสียที่ไม่ใช่ด้านเทคนิคสามารถใช้ฟีเจอร์ที่ไม่ต้องเขียนโค้ดด้วยการตั้งค่าเริ่มต้น ในขณะที่นักวิทยาศาสตร์ข้อมูลพลเมืองสามารถทดลองใช้อัลกอริธึมและเทคนิค ML ต่างๆ ได้ ช่วยให้พวกเขาเข้าใจว่าวิธีการใดทำงานได้ดีที่สุดสำหรับข้อมูลของตน และปรับให้เหมาะสมเพื่อให้มั่นใจในคุณภาพและประสิทธิภาพของแบบจำลอง

นอกเหนือจากการกำหนดค่าการสร้างแบบจำลองแล้ว SageMaker Canvas ยังมีบอร์ดผู้นำโมเดลอีกด้วย บอร์ดผู้นำช่วยให้คุณเปรียบเทียบตัวชี้วัดประสิทธิภาพหลัก (เช่น ความแม่นยำ ความแม่นยำ การเรียกคืน และคะแนน F1) สำหรับการกำหนดค่าของรุ่นต่างๆ เพื่อระบุรุ่นที่ดีที่สุดสำหรับข้อมูลของคุณ ซึ่งจะช่วยปรับปรุงความโปร่งใสในการสร้างแบบจำลอง และช่วยให้คุณตัดสินใจอย่างมีข้อมูล ตัวเลือกรุ่น คุณยังสามารถดูเวิร์กโฟลว์การสร้างโมเดลทั้งหมด รวมถึงขั้นตอนการประมวลผลล่วงหน้า อัลกอริทึม และช่วงไฮเปอร์พารามิเตอร์ที่แนะนำในสมุดบันทึก หากต้องการเข้าถึงฟังก์ชันเหล่านี้ ให้ออกจากระบบและลงชื่อกลับเข้าสู่ SageMaker Canvas แล้วเลือก กำหนดค่าโมเดล เมื่อสร้างแบบจำลอง

ในโพสต์นี้ เราจะแนะนำคุณตลอดกระบวนการใช้การกำหนดค่าการสร้างโมเดลขั้นสูงของ SageMaker Canvas ใหม่ เพื่อเริ่มต้นการฝึกอบรม Ensemble และการเพิ่มประสิทธิภาพไฮเปอร์พารามิเตอร์ (HPO)

ภาพรวมโซลูชัน

ในส่วนนี้ เราจะแสดงคำแนะนำทีละขั้นตอนสำหรับการกำหนดค่าการสร้างโมเดลขั้นสูงของ SageMaker Canvas ใหม่ เพื่อเริ่มต้นการฝึกอบรม Ensemble และการเพิ่มประสิทธิภาพไฮเปอร์พารามิเตอร์ (HPO) เพื่อวิเคราะห์ชุดข้อมูลของเรา สร้างโมเดล ML คุณภาพสูง และดูกระดานผู้นำโมเดล เพื่อตัดสินใจว่าโมเดลใดที่จะเผยแพร่เพื่อการอนุมาน SageMaker Canvas สามารถเลือกวิธีการฝึกฝนโดยอัตโนมัติตามขนาดชุดข้อมูล หรือคุณสามารถเลือกด้วยตนเองก็ได้ ทางเลือกคือ:

ด้วยกัน: ใช้ไฟล์ ออโต้กลูออน ไลบรารีเพื่อฝึกโมเดลพื้นฐานหลายแบบ หากต้องการค้นหาชุดข้อมูลที่ดีที่สุดสำหรับชุดข้อมูลของคุณ โหมด Ensemble จะทำการทดลอง 10 ครั้งโดยใช้การตั้งค่าโมเดลและพารามิเตอร์เมตาที่แตกต่างกัน จากนั้นจะรวมแบบจำลองเหล่านี้เข้าด้วยกันโดยใช้วิธี Stacking Ensemble เพื่อสร้างแบบจำลองการคาดการณ์ที่เหมาะสมที่สุด ในโหมด Ensemble SageMaker Canvas รองรับอัลกอริธึมการเรียนรู้ของเครื่องประเภทต่อไปนี้:
- GBM แบบเบา: เฟรมเวิร์กที่ได้รับการปรับปรุงซึ่งใช้อัลกอริธึมแบบต้นไม้พร้อมการเร่งการไล่ระดับสี อัลกอริทึมนี้ใช้ต้นไม้ที่เติบโตในความกว้างมากกว่าความลึก และได้รับการปรับให้เหมาะสมที่สุดสำหรับความเร็ว
- แคทบูสท์: เฟรมเวิร์กที่ใช้อัลกอริธึมแบบต้นไม้พร้อมการเร่งการไล่ระดับสี ปรับให้เหมาะสมสำหรับการจัดการตัวแปรหมวดหมู่
- XGBoost: เฟรมเวิร์กที่ใช้อัลกอริธึมแบบต้นไม้พร้อมการเร่งการไล่ระดับสีที่เติบโตในเชิงลึกมากกว่าความกว้าง
- ป่าสุ่ม: อัลกอริธึมแบบต้นไม้ที่ใช้แผนผังการตัดสินใจหลายแบบกับตัวอย่างย่อยแบบสุ่มของข้อมูลที่มีการแทนที่ ต้นไม้จะถูกแบ่งออกเป็นโหนดที่เหมาะสมที่สุดในแต่ละระดับ การตัดสินใจของต้นไม้แต่ละต้นจะถูกนำมาเฉลี่ยรวมกันเพื่อป้องกันการเกินพอดีและปรับปรุงการคาดการณ์
- ต้นไม้เสริม: อัลกอริธึมแบบต้นไม้ที่ใช้แผนผังการตัดสินใจหลายแบบกับชุดข้อมูลทั้งหมด ต้นไม้จะถูกแบ่งแบบสุ่มในแต่ละระดับ การตัดสินใจของต้นไม้แต่ละต้นมีค่าเฉลี่ยเพื่อป้องกันการเกินพอดีและเพื่อปรับปรุงการคาดการณ์ ต้นไม้พิเศษจะเพิ่มระดับของการสุ่มเมื่อเปรียบเทียบกับอัลกอริธึมฟอเรสต์แบบสุ่ม
- โมเดลเชิงเส้น: กรอบงานที่ใช้สมการเชิงเส้นเพื่อสร้างแบบจำลองความสัมพันธ์ระหว่างตัวแปรสองตัวในข้อมูลที่สังเกตได้
- คบเพลิงโครงข่ายประสาทเทียม: โมเดลโครงข่ายประสาทเทียมที่นำไปใช้งานโดยใช้ Pytorch
- โครงข่ายประสาทเทียม fast.ai: โมเดลโครงข่ายประสาทเทียมที่นำไปใช้งานโดยใช้ fast.ai
การเพิ่มประสิทธิภาพไฮเปอร์พารามิเตอร์ (HPO): SageMaker Canvas ค้นหาเวอร์ชันที่ดีที่สุดของโมเดลโดยการปรับแต่งไฮเปอร์พารามิเตอร์โดยใช้การเพิ่มประสิทธิภาพแบบเบย์หรือการเพิ่มประสิทธิภาพแบบหลายความเที่ยงตรงในขณะที่รันงานการฝึกอบรมบนชุดข้อมูลของคุณ โหมด HPO จะเลือกอัลกอริธึมที่เกี่ยวข้องกับชุดข้อมูลของคุณมากที่สุด และเลือกช่วงของไฮเปอร์พารามิเตอร์ที่ดีที่สุดเพื่อปรับแต่งโมเดลของคุณ หากต้องการปรับแต่งโมเดลของคุณ โหมด HPO จะทำการทดลองสูงสุด 100 ครั้ง (ค่าเริ่มต้น) เพื่อค้นหาการตั้งค่าไฮเปอร์พารามิเตอร์ที่เหมาะสมที่สุดภายในช่วงที่เลือก หากขนาดชุดข้อมูลของคุณน้อยกว่า 100 MB SageMaker Canvas จะใช้การปรับให้เหมาะสมแบบเบย์ SageMaker Canvas เลือกการเพิ่มประสิทธิภาพหลายความเที่ยงตรงหากชุดข้อมูลของคุณมีขนาดใหญ่กว่า 100 MB ในการเพิ่มประสิทธิภาพหลายความเที่ยงตรง ตัววัดจะถูกปล่อยออกมาอย่างต่อเนื่องจากคอนเทนเนอร์การฝึก การทดลองที่มีประสิทธิภาพต่ำเมื่อเทียบกับการวัดวัตถุประสงค์ที่เลือกไว้จะถูกหยุดก่อนกำหนด การทดลองที่ทำงานได้ดีจะได้รับการจัดสรรทรัพยากรมากขึ้น ในโหมด HPO SageMaker Canvas รองรับอัลกอริธึมการเรียนรู้ของเครื่องประเภทต่อไปนี้:
ผู้เรียนเชิงเส้น: อัลกอริธึมการเรียนรู้แบบมีผู้สอนที่สามารถแก้ปัญหาการจำแนกประเภทหรือปัญหาการถดถอย
XGBoost: อัลกอริธึมการเรียนรู้แบบมีผู้สอนที่พยายามทำนายตัวแปรเป้าหมายอย่างแม่นยำโดยการรวมชุดการประมาณค่าจากชุดรูปแบบที่เรียบง่ายและอ่อนแอกว่า
อัลกอริธึมการเรียนรู้เชิงลึก: เพอร์เซปตรอนหลายชั้น (MLP) และโครงข่ายประสาทเทียมแบบป้อนไปข้างหน้า อัลกอริธึมนี้สามารถจัดการข้อมูลที่ไม่สามารถแบ่งแยกเชิงเส้นได้
อัตโนมัติ: SageMaker Canvas จะเลือกโหมดทั้งชุดหรือโหมด HPO โดยอัตโนมัติตามขนาดชุดข้อมูลของคุณ หากชุดข้อมูลของคุณมีขนาดใหญ่กว่า 100 MB SageMaker Canvas จะเลือก HPO มิฉะนั้นจะเลือกโหมดทั้งมวล

เบื้องต้น

สำหรับโพสต์นี้ คุณต้องปฏิบัติตามข้อกำหนดเบื้องต้นต่อไปนี้:

มี บัญชี AWS.
ตั้งค่า SageMaker Canvas ดู ข้อกำหนดเบื้องต้นสำหรับการตั้งค่า Amazon SageMaker Canvas.
ดาวน์โหลดคลาสสิก ชุดข้อมูลไททานิค ไปยังเครื่องคอมพิวเตอร์ของคุณ

สร้างแบบจำลอง

เราจะอธิบายให้คุณทราบโดยใช้ชุดข้อมูล Titanic และ SageMaker Canvas เพื่อสร้างแบบจำลองที่คาดการณ์ว่าผู้โดยสารคนไหนรอดชีวิตจากเหตุเรือไททานิคล่ม นี่เป็นปัญหาการจำแนกประเภทไบนารี เรามุ่งเน้นที่การสร้างการทดลอง Canvas โดยใช้โหมดการฝึกอบรมทั้งมวล และเปรียบเทียบผลลัพธ์ของคะแนน F1 และรันไทม์โดยรวมกับการทดลอง SageMaker Canvas โดยใช้โหมดการฝึกอบรม HPO (การทดลอง 100 ครั้ง)

ชื่อคอลัมน์	รายละเอียด
รหัสผู้โดยสาร	หมายเลขประจำตัว
รอดชีวิตมาได้	การอยู่รอด
พีคลาส	ชั้นตั๋ว
Name	ชื่อผู้โดยสาร
เพศ	เพศ
อายุ	อายุในปี
ซิบพ์	จำนวนพี่น้องหรือคู่สมรสบนเรือไททานิค
กระดาษ	จำนวนผู้ปกครองหรือเด็กบนเรือไททานิค
ตั๋ว	เลขที่ตั๋ว
ค่าโดยสาร	งานผู้โดยสาร
ห้องโดยสาร	หมายเลขห้องโดยสาร
ทำเครื่องหมายไว้	ท่าเรือลงเรือ

พื้นที่ ชุดข้อมูลไททานิค มี 890 แถว 12 คอลัมน์ ประกอบด้วยข้อมูลประชากรเกี่ยวกับผู้โดยสาร (อายุ เพศ ชั้นตั๋ว และอื่นๆ) และคอลัมน์เป้าหมายผู้รอดชีวิต (ใช่/ไม่ใช่)

เริ่มต้นด้วยการนำเข้าชุดข้อมูลไปยัง SageMaker Canvas ตั้งชื่อชุดข้อมูล มหึมา.
เลือกชุดข้อมูล Titanic และเลือก สร้างโมเดลใหม่. กรอกชื่อรุ่น เลือก การวิเคราะห์เชิงคาดการณ์ เป็นประเภทปัญหา และเลือก สร้างบัญชีตัวแทน.
ภายใต้ เลือกคอลัมน์ที่จะทำนาย, ใช้ คอลัมน์เป้าหมาย เลื่อนลงเพื่อเลือก รอดชีวิตมาได้. คอลัมน์เป้าหมายที่รอดชีวิตเป็นชนิดข้อมูลไบนารีที่มีค่า 0 (ไม่รอด) และ 1 (รอดชีวิต)

กำหนดค่าและรันโมเดล

ในการทดสอบแรก คุณกำหนดค่า SageMaker Canvas เพื่อเรียกใช้การฝึกอบรมทั้งชุดบนชุดข้อมูลโดยมีความแม่นยำเป็นตัวชี้วัดวัตถุประสงค์ของคุณ คะแนนความแม่นยำที่สูงกว่าบ่งชี้ว่าแบบจำลองกำลังคาดการณ์ได้ถูกต้องมากขึ้น ในขณะที่คะแนนความแม่นยำที่ต่ำกว่าบ่งชี้ว่าแบบจำลองกำลังทำข้อผิดพลาดมากขึ้น ความแม่นยำทำงานได้ดีสำหรับชุดข้อมูลที่สมดุล สำหรับการฝึกอบรมทั้งมวล ให้เลือก XGBoost, Random Forest, CatBoost และ Linear Models เป็นอัลกอริธึมของคุณ ปล่อยให้การแยกข้อมูลเป็นค่าเริ่มต้น 80/20 สำหรับการฝึกและการตรวจสอบ และสุดท้าย กำหนดค่างานการฝึกให้รันสำหรับรันไทม์งานสูงสุด 1 ชั่วโมง

เริ่มต้นด้วยการเลือก กำหนดค่าโมเดล.
สิ่งนี้จะแสดงหน้าต่างโมดอลสำหรับ กำหนดค่าโมเดล. เลือก ระดับสูง จากบานหน้าต่างนำทาง
เริ่มกำหนดค่าโมเดลของคุณโดยเลือก ตัวชี้วัดวัตถุประสงค์. สำหรับการทดลองนี้ ให้เลือก ความถูกต้อง. คะแนนความแม่นยำจะบอกคุณว่าการคาดการณ์ของแบบจำลองโดยรวมถูกต้องบ่อยเพียงใด
เลือก วิธีการฝึกอบรมและอัลกอริทึม และเลือก ทั้งมวล. วิธีการทั้งมวลในการเรียนรู้ของเครื่องเกี่ยวข้องกับการสร้างแบบจำลองหลาย ๆ แบบแล้วรวมเข้าด้วยกันเพื่อให้ได้ผลลัพธ์ที่ดีขึ้น เทคนิคนี้ใช้เพื่อเพิ่มความแม่นยำในการทำนายโดยใช้ประโยชน์จากจุดแข็งของอัลกอริทึมต่างๆ เป็นที่ทราบกันว่าวิธีการของ Ensemble สามารถสร้างโซลูชันที่แม่นยำมากกว่าแบบจำลองเดียว ดังที่แสดงให้เห็นในการแข่งขันการเรียนรู้ของเครื่องและแอปพลิเคชันในโลกแห่งความเป็นจริง
เลือกอัลกอริธึมต่างๆ ที่จะใช้สำหรับชุด สำหรับการทดลองนี้ ให้เลือก XGBoost, วัดเชิงเส้น, แคทบูสท์และ ป่าสุ่ม. ล้างอัลกอริธึมอื่น ๆ ทั้งหมด
เลือก การแยกข้อมูล จากบานหน้าต่างนำทาง สำหรับการทดสอบนี้ ให้ปล่อยให้การแบ่งการฝึกและการตรวจสอบเริ่มต้นเป็น 80/20 การทดสอบซ้ำครั้งถัดไปจะใช้การแยกที่แตกต่างกันเพื่อดูว่าส่งผลให้โมเดลมีประสิทธิภาพดีขึ้นหรือไม่
เลือก ผู้สมัครสูงสุดและรันไทม์ จากบานหน้าต่างนำทางและตั้งค่า รันไทม์งานสูงสุด ถึง 1 ชั่วโมงแล้วเลือก ลด.
Choose โครงสร้างมาตรฐาน เพื่อเริ่มการสร้าง

ณ จุดนี้ SageMaker Canvas กำลังเรียกใช้การฝึกโมเดลตามการกำหนดค่าที่คุณให้ไว้ เนื่องจากคุณระบุรันไทม์สูงสุดสำหรับงานการฝึกไว้ที่ 1 ชั่วโมง SageMaker Canvas จะใช้เวลาถึงหนึ่งชั่วโมงในการรันงานการฝึก

Build and evaluate machine learning models with advanced configurations using the SageMaker Canvas model leaderboard | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

ตรวจสอบผลลัพธ์

เมื่อเสร็จสิ้นงานการฝึก SageMaker Canvas จะนำคุณกลับเข้าสู่มุมมองวิเคราะห์โดยอัตโนมัติ และแสดงผลการวัดตามวัตถุประสงค์ที่คุณได้กำหนดค่าไว้สำหรับการทดสอบการฝึกโมเดล ในกรณีนี้ คุณจะเห็นว่าความแม่นยำของแบบจำลองคือ 86.034 เปอร์เซ็นต์

เลือกปุ่มลูกศรยุบที่อยู่ถัดจาก ลีดเดอร์บอร์ดโมเดล เพื่อตรวจสอบข้อมูลประสิทธิภาพของโมเดล
เลือก เกณฑ์การให้คะแนน แท็บเพื่อเจาะลึกข้อมูลเชิงลึกด้านความแม่นยำของโมเดล โมเดลที่ได้รับการฝึกรายงานว่าสามารถทำนายผู้โดยสารที่ไม่รอดชีวิตได้อย่างถูกต้องถึงร้อยละ 89.72 ของทั้งหมด
เลือก ตัวชี้วัดขั้นสูง แท็บเพื่อประเมินรายละเอียดประสิทธิภาพของโมเดลเพิ่มเติม เริ่มต้นด้วยการเลือก ตารางเมตริก เพื่อตรวจสอบรายละเอียดตัวชี้วัด เช่น F1, ความแม่นยำ, จำและ AUC.
SageMaker Canvas ยังช่วยให้เห็นภาพ เมทริกซ์ความสับสน สำหรับรุ่นที่ฝึกแล้ว
และเห็นภาพ. เส้นโค้งการเรียกคืนที่แม่นยำ. AUPRC ที่ 0.86 ส่งสัญญาณว่ามีความแม่นยำในการจำแนกประเภทสูง ซึ่งถือว่าดี
Choose ลีดเดอร์บอร์ดโมเดล เพื่อเปรียบเทียบตัวชี้วัดประสิทธิภาพหลัก (เช่น ความแม่นยำ ความแม่นยำ การเรียกคืน และคะแนน F1) สำหรับโมเดลต่างๆ ที่ประเมินโดย SageMaker Canvas เพื่อกำหนดโมเดลที่ดีที่สุดสำหรับข้อมูล โดยอิงตามการกำหนดค่าที่คุณตั้งไว้สำหรับการทดสอบนี้ โมเดลเริ่มต้นที่มีประสิทธิภาพดีที่สุดจะถูกเน้นด้วย โมเดลเริ่มต้น ป้ายบนบอร์ดผู้นำโมเดล
คุณสามารถใช้เมนูบริบทที่ด้านข้างเพื่อเจาะลึกรายละเอียดของโมเดลใดๆ หรือเพื่อทำให้โมเดลเป็นโมเดลเริ่มต้น เลือก ดูรายละเอียดรุ่น บนรุ่นที่สองในลีดเดอร์บอร์ดเพื่อดูรายละเอียด
SageMaker Canvas เปลี่ยนมุมมองเพื่อแสดงรายละเอียดของตัวเลือกโมเดลที่เลือก แม้ว่ารายละเอียดของโมเดลเริ่มต้นจะมีอยู่แล้ว มุมมองรายละเอียดโมเดลสำรองจะใช้เวลา 10–15 นาทีในการลงรายละเอียด

สร้างแบบจำลองที่สอง

ตอนนี้คุณได้สร้าง ใช้งาน และตรวจสอบแบบจำลองแล้ว เรามาสร้างแบบจำลองที่สองเพื่อเปรียบเทียบกันดีกว่า

กลับสู่มุมมองแบบจำลองเริ่มต้นโดยการเลือก X ที่มุมด้านบน ตอนนี้เลือก เพิ่มเวอร์ชัน เพื่อสร้างโมเดลเวอร์ชันใหม่
เลือกชุดข้อมูล Titanic ที่คุณสร้างขึ้นในตอนแรก จากนั้นเลือก เลือกชุดข้อมูล.

SageMaker Canvas จะโหลดโมเดลโดยอัตโนมัติโดยเลือกคอลัมน์เป้าหมายไว้แล้ว ในการทดลองที่สองนี้ คุณจะเปลี่ยนไปใช้การฝึกอบรม HPO เพื่อดูว่าจะให้ผลลัพธ์ที่ดีกว่าสำหรับชุดข้อมูลหรือไม่ สำหรับแบบจำลองนี้ คุณคงการวัดวัตถุประสงค์ (ความแม่นยำ) ไว้เดิมเพื่อเปรียบเทียบกับการทดสอบครั้งแรก และใช้อัลกอริทึม XGBoost สำหรับการฝึก HPO คุณเปลี่ยนการแบ่งข้อมูลสำหรับการฝึกอบรมและการตรวจสอบเป็น 70/30 และกำหนดค่าผู้สมัครสูงสุดและค่ารันไทม์สำหรับงาน HPO เป็นผู้สมัคร 20 ราย และรันไทม์งานสูงสุดเป็น 1 ชั่วโมง

กำหนดค่าและรันโมเดล

เริ่มต้นการทดสอบครั้งที่สองโดยเลือก กำหนดค่าโมเดล เพื่อกำหนดค่ารายละเอียดการฝึกโมเดลของคุณ
ตัว Vortex Indicator ได้ถูกนำเสนอลงในนิตยสาร กำหนดค่าโมเดล เลือก ตัวชี้วัดวัตถุประสงค์ จากบานหน้าต่างนำทาง สำหรับ ตัวชี้วัดวัตถุประสงค์ให้ใช้เมนูแบบเลื่อนลงเพื่อเลือก ความถูกต้องซึ่งจะทำให้คุณสามารถดูและเปรียบเทียบเอาต์พุตเวอร์ชันทั้งหมดแบบเทียบเคียงกันได้
เลือก วิธีการฝึกอบรมและอัลกอริทึม. เลือก การเพิ่มประสิทธิภาพไฮเปอร์พารามิเตอร์ สำหรับวิธีการฝึกอบรม จากนั้นเลื่อนลงเพื่อเลือกอัลกอริทึม
เลือก XGBoost สำหรับอัลกอริทึม XGBoost ให้การเพิ่มประสิทธิภาพต้นไม้แบบขนานที่ช่วยแก้ปัญหาด้านวิทยาศาสตร์ข้อมูลจำนวนมากได้อย่างรวดเร็วและแม่นยำ และนำเสนอไฮเปอร์พารามิเตอร์ที่หลากหลายที่สามารถปรับแต่งเพื่อปรับปรุงและใช้ประโยชน์จากโมเดล XGBoost ได้อย่างเต็มที่
เลือก การแยกข้อมูล. สำหรับโมเดลนี้ ให้ตั้งค่าการแบ่งข้อมูลการฝึกและการตรวจสอบความถูกต้องเป็น 70/30
เลือก ผู้สมัครสูงสุดและรันไทม์ และตั้งค่าสำหรับงาน HPO เป็น 20 สำหรับงาน ผู้สมัครสูงสุด และ 1 ชั่วโมงสำหรับ รันไทม์งานสูงสุด. เลือก ลด เพื่อเสร็จสิ้นการกำหนดค่ารุ่นที่สอง
เมื่อคุณได้กำหนดค่าโมเดลที่สองแล้ว ให้เลือก โครงสร้างมาตรฐาน เพื่อเริ่มการฝึกอบรม

SageMaker Canvas ใช้การกำหนดค่าเพื่อเริ่มงาน HPO เช่นเดียวกับงานแรก งานฝึกอบรมนี้จะใช้เวลาถึงหนึ่งชั่วโมงจึงจะเสร็จสมบูรณ์

Build and evaluate machine learning models with advanced configurations using the SageMaker Canvas model leaderboard | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

ตรวจสอบผลลัพธ์

เมื่องานการฝึก HPO เสร็จสมบูรณ์ (หรือรันไทม์สูงสุดหมดอายุ) SageMaker Canvas จะแสดงผลลัพธ์ของงานการฝึกตามโมเดลเริ่มต้น และแสดงคะแนนความแม่นยำของโมเดล

Build and evaluate machine learning models with advanced configurations using the SageMaker Canvas model leaderboard | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Choose ลีดเดอร์บอร์ดโมเดล เพื่อดูรายชื่อผู้สมัครรุ่นทั้ง 20 รุ่นจากการฝึกอบรม HPO โมเดลที่ดีที่สุดตามวัตถุประสงค์เพื่อค้นหาความแม่นยำที่ดีที่สุด จะถูกทำเครื่องหมายเป็นค่าเริ่มต้น

ในขณะที่ความแม่นยำของ ผิดนัด โมเดลที่ดีที่สุด อีกโมเดลหนึ่งจากการรันงาน HPO มีพื้นที่สูงกว่าภายใต้คะแนน ROC Curve (AUC) คะแนน AUC ใช้เพื่อประเมินประสิทธิภาพของแบบจำลองการจำแนกประเภทไบนารี AUC ที่สูงกว่าบ่งชี้ว่าโมเดลสามารถแยกแยะความแตกต่างระหว่างสองคลาสได้ดีกว่า โดย 1 คือคะแนนสมบูรณ์ และ 0.5 หมายถึงการเดาแบบสุ่ม

ใช้เมนูบริบทเพื่อทำให้โมเดลที่มี AUC สูงกว่าเป็นโมเดลเริ่มต้น เลือกเมนูบริบทสำหรับรุ่นนั้นและเลือก เปลี่ยนเป็นรูปแบบเริ่มต้น ตัวเลือกในเมนูเส้นดังแสดงในรูปที่ 31 ต่อไปนี้

SageMaker Canvas ใช้เวลาสักครู่ในการเปลี่ยนโมเดลที่เลือกไปเป็นโมเดลเริ่มต้นใหม่สำหรับเวอร์ชัน 2 ของการทดสอบ และย้ายไปที่ด้านบนสุดของรายการโมเดล

Build and evaluate machine learning models with advanced configurations using the SageMaker Canvas model leaderboard | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

เปรียบเทียบรุ่น

ณ จุดนี้ คุณมีโมเดลสองเวอร์ชันและสามารถดูแบบเทียบเคียงได้โดยไปที่ โมเดลของฉัน ใน SageMaker Canvas

เลือก ทำนายความอยู่รอดบนเรือไททานิก เพื่อดูรุ่นรุ่นที่มีจำหน่าย
มีสองเวอร์ชันและประสิทธิภาพจะแสดงในรูปแบบตารางสำหรับการเปรียบเทียบแบบเทียบเคียงกัน
คุณจะเห็นว่าเวอร์ชัน 1 ของโมเดล (ซึ่งได้รับการฝึกฝนโดยใช้อัลกอริธึมทั้งมวล) มีความแม่นยำที่ดีกว่า ตอนนี้คุณสามารถใช้ SageMaker Canvas เพื่อสร้างสมุดบันทึก SageMaker พร้อมโค้ด ความคิดเห็น และคำแนะนำ เพื่อปรับแต่ง ออโต้กลูออน ทดลองใช้และรันเวิร์กโฟลว์ SageMaker Canvas โดยไม่ต้องเขียนโค้ดแม้แต่บรรทัดเดียว คุณสามารถสร้างสมุดบันทึก SageMaker ได้โดยเลือกเมนูบริบทและเลือก ดูโน๊ตบุ๊ค.
สมุดบันทึก SageMaker จะปรากฏในหน้าต่างป๊อปอัป สมุดบันทึกจะช่วยคุณตรวจสอบและแก้ไขพารามิเตอร์ที่เสนอโดย SageMaker Canvas คุณสามารถเลือกการกำหนดค่าแบบโต้ตอบที่เสนอโดย SageMaker Canvas แก้ไข และเรียกใช้งานการประมวลผลเพื่อฝึกโมเดลตามการกำหนดค่าที่เลือกในสภาพแวดล้อม SageMaker Studio

การอนุมาน

เมื่อคุณระบุแบบจำลองที่ดีที่สุดแล้ว คุณสามารถใช้เมนูบริบทเพื่อดำเนินการได้ ปรับใช้กับปลายทางสำหรับการอนุมานตามเวลาจริง.

Build and evaluate machine learning models with advanced configurations using the SageMaker Canvas model leaderboard | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

หรือใช้เมนูบริบทเพื่อดำเนินการโมเดล ML ของคุณในการใช้งานจริง การลงทะเบียนโมเดล Machine Learning (ML) เข้ากับการลงทะเบียนโมเดล SageMaker.

Build and evaluate machine learning models with advanced configurations using the SageMaker Canvas model leaderboard | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

ทำความสะอาด

เพื่อหลีกเลี่ยงไม่ให้มีการเรียกเก็บเงินในอนาคต โปรดลบทรัพยากรที่คุณสร้างขณะติดตามโพสต์นี้ SageMaker Canvas จะเรียกเก็บเงินคุณตามระยะเวลาของเซสชัน และเราขอแนะนำให้ออกจากระบบ SageMaker Canvas เมื่อคุณไม่ได้ใช้งาน

ดู ออกจากระบบ Amazon SageMaker Canvas .

สรุป

SageMaker Canvas เป็นเครื่องมืออันทรงพลังที่ทำให้การเรียนรู้ของเครื่องเป็นประชาธิปไตย เพื่อรองรับทั้งผู้มีส่วนได้ส่วนเสียที่ไม่ใช่ด้านเทคนิคและนักวิทยาศาสตร์ข้อมูลพลเมือง คุณสมบัติที่เพิ่งเปิดตัว รวมถึงการกำหนดค่าการสร้างโมเดลขั้นสูงและกระดานผู้นำโมเดล ช่วยยกระดับความยืดหยุ่นและความโปร่งใสของแพลตฟอร์ม สิ่งนี้ช่วยให้คุณปรับแต่งโมเดลการเรียนรู้ของเครื่องให้เหมาะกับความต้องการทางธุรกิจเฉพาะโดยไม่ต้องเจาะลึกโค้ด ความสามารถในการปรับแต่งวิธีการฝึกฝน อัลกอริธึม การแยกข้อมูล และพารามิเตอร์อื่นๆ ช่วยให้คุณสามารถทดลองใช้เทคนิค ML ต่างๆ ได้ ส่งเสริมความเข้าใจที่ลึกซึ้งยิ่งขึ้นเกี่ยวกับประสิทธิภาพของโมเดล

การเปิดตัวบอร์ดผู้นำโมเดลเป็นการปรับปรุงที่สำคัญ โดยให้ภาพรวมที่ชัดเจนของตัวชี้วัดประสิทธิภาพหลักสำหรับการกำหนดค่าต่างๆ ความโปร่งใสนี้ช่วยให้ผู้ใช้มีข้อมูลประกอบการตัดสินใจเกี่ยวกับตัวเลือกโมเดลและการเพิ่มประสิทธิภาพ ด้วยการแสดงเวิร์กโฟลว์การสร้างโมเดลทั้งหมด รวมถึงขั้นตอนก่อนการประมวลผลที่แนะนำ อัลกอริธึม และช่วงไฮเปอร์พารามิเตอร์ในสมุดบันทึก SageMaker Canvas ช่วยให้เข้าใจกระบวนการพัฒนาโมเดลได้อย่างครอบคลุม

หากต้องการเริ่มต้นการเดินทาง ML แบบใช้โค้ดน้อย/ไม่มีโค้ด โปรดดู Amazon SageMaker Canvas

ขอขอบคุณเป็นพิเศษสำหรับทุกคนที่มีส่วนร่วมในการเปิดตัว:

Esha Dutta, Ed Cheung, Max Kondrashov, Allan Johnson, Ridhim Rastogi, Ranga Reddy Pallelra, Ruochen Wen, Ruinong Tian, Sandipan Manna, Renu Rozera, Vikash Garg, Ramesh Sekaran และ Gunjan Garg

เกี่ยวกับผู้เขียน

เจนิชา อานันท์ เป็นผู้จัดการผลิตภัณฑ์อาวุโสในทีม SageMaker Low/No Code ML ซึ่งรวมถึง SageMaker Canvas และ SageMaker Autopilot เธอชอบดื่มกาแฟ กระตือรือร้น และใช้เวลากับครอบครัว

อินดี้ ซอว์นีย์ เป็นผู้นำโซลูชันลูกค้าอาวุโสของ Amazon Web Services Indy ทำงานแบบย้อนกลับจากปัญหาของลูกค้าอยู่เสมอ ให้คำแนะนำแก่ผู้บริหารลูกค้าองค์กร AWS ผ่านเส้นทางการเปลี่ยนแปลงระบบคลาวด์ที่ไม่เหมือนใคร เขามีประสบการณ์มากกว่า 25 ปีในการช่วยเหลือองค์กรองค์กรให้นำเทคโนโลยีและโซลูชั่นทางธุรกิจที่เกิดขึ้นใหม่มาใช้ Indy เป็นผู้เชี่ยวชาญเฉพาะด้านในชุมชน AWS Technical Field สำหรับปัญญาประดิษฐ์และการเรียนรู้ของเครื่องจักร (AI/ML) โดยมีความเชี่ยวชาญเฉพาะด้านด้านโซลูชัน SageMaker ที่ใช้ generative AI และ low-code/no-code (LCNC)

เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
PlatoData.Network Vertical Generative Ai เพิ่มพลังให้กับตัวเอง เข้าถึงได้ที่นี่.
เพลโตไอสตรีม. Web3 อัจฉริยะ ขยายความรู้ เข้าถึงได้ที่นี่.
เพลโตESG. คาร์บอน, คลีนเทค, พลังงาน, สิ่งแวดล้อม แสงอาทิตย์, การจัดการของเสีย. เข้าถึงได้ที่นี่.
เพลโตสุขภาพ เทคโนโลยีชีวภาพและข่าวกรองการทดลองทางคลินิก เข้าถึงได้ที่นี่.
ที่มา: https://aws.amazon.com/blogs/machine-learning/build-and-evaluate-machine-learning-models-with-advanced-configurations-using-the-sagemaker-canvas-model-leaderboard/

ประทับเวลา: November 30, 2023

เพิ่มเติมจาก AWS Machine Learning AWS

ปรับแต่งการออกเสียงโดยใช้พจนานุกรมใน Amazon Polly

AWS Machine Learning AWS

โหนดต้นทาง: 1834687

ประทับเวลา: May 10, 2023

โมเดลพื้นฐาน AI21 Jurassic-1 พร้อมใช้งานแล้วบน Amazon SageMaker PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

โมเดลรองพื้น AI21 Jurassic-1 มีวางจำหน่ายแล้วใน Amazon SageMaker

คลัสเตอร์ต้นทาง:

AWS Machine Learning AWS

โหนดต้นทาง: 1766571

ประทับเวลา: พฤศจิกายน 30, 2022

เผยแพร่ซ้ำโดยเพลโต

ขับเคลื่อนประสิทธิภาพด้วยแนวทางปฏิบัติที่ดีที่สุด CI/CD บน Amazon Lex

ใช้บริการ AWS AI และ ML เพื่อส่งเสริมการเข้าถึงและการรวมผู้ที่มีความบกพร่องทางการมองเห็นหรือการสื่อสาร

วิธีที่ผู้ให้บริการสามารถใช้การประมวลผลภาษาธรรมชาติเพื่อรับข้อมูลเชิงลึกจากตั๋วของลูกค้าด้วย Amazon Comprehend

การคาดการณ์ที่ง่ายและแม่นยำด้วย AutoGluon-TimeSeries

ปรับแต่งการแจ้งเตือนของคุณได้อย่างง่ายดายในขณะที่ใช้ Amazon Lookout for Metrics

ประกาศตัวเชื่อมต่อ ServiceNow ที่อัปเดต (V2) สำหรับ Amazon Kendra

โมเดลรองพื้น AI21 Jurassic-1 มีวางจำหน่ายแล้วใน Amazon SageMaker

เกี่ยวกับเรา

การค้นหาแนวตั้ง & Ai

ระบบปฏิบัติการ

การติดต่อ

ลงชื่อเข้าใช้