ผืนผ้าใบ Amazon SageMaker เป็นพื้นที่ทำงานแบบไม่ต้องเขียนโค้ดที่ช่วยให้นักวิเคราะห์และนักวิทยาศาสตร์ข้อมูลพลเมืองสามารถสร้างการคาดการณ์การเรียนรู้ของเครื่อง (ML) ที่แม่นยำสำหรับความต้องการทางธุรกิจของตนได้ ตั้งแต่วันนี้เป็นต้นไป SageMaker Canvas รองรับการกำหนดค่าการสร้างโมเดลขั้นสูง เช่น การเลือกวิธีการฝึกฝน (การเพิ่มประสิทธิภาพทั้งชุดหรือไฮเปอร์พารามิเตอร์) และอัลกอริธึม การปรับแต่งอัตราส่วนการแบ่งข้อมูลการฝึกและการตรวจสอบความถูกต้อง และการตั้งค่าขีดจำกัดในการวนซ้ำ autoML และเวลารันงาน จึงช่วยให้ผู้ใช้สามารถปรับแต่งได้ การกำหนดค่าการสร้างแบบจำลองโดยไม่ต้องเขียนโค้ดแม้แต่บรรทัดเดียว ความยืดหยุ่นนี้สามารถให้การพัฒนาแบบจำลองที่แข็งแกร่งและลึกซึ้งยิ่งขึ้น ผู้มีส่วนได้ส่วนเสียที่ไม่ใช่ด้านเทคนิคสามารถใช้ฟีเจอร์ที่ไม่ต้องเขียนโค้ดด้วยการตั้งค่าเริ่มต้น ในขณะที่นักวิทยาศาสตร์ข้อมูลพลเมืองสามารถทดลองใช้อัลกอริธึมและเทคนิค ML ต่างๆ ได้ ช่วยให้พวกเขาเข้าใจว่าวิธีการใดทำงานได้ดีที่สุดสำหรับข้อมูลของตน และปรับให้เหมาะสมเพื่อให้มั่นใจในคุณภาพและประสิทธิภาพของแบบจำลอง
นอกเหนือจากการกำหนดค่าการสร้างแบบจำลองแล้ว SageMaker Canvas ยังมีบอร์ดผู้นำโมเดลอีกด้วย บอร์ดผู้นำช่วยให้คุณเปรียบเทียบตัวชี้วัดประสิทธิภาพหลัก (เช่น ความแม่นยำ ความแม่นยำ การเรียกคืน และคะแนน F1) สำหรับการกำหนดค่าของรุ่นต่างๆ เพื่อระบุรุ่นที่ดีที่สุดสำหรับข้อมูลของคุณ ซึ่งจะช่วยปรับปรุงความโปร่งใสในการสร้างแบบจำลอง และช่วยให้คุณตัดสินใจอย่างมีข้อมูล ตัวเลือกรุ่น คุณยังสามารถดูเวิร์กโฟลว์การสร้างโมเดลทั้งหมด รวมถึงขั้นตอนการประมวลผลล่วงหน้า อัลกอริทึม และช่วงไฮเปอร์พารามิเตอร์ที่แนะนำในสมุดบันทึก หากต้องการเข้าถึงฟังก์ชันเหล่านี้ ให้ออกจากระบบและลงชื่อกลับเข้าสู่ SageMaker Canvas แล้วเลือก กำหนดค่าโมเดล เมื่อสร้างแบบจำลอง
ในโพสต์นี้ เราจะแนะนำคุณตลอดกระบวนการใช้การกำหนดค่าการสร้างโมเดลขั้นสูงของ SageMaker Canvas ใหม่ เพื่อเริ่มต้นการฝึกอบรม Ensemble และการเพิ่มประสิทธิภาพไฮเปอร์พารามิเตอร์ (HPO)
ภาพรวมโซลูชัน
ในส่วนนี้ เราจะแสดงคำแนะนำทีละขั้นตอนสำหรับการกำหนดค่าการสร้างโมเดลขั้นสูงของ SageMaker Canvas ใหม่ เพื่อเริ่มต้นการฝึกอบรม Ensemble และการเพิ่มประสิทธิภาพไฮเปอร์พารามิเตอร์ (HPO) เพื่อวิเคราะห์ชุดข้อมูลของเรา สร้างโมเดล ML คุณภาพสูง และดูกระดานผู้นำโมเดล เพื่อตัดสินใจว่าโมเดลใดที่จะเผยแพร่เพื่อการอนุมาน SageMaker Canvas สามารถเลือกวิธีการฝึกฝนโดยอัตโนมัติตามขนาดชุดข้อมูล หรือคุณสามารถเลือกด้วยตนเองก็ได้ ทางเลือกคือ:
- ด้วยกัน: ใช้ไฟล์ ออโต้กลูออน ไลบรารีเพื่อฝึกโมเดลพื้นฐานหลายแบบ หากต้องการค้นหาชุดข้อมูลที่ดีที่สุดสำหรับชุดข้อมูลของคุณ โหมด Ensemble จะทำการทดลอง 10 ครั้งโดยใช้การตั้งค่าโมเดลและพารามิเตอร์เมตาที่แตกต่างกัน จากนั้นจะรวมแบบจำลองเหล่านี้เข้าด้วยกันโดยใช้วิธี Stacking Ensemble เพื่อสร้างแบบจำลองการคาดการณ์ที่เหมาะสมที่สุด ในโหมด Ensemble SageMaker Canvas รองรับอัลกอริธึมการเรียนรู้ของเครื่องประเภทต่อไปนี้:
- GBM แบบเบา: เฟรมเวิร์กที่ได้รับการปรับปรุงซึ่งใช้อัลกอริธึมแบบต้นไม้พร้อมการเร่งการไล่ระดับสี อัลกอริทึมนี้ใช้ต้นไม้ที่เติบโตในความกว้างมากกว่าความลึก และได้รับการปรับให้เหมาะสมที่สุดสำหรับความเร็ว
- แคทบูสท์: เฟรมเวิร์กที่ใช้อัลกอริธึมแบบต้นไม้พร้อมการเร่งการไล่ระดับสี ปรับให้เหมาะสมสำหรับการจัดการตัวแปรหมวดหมู่
- XGBoost: เฟรมเวิร์กที่ใช้อัลกอริธึมแบบต้นไม้พร้อมการเร่งการไล่ระดับสีที่เติบโตในเชิงลึกมากกว่าความกว้าง
- ป่าสุ่ม: อัลกอริธึมแบบต้นไม้ที่ใช้แผนผังการตัดสินใจหลายแบบกับตัวอย่างย่อยแบบสุ่มของข้อมูลที่มีการแทนที่ ต้นไม้จะถูกแบ่งออกเป็นโหนดที่เหมาะสมที่สุดในแต่ละระดับ การตัดสินใจของต้นไม้แต่ละต้นจะถูกนำมาเฉลี่ยรวมกันเพื่อป้องกันการเกินพอดีและปรับปรุงการคาดการณ์
- ต้นไม้เสริม: อัลกอริธึมแบบต้นไม้ที่ใช้แผนผังการตัดสินใจหลายแบบกับชุดข้อมูลทั้งหมด ต้นไม้จะถูกแบ่งแบบสุ่มในแต่ละระดับ การตัดสินใจของต้นไม้แต่ละต้นมีค่าเฉลี่ยเพื่อป้องกันการเกินพอดีและเพื่อปรับปรุงการคาดการณ์ ต้นไม้พิเศษจะเพิ่มระดับของการสุ่มเมื่อเปรียบเทียบกับอัลกอริธึมฟอเรสต์แบบสุ่ม
- โมเดลเชิงเส้น: กรอบงานที่ใช้สมการเชิงเส้นเพื่อสร้างแบบจำลองความสัมพันธ์ระหว่างตัวแปรสองตัวในข้อมูลที่สังเกตได้
- คบเพลิงโครงข่ายประสาทเทียม: โมเดลโครงข่ายประสาทเทียมที่นำไปใช้งานโดยใช้ Pytorch
- โครงข่ายประสาทเทียม fast.ai: โมเดลโครงข่ายประสาทเทียมที่นำไปใช้งานโดยใช้ fast.ai
- การเพิ่มประสิทธิภาพไฮเปอร์พารามิเตอร์ (HPO): SageMaker Canvas ค้นหาเวอร์ชันที่ดีที่สุดของโมเดลโดยการปรับแต่งไฮเปอร์พารามิเตอร์โดยใช้การเพิ่มประสิทธิภาพแบบเบย์หรือการเพิ่มประสิทธิภาพแบบหลายความเที่ยงตรงในขณะที่รันงานการฝึกอบรมบนชุดข้อมูลของคุณ โหมด HPO จะเลือกอัลกอริธึมที่เกี่ยวข้องกับชุดข้อมูลของคุณมากที่สุด และเลือกช่วงของไฮเปอร์พารามิเตอร์ที่ดีที่สุดเพื่อปรับแต่งโมเดลของคุณ หากต้องการปรับแต่งโมเดลของคุณ โหมด HPO จะทำการทดลองสูงสุด 100 ครั้ง (ค่าเริ่มต้น) เพื่อค้นหาการตั้งค่าไฮเปอร์พารามิเตอร์ที่เหมาะสมที่สุดภายในช่วงที่เลือก หากขนาดชุดข้อมูลของคุณน้อยกว่า 100 MB SageMaker Canvas จะใช้การปรับให้เหมาะสมแบบเบย์ SageMaker Canvas เลือกการเพิ่มประสิทธิภาพหลายความเที่ยงตรงหากชุดข้อมูลของคุณมีขนาดใหญ่กว่า 100 MB ในการเพิ่มประสิทธิภาพหลายความเที่ยงตรง ตัววัดจะถูกปล่อยออกมาอย่างต่อเนื่องจากคอนเทนเนอร์การฝึก การทดลองที่มีประสิทธิภาพต่ำเมื่อเทียบกับการวัดวัตถุประสงค์ที่เลือกไว้จะถูกหยุดก่อนกำหนด การทดลองที่ทำงานได้ดีจะได้รับการจัดสรรทรัพยากรมากขึ้น ในโหมด HPO SageMaker Canvas รองรับอัลกอริธึมการเรียนรู้ของเครื่องประเภทต่อไปนี้:
- ผู้เรียนเชิงเส้น: อัลกอริธึมการเรียนรู้แบบมีผู้สอนที่สามารถแก้ปัญหาการจำแนกประเภทหรือปัญหาการถดถอย
- XGBoost: อัลกอริธึมการเรียนรู้แบบมีผู้สอนที่พยายามทำนายตัวแปรเป้าหมายอย่างแม่นยำโดยการรวมชุดการประมาณค่าจากชุดรูปแบบที่เรียบง่ายและอ่อนแอกว่า
- อัลกอริธึมการเรียนรู้เชิงลึก: เพอร์เซปตรอนหลายชั้น (MLP) และโครงข่ายประสาทเทียมแบบป้อนไปข้างหน้า อัลกอริธึมนี้สามารถจัดการข้อมูลที่ไม่สามารถแบ่งแยกเชิงเส้นได้
- อัตโนมัติ: SageMaker Canvas จะเลือกโหมดทั้งชุดหรือโหมด HPO โดยอัตโนมัติตามขนาดชุดข้อมูลของคุณ หากชุดข้อมูลของคุณมีขนาดใหญ่กว่า 100 MB SageMaker Canvas จะเลือก HPO มิฉะนั้นจะเลือกโหมดทั้งมวล
เบื้องต้น
สำหรับโพสต์นี้ คุณต้องปฏิบัติตามข้อกำหนดเบื้องต้นต่อไปนี้:
- มี บัญชี AWS.
- ตั้งค่า SageMaker Canvas ดู ข้อกำหนดเบื้องต้นสำหรับการตั้งค่า Amazon SageMaker Canvas.
- ดาวน์โหลดคลาสสิก ชุดข้อมูลไททานิค ไปยังเครื่องคอมพิวเตอร์ของคุณ
สร้างแบบจำลอง
เราจะอธิบายให้คุณทราบโดยใช้ชุดข้อมูล Titanic และ SageMaker Canvas เพื่อสร้างแบบจำลองที่คาดการณ์ว่าผู้โดยสารคนไหนรอดชีวิตจากเหตุเรือไททานิคล่ม นี่เป็นปัญหาการจำแนกประเภทไบนารี เรามุ่งเน้นที่การสร้างการทดลอง Canvas โดยใช้โหมดการฝึกอบรมทั้งมวล และเปรียบเทียบผลลัพธ์ของคะแนน F1 และรันไทม์โดยรวมกับการทดลอง SageMaker Canvas โดยใช้โหมดการฝึกอบรม HPO (การทดลอง 100 ครั้ง)
ชื่อคอลัมน์ | รายละเอียด |
รหัสผู้โดยสาร | หมายเลขประจำตัว |
รอดชีวิตมาได้ | การอยู่รอด |
พีคลาส | ชั้นตั๋ว |
Name | ชื่อผู้โดยสาร |
เพศ | เพศ |
อายุ | อายุในปี |
ซิบพ์ | จำนวนพี่น้องหรือคู่สมรสบนเรือไททานิค |
กระดาษ | จำนวนผู้ปกครองหรือเด็กบนเรือไททานิค |
ตั๋ว | เลขที่ตั๋ว |
ค่าโดยสาร | งานผู้โดยสาร |
ห้องโดยสาร | หมายเลขห้องโดยสาร |
ทำเครื่องหมายไว้ | ท่าเรือลงเรือ |
พื้นที่ ชุดข้อมูลไททานิค มี 890 แถว 12 คอลัมน์ ประกอบด้วยข้อมูลประชากรเกี่ยวกับผู้โดยสาร (อายุ เพศ ชั้นตั๋ว และอื่นๆ) และคอลัมน์เป้าหมายผู้รอดชีวิต (ใช่/ไม่ใช่)
- เริ่มต้นด้วยการนำเข้าชุดข้อมูลไปยัง SageMaker Canvas ตั้งชื่อชุดข้อมูล มหึมา.
- เลือกชุดข้อมูล Titanic และเลือก สร้างโมเดลใหม่. กรอกชื่อรุ่น เลือก การวิเคราะห์เชิงคาดการณ์ เป็นประเภทปัญหา และเลือก สร้างบัญชีตัวแทน.
- ภายใต้ เลือกคอลัมน์ที่จะทำนาย, ใช้ คอลัมน์เป้าหมาย เลื่อนลงเพื่อเลือก รอดชีวิตมาได้. คอลัมน์เป้าหมายที่รอดชีวิตเป็นชนิดข้อมูลไบนารีที่มีค่า 0 (ไม่รอด) และ 1 (รอดชีวิต)
กำหนดค่าและรันโมเดล
ในการทดสอบแรก คุณกำหนดค่า SageMaker Canvas เพื่อเรียกใช้การฝึกอบรมทั้งชุดบนชุดข้อมูลโดยมีความแม่นยำเป็นตัวชี้วัดวัตถุประสงค์ของคุณ คะแนนความแม่นยำที่สูงกว่าบ่งชี้ว่าแบบจำลองกำลังคาดการณ์ได้ถูกต้องมากขึ้น ในขณะที่คะแนนความแม่นยำที่ต่ำกว่าบ่งชี้ว่าแบบจำลองกำลังทำข้อผิดพลาดมากขึ้น ความแม่นยำทำงานได้ดีสำหรับชุดข้อมูลที่สมดุล สำหรับการฝึกอบรมทั้งมวล ให้เลือก XGBoost, Random Forest, CatBoost และ Linear Models เป็นอัลกอริธึมของคุณ ปล่อยให้การแยกข้อมูลเป็นค่าเริ่มต้น 80/20 สำหรับการฝึกและการตรวจสอบ และสุดท้าย กำหนดค่างานการฝึกให้รันสำหรับรันไทม์งานสูงสุด 1 ชั่วโมง
- เริ่มต้นด้วยการเลือก กำหนดค่าโมเดล.
- สิ่งนี้จะแสดงหน้าต่างโมดอลสำหรับ กำหนดค่าโมเดล. เลือก ระดับสูง จากบานหน้าต่างนำทาง
- เริ่มกำหนดค่าโมเดลของคุณโดยเลือก ตัวชี้วัดวัตถุประสงค์. สำหรับการทดลองนี้ ให้เลือก ความถูกต้อง. คะแนนความแม่นยำจะบอกคุณว่าการคาดการณ์ของแบบจำลองโดยรวมถูกต้องบ่อยเพียงใด
- เลือก วิธีการฝึกอบรมและอัลกอริทึม และเลือก ทั้งมวล. วิธีการทั้งมวลในการเรียนรู้ของเครื่องเกี่ยวข้องกับการสร้างแบบจำลองหลาย ๆ แบบแล้วรวมเข้าด้วยกันเพื่อให้ได้ผลลัพธ์ที่ดีขึ้น เทคนิคนี้ใช้เพื่อเพิ่มความแม่นยำในการทำนายโดยใช้ประโยชน์จากจุดแข็งของอัลกอริทึมต่างๆ เป็นที่ทราบกันว่าวิธีการของ Ensemble สามารถสร้างโซลูชันที่แม่นยำมากกว่าแบบจำลองเดียว ดังที่แสดงให้เห็นในการแข่งขันการเรียนรู้ของเครื่องและแอปพลิเคชันในโลกแห่งความเป็นจริง
- เลือกอัลกอริธึมต่างๆ ที่จะใช้สำหรับชุด สำหรับการทดลองนี้ ให้เลือก XGBoost, วัดเชิงเส้น, แคทบูสท์และ ป่าสุ่ม. ล้างอัลกอริธึมอื่น ๆ ทั้งหมด
- เลือก การแยกข้อมูล จากบานหน้าต่างนำทาง สำหรับการทดสอบนี้ ให้ปล่อยให้การแบ่งการฝึกและการตรวจสอบเริ่มต้นเป็น 80/20 การทดสอบซ้ำครั้งถัดไปจะใช้การแยกที่แตกต่างกันเพื่อดูว่าส่งผลให้โมเดลมีประสิทธิภาพดีขึ้นหรือไม่
- เลือก ผู้สมัครสูงสุดและรันไทม์ จากบานหน้าต่างนำทางและตั้งค่า รันไทม์งานสูงสุด ถึง 1 ชั่วโมงแล้วเลือก ลด.
- Choose โครงสร้างมาตรฐาน เพื่อเริ่มการสร้าง
ณ จุดนี้ SageMaker Canvas กำลังเรียกใช้การฝึกโมเดลตามการกำหนดค่าที่คุณให้ไว้ เนื่องจากคุณระบุรันไทม์สูงสุดสำหรับงานการฝึกไว้ที่ 1 ชั่วโมง SageMaker Canvas จะใช้เวลาถึงหนึ่งชั่วโมงในการรันงานการฝึก
ตรวจสอบผลลัพธ์
เมื่อเสร็จสิ้นงานการฝึก SageMaker Canvas จะนำคุณกลับเข้าสู่มุมมองวิเคราะห์โดยอัตโนมัติ และแสดงผลการวัดตามวัตถุประสงค์ที่คุณได้กำหนดค่าไว้สำหรับการทดสอบการฝึกโมเดล ในกรณีนี้ คุณจะเห็นว่าความแม่นยำของแบบจำลองคือ 86.034 เปอร์เซ็นต์
- เลือกปุ่มลูกศรยุบที่อยู่ถัดจาก ลีดเดอร์บอร์ดโมเดล เพื่อตรวจสอบข้อมูลประสิทธิภาพของโมเดล
- เลือก เกณฑ์การให้คะแนน แท็บเพื่อเจาะลึกข้อมูลเชิงลึกด้านความแม่นยำของโมเดล โมเดลที่ได้รับการฝึกรายงานว่าสามารถทำนายผู้โดยสารที่ไม่รอดชีวิตได้อย่างถูกต้องถึงร้อยละ 89.72 ของทั้งหมด
- เลือก ตัวชี้วัดขั้นสูง แท็บเพื่อประเมินรายละเอียดประสิทธิภาพของโมเดลเพิ่มเติม เริ่มต้นด้วยการเลือก ตารางเมตริก เพื่อตรวจสอบรายละเอียดตัวชี้วัด เช่น F1, ความแม่นยำ, จำและ AUC.
- SageMaker Canvas ยังช่วยให้เห็นภาพ เมทริกซ์ความสับสน สำหรับรุ่นที่ฝึกแล้ว
- และเห็นภาพ. เส้นโค้งการเรียกคืนที่แม่นยำ. AUPRC ที่ 0.86 ส่งสัญญาณว่ามีความแม่นยำในการจำแนกประเภทสูง ซึ่งถือว่าดี
- Choose ลีดเดอร์บอร์ดโมเดล เพื่อเปรียบเทียบตัวชี้วัดประสิทธิภาพหลัก (เช่น ความแม่นยำ ความแม่นยำ การเรียกคืน และคะแนน F1) สำหรับโมเดลต่างๆ ที่ประเมินโดย SageMaker Canvas เพื่อกำหนดโมเดลที่ดีที่สุดสำหรับข้อมูล โดยอิงตามการกำหนดค่าที่คุณตั้งไว้สำหรับการทดสอบนี้ โมเดลเริ่มต้นที่มีประสิทธิภาพดีที่สุดจะถูกเน้นด้วย โมเดลเริ่มต้น ป้ายบนบอร์ดผู้นำโมเดล
- คุณสามารถใช้เมนูบริบทที่ด้านข้างเพื่อเจาะลึกรายละเอียดของโมเดลใดๆ หรือเพื่อทำให้โมเดลเป็นโมเดลเริ่มต้น เลือก ดูรายละเอียดรุ่น บนรุ่นที่สองในลีดเดอร์บอร์ดเพื่อดูรายละเอียด
- SageMaker Canvas เปลี่ยนมุมมองเพื่อแสดงรายละเอียดของตัวเลือกโมเดลที่เลือก แม้ว่ารายละเอียดของโมเดลเริ่มต้นจะมีอยู่แล้ว มุมมองรายละเอียดโมเดลสำรองจะใช้เวลา 10–15 นาทีในการลงรายละเอียด
สร้างแบบจำลองที่สอง
ตอนนี้คุณได้สร้าง ใช้งาน และตรวจสอบแบบจำลองแล้ว เรามาสร้างแบบจำลองที่สองเพื่อเปรียบเทียบกันดีกว่า
- กลับสู่มุมมองแบบจำลองเริ่มต้นโดยการเลือก X ที่มุมด้านบน ตอนนี้เลือก เพิ่มเวอร์ชัน เพื่อสร้างโมเดลเวอร์ชันใหม่
- เลือกชุดข้อมูล Titanic ที่คุณสร้างขึ้นในตอนแรก จากนั้นเลือก เลือกชุดข้อมูล.
SageMaker Canvas จะโหลดโมเดลโดยอัตโนมัติโดยเลือกคอลัมน์เป้าหมายไว้แล้ว ในการทดลองที่สองนี้ คุณจะเปลี่ยนไปใช้การฝึกอบรม HPO เพื่อดูว่าจะให้ผลลัพธ์ที่ดีกว่าสำหรับชุดข้อมูลหรือไม่ สำหรับแบบจำลองนี้ คุณคงการวัดวัตถุประสงค์ (ความแม่นยำ) ไว้เดิมเพื่อเปรียบเทียบกับการทดสอบครั้งแรก และใช้อัลกอริทึม XGBoost สำหรับการฝึก HPO คุณเปลี่ยนการแบ่งข้อมูลสำหรับการฝึกอบรมและการตรวจสอบเป็น 70/30 และกำหนดค่าผู้สมัครสูงสุดและค่ารันไทม์สำหรับงาน HPO เป็นผู้สมัคร 20 ราย และรันไทม์งานสูงสุดเป็น 1 ชั่วโมง
กำหนดค่าและรันโมเดล
- เริ่มต้นการทดสอบครั้งที่สองโดยเลือก กำหนดค่าโมเดล เพื่อกำหนดค่ารายละเอียดการฝึกโมเดลของคุณ
- ตัว Vortex Indicator ได้ถูกนำเสนอลงในนิตยสาร กำหนดค่าโมเดล เลือก ตัวชี้วัดวัตถุประสงค์ จากบานหน้าต่างนำทาง สำหรับ ตัวชี้วัดวัตถุประสงค์ให้ใช้เมนูแบบเลื่อนลงเพื่อเลือก ความถูกต้องซึ่งจะทำให้คุณสามารถดูและเปรียบเทียบเอาต์พุตเวอร์ชันทั้งหมดแบบเทียบเคียงกันได้
- เลือก วิธีการฝึกอบรมและอัลกอริทึม. เลือก การเพิ่มประสิทธิภาพไฮเปอร์พารามิเตอร์ สำหรับวิธีการฝึกอบรม จากนั้นเลื่อนลงเพื่อเลือกอัลกอริทึม
- เลือก XGBoost สำหรับอัลกอริทึม XGBoost ให้การเพิ่มประสิทธิภาพต้นไม้แบบขนานที่ช่วยแก้ปัญหาด้านวิทยาศาสตร์ข้อมูลจำนวนมากได้อย่างรวดเร็วและแม่นยำ และนำเสนอไฮเปอร์พารามิเตอร์ที่หลากหลายที่สามารถปรับแต่งเพื่อปรับปรุงและใช้ประโยชน์จากโมเดล XGBoost ได้อย่างเต็มที่
- เลือก การแยกข้อมูล. สำหรับโมเดลนี้ ให้ตั้งค่าการแบ่งข้อมูลการฝึกและการตรวจสอบความถูกต้องเป็น 70/30
- เลือก ผู้สมัครสูงสุดและรันไทม์ และตั้งค่าสำหรับงาน HPO เป็น 20 สำหรับงาน ผู้สมัครสูงสุด และ 1 ชั่วโมงสำหรับ รันไทม์งานสูงสุด. เลือก ลด เพื่อเสร็จสิ้นการกำหนดค่ารุ่นที่สอง
- เมื่อคุณได้กำหนดค่าโมเดลที่สองแล้ว ให้เลือก โครงสร้างมาตรฐาน เพื่อเริ่มการฝึกอบรม
SageMaker Canvas ใช้การกำหนดค่าเพื่อเริ่มงาน HPO เช่นเดียวกับงานแรก งานฝึกอบรมนี้จะใช้เวลาถึงหนึ่งชั่วโมงจึงจะเสร็จสมบูรณ์
ตรวจสอบผลลัพธ์
เมื่องานการฝึก HPO เสร็จสมบูรณ์ (หรือรันไทม์สูงสุดหมดอายุ) SageMaker Canvas จะแสดงผลลัพธ์ของงานการฝึกตามโมเดลเริ่มต้น และแสดงคะแนนความแม่นยำของโมเดล
- Choose ลีดเดอร์บอร์ดโมเดล เพื่อดูรายชื่อผู้สมัครรุ่นทั้ง 20 รุ่นจากการฝึกอบรม HPO โมเดลที่ดีที่สุดตามวัตถุประสงค์เพื่อค้นหาความแม่นยำที่ดีที่สุด จะถูกทำเครื่องหมายเป็นค่าเริ่มต้น
ในขณะที่ความแม่นยำของ ผิดนัด โมเดลที่ดีที่สุด อีกโมเดลหนึ่งจากการรันงาน HPO มีพื้นที่สูงกว่าภายใต้คะแนน ROC Curve (AUC) คะแนน AUC ใช้เพื่อประเมินประสิทธิภาพของแบบจำลองการจำแนกประเภทไบนารี AUC ที่สูงกว่าบ่งชี้ว่าโมเดลสามารถแยกแยะความแตกต่างระหว่างสองคลาสได้ดีกว่า โดย 1 คือคะแนนสมบูรณ์ และ 0.5 หมายถึงการเดาแบบสุ่ม
- ใช้เมนูบริบทเพื่อทำให้โมเดลที่มี AUC สูงกว่าเป็นโมเดลเริ่มต้น เลือกเมนูบริบทสำหรับรุ่นนั้นและเลือก เปลี่ยนเป็นรูปแบบเริ่มต้น ตัวเลือกในเมนูเส้นดังแสดงในรูปที่ 31 ต่อไปนี้
SageMaker Canvas ใช้เวลาสักครู่ในการเปลี่ยนโมเดลที่เลือกไปเป็นโมเดลเริ่มต้นใหม่สำหรับเวอร์ชัน 2 ของการทดสอบ และย้ายไปที่ด้านบนสุดของรายการโมเดล
เปรียบเทียบรุ่น
ณ จุดนี้ คุณมีโมเดลสองเวอร์ชันและสามารถดูแบบเทียบเคียงได้โดยไปที่ โมเดลของฉัน ใน SageMaker Canvas
- เลือก ทำนายความอยู่รอดบนเรือไททานิก เพื่อดูรุ่นรุ่นที่มีจำหน่าย
- มีสองเวอร์ชันและประสิทธิภาพจะแสดงในรูปแบบตารางสำหรับการเปรียบเทียบแบบเทียบเคียงกัน
- คุณจะเห็นว่าเวอร์ชัน 1 ของโมเดล (ซึ่งได้รับการฝึกฝนโดยใช้อัลกอริธึมทั้งมวล) มีความแม่นยำที่ดีกว่า ตอนนี้คุณสามารถใช้ SageMaker Canvas เพื่อสร้างสมุดบันทึก SageMaker พร้อมโค้ด ความคิดเห็น และคำแนะนำ เพื่อปรับแต่ง ออโต้กลูออน ทดลองใช้และรันเวิร์กโฟลว์ SageMaker Canvas โดยไม่ต้องเขียนโค้ดแม้แต่บรรทัดเดียว คุณสามารถสร้างสมุดบันทึก SageMaker ได้โดยเลือกเมนูบริบทและเลือก ดูโน๊ตบุ๊ค.
- สมุดบันทึก SageMaker จะปรากฏในหน้าต่างป๊อปอัป สมุดบันทึกจะช่วยคุณตรวจสอบและแก้ไขพารามิเตอร์ที่เสนอโดย SageMaker Canvas คุณสามารถเลือกการกำหนดค่าแบบโต้ตอบที่เสนอโดย SageMaker Canvas แก้ไข และเรียกใช้งานการประมวลผลเพื่อฝึกโมเดลตามการกำหนดค่าที่เลือกในสภาพแวดล้อม SageMaker Studio
การอนุมาน
เมื่อคุณระบุแบบจำลองที่ดีที่สุดแล้ว คุณสามารถใช้เมนูบริบทเพื่อดำเนินการได้ ปรับใช้กับปลายทางสำหรับการอนุมานตามเวลาจริง.
หรือใช้เมนูบริบทเพื่อดำเนินการโมเดล ML ของคุณในการใช้งานจริง การลงทะเบียนโมเดล Machine Learning (ML) เข้ากับการลงทะเบียนโมเดล SageMaker.
ทำความสะอาด
เพื่อหลีกเลี่ยงไม่ให้มีการเรียกเก็บเงินในอนาคต โปรดลบทรัพยากรที่คุณสร้างขณะติดตามโพสต์นี้ SageMaker Canvas จะเรียกเก็บเงินคุณตามระยะเวลาของเซสชัน และเราขอแนะนำให้ออกจากระบบ SageMaker Canvas เมื่อคุณไม่ได้ใช้งาน
ดู ออกจากระบบ Amazon SageMaker Canvas .
สรุป
SageMaker Canvas เป็นเครื่องมืออันทรงพลังที่ทำให้การเรียนรู้ของเครื่องเป็นประชาธิปไตย เพื่อรองรับทั้งผู้มีส่วนได้ส่วนเสียที่ไม่ใช่ด้านเทคนิคและนักวิทยาศาสตร์ข้อมูลพลเมือง คุณสมบัติที่เพิ่งเปิดตัว รวมถึงการกำหนดค่าการสร้างโมเดลขั้นสูงและกระดานผู้นำโมเดล ช่วยยกระดับความยืดหยุ่นและความโปร่งใสของแพลตฟอร์ม สิ่งนี้ช่วยให้คุณปรับแต่งโมเดลการเรียนรู้ของเครื่องให้เหมาะกับความต้องการทางธุรกิจเฉพาะโดยไม่ต้องเจาะลึกโค้ด ความสามารถในการปรับแต่งวิธีการฝึกฝน อัลกอริธึม การแยกข้อมูล และพารามิเตอร์อื่นๆ ช่วยให้คุณสามารถทดลองใช้เทคนิค ML ต่างๆ ได้ ส่งเสริมความเข้าใจที่ลึกซึ้งยิ่งขึ้นเกี่ยวกับประสิทธิภาพของโมเดล
การเปิดตัวบอร์ดผู้นำโมเดลเป็นการปรับปรุงที่สำคัญ โดยให้ภาพรวมที่ชัดเจนของตัวชี้วัดประสิทธิภาพหลักสำหรับการกำหนดค่าต่างๆ ความโปร่งใสนี้ช่วยให้ผู้ใช้มีข้อมูลประกอบการตัดสินใจเกี่ยวกับตัวเลือกโมเดลและการเพิ่มประสิทธิภาพ ด้วยการแสดงเวิร์กโฟลว์การสร้างโมเดลทั้งหมด รวมถึงขั้นตอนก่อนการประมวลผลที่แนะนำ อัลกอริธึม และช่วงไฮเปอร์พารามิเตอร์ในสมุดบันทึก SageMaker Canvas ช่วยให้เข้าใจกระบวนการพัฒนาโมเดลได้อย่างครอบคลุม
หากต้องการเริ่มต้นการเดินทาง ML แบบใช้โค้ดน้อย/ไม่มีโค้ด โปรดดู Amazon SageMaker Canvas
ขอขอบคุณเป็นพิเศษสำหรับทุกคนที่มีส่วนร่วมในการเปิดตัว:
Esha Dutta, Ed Cheung, Max Kondrashov, Allan Johnson, Ridhim Rastogi, Ranga Reddy Pallelra, Ruochen Wen, Ruinong Tian, Sandipan Manna, Renu Rozera, Vikash Garg, Ramesh Sekaran และ Gunjan Garg
เกี่ยวกับผู้เขียน
เจนิชา อานันท์ เป็นผู้จัดการผลิตภัณฑ์อาวุโสในทีม SageMaker Low/No Code ML ซึ่งรวมถึง SageMaker Canvas และ SageMaker Autopilot เธอชอบดื่มกาแฟ กระตือรือร้น และใช้เวลากับครอบครัว
อินดี้ ซอว์นีย์ เป็นผู้นำโซลูชันลูกค้าอาวุโสของ Amazon Web Services Indy ทำงานแบบย้อนกลับจากปัญหาของลูกค้าอยู่เสมอ ให้คำแนะนำแก่ผู้บริหารลูกค้าองค์กร AWS ผ่านเส้นทางการเปลี่ยนแปลงระบบคลาวด์ที่ไม่เหมือนใคร เขามีประสบการณ์มากกว่า 25 ปีในการช่วยเหลือองค์กรองค์กรให้นำเทคโนโลยีและโซลูชั่นทางธุรกิจที่เกิดขึ้นใหม่มาใช้ Indy เป็นผู้เชี่ยวชาญเฉพาะด้านในชุมชน AWS Technical Field สำหรับปัญญาประดิษฐ์และการเรียนรู้ของเครื่องจักร (AI/ML) โดยมีความเชี่ยวชาญเฉพาะด้านด้านโซลูชัน SageMaker ที่ใช้ generative AI และ low-code/no-code (LCNC)
- เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
- PlatoData.Network Vertical Generative Ai เพิ่มพลังให้กับตัวเอง เข้าถึงได้ที่นี่.
- เพลโตไอสตรีม. Web3 อัจฉริยะ ขยายความรู้ เข้าถึงได้ที่นี่.
- เพลโตESG. คาร์บอน, คลีนเทค, พลังงาน, สิ่งแวดล้อม แสงอาทิตย์, การจัดการของเสีย. เข้าถึงได้ที่นี่.
- เพลโตสุขภาพ เทคโนโลยีชีวภาพและข่าวกรองการทดลองทางคลินิก เข้าถึงได้ที่นี่.
- ที่มา: https://aws.amazon.com/blogs/machine-learning/build-and-evaluate-machine-learning-models-with-advanced-configurations-using-the-sagemaker-canvas-model-leaderboard/
- :มี
- :เป็น
- :ไม่
- $ ขึ้น
- 1
- 10
- 100
- 11
- 12
- 13
- 14
- 15%
- 16
- 17
- 19
- 20
- 22
- 23
- 24
- 25
- 26%
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 35%
- 36
- 39
- 7
- 72
- 8
- 9
- a
- ความสามารถ
- เกี่ยวกับเรา
- เข้า
- ความถูกต้อง
- ถูกต้อง
- แม่นยำ
- คล่องแคล่ว
- เพิ่ม
- นอกจากนี้
- เพิ่มเติม
- นำมาใช้
- สูง
- ความได้เปรียบ
- กับ
- อายุ
- AI
- AI / ML
- ขั้นตอนวิธี
- อัลกอริทึม
- ทั้งหมด
- จัดสรร
- การอนุญาต
- ช่วยให้
- แล้ว
- ด้วย
- เสมอ
- อเมซอน
- อเมซอน SageMaker
- Amazon Web Services
- an
- นักวิเคราะห์
- วิเคราะห์
- และ
- อื่น
- ใด
- ปรากฏ
- การใช้งาน
- เป็น
- AREA
- เทียม
- ปัญญาประดิษฐ์
- ปัญญาประดิษฐ์และการเรียนรู้ด้วยเครื่อง
- AS
- At
- ความพยายามในการ
- au
- อัตโนมัติ
- ออโต้เอ็มแอล
- ใช้ได้
- เฉลี่ย
- หลีกเลี่ยง
- AWS
- กลับ
- สมดุลย์
- ฐาน
- ตาม
- เบย์เซียน
- BE
- เพราะ
- กำลัง
- ที่ดีที่สุด
- ดีกว่า
- ระหว่าง
- ธนบัตร
- การส่งเสริม
- ทั้งสอง
- ความกว้าง
- นำ
- สร้าง
- การก่อสร้าง
- แบบจำลองอาคาร
- สร้าง
- ธุรกิจ
- ปุ่ม
- by
- CAN
- ผู้สมัคร
- ผู้สมัคร
- ผ้าใบ
- กรณี
- ทำอาหารรับประทานเอง
- เปลี่ยนแปลง
- การเปลี่ยนแปลง
- โหลด
- เด็ก
- ทางเลือก
- Choose
- เลือก
- พลเมือง
- ชั้น
- ชั้นเรียน
- การจัดหมวดหมู่
- ชัดเจน
- เมฆ
- รหัส
- กาแฟ
- ล่มสลาย
- คอลัมน์
- คอลัมน์
- การผสมผสาน
- รวม
- การรวมกัน
- ความคิดเห็น
- ชุมชน
- เปรียบเทียบ
- การเปรียบเทียบ
- การแข่งขัน
- สมบูรณ์
- เสร็จสิ้น
- ครอบคลุม
- คอมพิวเตอร์
- องค์ประกอบ
- การกำหนดค่า
- การกำหนดค่า
- ภาชนะบรรจุ
- มี
- สิ่งแวดล้อม
- อย่างต่อเนื่อง
- ส่วน
- มุม
- แก้ไข
- ได้อย่างถูกต้อง
- สร้าง
- ที่สร้างขึ้น
- การสร้าง
- เส้นโค้ง
- ลูกค้า
- โซลูชั่นสำหรับลูกค้า
- ปรับแต่ง
- ข้อมูล
- วิทยาศาสตร์ข้อมูล
- ชุดข้อมูล
- ตัดสินใจ
- การตัดสินใจ
- การตัดสินใจ
- ลึก
- ค่าเริ่มต้น
- องศา
- ทำให้เป็นประชาธิปไตย
- ประชากรศาสตร์
- แสดงให้เห็นถึง
- ความลึก
- รายละเอียด
- รายละเอียด
- กำหนด
- พัฒนาการ
- DID
- ต่าง
- แสดง
- แสดง
- แสดง
- การดำน้ำ
- ลง
- หล่น
- ระยะเวลา
- แต่ละ
- ก่อน
- ed
- ทั้ง
- ยกระดับ
- กากกะรุน
- เทคโนโลยีใหม่
- ให้อำนาจ
- ช่วยให้
- ปลายทาง
- ทำให้มั่นใจ
- เข้าสู่
- Enterprise
- ทั้งหมด
- สิ่งแวดล้อม
- ข้อผิดพลาด
- ประมาณการ
- ประเมินค่า
- ประเมิน
- ทุกคน
- ตัวอย่าง
- ผู้บริหารระดับสูง
- ประสบการณ์
- การทดลอง
- พิเศษ
- f1
- อำนวยความสะดวก
- ครอบครัว
- FAST
- คุณสมบัติ
- สองสาม
- สนาม
- รูป
- ในที่สุด
- หา
- พบ
- เสร็จสิ้น
- ชื่อจริง
- ความยืดหยุ่น
- โฟกัส
- ดังต่อไปนี้
- ดังต่อไปนี้
- สำหรับ
- ป่า
- รูป
- อุปถัมภ์
- กรอบ
- ราคาเริ่มต้นที่
- เต็ม
- ฟังก์ชันการทำงาน
- อนาคต
- การ์ก
- สร้าง
- กำเนิด
- กำเนิด AI
- gluon
- ไป
- ดี
- ขึ้น
- เติบโต
- มี
- จัดการ
- การจัดการ
- มี
- มี
- he
- การช่วยเหลือ
- จะช่วยให้
- เธอ
- จุดสูง
- ที่มีคุณภาพสูง
- สูงกว่า
- ไฮไลต์
- อย่างสูง
- ชั่วโมง
- สรุป ความน่าเชื่อถือของ Olymp Trade?
- HTML
- HTTPS
- การเพิ่มประสิทธิภาพไฮเปอร์พารามิเตอร์
- ระบุ
- แยกแยะ
- if
- การดำเนินการ
- การนำเข้า
- ปรับปรุง
- การปรับปรุง
- การปรับปรุง
- in
- รวมถึง
- รวมทั้ง
- เพิ่ม
- บ่งชี้ว่า
- ข้อมูล
- แจ้ง
- ในขั้นต้น
- เริ่มต้น
- ที่ชาญฉลาด
- ข้อมูลเชิงลึก
- คำแนะนำการใช้
- Intelligence
- เข้าไป
- แนะนำ
- บทนำ
- รวมถึง
- IT
- การย้ำ
- ซ้ำ
- การสัมภาษณ์
- งาน
- จอห์นสัน
- การเดินทาง
- jpg
- เก็บ
- คีย์
- ที่รู้จักกัน
- ฉลาก
- ใหญ่
- ที่มีขนาดใหญ่
- เปิดตัว
- ผู้นำ
- ผู้เรียน
- การเรียนรู้
- ทิ้ง
- น้อยลง
- ช่วยให้
- ชั้น
- ห้องสมุด
- กดไลก์
- ขีด จำกัด
- Line
- รายการ
- โหลด
- ในประเทศ
- ลด
- เครื่อง
- เรียนรู้เครื่อง
- ทำ
- การทำ
- ผู้จัดการ
- ด้วยมือ
- หลาย
- โดดเด่น
- แม็กซ์
- สูงสุด
- เมนู
- Meta
- วิธี
- วิธีการ
- เมตริก
- ตัวชี้วัด
- นาที
- ML
- โหมด
- แบบ
- โมเดล
- แก้ไข
- ข้อมูลเพิ่มเติม
- มากที่สุด
- ย้าย
- หลาย
- ต้อง
- ชื่อ
- การเดินเรือ
- ความต้องการ
- เครือข่าย
- เกี่ยวกับประสาท
- เครือข่ายประสาท
- ใหม่
- ใหม่
- ถัดไป
- โหนด
- ไม่ใช่เทคนิค
- สมุดบันทึก
- ตอนนี้
- วัตถุประสงค์
- of
- เสนอ
- มักจะ
- on
- ONE
- ดีที่สุด
- การเพิ่มประสิทธิภาพ
- เพิ่มประสิทธิภาพ
- การปรับให้เหมาะสม
- ตัวเลือกเสริม (Option)
- or
- องค์กร
- อื่นๆ
- มิฉะนั้น
- ของเรา
- ออก
- เอาท์พุต
- เอาท์พุท
- เกิน
- ทั้งหมด
- ภาพรวม
- บานหน้าต่าง
- Parallel
- พารามิเตอร์
- พารามิเตอร์
- พ่อแม่
- เปอร์เซ็นต์
- สมบูรณ์
- การปฏิบัติ
- ที่มีประสิทธิภาพ
- แพลตฟอร์ม
- เพลโต
- เพลโตดาต้าอินเทลลิเจนซ์
- เพลโตดาต้า
- จุด
- ป๊อปอัพ
- โพสต์
- ที่มีประสิทธิภาพ
- ความแม่นยำ
- คาดการณ์
- คำทำนาย
- การคาดการณ์
- คาดการณ์
- ข้อกำหนดเบื้องต้น
- ป้องกัน
- ปัญหา
- ปัญหาที่เกิดขึ้น
- กระบวนการ
- การประมวลผล
- ก่อ
- ผลิตภัณฑ์
- ผู้จัดการผลิตภัณฑ์
- การผลิต
- เสนอ
- ให้
- ให้
- ให้
- การให้
- ประกาศ
- ไฟฉาย
- คุณภาพ
- อย่างรวดเร็ว
- สุ่ม
- พิสัย
- ช่วง
- ค่อนข้าง
- อัตราส่วน
- โลกแห่งความจริง
- เรียลไทม์
- แนะนำ
- ความสัมพันธ์
- ตรงประเด็น
- การแทนที่
- การรายงาน
- แหล่งข้อมูล
- ผลสอบ
- ทบทวน
- สุดท้าย
- แข็งแรง
- วิ่ง
- วิ่ง
- ทำงาน
- รันไทม์
- sagemaker
- เดียวกัน
- วิทยาศาสตร์
- นักวิทยาศาสตร์
- คะแนน
- เลื่อน
- ที่สอง
- Section
- เห็น
- ดูรายละเอียด
- เลือก
- เลือก
- การเลือก
- ระดับอาวุโส
- บริการ
- เซสชั่น
- ชุด
- การตั้งค่า
- การตั้งค่า
- หลาย
- เพศ
- เธอ
- โชว์
- แสดง
- แสดงให้เห็นว่า
- ด้าน
- ลงชื่อ
- สัญญาณ
- สำคัญ
- การลงชื่อ
- ที่เรียบง่าย
- เดียว
- ขนาด
- So
- โซลูชัน
- แก้
- แก้ปัญหา
- ผู้เชี่ยวชาญ
- โดยเฉพาะ
- ที่ระบุไว้
- ความเร็ว
- การใช้จ่าย
- แยก
- แยก
- การสุม
- ผู้มีส่วนได้เสีย
- เริ่มต้น
- ที่เริ่มต้น
- การเข้าพัก
- ขั้นตอน
- หยุด
- จุดแข็ง
- สตูดิโอ
- อย่างเช่น
- ชี้ให้เห็นถึง
- รองรับ
- การอยู่รอด
- รอด
- รอดชีวิตมาได้
- สวิตซ์
- ช่างตัดเสื้อ
- เอา
- ใช้เวลา
- การ
- เป้า
- ทีม
- วิชาการ
- เทคนิค
- เทคนิค
- เทคโนโลยี
- บอก
- กว่า
- ขอบคุณ
- ที่
- พื้นที่
- เส้น
- ของพวกเขา
- พวกเขา
- แล้วก็
- ดังนั้น
- ล้อยางขัดเหล่านี้ติดตั้งบนแกน XNUMX (มม.) ผลิตภัณฑ์นี้ถูกผลิตในหลายรูปทรง และหลากหลายเบอร์ความแน่นหนาของปริมาณอนุภาคขัดของมัน จะทำให้ท่านได้รับประสิทธิภาพสูงในการขัดและการใช้งานที่ยาวนาน
- นี้
- ตลอด
- ดังนั้น
- ตั๋ว
- เวลา
- ไปยัง
- ในวันนี้
- ร่วมกัน
- เครื่องมือ
- ด้านบน
- ไฟฉาย
- รถไฟ
- ผ่านการฝึกอบรม
- การฝึกอบรม
- การแปลง
- ความโปร่งใส
- ต้นไม้
- ต้นไม้
- การทดลอง
- การทดลอง
- ปรับแต่ง
- ติดตามความคืบหน้า
- จูน
- สอง
- ชนิด
- ชนิด
- ภายใต้
- เข้าใจ
- ความเข้าใจ
- เป็นเอกลักษณ์
- ใช้
- มือสอง
- ผู้ใช้
- ใช้
- การใช้
- การตรวจสอบ
- ความคุ้มค่า
- ตัวแปร
- ต่างๆ
- รุ่น
- รุ่น
- รายละเอียด
- เห็นภาพ
- เดิน
- คือ
- we
- ปรับตัวลดลง
- เว็บ
- บริการเว็บ
- ดี
- เมื่อ
- ที่
- ในขณะที่
- WHO
- จะ
- หน้าต่าง
- กับ
- ภายใน
- ไม่มี
- งาน
- เวิร์กโฟลว์
- การทำงาน
- โรงงาน
- จะ
- เขียน
- การเขียน
- XGBoost
- ปี
- อัตราผลตอบแทน
- คุณ
- ของคุณ
- ลมทะเล