สร้างเวิร์กโฟลว์แมชชีนเลิร์นนิงสำหรับการจัดการความเสี่ยงบน Amazon SageMaker โดยไม่ต้องใช้โค้ด PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

สร้างเวิร์กโฟลว์แมชชีนเลิร์นนิงสำหรับการจัดการความเสี่ยงบน Amazon SageMaker โดยไม่ต้องใช้โค้ด

นับตั้งแต่วิกฤตการเงินโลก การบริหารความเสี่ยงมีบทบาทสำคัญในการกำหนดการตัดสินใจของธนาคาร รวมถึงการทำนายสถานะสินเชื่อสำหรับผู้มีโอกาสเป็นลูกค้า ซึ่งมักเป็นแบบฝึกหัดที่ใช้ข้อมูลจำนวนมากซึ่งต้องใช้การเรียนรู้ของเครื่อง (ML) อย่างไรก็ตาม ไม่ใช่ทุกองค์กรที่มีทรัพยากรด้านวิทยาศาสตร์ข้อมูลและความเชี่ยวชาญในการสร้างเวิร์กโฟลว์ ML การจัดการความเสี่ยง

อเมซอน SageMaker เป็นแพลตฟอร์ม ML ที่มีการจัดการเต็มรูปแบบ ซึ่งช่วยให้วิศวกรข้อมูลและนักวิเคราะห์ธุรกิจสามารถสร้าง ฝึกอบรม และปรับใช้โมเดล ML ได้อย่างรวดเร็วและง่ายดาย วิศวกรข้อมูลและนักวิเคราะห์ธุรกิจสามารถทำงานร่วมกันได้โดยใช้ความสามารถที่ไม่มีโค้ด/โค้ดน้อยของ SageMaker วิศวกรข้อมูลสามารถใช้ได้ Amazon SageMaker ข้อมูล Wrangler เพื่อรวบรวมและเตรียมข้อมูลสำหรับการสร้างแบบจำลองอย่างรวดเร็วโดยไม่ต้องเขียนโค้ด จากนั้นนักวิเคราะห์ธุรกิจก็สามารถใช้อินเทอร์เฟซแบบชี้แล้วคลิกของ ผืนผ้าใบ Amazon SageMaker เพื่อสร้างการคาดการณ์ ML ที่แม่นยำด้วยตนเอง

ในโพสต์นี้ เราแสดงให้เห็นว่าง่ายเพียงใดสำหรับวิศวกรข้อมูลและนักวิเคราะห์ธุรกิจในการทำงานร่วมกันเพื่อสร้างเวิร์กโฟลว์ ML ที่เกี่ยวข้องกับการเตรียมข้อมูล การสร้างแบบจำลอง และการอนุมานโดยไม่ต้องเขียนโค้ด

ภาพรวมโซลูชัน

แม้ว่าการพัฒนา ML จะเป็นกระบวนการที่ซับซ้อนและทำซ้ำได้ คุณสามารถสรุปเวิร์กโฟลว์ ML ลงในขั้นตอนการเตรียมข้อมูล การพัฒนาแบบจำลอง และขั้นตอนการปรับใช้แบบจำลองได้

สร้างเวิร์กโฟลว์แมชชีนเลิร์นนิงสำหรับการจัดการความเสี่ยงบน Amazon SageMaker โดยไม่ต้องใช้โค้ด PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

Data Wrangler และ Canvas สรุปความซับซ้อนของการเตรียมข้อมูลและการพัฒนาแบบจำลอง ดังนั้นคุณจึงสามารถมุ่งเน้นไปที่การส่งมอบคุณค่าให้กับธุรกิจของคุณโดยดึงข้อมูลเชิงลึกจากข้อมูลของคุณโดยไม่ต้องเป็นผู้เชี่ยวชาญในการพัฒนาโค้ด ไดอะแกรมสถาปัตยกรรมต่อไปนี้เน้นส่วนประกอบในโซลูชันที่ไม่มีโค้ด/โค้ดน้อย

สร้างเวิร์กโฟลว์แมชชีนเลิร์นนิงสำหรับการจัดการความเสี่ยงบน Amazon SageMaker โดยไม่ต้องใช้โค้ด PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

บริการจัดเก็บข้อมูลอย่างง่ายของ Amazon (Amazon S3) ทำหน้าที่เป็นที่เก็บข้อมูลของเราสำหรับข้อมูลดิบ ข้อมูลทางวิศวกรรม และสิ่งประดิษฐ์ของแบบจำลอง คุณยังสามารถเลือกนำเข้าข้อมูลจาก อเมซอน Redshift, อเมซอน อาเธน่า, Databricks และ Snowflake

ในฐานะนักวิทยาศาสตร์ข้อมูล เราใช้ Data Wrangler สำหรับการวิเคราะห์ข้อมูลเชิงสำรวจและวิศวกรรมคุณลักษณะ แม้ว่า Canvas จะสามารถทำงานด้านวิศวกรรมคุณลักษณะได้ แต่วิศวกรรมคุณลักษณะมักต้องการความรู้ทางสถิติและโดเมนเพื่อเสริมชุดข้อมูลให้อยู่ในรูปแบบที่เหมาะสมสำหรับการพัฒนาแบบจำลอง ดังนั้นเราจึงมอบความรับผิดชอบนี้ให้กับวิศวกรข้อมูลเพื่อให้พวกเขาสามารถแปลงข้อมูลโดยไม่ต้องเขียนโค้ดด้วย Data Wrangler

หลังจากการเตรียมข้อมูล เราจะส่งต่อความรับผิดชอบในการสร้างแบบจำลองให้กับนักวิเคราะห์ข้อมูล ซึ่งสามารถใช้ Canvas เพื่อฝึกโมเดลโดยไม่ต้องเขียนโค้ดใดๆ

สุดท้าย เราทำการคาดการณ์แบบเดี่ยวและแบบกลุ่มโดยตรงภายใน Canvas จากโมเดลที่เป็นผลลัพธ์ โดยไม่ต้องปรับใช้ปลายทางของโมเดลด้วยตนเอง

ภาพรวมชุดข้อมูล

เราใช้คุณสมบัติของ SageMaker เพื่อทำนายสถานะของเงินกู้โดยใช้ Lending Club's เวอร์ชันแก้ไข ชุดข้อมูลการวิเคราะห์สินเชื่อที่เปิดเผยต่อสาธารณะ. ชุดข้อมูลประกอบด้วยข้อมูลเงินกู้สำหรับสินเชื่อที่ออกในปี 2007-2011 คอลัมน์ที่อธิบายเงินกู้และผู้กู้คือคุณลักษณะของเรา คอลัมน์เงินกู้_สถานะเป็นตัวแปรเป้าหมาย ซึ่งเป็นสิ่งที่เราพยายามคาดการณ์

เพื่อสาธิตใน Data Wrangler เราแบ่งชุดข้อมูลออกเป็นไฟล์ CSV สองไฟล์: ส่วนหนึ่ง และ ส่วนที่สอง. เราได้ลบบางคอลัมน์ออกจากชุดข้อมูลดั้งเดิมของ Lending Club เพื่อให้การสาธิตง่ายขึ้น ชุดข้อมูลของเรามีมากกว่า 37,000 แถวและคอลัมน์คุณลักษณะ 21 คอลัมน์ ดังที่อธิบายไว้ในตารางต่อไปนี้

ชื่อคอลัมน์ รายละเอียด
loan_status สถานะปัจจุบันของเงินกู้ (ตัวแปรเป้าหมาย)
loan_amount จำนวนเงินที่ระบุของเงินกู้ที่ผู้กู้ใช้ หากแผนกสินเชื่อลดจำนวนเงินกู้ จะแสดงในมูลค่านี้
funded_amount_by_investors จำนวนเงินทั้งหมดที่นักลงทุนให้กู้สำหรับเงินกู้นั้นในขณะนั้น
term จำนวนการชำระเงินกู้ ค่าเป็นเดือนและสามารถเป็น 36 หรือ 60 ก็ได้
interest_rate อัตราดอกเบี้ยเงินกู้
installment การชำระเงินรายเดือนที่ค้างชำระโดยผู้กู้หากเงินกู้เกิดขึ้น
grade LC กำหนดเกรดสินเชื่อ
sub_grade LC กำหนดระดับสินเชื่อย่อย
employment_length ระยะเวลาการจ้างงานเป็นปี ค่าที่เป็นไปได้อยู่ระหว่าง 0–10 โดยที่ 0 หมายถึงน้อยกว่าหนึ่งปี และ 10 หมายถึงสิบปีขึ้นไป
home_ownership สถานะความเป็นเจ้าของบ้านที่ผู้กู้ให้ไว้ในระหว่างการลงทะเบียน ค่านิยมของเราคือ RENT, OWN, MORTGAGE และอื่นๆ
annual_income รายได้ประจำปีที่รายงานด้วยตนเองโดยผู้กู้ในระหว่างการลงทะเบียน
verification_status ระบุว่ารายได้ได้รับการยืนยันหรือไม่โดย LC
issued_amount เดือนที่มีการกู้ยืมเงิน
purpose หมวดหมู่ที่ผู้กู้ให้ไว้สำหรับการขอสินเชื่อ
dti อัตราส่วนที่คำนวณโดยใช้การชำระหนี้รายเดือนทั้งหมดของผู้กู้กับภาระหนี้ทั้งหมด ไม่รวมการจำนองและเงินกู้ LC ที่ร้องขอ หารด้วยรายได้รายเดือนที่ผู้กู้รายงานด้วยตนเอง
earliest_credit_line เดือนที่เปิดวงเงินสินเชื่อที่รายงานเร็วที่สุดของผู้กู้
inquiries_last_6_months จำนวนคำถามในช่วง 6 เดือนที่ผ่านมา (ไม่รวมการสอบถามเกี่ยวกับรถยนต์และการจำนอง)
open_credit_lines จำนวนวงเงินสินเชื่อที่เปิดอยู่ในไฟล์เครดิตของผู้กู้
derogatory_public_records จำนวนบันทึกสาธารณะที่เสื่อมเสีย
revolving_line_utilization_rate อัตราการใช้วงเงินหมุนเวียน หรือจำนวนเครดิตที่ผู้กู้ใช้เทียบกับเครดิตหมุนเวียนที่มีอยู่ทั้งหมด
total_credit_lines จำนวนวงเงินสินเชื่อทั้งหมดที่อยู่ในไฟล์เครดิตของผู้กู้ในปัจจุบัน

เราใช้ชุดข้อมูลนี้สำหรับการเตรียมข้อมูลและการฝึกแบบจำลอง

เบื้องต้น

ทำตามขั้นตอนข้อกำหนดเบื้องต้นต่อไปนี้:

  1. อัพโหลดทั้งไฟล์สินเชื่อ ไปยังถัง S3 ที่คุณเลือก
  2. ตรวจสอบให้แน่ใจว่าคุณมีสิทธิ์ที่จำเป็น สำหรับข้อมูลเพิ่มเติม โปรดดูที่ เริ่มต้นใช้งาน Data Wrangler.
  3. ตั้งค่าโดเมน SageMaker ที่กำหนดค่าให้ใช้ Data Wrangler สำหรับคำแนะนำ โปรดดูที่ ออนบอร์ดไปยังโดเมน Amazon SageMaker.

นำเข้าข้อมูล

สร้างโฟลว์ข้อมูล Data Wrangler ใหม่ จาก UI ของ Amazon SageMaker Studio.

สร้างเวิร์กโฟลว์แมชชีนเลิร์นนิงสำหรับการจัดการความเสี่ยงบน Amazon SageMaker โดยไม่ต้องใช้โค้ด PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

นำเข้าข้อมูลจาก Amazon S3 โดยเลือกไฟล์ CSV จากบัคเก็ต S3 ที่คุณวางชุดข้อมูลของคุณ หลังจากที่คุณนำเข้าทั้งสองไฟล์ คุณจะเห็นเวิร์กโฟลว์แยกกันสองรายการในไฟล์ การไหลของข้อมูล ดู.

คุณสามารถเลือกตัวเลือกการสุ่มตัวอย่างได้หลายแบบเมื่อนำเข้าข้อมูลของคุณในโฟลว์ Data Wrangler การสุ่มตัวอย่างสามารถช่วยได้เมื่อคุณมีชุดข้อมูลที่ใหญ่เกินกว่าจะเตรียมแบบโต้ตอบได้ หรือเมื่อคุณต้องการรักษาสัดส่วนของเหตุการณ์หายากในชุดข้อมูลตัวอย่างของคุณ เนื่องจากชุดข้อมูลของเรามีขนาดเล็ก เราจึงไม่ใช้การสุ่มตัวอย่าง

เตรียมข้อมูล

สำหรับกรณีการใช้งานของเรา เรามีชุดข้อมูลสองชุดที่มีคอลัมน์ร่วมกัน: id. ในขั้นแรกในการเตรียมข้อมูล เราต้องการรวมไฟล์เหล่านี้โดยการรวมเข้าด้วยกัน สำหรับคำแนะนำ โปรดดูที่ แปลงข้อมูล.

สร้างเวิร์กโฟลว์แมชชีนเลิร์นนิงสำหรับการจัดการความเสี่ยงบน Amazon SageMaker โดยไม่ต้องใช้โค้ด PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

เราใช้ ร่วมเป็นผู้ขายกับเราที่ ขั้นตอนการแปลงข้อมูลและใช้ ภายใน เข้าร่วมพิมพ์บน id คอลัมน์.

สร้างเวิร์กโฟลว์แมชชีนเลิร์นนิงสำหรับการจัดการความเสี่ยงบน Amazon SageMaker โดยไม่ต้องใช้โค้ด PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

จากผลของการแปลงการรวมของเรา Data Wrangler ได้สร้างคอลัมน์เพิ่มเติมสองคอลัมน์: id_0 และ id_1. อย่างไรก็ตาม คอลัมน์เหล่านี้ไม่จำเป็นสำหรับวัตถุประสงค์ในการสร้างแบบจำลองของเรา เราวางคอลัมน์ที่ซ้ำซ้อนเหล่านี้โดยใช้ จัดการคอลัมน์ ขั้นตอนการแปลง

สร้างเวิร์กโฟลว์แมชชีนเลิร์นนิงสำหรับการจัดการความเสี่ยงบน Amazon SageMaker โดยไม่ต้องใช้โค้ด PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.
สร้างเวิร์กโฟลว์แมชชีนเลิร์นนิงสำหรับการจัดการความเสี่ยงบน Amazon SageMaker โดยไม่ต้องใช้โค้ด PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

เราได้นำเข้าชุดข้อมูลของเรา รวมเข้าด้วยกัน และลบคอลัมน์ที่ไม่จำเป็นออก ตอนนี้เราพร้อมที่จะเสริมแต่งข้อมูลของเราผ่านวิศวกรรมคุณลักษณะและเตรียมพร้อมสำหรับการสร้างแบบจำลอง

ดำเนินการวิศวกรรมคุณลักษณะ

เราใช้ Data Wrangler เพื่อเตรียมข้อมูล คุณยังสามารถใช้ คุณสมบัติรายงานคุณภาพข้อมูลและข้อมูลเชิงลึก ภายใน Data Wrangler เพื่อตรวจสอบคุณภาพข้อมูลของคุณและตรวจจับความผิดปกติในข้อมูลของคุณ นักวิทยาศาสตร์ด้านข้อมูลมักจะต้องใช้ข้อมูลเชิงลึกเหล่านี้เพื่อนำความรู้ด้านโดเมนที่เหมาะสมไปใช้กับคุณลักษณะทางวิศวกรรมอย่างมีประสิทธิภาพ สำหรับโพสต์นี้ เราถือว่าเราได้เสร็จสิ้นการประเมินคุณภาพเหล่านี้แล้ว และสามารถไปยังคุณลักษณะด้านวิศวกรรมได้

ในขั้นตอนนี้ เราใช้การแปลงบางส่วนกับคอลัมน์ตัวเลข หมวดหมู่ และข้อความ

ก่อนอื่น เราปรับอัตราดอกเบี้ยให้เป็นมาตรฐานเพื่อปรับขนาดระหว่าง 0–1 เราทำสิ่งนี้โดยใช้ ประมวลผลตัวเลข แปลงเป็นมาตราส่วน interest_rate คอลัมน์โดยใช้ตัวปรับขนาดต่ำสุด-สูงสุด จุดประสงค์ของการทำให้เป็นมาตรฐาน (หรือการทำให้เป็นมาตรฐาน) คือการกำจัดอคติออกจากแบบจำลองของเรา ตัวแปรที่วัดในระดับต่างๆ จะไม่ส่งผลต่อกระบวนการเรียนรู้แบบจำลองอย่างเท่าเทียมกัน ดังนั้น ฟังก์ชันการแปลง เช่น การแปลงสเกลเตอร์ขั้นต่ำ-สูงสุด จะช่วยทำให้คุณสมบัติเป็นมาตรฐาน

สร้างเวิร์กโฟลว์แมชชีนเลิร์นนิงสำหรับการจัดการความเสี่ยงบน Amazon SageMaker โดยไม่ต้องใช้โค้ด PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

ในการแปลงตัวแปรหมวดหมู่เป็นค่าตัวเลข เราใช้การเข้ารหัสแบบร้อนครั้งเดียว เราเลือก เข้ารหัสหมวดหมู่ แปลงแล้วเลือก การเข้ารหัสแบบร้อนครั้งเดียว. การเข้ารหัสแบบใช้ครั้งเดียวช่วยปรับปรุงความสามารถในการคาดการณ์ของโมเดล ML กระบวนการนี้จะแปลงค่าหมวดหมู่เป็นคุณลักษณะใหม่โดยการกำหนดค่าไบนารีเป็น 1 หรือ 0 ให้กับคุณลักษณะ ยกตัวอย่างง่ายๆ หากคุณมีหนึ่งคอลัมน์ที่มีค่า yes or noการเข้ารหัสแบบ one-hot จะแปลงคอลัมน์นั้นเป็นสองคอลัมน์: a Yes คอลัมน์และ a No คอลัมน์. ค่าใช่จะมี 1 ใน Yes คอลัมน์และ 0 ใน No คอลัมน์. การเข้ารหัสแบบใช้ครั้งเดียวทำให้ข้อมูลของเรามีประโยชน์มากขึ้น เนื่องจากค่าตัวเลขสามารถระบุความน่าจะเป็นสำหรับการคาดการณ์ของเราได้ง่ายขึ้น

สุดท้ายนี้ เรานำเสนอ employer_title คอลัมน์เพื่อแปลงค่าสตริงเป็นเวกเตอร์ตัวเลข เราใช้ นับ Vectorizer และตัวสร้างโทเค็นมาตรฐานภายใน vectorize แปลง. Tokenization แบ่งประโยคหรือชุดข้อความออกเป็นคำ ในขณะที่ vectorizer จะแปลงข้อมูลข้อความให้อยู่ในรูปแบบที่เครื่องอ่านได้ คำเหล่านี้แสดงเป็นเวกเตอร์

สร้างเวิร์กโฟลว์แมชชีนเลิร์นนิงสำหรับการจัดการความเสี่ยงบน Amazon SageMaker โดยไม่ต้องใช้โค้ด PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

เมื่อขั้นตอนทางวิศวกรรมคุณลักษณะทั้งหมดเสร็จสมบูรณ์ เราสามารถส่งออกข้อมูลและส่งออกผลลัพธ์ไปยังบัคเก็ต S3 ของเราได้ หรือคุณสามารถส่งออกโฟลว์ของคุณเป็นโค้ด Python หรือโน้ตบุ๊ก Jupyter เพื่อสร้างไปป์ไลน์ด้วยมุมมองของคุณโดยใช้ ท่อส่ง Amazon SageMaker. พิจารณาสิ่งนี้เมื่อคุณต้องการเรียกใช้ขั้นตอนวิศวกรรมคุณลักษณะตามขนาดหรือเป็นส่วนหนึ่งของไปป์ไลน์ ML

สร้างเวิร์กโฟลว์แมชชีนเลิร์นนิงสำหรับการจัดการความเสี่ยงบน Amazon SageMaker โดยไม่ต้องใช้โค้ด PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

ตอนนี้เราสามารถใช้ไฟล์เอาท์พุต Data Wrangler เป็นอินพุตสำหรับ Canvas ได้แล้ว เราอ้างอิงสิ่งนี้เป็นชุดข้อมูลใน Canvas เพื่อสร้างแบบจำลอง ML ของเรา

สร้างเวิร์กโฟลว์แมชชีนเลิร์นนิงสำหรับการจัดการความเสี่ยงบน Amazon SageMaker โดยไม่ต้องใช้โค้ด PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

ในกรณีของเรา เราส่งออกชุดข้อมูลที่เตรียมไว้ไปยังบัคเก็ต Studio ที่เป็นค่าเริ่มต้นด้วย an output คำนำหน้า เราอ้างอิงตำแหน่งชุดข้อมูลนี้เมื่อโหลดข้อมูลลงใน Canvas สำหรับการสร้างแบบจำลองต่อไป

สร้างและฝึกโมเดล ML ของคุณด้วย Canvas

บนคอนโซล SageMaker ให้เปิดแอปพลิเคชัน Canvas ในการสร้างแบบจำลอง ML จากข้อมูลที่เตรียมไว้ในส่วนก่อนหน้า เราดำเนินการตามขั้นตอนต่อไปนี้:

  1. นำเข้าชุดข้อมูลที่เตรียมไว้ไปยัง Canvas จากบัคเก็ต S3

สร้างเวิร์กโฟลว์แมชชีนเลิร์นนิงสำหรับการจัดการความเสี่ยงบน Amazon SageMaker โดยไม่ต้องใช้โค้ด PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

เราอ้างอิงเส้นทาง S3 เดียวกันกับที่เราส่งออกผลลัพธ์ Data Wrangler จากส่วนก่อนหน้า

  1. สร้างโมเดลใหม่ใน Canvas แล้วตั้งชื่อมัน loan_prediction_model.
  2. เลือกชุดข้อมูลที่นำเข้าและเพิ่มไปยังวัตถุแบบจำลอง

สร้างเวิร์กโฟลว์แมชชีนเลิร์นนิงสำหรับการจัดการความเสี่ยงบน Amazon SageMaker โดยไม่ต้องใช้โค้ด PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

หากต้องการให้ Canvas สร้างแบบจำลอง เราต้องเลือกคอลัมน์เป้าหมาย

  1. เนื่องจากเป้าหมายของเราคือการคาดการณ์ความน่าจะเป็นของความสามารถของผู้ให้กู้ในการชำระคืนเงินกู้ เราจึงเลือก loan_status คอลัมน์.

Canvas จะระบุประเภทของคำสั่งปัญหา ML โดยอัตโนมัติ ในขณะที่เขียน Canvas รองรับปัญหาการถดถอย การจัดประเภท และการคาดการณ์อนุกรมเวลา คุณสามารถระบุประเภทของปัญหาหรือให้ Canvas อนุมานปัญหาโดยอัตโนมัติจากข้อมูลของคุณ

สร้างเวิร์กโฟลว์แมชชีนเลิร์นนิงสำหรับการจัดการความเสี่ยงบน Amazon SageMaker โดยไม่ต้องใช้โค้ด PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

  1. เลือกตัวเลือกของคุณเพื่อเริ่มกระบวนการสร้างแบบจำลอง: สร้างด่วน or โครงสร้างมาตรฐาน.

พื้นที่ สร้างด่วน option ใช้ชุดข้อมูลของคุณเพื่อฝึกโมเดลภายใน 2–15 นาที สิ่งนี้มีประโยชน์เมื่อคุณทำการทดลองกับชุดข้อมูลใหม่เพื่อพิจารณาว่าชุดข้อมูลที่คุณมีจะเพียงพอที่จะคาดการณ์ได้หรือไม่ เราใช้ตัวเลือกนี้สำหรับโพสต์นี้

พื้นที่ โครงสร้างมาตรฐาน ตัวเลือกเลือกความแม่นยำมากกว่าความเร็วและใช้ตัวเลือกรุ่นประมาณ 250 ตัวเพื่อฝึกแบบจำลอง กระบวนการนี้มักใช้เวลา 1-2 ชั่วโมง

หลังจากสร้างแบบจำลองแล้ว คุณสามารถตรวจสอบผลลัพธ์ของแบบจำลองได้ Canvas ประมาณการว่าแบบจำลองของคุณสามารถทำนายผลลัพธ์ที่ถูกต้องได้ 82.9% ของเวลาทั้งหมด ผลลัพธ์ของคุณอาจแตกต่างกันไปเนื่องจากความแปรปรวนในแบบจำลองการฝึก

สร้างเวิร์กโฟลว์แมชชีนเลิร์นนิงสำหรับการจัดการความเสี่ยงบน Amazon SageMaker โดยไม่ต้องใช้โค้ด PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

นอกจากนี้ คุณสามารถเจาะลึกในการวิเคราะห์รายละเอียดของแบบจำลองเพื่อเรียนรู้เพิ่มเติมเกี่ยวกับแบบจำลอง

ความสำคัญของคุณลักษณะแสดงถึงความสำคัญโดยประมาณของคุณลักษณะแต่ละรายการในการทำนายคอลัมน์เป้าหมาย ในกรณีนี้ คอลัมน์วงเงินมีผลกระทบที่สำคัญที่สุดในการคาดการณ์ว่าลูกค้าจะชำระคืนเงินกู้หรือไม่ ตามด้วยอัตราดอกเบี้ยและรายได้ต่อปี

สร้างเวิร์กโฟลว์แมชชีนเลิร์นนิงสำหรับการจัดการความเสี่ยงบน Amazon SageMaker โดยไม่ต้องใช้โค้ด PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

เมทริกซ์ความสับสนใน ตัวชี้วัดขั้นสูง ส่วนนี้มีข้อมูลสำหรับผู้ใช้ที่ต้องการความเข้าใจอย่างลึกซึ้งเกี่ยวกับประสิทธิภาพของแบบจำลอง

สร้างเวิร์กโฟลว์แมชชีนเลิร์นนิงสำหรับการจัดการความเสี่ยงบน Amazon SageMaker โดยไม่ต้องใช้โค้ด PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

ก่อนที่คุณจะปรับใช้แบบจำลองของคุณสำหรับปริมาณงานการผลิต ให้ใช้ Canvas เพื่อทดสอบแบบจำลอง Canvas จัดการจุดสิ้นสุดของโมเดลของเรา และช่วยให้เราสามารถคาดการณ์ได้โดยตรงในอินเทอร์เฟซผู้ใช้ Canvas

  1. Choose ทำนาย และทบทวนข้อค้นพบใน การทำนายแบทช์ or คำทำนายเดียว แถบ

ในตัวอย่างต่อไปนี้ เราทำการทำนายเพียงครั้งเดียวโดยแก้ไขค่าเพื่อทำนายตัวแปรเป้าหมายของเรา loan_status ในเวลาจริง

สร้างเวิร์กโฟลว์แมชชีนเลิร์นนิงสำหรับการจัดการความเสี่ยงบน Amazon SageMaker โดยไม่ต้องใช้โค้ด PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

นอกจากนี้เรายังสามารถเลือกชุดข้อมูลที่ใหญ่ขึ้นและให้ Canvas สร้างการคาดการณ์แบบกลุ่มในนามของเรา

สร้างเวิร์กโฟลว์แมชชีนเลิร์นนิงสำหรับการจัดการความเสี่ยงบน Amazon SageMaker โดยไม่ต้องใช้โค้ด PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

สรุป

การเรียนรู้ของเครื่องจากต้นทางถึงปลายทางนั้นซับซ้อนและทำซ้ำได้ และมักเกี่ยวข้องกับบุคคล เทคโนโลยี และกระบวนการที่หลากหลาย Data Wrangler และ Canvas ช่วยให้ทำงานร่วมกันระหว่างทีมโดยไม่ต้องให้ทีมเหล่านี้เขียนโค้ดใดๆ

วิศวกรข้อมูลสามารถเตรียมข้อมูลได้อย่างง่ายดายโดยใช้ Data Wrangler โดยไม่ต้องเขียนโค้ดใดๆ และส่งชุดข้อมูลที่เตรียมไว้ให้นักวิเคราะห์ธุรกิจ นักวิเคราะห์ธุรกิจสามารถสร้างโมเดล ML ที่แม่นยำได้อย่างง่ายดายด้วยการคลิกเพียงไม่กี่ครั้งโดยใช้ Canvas และรับการคาดการณ์ที่แม่นยำในแบบเรียลไทม์หรือเป็นกลุ่ม

เริ่มต้นใช้งาน Data Wrangler โดยใช้เครื่องมือเหล่านี้โดยไม่ต้องจัดการโครงสร้างพื้นฐานใดๆ คุณสามารถ ตั้งค่าผ้าใบ เริ่มสร้างโมเดล ML อย่างรวดเร็วและทันทีเพื่อรองรับความต้องการทางธุรกิจของคุณ


เกี่ยวกับผู้เขียน

สร้างเวิร์กโฟลว์แมชชีนเลิร์นนิงสำหรับการจัดการความเสี่ยงบน Amazon SageMaker โดยไม่ต้องใช้โค้ด PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.ปีเตอร์ จุง เป็นสถาปนิกโซลูชันสำหรับ AWS และมีความกระตือรือร้นในการช่วยให้ลูกค้าค้นพบข้อมูลเชิงลึกจากข้อมูลของพวกเขา เขาได้สร้างโซลูชันเพื่อช่วยให้องค์กรต่างๆ ตัดสินใจโดยใช้ข้อมูลเป็นหลักทั้งในภาครัฐและเอกชน เขาถือใบรับรอง AWS ทั้งหมดรวมถึงใบรับรอง GCP สองใบ

สร้างเวิร์กโฟลว์แมชชีนเลิร์นนิงสำหรับการจัดการความเสี่ยงบน Amazon SageMaker โดยไม่ต้องใช้โค้ด PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI. มีนคชีสันดาราม ทันดาวารายัน เป็นผู้เชี่ยวชาญด้าน AI/ML อาวุโสของ AWS เขาช่วยบัญชีเชิงกลยุทธ์ไฮเทคในการเดินทางของ AI และ ML เขาหลงใหลเกี่ยวกับ AI ที่ขับเคลื่อนด้วยข้อมูลเป็นอย่างมาก

สร้างเวิร์กโฟลว์แมชชีนเลิร์นนิงสำหรับการจัดการความเสี่ยงบน Amazon SageMaker โดยไม่ต้องใช้โค้ด PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.แดนเฟอร์กูสัน เป็นสถาปนิกโซลูชันที่ AWS ซึ่งตั้งอยู่ในนิวยอร์ก สหรัฐอเมริกา ในฐานะผู้เชี่ยวชาญด้านบริการแมชชีนเลิร์นนิง Dan ทำงานเพื่อสนับสนุนลูกค้าในการเดินทางเพื่อบูรณาการเวิร์กโฟลว์ ML อย่างมีประสิทธิภาพ ประสิทธิผล และยั่งยืน

ประทับเวลา:

เพิ่มเติมจาก AWS Machine Learning AWS

ส่งเสริมการค้นพบคุณสมบัติและนำกลับมาใช้ใหม่ทั่วทั้งองค์กรของคุณโดยใช้ Amazon SageMaker Feature Store และความสามารถข้อมูลเมตาระดับฟีเจอร์

โหนดต้นทาง: 1606966
ประทับเวลา: สิงหาคม 3, 2022