แก้ปัญหาทางธุรกิจแบบ end-to-end ผ่านการเรียนรู้ของเครื่องใน Amazon SageMaker JumpStart Solutions

เผยแพร่ซ้ำโดยเพลโต

ผู้ติดตาม: 0

Amazon SageMaker JumpStart มีโมเดลโอเพนซอร์ซที่ผ่านการฝึกอบรมล่วงหน้าสำหรับปัญหาประเภทต่างๆ มากมาย เพื่อช่วยคุณในการเริ่มต้นใช้งานแมชชีนเลิร์นนิง (ML) JumpStart ยังมีเทมเพลตโซลูชันที่ตั้งค่าโครงสร้างพื้นฐานสำหรับกรณีการใช้งานทั่วไป และสมุดบันทึกตัวอย่างที่เรียกใช้งานได้สำหรับ ML ด้วย อเมซอน SageMaker.

ในฐานะผู้ใช้ทางธุรกิจ คุณต้องทำสิ่งต่อไปนี้ด้วยโซลูชัน JumpStart:

สำรวจโซลูชันและประเมินว่าสิ่งใดที่ตรงกับความต้องการทางธุรกิจของคุณ
เปิดตัวโซลูชันด้วยการคลิกเพียงครั้งเดียวใน สตูดิโอ Amazon SageMaker. เปิดตัว an การก่อตัวของ AWS Cloud แม่แบบเพื่อสร้างทรัพยากรที่จำเป็น
ปรับเปลี่ยนโซลูชันเพื่อตอบสนองความต้องการของคุณด้วยการเข้าถึงทรัพยากรโน้ตบุ๊กและแบบจำลอง
ลบทรัพยากรที่ได้มาเมื่อทำเสร็จแล้ว

โพสต์นี้เน้นที่โซลูชัน ML ห้ารายการที่เพิ่งเพิ่มเข้ามาเพื่อจัดการกับความท้าทายทางธุรกิจที่แตกต่างกันห้าประการ ในการเขียนนี้ JumpStart ขอเสนอโซลูชันทางธุรกิจ 23 แบบ ตั้งแต่การตรวจจับการฉ้อโกงในธุรกรรมทางการเงินไปจนถึงการจดจำลายมือ จำนวนโซลูชันที่นำเสนอผ่าน JumpStart เพิ่มขึ้นเป็นประจำ เนื่องจากมีการเพิ่มโซลูชันเพิ่มเติมเข้าไป

ภาพรวมโซลูชัน

ห้าโซลูชั่นใหม่มีดังนี้:

การเพิ่มประสิทธิภาพราคา – นำเสนอโมเดล ML ที่ปรับแต่งได้เพื่อช่วยให้คุณตัดสินใจได้อย่างเหมาะสมในการกำหนดราคาผลิตภัณฑ์หรือบริการของคุณ เพื่อให้บรรลุวัตถุประสงค์ทางธุรกิจของคุณ เช่น การเพิ่มรายได้ กำไร หรือเมตริกที่กำหนดเองอื่นๆ
การทำนายสายพันธุ์นก – แสดงวิธีการฝึกฝนและปรับแต่งโมเดลการตรวจจับวัตถุ ซึ่งแสดงให้เห็นการปรับโมเดลผ่านการเสริมภาพการฝึก และแผนภูมิการปรับปรุงความแม่นยำที่เกิดขึ้นตลอดการทำซ้ำ (ยุค) ของงานการฝึกอบรม
การทำนายการอยู่รอดของมะเร็งปอด – แสดงให้เห็นว่าคุณสามารถป้อนคุณสมบัติคลื่นวิทยุแบบ 2 มิติและ 3 มิติและข้อมูลประชากรของผู้ป่วยไปยังอัลกอริธึม ML เพื่อทำนายโอกาสในการรอดชีวิตจากมะเร็งปอดของผู้ป่วยได้อย่างไร ผลลัพธ์จากการคาดคะเนนี้สามารถช่วยให้ผู้ให้บริการใช้มาตรการเชิงรุกที่เหมาะสม
การจัดประเภทการชำระเงินทางการเงิน – สาธิตวิธีการฝึกอบรมและปรับใช้แบบจำลอง ML เพื่อจัดประเภทธุรกรรมทางการเงินตามข้อมูลธุรกรรม คุณยังสามารถใช้โซลูชันนี้เป็นขั้นตอนกลางในการตรวจจับการฉ้อโกง การกำหนดค่าส่วนบุคคล หรือการตรวจจับความผิดปกติ
ทำนายปั่นสำหรับลูกค้ามือถือ – สาธิตวิธีพัฒนาโมเดลการคาดการณ์การปั่นอย่างรวดเร็วโดยใช้ชุดข้อมูลธุรกรรมการโทรผ่านมือถือ นี่เป็นตัวอย่างง่ายๆ สำหรับผู้ใช้ที่ยังใหม่กับ ML

เบื้องต้น

ในการใช้โซลูชันเหล่านี้ ตรวจสอบให้แน่ใจว่าคุณมีสิทธิ์เข้าถึง Studio ที่มีบทบาทการดำเนินการที่ช่วยให้คุณเรียกใช้ฟังก์ชัน SageMaker ได้ สำหรับบทบาทผู้ใช้ของคุณใน Studio ตรวจสอบให้แน่ใจว่า โครงการ SageMaker และ JumpStart เปิดอยู่

ในส่วนต่อไปนี้ เราจะพูดถึงโซลูชันใหม่ทั้งห้าวิธีและอภิปรายวิธีการทำงานโดยละเอียด พร้อมกับคำแนะนำบางประการเกี่ยวกับวิธีการใช้โซลูชันนี้สำหรับความต้องการทางธุรกิจของคุณเอง

การเพิ่มประสิทธิภาพราคา

ธุรกิจชอบใช้คันโยกต่างๆ เพื่อให้ได้ผลลัพธ์ที่ดีที่สุด ตัวอย่างเช่น ราคาของผลิตภัณฑ์หรือบริการเป็นตัวบังคับที่ธุรกิจสามารถควบคุมได้ คำถามคือวิธีการตัดสินใจว่าจะกำหนดราคาผลิตภัณฑ์หรือบริการอย่างไร เพื่อเพิ่มวัตถุประสงค์ทางธุรกิจ เช่น กำไรหรือรายได้ให้สูงสุด

โซลูชันนี้มีโมเดล ML ที่ปรับแต่งได้เพื่อช่วยให้คุณตัดสินใจได้อย่างเหมาะสมในการกำหนดราคาผลิตภัณฑ์หรือบริการของคุณ เพื่อให้บรรลุวัตถุประสงค์ของคุณ เช่น การเพิ่มรายได้ กำไร หรือเมตริกที่กำหนดเองอื่นๆ โซลูชันนี้ใช้ ML และการอนุมานเชิงสาเหตุเพื่อเรียนรู้ความสัมพันธ์ของปริมาณราคาจากข้อมูลในอดีต และสามารถให้คำแนะนำราคาแบบไดนามิกในแบบเรียลไทม์เพื่อเพิ่มประสิทธิภาพเมตริกวัตถุประสงค์ที่กำหนดเองได้

ภาพหน้าจอต่อไปนี้แสดงตัวอย่างข้อมูลอินพุต

การแก้ปัญหาประกอบด้วยสามส่วน:

การประเมินความยืดหยุ่นของราคา – ประมาณการโดยการอนุมานเชิงสาเหตุผ่านอัลกอริธึม ML สองเท่า
พยากรณ์ปริมาณ – คาดการณ์โดยใช้อัลกอริธึมของศาสดา
การเพิ่มประสิทธิภาพราคา – สิ่งนี้ทำได้โดยการจำลองแบบ what-if ผ่านสถานการณ์ราคาที่แตกต่างกัน

โซลูชันนี้ให้ราคาแนะนำสำหรับวันถัดไปเพื่อเพิ่มรายได้ให้สูงสุด นอกจากนี้ ผลลัพธ์ยังรวมถึงความยืดหยุ่นของราคาโดยประมาณ ซึ่งเป็นค่าที่ระบุผลกระทบของราคาต่อปริมาณ และรูปแบบการคาดการณ์ซึ่งสามารถคาดการณ์ปริมาณของวันถัดไปได้ แผนภูมิต่อไปนี้แสดงให้เห็นว่าแบบจำลองเชิงสาเหตุซึ่งรวมความยืดหยุ่นของราคาที่คำนวณไว้นั้นทำงานได้ดีกว่ามากภายใต้การวิเคราะห์แบบ what-if (โดยมีการเบี่ยงเบนจากราคาพฤติกรรมมาก) มากกว่าแบบจำลองการคาดการณ์ที่ใช้ศาสดาพยากรณ์ปริมาณโดยใช้ข้อมูลอนุกรมเวลา

คุณสามารถใช้โซลูชันนี้กับธุรกิจของคุณสำหรับกรณีการใช้งานต่อไปนี้:

กำหนดราคาสินค้าที่เหมาะสมที่สุดสำหรับร้านค้าปลีก
ประเมินผลกระทบของคูปองส่วนลดต่อการซื้อของลูกค้า
ทำนายผลกระทบของวิธีการจูงใจต่างๆในธุรกิจใด ๆ

การทำนายชนิดของนก

ปัจจุบันมีแอพพลิเคชั่นคอมพิวเตอร์วิทัศน์ (CV) หลายตัวสำหรับธุรกิจ หนึ่งในแอปพลิเคชันเหล่านั้นคือการตรวจจับวัตถุ โดยที่อัลกอริทึม ML จะตรวจจับตำแหน่งของวัตถุในภาพโดยการวาดกรอบล้อมรอบ และระบุประเภทของวัตถุที่เป็นวัตถุนั้น การเรียนรู้วิธีใช้โมเดลการตรวจจับวัตถุและปรับแต่งอาจเป็นประโยชน์อย่างยิ่งต่อองค์กรที่มีความต้องการ CV

โซลูชันนี้แสดงตัวอย่างวิธีการแปลข้อกำหนด bounding box เมื่อจัดเตรียมรูปภาพไปยังอัลกอริธึม SageMaker โซลูชันนี้ยังสาธิตวิธีปรับปรุงโมเดลการตรวจจับวัตถุด้วยการเพิ่มรูปภาพการฝึกที่พลิกในแนวนอน (ภาพสะท้อน)

มีสมุดบันทึกสำหรับทดลองความท้าทายในการตรวจจับวัตถุเมื่อมีชั้นเรียนจำนวนมาก (นก 200 สายพันธุ์) สมุดบันทึกยังแสดงวิธีการจัดทำแผนภูมิการปรับปรุงความแม่นยำที่เกิดขึ้นตลอดช่วงของงานการฝึกอบรม ภาพต่อไปนี้แสดงภาพตัวอย่างจากชุดข้อมูลนก

โซลูชันนี้มีห้าขั้นตอน:

เตรียมข้อมูลรวมทั้งดาวน์โหลดและ RecordIO การสร้างไฟล์
สร้างและฝึกโมเดลการตรวจจับวัตถุ
ปรับใช้ปลายทางและประเมินประสิทธิภาพของโมเดล
สร้างและฝึกโมเดลการตรวจหาวัตถุอีกครั้งด้วยชุดข้อมูลที่ขยาย
ปรับใช้ปลายทางและประเมินประสิทธิภาพของแบบจำลองที่ขยาย

คุณได้รับสิ่งต่อไปนี้เป็นผลลัพธ์:

ผลการตรวจจับวัตถุด้วยกล่องเชื่อมกับภาพทดสอบของคุณ
แบบจำลองการตรวจจับวัตถุที่ได้รับการฝึกอบรม
โมเดลการตรวจจับวัตถุที่ผ่านการฝึกอบรมพร้อมชุดข้อมูลแบบขยาย (พลิก) เพิ่มเติม
สองปลายทางแยกกันปรับใช้กับแต่ละรุ่น

แผนภูมิต่อไปนี้แสดงการปรับปรุงแบบจำลองเทียบกับการทำซ้ำแบบจำลอง (ยุค) ระหว่างการฝึก

ตัวอย่างต่อไปนี้เป็นผลลัพธ์จากภาพทดสอบสองภาพ

คุณสามารถใช้โซลูชันนี้กับธุรกิจของคุณสำหรับกรณีการใช้งานต่อไปนี้:

ตรวจจับวัตถุบนสายพานลำเลียงในอุตสาหกรรมบรรจุภัณฑ์
ตรวจจับท็อปปิ้งบนพิซซ่า
นำแอพพลิเคชั่นปฏิบัติการซัพพลายเชนที่เกี่ยวข้องกับการตรวจจับวัตถุ

การพยากรณ์การรอดชีวิตของมะเร็งปอด

โควิด-19 ให้ความสนใจกับความท้าทายทางการแพทย์ที่เกี่ยวข้องกับปอดมากขึ้น นอกจากนี้ยังสร้างแรงกดดันอย่างมากต่อโรงพยาบาล แพทย์ พยาบาล และนักรังสีวิทยา ลองนึกภาพความเป็นไปได้ที่คุณสามารถใช้ ML เป็นเครื่องมืออันทรงพลังเพื่อช่วยเหลือผู้ปฏิบัติงานทางการแพทย์และช่วยให้พวกเขาทำงานได้เร็วขึ้น ในโซลูชันนี้ เราแสดงให้เห็นว่าคุณลักษณะคลื่นวิทยุแบบ 2 มิติและ 3 มิติและข้อมูลประชากรของผู้ป่วยสามารถป้อนไปยังอัลกอริธึม ML เพื่อคาดการณ์โอกาสในการรอดชีวิตจากมะเร็งปอดของผู้ป่วยได้อย่างไร ผลลัพธ์จากการคาดคะเนนี้สามารถช่วยให้ผู้ให้บริการใช้มาตรการเชิงรุกที่เหมาะสม

โซลูชันนี้สาธิตวิธีสร้างไปป์ไลน์ ML ที่ปรับขนาดได้สำหรับชุดข้อมูล Radiogenomics ที่ไม่ใช่เซลล์มะเร็งปอด (NSCLC) ซึ่งประกอบด้วยข้อมูลการจัดลำดับ RNA ข้อมูลทางคลินิก (สะท้อนข้อมูล EHR) และภาพทางการแพทย์ การใช้ข้อมูลหลายประเภทเพื่อสร้างแบบจำลองเครื่องจะเรียกว่า หลายรูปแบบ มล. โซลูชันนี้คาดการณ์ผลลัพธ์การรอดชีวิตของผู้ป่วยที่ได้รับการวินิจฉัยว่าเป็นมะเร็งปอดชนิดเซลล์ไม่เล็ก

รูปภาพต่อไปนี้แสดงตัวอย่างข้อมูลอินพุตจากชุดข้อมูล Radiogenomics ที่ไม่ใช่เซลล์มะเร็งปอด (NSCLC)

โดยเป็นส่วนหนึ่งของการแก้ปัญหา RNA ทั้งหมดถูกสกัดจากเนื้อเยื่อเนื้องอกและวิเคราะห์ด้วยเทคโนโลยีการจัดลำดับอาร์เอ็นเอ แม้ว่าข้อมูลเดิมจะมียีนมากกว่า 22,000 ยีน แต่เราเก็บยีน 21 ยีนจากกลุ่มยีนที่มีการแสดงออกร่วมกันสูง 10 กลุ่ม (เมตาเจเนส) ที่ระบุได้ ตรวจสอบความถูกต้องในกลุ่มการแสดงออกของยีนที่เปิดเผยต่อสาธารณะ และสัมพันธ์กับการพยากรณ์โรค

บันทึกทางคลินิกจะถูกจัดเก็บในรูปแบบ CSV แต่ละแถวสอดคล้องกับผู้ป่วย และคอลัมน์มีข้อมูลเกี่ยวกับผู้ป่วย รวมทั้งข้อมูลประชากร ระยะเนื้องอก และสถานะการรอดชีวิต

สำหรับข้อมูลจีโนม เราเก็บยีน 21 ยีนจากกลุ่มยีนที่มีการแสดงออกร่วมกันสูง 10 กลุ่ม (เมตาเจเนส) ที่ถูกระบุ ตรวจสอบความถูกต้องในกลุ่มประชากรการแสดงออกของยีนที่เปิดเผยต่อสาธารณะ และสัมพันธ์กับการพยากรณ์โรค

สำหรับข้อมูลการถ่ายภาพทางการแพทย์ เราสร้างคุณสมบัติ 3D radiomic ระดับผู้ป่วยที่อธิบายขนาด รูปร่าง และลักษณะการมองเห็นของเนื้องอกที่สังเกตได้ในการสแกน CT สำหรับการศึกษาผู้ป่วยแต่ละราย มีการดำเนินการขั้นตอนต่อไปนี้:

อ่านไฟล์สไลซ์ 2D DICOM สำหรับทั้งการสแกน CT และการแบ่งส่วนเนื้องอก รวมเข้ากับโวลุ่ม 3 มิติ บันทึกโวลุ่มในรูปแบบ NIfTI
ปรับปริมาตร CT และการแบ่งส่วนเนื้องอกเพื่อให้เราสามารถโฟกัสการคำนวณภายในเนื้องอกได้
คำนวณคุณสมบัติกัมมันตภาพรังสีที่อธิบายบริเวณเนื้องอกโดยใช้ไลบรารี pyradiomics
แยกคุณสมบัติทางรังสี 120 ประการจากแปดคลาส เช่น การแสดงทางสถิติของการกระจายและการเกิดขึ้นร่วมของความเข้มภายในบริเวณที่เป็นเนื้องอกที่น่าสนใจ และการวัดตามรูปร่างที่อธิบายลักษณะเนื้องอกของเนื้องอก

เพื่อสร้างมุมมองหลายรูปแบบของผู้ป่วยสำหรับการฝึกแบบจำลอง เราเข้าร่วมเวกเตอร์คุณลักษณะจากสามรูปแบบ จากนั้นเราประมวลผลข้อมูล อันดับแรก เราปรับช่วงของคุณสมบัติอิสระให้เป็นปกติโดยใช้การปรับขนาดคุณสมบัติ จากนั้น เราทำการวิเคราะห์องค์ประกอบหลัก (PCA) กับคุณลักษณะต่างๆ เพื่อลดมิติข้อมูลและระบุคุณลักษณะที่มีการเลือกปฏิบัติมากที่สุดซึ่งมีส่วนทำให้เกิดความแปรปรวน 95% ในข้อมูล

ส่งผลให้ลดมิติจาก 215 ฟีเจอร์ลงเหลือ 45 องค์ประกอบหลัก ซึ่งเป็นฟีเจอร์สำหรับผู้เรียนภายใต้การดูแล

โซลูชันนี้สร้างแบบจำลอง ML ที่คาดการณ์สถานะการอยู่รอดของผู้ป่วย NSCLC (ตายหรือมีชีวิตอยู่) ในรูปแบบของความน่าจะเป็น นอกจากแบบจำลองและการทำนายแล้ว เรายังสร้างรายงานเพื่ออธิบายแบบจำลองอีกด้วย ไปป์ไลน์การถ่ายภาพทางการแพทย์สร้างปริมาตร CT ปอด 3 มิติและการแบ่งส่วนเนื้องอกเพื่อจุดประสงค์ในการมองเห็น

คุณสามารถใช้โซลูชันนี้กับกรณีการใช้งานด้านการดูแลสุขภาพและวิทยาศาสตร์เพื่อชีวิต

การจัดประเภทการชำระเงินทางการเงิน

การทำธุรกรรมทางการเงินทั้งหมดของธุรกิจหรือผู้บริโภคและจัดเป็นหมวดหมู่ต่างๆ อาจช่วยได้มากทีเดียว สามารถช่วยให้ผู้ใช้เรียนรู้ว่าพวกเขาใช้จ่ายไปเท่าใดในหมวดหมู่ใด และยังแจ้งเตือนเมื่อธุรกรรมหรือการใช้จ่ายในหมวดหมู่หนึ่งเพิ่มขึ้นหรือลดลงโดยไม่คาดคิด

โซลูชันนี้สาธิตวิธีการฝึกอบรมและปรับใช้แบบจำลอง ML เพื่อจัดประเภทธุรกรรมทางการเงินตามข้อมูลธุรกรรม ธนาคารหลายแห่งให้บริการนี้เป็นบริการเพื่อให้ภาพรวมพฤติกรรมการใช้จ่ายแก่ผู้ใช้ปลายทาง คุณยังสามารถใช้โซลูชันนี้เป็นขั้นตอนกลางในการตรวจจับการฉ้อโกง การกำหนดค่าส่วนบุคคล หรือการตรวจจับความผิดปกติ เราใช้ SageMaker เพื่อฝึกและปรับใช้โมเดล XGBoost กับโครงสร้างพื้นฐานที่จำเป็น

ชุดข้อมูลสังเคราะห์ที่เราสาธิตวิธีแก้ปัญหานี้มีคุณสมบัติดังต่อไปนี้:

ธุรกรรม_หมวดหมู่ – ประเภทของธุรกรรม จาก 19 ตัวเลือกต่อไปนี้: Uncategorized, Entertainment, Education, Shopping, Personal Care, Health and Fitness, Food and Dining, Gifts and Donations, Investments, Bills and Utilities, Auto and Transport, Travel, Fees and Charges, Business Services, Personal Services, Taxes, Gambling, Homeและ Pension and insurances.
ผู้รับ_id – ตัวระบุสำหรับฝ่ายรับ ตัวระบุประกอบด้วยตัวเลข 16 ตัว
ผู้ส่ง_id – ตัวระบุสำหรับฝ่ายส่ง ตัวระบุประกอบด้วยตัวเลข 16 ตัว
จำนวน – จำนวนเงินที่โอน
การประทับเวลา – การประทับเวลาของธุรกรรมในรูปแบบ YYYY-MM-DD HH:MM:SS

การสังเกตห้าครั้งแรกของชุดข้อมูลมีดังนี้:

สำหรับโซลูชันนี้ เราใช้ XGBoost ซึ่งเป็นการใช้งานโอเพ่นซอร์สที่ได้รับความนิยมและมีประสิทธิภาพของอัลกอริธึมการไล่ระดับต้นไม้ที่เพิ่มการไล่ระดับสี การเพิ่มระดับการไล่ระดับสีคืออัลกอริธึมการเรียนรู้ภายใต้การดูแลที่พยายามทำนายตัวแปรเป้าหมายอย่างแม่นยำโดยการรวมชุดค่าประมาณจากชุดของแบบจำลองที่ง่ายกว่าและน้อยกว่า การใช้งานมีอยู่ในอัลกอริธึมในตัวของ SageMaker

โซลูชันการจัดประเภทการชำระเงินทางการเงินประกอบด้วยสี่ขั้นตอน:

เตรียมข้อมูล.
สร้างร้านค้าคุณลักษณะ
สร้างและฝึกโมเดล XGBoost
ปรับใช้ปลายทางและประเมินประสิทธิภาพของโมเดล

เราได้รับผลลัพธ์ต่อไปนี้:

โมเดล XGBoost ที่ผ่านการฝึกอบรมตามชุดข้อมูลตัวอย่างของเรา
ตำแหน่งข้อมูล SageMaker ที่สามารถคาดการณ์หมวดหมู่ธุรกรรมได้

หลังจากรันโซลูชันนี้ คุณควรเห็นรายงานการจัดประเภทที่คล้ายกับต่อไปนี้

แอปพลิเคชันที่เป็นไปได้สำหรับธุรกิจของคุณมีดังนี้:

แอปพลิเคชันทางการเงินต่างๆ ในการธนาคารเพื่อรายย่อยและวาณิชธนกิจ
เมื่อธุรกรรมจำเป็นต้องจัดประเภทในกรณีการใช้งานใด ๆ (ไม่ใช่แค่การเงิน)

คำทำนายปั่นสำหรับลูกค้ามือถือ

การคาดการณ์การเลิกราของลูกค้าเป็นความต้องการทางธุรกิจทั่วไป การศึกษาจำนวนมากแสดงให้เห็นว่าต้นทุนในการรักษาลูกค้าเดิมนั้นน้อยกว่าการหาลูกค้าใหม่มาก ความท้าทายมักมาจากธุรกิจที่มีช่วงเวลาที่ยากลำบากในการทำความเข้าใจว่าทำไมลูกค้าถึงเลิกใช้งาน หรือสร้างแบบจำลองที่คาดการณ์ว่าจะเลิกใช้งาน

ในตัวอย่างนี้ ผู้ใช้ที่เพิ่งเริ่มใช้ ML สามารถสัมผัสได้ว่าโมเดลการคาดการณ์การปั่นป่วนสามารถพัฒนาอย่างรวดเร็วโดยใช้ชุดข้อมูลธุรกรรมการโทรผ่านมือถือได้อย่างไร โซลูชันนี้ใช้ SageMaker เพื่อฝึกและปรับใช้โมเดล XGBoost บนชุดข้อมูลโปรไฟล์ลูกค้าเพื่อคาดการณ์ว่าลูกค้ามีแนวโน้มที่จะออกจากผู้ให้บริการโทรศัพท์มือถือหรือไม่

ชุดข้อมูลที่โซลูชันนี้ใช้นั้นเปิดเผยต่อสาธารณะและมีการกล่าวถึงในหนังสือ Discovering Knowledge in Data โดย Daniel T. Larose ผู้เขียนมาจาก University of California Irvine Repository of Machine Learning Datasets

ชุดข้อมูลนี้ใช้แอตทริบิวต์ 21 รายการต่อไปนี้เพื่ออธิบายโปรไฟล์ของลูกค้าของผู้ให้บริการมือถือในสหรัฐอเมริกาที่ไม่รู้จัก

รัฐ: รัฐในสหรัฐอเมริกาที่ลูกค้าอาศัยอยู่ โดยระบุด้วยอักษรย่อสองตัวอักษร ตัวอย่างเช่น OH หรือ NJ
ความยาวบัญชี: จำนวนวันที่บัญชีนี้มีการใช้งาน
รหัสพื้นที่: รหัสพื้นที่สามหลักของหมายเลขโทรศัพท์ของลูกค้าที่เกี่ยวข้อง
โทรศัพท์: หมายเลขโทรศัพท์เจ็ดหลักที่เหลือ
แผนระหว่างประเทศ: ลูกค้ามีแผนการโทรระหว่างประเทศหรือไม่: ใช่/ไม่ใช่
แผน VMail: ลูกค้ามีคุณสมบัติวอยซ์เมลหรือไม่: ใช่/ไม่ใช่
ข้อความ VMail: จำนวนข้อความเสียงเฉลี่ยต่อเดือน
Day Mins: จำนวนนาทีโทรทั้งหมดที่ใช้ระหว่างวัน
Day Calls: จำนวนการโทรทั้งหมดระหว่างวัน
ค่าบริการรายวัน: ค่าโทรในตอนกลางวัน
Eve Mins, Eve Calls, Eve Charge: ค่าโทรที่เรียกเก็บในช่วงเย็น
Night Mins, Night Calls, Night Charge: ค่าโทรที่เรียกเก็บในช่วงเวลากลางคืน
Intl Mins, Intl Calls, Intl Charge: ค่าใช้จ่ายที่เรียกเก็บสำหรับการโทรระหว่างประเทศ
CustServ Calls: จำนวนการโทรไปยังฝ่ายบริการลูกค้า
Churn?: ลูกค้าออกจากบริการหรือไม่: true/false

โซลูชันนี้มีสามขั้นตอน:

เตรียมข้อมูล.
สร้างและฝึกโมเดล XGBoost
ปรับใช้ปลายทางและประเมินประสิทธิภาพของโมเดล

เราได้รับผลลัพธ์ต่อไปนี้:

โมเดล XGBoost ที่ผ่านการฝึกอบรมโดยอิงตามชุดข้อมูลตัวอย่างของเราเพื่อทำนายการเลิกใช้งานของผู้ใช้
ตำแหน่งข้อมูล SageMaker ที่สามารถทำนายการปั่นป่วนของผู้ใช้ได้

โมเดลนี้ช่วยประมาณการว่าลูกค้าโทรศัพท์มือถือ 5,000 รายมีแนวโน้มที่จะเลิกใช้ผู้ให้บริการโทรศัพท์มือถือปัจจุบันของตนกี่ราย

แผนภูมิต่อไปนี้แสดงการกระจายความน่าจะเป็นของการปั่นเป็นผลลัพธ์จากแบบจำลอง

คุณสามารถใช้สิ่งนี้กับธุรกิจของคุณสำหรับกรณีการใช้งานต่อไปนี้:

ทำนายว่าลูกค้าจะปั่นป่วนในธุรกิจของคุณเอง
จำแนกว่าลูกค้ารายใดสามารถเปิดอีเมลการตลาดของคุณและใครจะไม่เปิด (การจัดประเภทไบนารี)
ทำนายว่านักเรียนคนใดมีแนวโน้มที่จะออกจากหลักสูตร

ทำความสะอาดทรัพยากร

หลังจากที่คุณเรียกใช้โซลูชันใน JumpStart เสร็จแล้ว ตรวจสอบให้แน่ใจว่าได้เลือก ลบทรัพยากรทั้งหมด ดังนั้นทรัพยากรทั้งหมดที่คุณสร้างขึ้นในกระบวนการจะถูกลบและการเรียกเก็บเงินของคุณจะหยุดลง

สรุป

โพสต์นี้แสดงวิธีการแก้ปัญหาทางธุรกิจต่างๆ ด้วยการใช้ ML ตามโซลูชัน JumpStart แม้ว่าโพสต์นี้จะเน้นไปที่โซลูชันใหม่ 23 รายการที่เพิ่งเพิ่มลงใน JumpStart แต่ก็มีโซลูชันที่พร้อมใช้งานทั้งหมด XNUMX รายการ เราขอแนะนำให้คุณเข้าสู่ระบบ Studio และดูโซลูชัน JumpStart ด้วยตัวคุณเอง และเริ่มสร้างมูลค่าได้ทันที สำหรับข้อมูลเพิ่มเติม โปรดดูที่ สตูดิโอ Amazon SageMaker และ SageMaker JumpStart.

หมายเหตุ: หากคุณไม่เห็นโซลูชันทั้งห้าข้างต้นในคอนโซล JumpStart ของภูมิภาค AWS ของคุณ โปรดรอหนึ่งสัปดาห์แล้วตรวจสอบอีกครั้ง เรากำลังเผยแพร่ไปยังภูมิภาคต่างๆ แบบค่อยเป็นค่อยไป

เกี่ยวกับผู้เขียน

นพ. ราชุ เพ็ญมัจฉา เป็นสถาปนิกโซลูชัน AI/ML Specialist Solutions ในแพลตฟอร์ม AI ที่ AWS เขาทำงานเกี่ยวกับชุดบริการแบบ low-code/no-code ใน SageMaker ที่ช่วยให้ลูกค้าสร้างและปรับใช้โมเดลและโซลูชันแมชชีนเลิร์นนิงได้อย่างง่ายดาย เวลาไม่ช่วยเหลือลูกค้าก็ชอบเที่ยวที่ใหม่ๆ

มานัน ชาห์ เป็นผู้จัดการฝ่ายพัฒนาซอฟต์แวร์ที่ Amazon Web Services เขาเป็นผู้ที่ชื่นชอบ ML และมุ่งเน้นไปที่การสร้างผลิตภัณฑ์ AI/ML ที่ไม่มีโค้ด/โค้ดน้อย เขามุ่งมั่นที่จะส่งเสริมคนที่มีความสามารถและมีเทคนิคเพื่อสร้างซอฟต์แวร์ที่ยอดเยี่ยม

ประทับเวลา: ตุลาคม 31, 2022November 1, 2022

ประทับเวลา: มิถุนายน 6, 2023

แก้ปัญหาทางธุรกิจแบบ end-to-end ผ่านการเรียนรู้ของเครื่องในโซลูชัน Amazon SageMaker JumpStart

เผยแพร่ซ้ำโดยเพลโต

ภาพรวมโซลูชัน

เบื้องต้น

การเพิ่มประสิทธิภาพราคา

การทำนายชนิดของนก

การพยากรณ์การรอดชีวิตของมะเร็งปอด

การจัดประเภทการชำระเงินทางการเงิน

คำทำนายปั่นสำหรับลูกค้ามือถือ

ทำความสะอาดทรัพยากร

สรุป

เกี่ยวกับผู้เขียน

เพิ่มเติมจาก AWS Machine Learning AWS

ใช้ AWS CDK เพื่อปรับใช้การกำหนดค่าวงจรชีวิตของ Amazon SageMaker Studio | บริการเว็บอเมซอน

การคาดการณ์รายสัปดาห์สามารถเริ่มได้ในวันอาทิตย์ด้วย Amazon Forecast

เร่งเวลาไปสู่ข้อมูลเชิงลึกทางธุรกิจด้วยการเชื่อมต่อโดยตรงกับ Amazon SageMaker Data Wrangler กับ Snowflake | บริการเว็บอเมซอน

รับผลการค้นหาที่ชาญฉลาดยิ่งขึ้นด้วย Amazon Kendra Intelligent Ranking และปลั๊กอิน OpenSearch

การตรวจจับการฉ้อโกงตามเวลาจริงโดยใช้บริการ AWS แบบไร้เซิร์ฟเวอร์และการเรียนรู้ของเครื่อง

ปรับปรุงความเสถียรและความยืดหยุ่นของไปป์ไลน์ ML ที่ Amazon Packaging Innovation ด้วย Amazon SageMaker Pipelines

เกี่ยวกับเรา

การค้นหาแนวตั้ง & Ai

ระบบปฏิบัติการ

การติดต่อ

ลงชื่อเข้าใช้