สร้าง แชร์ ปรับใช้: วิธีที่นักวิเคราะห์ธุรกิจและนักวิทยาศาสตร์ด้านข้อมูลบรรลุเวลาสู่ตลาดได้เร็วขึ้นโดยใช้ ML ที่ไม่มีโค้ดและ Amazon SageMaker Canvas PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

สร้าง แชร์ ปรับใช้: วิธีที่นักวิเคราะห์ธุรกิจและนักวิทยาศาสตร์ข้อมูลบรรลุเวลาสู่ตลาดได้เร็วขึ้นโดยใช้ ML แบบไม่มีโค้ดและ Amazon SageMaker Canvas

แมชชีนเลิร์นนิง (ML) ช่วยให้องค์กรเพิ่มรายได้ ขับเคลื่อนการเติบโตของธุรกิจ และลดต้นทุนด้วยการปรับฟังก์ชันธุรกิจหลักในแนวดิ่งต่างๆ เช่น การพยากรณ์ความต้องการ การให้คะแนนเครดิต การกำหนดราคา การทำนายการเลิกราของลูกค้า การระบุข้อเสนอที่ดีที่สุดถัดไป การคาดการณ์การจัดส่งล่าช้า และ ปรับปรุงคุณภาพการผลิต วัฏจักรการพัฒนา ML แบบดั้งเดิมใช้เวลาหลายเดือนและต้องใช้วิทยาศาสตร์ข้อมูลที่หายากและทักษะด้านวิศวกรรม ML แนวคิดของนักวิเคราะห์สำหรับโมเดล ML มักจะค้างอยู่ในงานค้างที่รอแบนด์วิธของทีมวิทยาศาสตร์ข้อมูล ในขณะที่นักวิทยาศาสตร์ด้านข้อมูลจะมุ่งเน้นที่โปรเจ็กต์ ML ที่ซับซ้อนมากขึ้นซึ่งต้องใช้ชุดทักษะเต็มรูปแบบ

เพื่อช่วยทำลายจุดจบนี้ เราได้ เปิดตัว Amazon SageMaker Canvasซึ่งเป็นโซลูชัน ML แบบไม่มีโค้ดที่ช่วยให้บริษัทต่างๆ เร่งการส่งมอบโซลูชัน ML ได้ภายในไม่กี่ชั่วโมงหรือเป็นวัน SageMaker Canvas ช่วยให้นักวิเคราะห์ใช้ข้อมูลที่มีอยู่ใน Data Lake, คลังข้อมูล และที่จัดเก็บข้อมูลการดำเนินงานได้อย่างง่ายดาย สร้างโมเดล ML; และใช้การคาดการณ์แบบโต้ตอบและสำหรับการให้คะแนนแบบกลุ่มในชุดข้อมูลจำนวนมาก โดยไม่ต้องเขียนโค้ดแม้แต่บรรทัดเดียว

ในโพสต์นี้ เราแสดงให้เห็นว่า SageMaker Canvas ช่วยให้เกิดการทำงานร่วมกันระหว่างนักวิทยาศาสตร์ข้อมูลและนักวิเคราะห์ธุรกิจ บรรลุเวลาออกสู่ตลาดเร็วขึ้นและเร่งการพัฒนาโซลูชัน ML นักวิเคราะห์จะได้รับพื้นที่ทำงาน ML แบบไม่มีโค้ดใน SageMaker Canvas โดยไม่ต้องเป็นผู้เชี่ยวชาญ ML นักวิเคราะห์สามารถแชร์แบบจำลองของตนจาก Canvas ได้ด้วยการคลิกเพียงไม่กี่ครั้ง ซึ่งนักวิทยาศาสตร์ด้านข้อมูลจะสามารถทำงานได้ใน สตูดิโอ Amazon SageMaker, สภาพแวดล้อมการพัฒนา ML แบบรวม end-to-end (IDE) ด้วยการทำงานร่วมกัน นักวิเคราะห์ธุรกิจสามารถนำความรู้โดเมนและผลการทดลองไปใช้ ในขณะที่นักวิทยาศาสตร์ด้านข้อมูลสามารถสร้างท่อส่งและปรับปรุงกระบวนการได้อย่างมีประสิทธิภาพ

มาเจาะลึกกันว่าเวิร์กโฟลว์จะเป็นอย่างไร

นักวิเคราะห์ธุรกิจสร้างโมเดลแล้วแชร์

เพื่อทำความเข้าใจว่า SageMaker Canvas ช่วยลดความยุ่งยากในการทำงานร่วมกันระหว่างนักวิเคราะห์ธุรกิจและนักวิทยาศาสตร์ข้อมูล (หรือวิศวกร ML) ได้อย่างไร ขั้นแรกเราจะเข้าหากระบวนการนี้ในฐานะนักวิเคราะห์ธุรกิจ ก่อนที่คุณจะเริ่มต้น โปรดดูที่ ประกาศเปิดตัว Amazon SageMaker Canvas – ภาพที่ไม่มีความสามารถในการเรียนรู้ด้วยเครื่องโค้ดสำหรับนักวิเคราะห์ธุรกิจ สำหรับคำแนะนำในการสร้างและทดสอบโมเดลด้วย SageMaker Canvas

สำหรับโพสต์นี้ เราใช้เวอร์ชันที่แก้ไขแล้วของ ชุดข้อมูลการตรวจจับการฉ้อโกงบัตรเครดิต จาก Kaggle ชุดข้อมูลที่รู้จักกันดีสำหรับปัญหาการจำแนกประเภทไบนารี เดิมชุดข้อมูลมีความไม่สมดุลสูง มีรายการน้อยมากที่จัดเป็นคลาสเชิงลบ (ธุรกรรมผิดปกติ) โดยไม่คำนึงถึงการกระจายคุณสมบัติเป้าหมาย เรายังคงสามารถใช้ชุดข้อมูลนี้ได้ เนื่องจาก SageMaker Canvas จะจัดการกับความไม่สมดุลนี้ในขณะที่ฝึกและปรับแต่งโมเดลโดยอัตโนมัติ ชุดข้อมูลนี้ประกอบด้วยเซลล์ประมาณ 9 ล้านเซลล์ คุณยังสามารถดาวน์โหลด a รุ่นที่ลดลงของชุดข้อมูลนี้. ขนาดชุดข้อมูลมีขนาดเล็กกว่ามาก อยู่ที่ประมาณ 500,000 เซลล์ เนื่องจากมีการสุ่มตัวอย่างน้อยเกินไป จากนั้นจึงสุ่มตัวอย่างมากเกินไปด้วยเทคนิค SMOTE เพื่อให้แน่ใจว่าข้อมูลจะสูญหายน้อยที่สุดเท่าที่จะเป็นไปได้ในระหว่างกระบวนการนี้ การเรียกใช้การทดสอบทั้งหมดด้วยชุดข้อมูลที่ลดลงนี้มีค่าใช้จ่าย 0 ดอลลาร์สหรัฐฯ ภายใต้ SageMaker Canvas Free Tier

หลังจากสร้างแบบจำลองแล้ว นักวิเคราะห์สามารถใช้แบบจำลองนี้ในการคาดคะเนโดยตรงใน Canvas สำหรับคำขอแต่ละรายการ หรือสำหรับชุดข้อมูลอินพุตทั้งหมดเป็นกลุ่ม

ใช้แบบจำลองที่ผ่านการฝึกอบรมเพื่อสร้างการคาดการณ์

โมเดลที่สร้างด้วย Canvas Standard Build ยังสามารถแชร์ได้ง่ายๆ เพียงคลิกปุ่มกับนักวิทยาศาสตร์ข้อมูลและวิศวกร ML ที่ใช้ SageMaker Studio ซึ่งช่วยให้นักวิทยาศาสตร์ข้อมูลสามารถตรวจสอบประสิทธิภาพของแบบจำลองที่คุณสร้างขึ้นและให้ข้อเสนอแนะได้ วิศวกร ML สามารถรับแบบจำลองของคุณและรวมเข้ากับเวิร์กโฟลว์และผลิตภัณฑ์ที่มีอยู่สำหรับบริษัทและลูกค้าของคุณ โปรดทราบว่าในขณะที่เขียน คุณไม่สามารถแชร์แบบจำลองที่สร้างด้วย Canvas Quick Build หรือแบบจำลองการคาดการณ์อนุกรมเวลา

การแชร์โมเดลผ่าน Canvas UI นั้นตรงไปตรงมา:

  1. บนหน้าที่แสดงแบบจำลองที่คุณสร้างขึ้น ให้เลือกแบบจำลอง
  2. Choose Share.แชร์โมเดลที่ได้รับการฝึกจากแท็บวิเคราะห์
  3. เลือกรุ่นอย่างน้อยหนึ่งรุ่นที่คุณต้องการแชร์
  4. หรือจะใส่หมายเหตุที่ให้บริบทเพิ่มเติมเกี่ยวกับโมเดลหรือความช่วยเหลือที่คุณต้องการก็ได้
  5. Choose สร้างลิงก์ SageMaker Studio.แชร์โมเดลกับ SageMaker Studio
  6. คัดลอกลิงค์ที่สร้างขึ้นคัดลอกลิงค์ที่สร้างขึ้น

และนั่นแหล่ะ! ตอนนี้คุณสามารถแชร์ลิงก์กับเพื่อนร่วมงานของคุณผ่าน Slack อีเมล หรือวิธีการอื่นๆ ตามที่คุณต้องการ นักวิทยาศาสตร์ข้อมูลต้องอยู่ในโดเมน SageMaker Studio เดียวกันจึงจะสามารถเข้าถึงโมเดลของคุณได้ ดังนั้นโปรดตรวจสอบให้แน่ใจว่าผู้ดูแลระบบองค์กรของคุณเป็นกรณีนี้

แชร์โมเดลโดยส่งข้อความ Slack หรืออีเมล

นักวิทยาศาสตร์ข้อมูลเข้าถึงข้อมูลแบบจำลองจาก SageMaker Studio

ตอนนี้ มาเล่นบทบาทของนักวิทยาศาสตร์ข้อมูลหรือวิศวกร ML และดูสิ่งต่างๆ จากมุมมองของพวกเขาโดยใช้ SageMaker Studio

ลิงก์ที่นักวิเคราะห์แบ่งปันจะนำเราไปสู่ ​​SageMaker Studio ซึ่งเป็น IDE บนคลาวด์ตัวแรกสำหรับเวิร์กโฟลว์ ML แบบ end-to-end

แสดงภาพรวมของโมเดลตามที่เห็นใน SageMaker Studio

แท็บจะเปิดขึ้นโดยอัตโนมัติ และแสดงภาพรวมของแบบจำลองที่สร้างโดยนักวิเคราะห์ใน SageMaker Canvas คุณสามารถดูชื่อรุ่น ประเภทปัญหา ML เวอร์ชันของรุ่น และผู้ใช้ที่สร้างแบบจำลองได้อย่างรวดเร็ว (ในฟิลด์ ID ผู้ใช้ Canvas) คุณยังเข้าถึงรายละเอียดเกี่ยวกับชุดข้อมูลอินพุตและโมเดลที่ดีที่สุดที่ SageMaker สร้างขึ้นได้ เราจะดำดิ่งลงไปในภายหลังในโพสต์

เกี่ยวกับ ใส่ชุดข้อมูล คุณยังสามารถดูการไหลของข้อมูลจากต้นทางไปยังชุดข้อมูลอินพุตได้อีกด้วย ในกรณีนี้ จะใช้แหล่งข้อมูลเพียงแหล่งเดียวเท่านั้นและไม่มีการดำเนินการเข้าร่วม ดังนั้นจึงแสดงแหล่งข้อมูลเดียว คุณสามารถวิเคราะห์สถิติและรายละเอียดเกี่ยวกับชุดข้อมูลโดยเลือก เปิดสมุดบันทึกการสำรวจข้อมูล. สมุดบันทึกนี้ให้คุณสำรวจข้อมูลที่มีอยู่ก่อนการฝึกแบบจำลอง และมีการวิเคราะห์ตัวแปรเป้าหมาย ตัวอย่างข้อมูลที่ป้อน สถิติและคำอธิบายของคอลัมน์และแถวตลอดจนข้อมูลที่เป็นประโยชน์อื่น ๆ สำหรับนักวิทยาศาสตร์ข้อมูล ทราบข้อมูลเพิ่มเติมเกี่ยวกับชุดข้อมูล หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับรายงานนี้ โปรดดูที่ รายงานการสำรวจข้อมูล.

แสดงภาพรวมของรุ่น พร้อมงานที่เสร็จสมบูรณ์และข้อมูลงาน

หลังจากวิเคราะห์ชุดข้อมูลอินพุตแล้ว มาดูแท็บที่สองของภาพรวมโมเดลกัน งาน AutoML. แท็บนี้มีคำอธิบายของงาน AutoML เมื่อคุณเลือกตัวเลือกบิลด์มาตรฐานใน SageMaker Canvas

เทคโนโลยี AutoML ที่อยู่ภายใต้ SageMaker Canvas ช่วยลดการยกของหนักของโมเดล ML ของอาคาร โดยจะสร้าง ฝึกฝน และปรับแต่งโมเดล ML ที่ดีที่สุดโดยอัตโนมัติโดยอิงตามข้อมูลของคุณโดยใช้วิธีการอัตโนมัติ ในขณะเดียวกันก็ช่วยให้คุณรักษาการควบคุมและการมองเห็นได้ทั้งหมด การมองเห็นนี้ในแบบจำลองตัวเลือกที่สร้างขึ้นตลอดจนพารามิเตอร์ไฮเปอร์ที่ใช้ระหว่างกระบวนการ AutoML มีอยู่ใน โน๊ตบุ๊ครุ่นผู้สมัครซึ่งมีอยู่ในแท็บนี้

พื้นที่ งาน AutoML แท็บยังมีรายการของทุกรุ่นที่สร้างขึ้นโดยเป็นส่วนหนึ่งของกระบวนการ AutoML ซึ่งจัดเรียงตามตัวชี้วัดวัตถุประสงค์ F1 เพื่อเน้นรูปแบบที่ดีที่สุดจากงานฝึกอบรมที่เปิดตัว แท็กที่มีวงกลมสีเขียวถูกนำมาใช้ใน รุ่นที่ดีที่สุด คอลัมน์. คุณยังสามารถเห็นภาพตัวชี้วัดอื่นๆ ที่ใช้ในระหว่างขั้นตอนการฝึกอบรมและการประเมินได้อย่างง่ายดาย เช่น คะแนนความถูกต้องและบริเวณใต้เส้นโค้ง (AUC) หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับแบบจำลองที่คุณสามารถฝึกได้ระหว่างงาน AutoML และตัววัดที่ใช้สำหรับการประเมินประสิทธิภาพของแบบจำลองที่ได้รับการฝึก โปรดดูที่ การสนับสนุนแบบจำลอง ตัวชี้วัด และการตรวจสอบ.

หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับโมเดล คุณสามารถคลิกขวาที่โมเดลที่ดีที่สุดแล้วเลือก เปิดในรายละเอียดรุ่น. หรือคุณสามารถเลือก รุ่นที่ดีที่สุด ลิงค์ที่ด้านบนของ ภาพรวมของโมเดล ส่วนที่คุณเข้าชมครั้งแรก

รายละเอียดแบบจำลองที่มีความสำคัญและตัวชี้วัด

หน้ารายละเอียดแบบจำลองมีข้อมูลที่เป็นประโยชน์มากมายเกี่ยวกับแบบจำลองที่ทำงานได้ดีที่สุดกับข้อมูลที่ป้อนนี้ อันดับแรก ให้เน้นที่การสรุปที่ด้านบนของหน้า ภาพหน้าจอตัวอย่างก่อนหน้านี้แสดงให้เห็นว่า จากการวิ่งการฝึกโมเดลหลายร้อยครั้ง โมเดล XGBoost ทำงานได้ดีที่สุดในชุดข้อมูลอินพุต ในขณะที่เขียนบทความนี้ SageMaker Canvas สามารถฝึกอัลกอริธึม ML ได้สามประเภท ได้แก่ ผู้เรียนเชิงเส้น XGBoost และ Perceptron แบบหลายชั้น (MLP) แต่ละประเภทมีไพพ์ไลน์และไฮเปอร์พารามิเตอร์ก่อนการประมวลผลที่หลากหลาย หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับแต่ละอัลกอริทึม โปรดดูที่ หน้าอัลกอริทึมที่รองรับ.

SageMaker ยังมีฟังก์ชันที่อธิบายได้ด้วยการใช้งาน .ที่ปรับขนาดได้และมีประสิทธิภาพ เคอร์เนล SHAPตามแนวคิดของค่าแชปลีย์จากสาขาทฤษฎีเกมแบบร่วมมือซึ่งกำหนดค่าความสำคัญให้กับแต่ละคุณลักษณะสำหรับการทำนายโดยเฉพาะ ซึ่งช่วยให้เกิดความโปร่งใสเกี่ยวกับวิธีการที่โมเดลมาถึงการคาดการณ์ และมีประโยชน์มากในการกำหนดความสำคัญของคุณลักษณะ รายงานการอธิบายที่สมบูรณ์รวมถึงความสำคัญของคุณลักษณะสามารถดาวน์โหลดได้ในรูปแบบ PDF สมุดบันทึกหรือข้อมูลดิบ ในรายงานนั้น ชุดเมตริกที่กว้างขึ้นจะแสดงขึ้นพร้อมกับรายการไฮเปอร์พารามิเตอร์ทั้งหมดที่ใช้ระหว่างงาน AutoML หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับวิธีที่ SageMaker จัดเตรียมเครื่องมืออธิบายแบบบูรณาการสำหรับโซลูชัน AutoML และอัลกอริธึม ML มาตรฐาน โปรดดูที่ ใช้เครื่องมืออธิบายได้ในตัวและปรับปรุงคุณภาพของโมเดลโดยใช้ Amazon SageMaker Autopilot.

สุดท้าย แท็บอื่นๆ ในมุมมองนี้จะแสดงข้อมูลเกี่ยวกับรายละเอียดประสิทธิภาพ (เมทริกซ์ความสับสน เส้นโค้งการเรียกคืนที่แม่นยำ เส้นโค้ง ROC) สิ่งประดิษฐ์ที่ใช้สำหรับอินพุตและสร้างขึ้นระหว่างงาน AutoML และรายละเอียดเครือข่าย

ณ จุดนี้ นักวิทยาศาสตร์ข้อมูลมีสองทางเลือก: ปรับใช้โมเดลโดยตรง หรือสร้างไปป์ไลน์การฝึกอบรมที่สามารถกำหนดเวลาหรือทริกเกอร์ด้วยตนเองหรือโดยอัตโนมัติ ส่วนต่อไปนี้จะให้ข้อมูลเชิงลึกเกี่ยวกับตัวเลือกทั้งสอง

ปรับใช้โมเดลโดยตรง

หากนักวิทยาศาสตร์ข้อมูลพอใจกับผลลัพธ์ที่ได้รับจากงาน AutoML พวกเขาสามารถปรับใช้แบบจำลองได้โดยตรงจาก รายละเอียดรุ่น หน้าหนังสือ. ง่ายๆ แค่เลือก ปรับใช้โมเดล ถัดจากชื่อรุ่น

รายละเอียดโมเดลเพิ่มเติม จากตำแหน่งที่จะปรับใช้โมเดล

SageMaker แสดงให้คุณเห็นสองตัวเลือกสำหรับการปรับใช้: ตำแหน่งข้อมูลเรียลไทม์ ขับเคลื่อนโดย ตำแหน่งข้อมูล Amazon SageMakerและการอนุมานแบบกลุ่ม ขับเคลื่อนโดย การแปลงแบตช์ Amazon SageMaker.

ตัวเลือกในการเปิดการคาดคะเนจาก AutoML

SageMaker ยังมีโหมดการอนุมานอื่นๆ ดูข้อมูลเพิ่มเติมได้ที่ ปรับใช้แบบจำลองสำหรับการอนุมาน.

ในการเปิดใช้งานโหมดการคาดคะเนแบบเรียลไทม์ คุณเพียงแค่ตั้งชื่อปลายทาง ประเภทอินสแตนซ์ และจำนวนอินสแตนซ์ เนื่องจากโมเดลนี้ไม่ต้องการทรัพยากรในการประมวลผลจำนวนมาก คุณจึงสามารถใช้อินสแตนซ์ที่ใช้ CPU โดยมีจำนวนเริ่มต้นที่ 1 ได้ คุณสามารถเรียนรู้เพิ่มเติมเกี่ยวกับประเภทอินสแตนซ์ต่างๆ ที่มีอยู่และข้อกำหนดของอินสแตนซ์ได้บน หน้าราคา Amazon SageMaker (ใน ราคาตามความต้องการ เลือกส่วน การอนุมานตามเวลาจริง แท็บ) หากคุณไม่ทราบว่าคุณควรเลือกอินสแตนซ์ใดสำหรับการปรับใช้ของคุณ คุณสามารถขอให้ SageMaker ค้นหาอินสแตนซ์ที่ดีที่สุดสำหรับคุณตาม KPI ของคุณได้โดยใช้ ผู้แนะนำการอนุมาน SageMaker. คุณยังสามารถระบุพารามิเตอร์ทางเลือกเพิ่มเติม เกี่ยวกับว่าคุณต้องการบันทึกคำขอและข้อมูลตอบกลับไปยังหรือจากปลายทางหรือไม่ สิ่งนี้สามารถพิสูจน์ได้ว่ามีประโยชน์หากคุณกำลังวางแผน การตรวจสอบโมเดลของคุณ. คุณยังสามารถเลือกเนื้อหาที่คุณต้องการให้เป็นส่วนหนึ่งของคำตอบได้ ไม่ว่าจะเป็นการคาดคะเนหรือความน่าจะเป็นที่คาดการณ์ ความน่าจะเป็นของทุกคลาส และป้ายกำกับเป้าหมาย

ในการรันงานการให้คะแนนแบบกลุ่มเพื่อรับการคาดการณ์สำหรับอินพุตทั้งชุดในคราวเดียว คุณสามารถเรียกใช้งานการแปลงแบบกลุ่มได้จาก คอนโซลการจัดการ AWS หรือผ่าน SageMaker Python SDK หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับการแปลงเป็นชุด โปรดดูที่ ใช้การแปลงเป็นชุด และสมุดตัวอย่าง

กำหนดไปป์ไลน์การฝึกอบรม

โมเดล ML มักจะถูกมองว่าเป็นแบบคงที่และไม่เปลี่ยนแปลง (ถ้ามี) น้อยมาก เพราะพวกเขาเบี่ยงเบนไปจากเส้นฐานที่พวกเขาเคยฝึกมา ข้อมูลในโลกแห่งความเป็นจริงมีวิวัฒนาการอยู่ตลอดเวลา และมีรูปแบบและข้อมูลเชิงลึกมากขึ้น ซึ่งอาจจะหรืออาจจะไม่ถูกบันทึกโดยแบบจำลองดั้งเดิมที่ได้รับการฝึกอบรมเกี่ยวกับข้อมูลในอดีต ในการแก้ปัญหานี้ คุณสามารถตั้งค่าไปป์ไลน์การฝึกที่จะฝึกแบบจำลองของคุณใหม่โดยอัตโนมัติด้วยข้อมูลล่าสุดที่มี

ในการกำหนดไปป์ไลน์นี้ หนึ่งในตัวเลือกของนักวิทยาศาสตร์ข้อมูลคือการใช้ AutoML อีกครั้งสำหรับไปป์ไลน์การฝึกอบรม คุณสามารถเปิดงาน AutoML โดยทางโปรแกรมได้โดยเรียกใช้ create_auto_ml_job() API จาก AWS Boto3 SDK. คุณสามารถเรียกการดำเนินการนี้ได้จาก an AWS แลมบ์ดา ฟังก์ชันภายใน an ฟังก์ชันขั้นตอนของ AWS เวิร์กโฟลว์หรือจาก LambdaStep ใน ท่อส่ง Amazon SageMaker.

อีกทางหนึ่ง นักวิทยาศาสตร์ข้อมูลสามารถใช้ความรู้ สิ่งประดิษฐ์ และพารามิเตอร์ไฮเปอร์ที่ได้รับจากงาน AutoML เพื่อกำหนดไปป์ไลน์การฝึกอบรมที่สมบูรณ์ คุณต้องการทรัพยากรต่อไปนี้:

  • อัลกอริทึมที่ทำงานได้ดีที่สุดสำหรับกรณีการใช้งาน – คุณได้รับข้อมูลนี้แล้วจากบทสรุปของโมเดลที่สร้างด้วย Canvas สำหรับกรณีการใช้งานนี้คืออัลกอริทึมในตัวของ XGBoost สำหรับคำแนะนำเกี่ยวกับวิธีการใช้ SageMaker Python SDK เพื่อฝึกอัลกอริทึม XGBoost ด้วย SageMaker โปรดดูที่ ใช้ XGBoost กับ SageMaker Python SDK.
    ข้อมูลเกี่ยวกับอัลกอริธึมที่ฝึกกับงาน Canvas
  • ไฮเปอร์พารามิเตอร์ที่ได้รับจากงาน AutoML – มีอยู่ใน คำอธิบาย ส่วน. คุณสามารถใช้มันเป็นอินพุตเมื่อกำหนดงานการฝึกด้วย SageMaker Python SDK
    โมเดลไฮเปอร์พารามิเตอร์
  • รหัสวิศวกรรมคุณลักษณะที่ให้ไว้ในส่วนสิ่งประดิษฐ์ – คุณสามารถใช้โค้ดนี้เพื่อประมวลผลข้อมูลล่วงหน้าก่อนการฝึก (เช่น ผ่านการประมวลผล Amazon SageMaker) หรือก่อนการอนุมาน (เช่น เป็นส่วนหนึ่งของไปป์ไลน์การอนุมานของ SageMaker)
    S3 URI ของโค้ดวิศวกรรมคุณลักษณะ

คุณสามารถรวมทรัพยากรเหล่านี้เป็นส่วนหนึ่งของไปป์ไลน์ SageMaker เราละเว้นรายละเอียดการใช้งานในโพสต์นี้ โปรดติดตามเนื้อหาเพิ่มเติมในหัวข้อนี้

สรุป

SageMaker Canvas ให้คุณใช้ ML เพื่อสร้างการคาดคะเนโดยไม่จำเป็นต้องเขียนโค้ดใดๆ นักวิเคราะห์ธุรกิจสามารถเริ่มใช้งานกับชุดข้อมูลในเครื่องได้โดยอัตโนมัติ เช่นเดียวกับข้อมูลที่จัดเก็บไว้ใน บริการจัดเก็บข้อมูลอย่างง่ายของ Amazon (อเมซอน เอส3) อเมซอน Redshiftหรือเกล็ดหิมะ ด้วยการคลิกเพียงไม่กี่ครั้ง พวกเขาสามารถเตรียมและเข้าร่วมชุดข้อมูล วิเคราะห์ความแม่นยำโดยประมาณ ตรวจสอบว่าคอลัมน์ใดส่งผลกระทบ ฝึกโมเดลที่ทำงานได้ดีที่สุด และสร้างการคาดการณ์รายบุคคลหรือกลุ่มใหม่ ทั้งหมดนี้ไม่จำเป็นต้องดึงนักวิทยาศาสตร์ข้อมูลผู้เชี่ยวชาญ จากนั้น ตามความจำเป็น พวกเขาสามารถแชร์แบบจำลองกับทีมนักวิทยาศาสตร์ข้อมูลหรือวิศวกร MLOps ซึ่งนำเข้าแบบจำลองไปยัง SageMaker Studio และทำงานร่วมกับนักวิเคราะห์เพื่อส่งมอบโซลูชันการผลิต

นักวิเคราะห์ธุรกิจสามารถรับข้อมูลเชิงลึกจากข้อมูลของตนเองได้โดยไม่ต้องมีปริญญาใน ML และไม่ต้องเขียนโค้ดแม้แต่บรรทัดเดียว นักวิทยาศาสตร์ด้านข้อมูลสามารถมีเวลาเพิ่มเติมในการทำงานในโครงการที่ท้าทายมากขึ้น ซึ่งสามารถใช้ความรู้ที่กว้างขวางของ AI และ ML ได้ดีขึ้น

เราเชื่อว่าการร่วมมือครั้งใหม่นี้จะเปิดประตูสู่การสร้างโซลูชัน ML ที่มีประสิทธิภาพมากขึ้นสำหรับธุรกิจของคุณ ตอนนี้คุณมีนักวิเคราะห์ที่สร้างข้อมูลเชิงลึกทางธุรกิจอันมีค่า ในขณะที่ให้นักวิทยาศาสตร์ข้อมูลและวิศวกร ML ช่วยปรับแต่ง ปรับแต่ง และขยายตามความจำเป็น

แหล่งข้อมูลเพิ่มเติม


เกี่ยวกับผู้เขียน

สร้าง แชร์ ปรับใช้: วิธีที่นักวิเคราะห์ธุรกิจและนักวิทยาศาสตร์ด้านข้อมูลบรรลุเวลาสู่ตลาดได้เร็วขึ้นโดยใช้ ML ที่ไม่มีโค้ดและ Amazon SageMaker Canvas PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.ดาวิเด้ กัลลิเตลลี่ เป็น Specialist Solutions Architect สำหรับ AI/ML ในภูมิภาค EMEA เขาอยู่ในบรัสเซลส์และทำงานอย่างใกล้ชิดกับลูกค้าทั่วเบเนลักซ์ เขาเป็นนักพัฒนาตั้งแต่ยังเด็ก เริ่มเขียนโค้ดเมื่ออายุ 7 ขวบ เขาเริ่มเรียน AI/ML ที่มหาวิทยาลัย และตกหลุมรักมันตั้งแต่นั้นเป็นต้นมา

สร้าง แชร์ ปรับใช้: วิธีที่นักวิเคราะห์ธุรกิจและนักวิทยาศาสตร์ด้านข้อมูลบรรลุเวลาสู่ตลาดได้เร็วขึ้นโดยใช้ ML ที่ไม่มีโค้ดและ Amazon SageMaker Canvas PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.มาร์ครอย Ro คือ Principal Machine Learning Architect สำหรับ AWS ซึ่งช่วยลูกค้าในการออกแบบและสร้างโซลูชัน AI/ML งานของ Mark ครอบคลุมกรณีการใช้งาน ML ที่หลากหลาย โดยมีความสนใจหลักในด้านคอมพิวเตอร์วิทัศน์ การเรียนรู้เชิงลึก และการปรับขนาด ML ทั่วทั้งองค์กร เขาได้ช่วยบริษัทต่างๆ ในหลายอุตสาหกรรม รวมถึงการประกันภัย บริการทางการเงิน สื่อและความบันเทิง การดูแลสุขภาพ สาธารณูปโภค และการผลิต Mark มีใบรับรอง AWS หกใบ รวมถึง ML Specialty Certification ก่อนร่วมงานกับ AWS Mark เคยเป็นสถาปนิก นักพัฒนา และผู้นำด้านเทคโนโลยีมานานกว่า 25 ปี รวมถึง 19 ปีในด้านบริการทางการเงิน

ประทับเวลา:

เพิ่มเติมจาก AWS Machine Learning AWS