สตูดิโอ Amazon SageMaker ให้โซลูชันที่มีการจัดการเต็มรูปแบบสำหรับนักวิทยาศาสตร์ข้อมูลเพื่อสร้าง ฝึกอบรม และปรับใช้โมเดลแมชชีนเลิร์นนิง (ML) แบบโต้ตอบ นอกเหนือจากประสบการณ์ ML แบบอินเทอร์แอกทีฟแล้ว พนักงานด้านข้อมูลยังค้นหาโซลูชันเพื่อเรียกใช้โน้ตบุ๊กเป็นงานชั่วคราวโดยไม่จำเป็นต้องรีแฟคเตอร์โค้ดเป็นโมดูล Python หรือเรียนรู้เครื่องมือ DevOps และแนวทางปฏิบัติที่ดีที่สุดเพื่อทำให้โครงสร้างพื้นฐานการปรับใช้เป็นแบบอัตโนมัติ กรณีการใช้งานทั่วไปสำหรับการทำเช่นนี้ ได้แก่ :
- เรียกใช้การอนุมานแบบจำลองเป็นประจำเพื่อสร้างรายงาน
- ปรับขนาดขั้นตอนวิศวกรรมฟีเจอร์หลังจากทดสอบใน Studio กับชุดย่อยของข้อมูลในอินสแตนซ์ขนาดเล็ก
- การฝึกอบรมใหม่และการปรับใช้โมเดลในบางจังหวะ
- วิเคราะห์ทีมของคุณ อเมซอน SageMaker การใช้งานในจังหวะปกติ
ก่อนหน้านี้ เมื่อนักวิทยาศาสตร์ข้อมูลต้องการใช้โค้ดที่สร้างแบบโต้ตอบบนโน้ตบุ๊กและเรียกใช้งานเป็นชุด พวกเขาต้องเผชิญกับช่วงการเรียนรู้ที่สูงชันโดยใช้ ท่อส่ง Amazon SageMaker, AWS แลมบ์ดา, อเมซอน EventBridge,หรือ โซลูชั่นอื่นๆ ที่ตั้งค่า ใช้งาน และจัดการได้ยาก
กับ งานสมุดบันทึก SageMakerตอนนี้ คุณสามารถเรียกใช้สมุดบันทึกของคุณตามที่เป็นอยู่หรือในลักษณะที่กำหนดพารามิเตอร์ได้ด้วยการคลิกง่ายๆ เพียงไม่กี่ครั้งจาก SageMaker Studio หรือ SageMaker สตูดิโอแล็บ อินเตอร์เฟซ. คุณสามารถเรียกใช้สมุดบันทึกเหล่านี้ตามกำหนดเวลาหรือทันที ผู้ใช้ปลายทางไม่จำเป็นต้องแก้ไขรหัสโน้ตบุ๊กที่มีอยู่ เมื่องานเสร็จสมบูรณ์ คุณสามารถดูเซลล์สมุดบันทึกที่มีข้อมูล รวมถึงการแสดงภาพใดๆ ได้!
ในโพสต์นี้ เราจะแชร์วิธีการดำเนินการโน้ตบุ๊ก SageMaker Studio ของคุณเป็นงานโน้ตบุ๊กตามกำหนดเวลา
ภาพรวมโซลูชัน
ไดอะแกรมต่อไปนี้แสดงสถาปัตยกรรมโซลูชันของเรา เราใช้ส่วนขยาย SageMaker ที่ติดตั้งไว้ล่วงหน้าเพื่อใช้งานโน้ตบุ๊กเป็นงานทันทีหรือตามกำหนดเวลา
ในส่วนต่อไปนี้ เราจะอธิบายขั้นตอนต่างๆ เพื่อสร้างสมุดบันทึก กำหนดพารามิเตอร์เซลล์ ปรับแต่งตัวเลือกเพิ่มเติม และจัดกำหนดการงานของคุณ เรายังรวมกรณีการใช้งานตัวอย่าง
เบื้องต้น
หากต้องการใช้งานโน้ตบุ๊ก SageMaker คุณต้องใช้งานแอป JupyterLab 3 JupyterServer ภายใน Studio สำหรับข้อมูลเพิ่มเติมเกี่ยวกับวิธีอัปเกรดเป็น JupyterLab 3 โปรดดูที่ ดูและอัปเดตแอปเวอร์ชัน JupyterLab จากคอนโซล. อย่าลืม ปิดและอัปเดต SageMaker Studio เพื่อรับข่าวสารล่าสุด
หากต้องการกำหนดข้อกำหนดของงานที่เรียกใช้สมุดบันทึกตามกำหนดเวลา คุณอาจต้องเพิ่มสิทธิ์เพิ่มเติมให้กับบทบาทการดำเนินการของ SageMaker
ขั้นแรก เพิ่มความสัมพันธ์ที่ไว้วางใจให้กับบทบาทการดำเนินการของ SageMaker ที่อนุญาต events.amazonaws.com
เพื่อรับบทบาทของคุณ:
นอกจากนี้ คุณอาจต้องสร้างและแนบนโยบายแบบอินไลน์กับบทบาทการดำเนินการของคุณ นโยบายด้านล่างเป็นส่วนเสริมของนโยบายที่อนุญาต AmazonSageMakerFullAccess
นโยบาย. ดูชุดสิทธิ์ที่สมบูรณ์และน้อยที่สุด ติดตั้งนโยบายและสิทธิ์.
สร้างงานสมุดบันทึก
หากต้องการใช้งานโน้ตบุ๊กของคุณเป็นงานโน้ตบุ๊ก SageMaker ให้เลือก สร้างงานสมุดบันทึก ไอคอน
หรือคุณสามารถเลือก (คลิกขวา) สมุดบันทึกของคุณบนระบบไฟล์แล้วเลือก สร้างงานโน๊ตบุ๊ค.
ตัว Vortex Indicator ได้ถูกนำเสนอลงในนิตยสาร สร้างงาน เพียงเลือกประเภทอินสแตนซ์ที่เหมาะสมสำหรับงานตามกำหนดการของคุณตามปริมาณงานของคุณ: อินสแตนซ์มาตรฐาน อินสแตนซ์ที่เพิ่มประสิทธิภาพการประมวลผล หรืออินสแตนซ์การประมวลผลแบบเร่งที่มี GPU คุณสามารถเลือกอินสแตนซ์ใดก็ได้ที่มีให้สำหรับงานฝึกอบรมของ SageMaker สำหรับรายการอินสแตนซ์ทั้งหมดที่มี โปรดดูที่ ราคา Amazon SageMaker.
เมื่องานเสร็จสมบูรณ์ คุณสามารถดูไฟล์โน้ตบุ๊กเอาต์พุตที่มีเซลล์ที่เติมข้อมูล รวมทั้งบันทึกพื้นฐานจากการรันงาน
ปรับพารามิเตอร์เซลล์
เมื่อย้ายโน้ตบุ๊กไปยังเวิร์กโฟลว์การผลิต สิ่งสำคัญคือต้องใช้โน้ตบุ๊กเดิมซ้ำด้วยชุดพารามิเตอร์ที่แตกต่างกันสำหรับโมดูลาร์ ตัวอย่างเช่น คุณอาจต้องการกำหนดพารามิเตอร์ของตำแหน่งชุดข้อมูลหรือไฮเปอร์พารามิเตอร์ของโมเดลของคุณ เพื่อให้คุณสามารถนำโน้ตบุ๊กเดียวกันกลับมาใช้ใหม่สำหรับการฝึกโมเดลที่แตกต่างกันหลายๆ แบบ งานสมุดบันทึก SageMaker รองรับสิ่งนี้ผ่านแท็กเซลล์ เพียงเลือกไอคอนรูปเฟืองคู่ในบานหน้าต่างด้านขวาแล้วเลือก เพิ่มแท็ก. จากนั้นติดป้ายกำกับแท็กเป็นพารามิเตอร์
ตามค่าเริ่มต้น การรันงานโน้ตบุ๊กจะใช้ค่าพารามิเตอร์ที่ระบุในโน้ตบุ๊ก แต่อีกทางหนึ่ง คุณสามารถแก้ไขค่าเหล่านี้เป็นการกำหนดค่าสำหรับงานโน้ตบุ๊กของคุณได้
กำหนดค่าตัวเลือกเพิ่มเติม
เมื่อสร้างงานสมุดบันทึก คุณสามารถขยาย ตัวเลือกเพิ่มเติม เพื่อปรับแต่งคำจำกัดความของงานของคุณ Studio จะตรวจหาอิมเมจหรือเคอร์เนลที่คุณใช้ในโน้ตบุ๊กโดยอัตโนมัติ และเลือกไว้ล่วงหน้าให้คุณ ตรวจสอบให้แน่ใจว่าคุณได้ตรวจสอบการเลือกนี้แล้ว
คุณยังสามารถระบุตัวแปรสภาพแวดล้อมหรือสคริปต์เริ่มต้นเพื่อปรับแต่งสภาพแวดล้อมการเรียกใช้โน้ตบุ๊กของคุณ สำหรับรายการการกำหนดค่าทั้งหมด โปรดดูที่ ตัวเลือกเพิ่มเติม.
กำหนดเวลางานของคุณ
หากต้องการกำหนดเวลางานของคุณ ให้เลือก วิ่งตามกำหนด และกำหนดช่วงเวลาและเวลาที่เหมาะสม จากนั้นคุณสามารถเลือก งานโน๊ตบุ๊ค แท็บที่มองเห็นได้หลังจากเลือกไอคอนหน้าแรก หลังจากโหลดสมุดบันทึกแล้ว ให้เลือก คำจำกัดความของงานโน้ตบุ๊ก แท็บเพื่อหยุดชั่วคราวหรือลบกำหนดการของคุณ
ตัวอย่างการใช้งาน
สำหรับตัวอย่างของเรา เราแสดงเวิร์กโฟลว์ ML แบบ end-to-end ที่เตรียมข้อมูลจากแหล่งความจริงพื้นฐาน ฝึกโมเดลที่รีเฟรชจากช่วงเวลานั้น จากนั้นเรียกใช้การอนุมานข้อมูลล่าสุดเพื่อสร้างข้อมูลเชิงลึกที่นำไปปฏิบัติได้ ในทางปฏิบัติ คุณอาจเรียกใช้เวิร์กโฟลว์แบบ end-to-end ที่สมบูรณ์ หรือเพียงดำเนินการหนึ่งขั้นตอนของเวิร์กโฟลว์ของคุณ คุณสามารถกำหนดเวลา AWS กาว เซสชันแบบโต้ตอบ สำหรับการเตรียมข้อมูลรายวัน หรือเรียกใช้งานการอนุมานเป็นชุดที่สร้างผลลัพธ์กราฟิกโดยตรงในสมุดบันทึกผลลัพธ์ของคุณ
สมุดบันทึกแบบเต็มสำหรับตัวอย่างนี้มีอยู่ในของเรา SageMaker ตัวอย่างที่เก็บ GitHub กรณีการใช้งานถือว่าเราเป็นบริษัทโทรคมนาคมที่ต้องการจัดกำหนดการโน้ตบุ๊กที่คาดการณ์ว่าลูกค้าน่าจะเลิกใช้ตามแบบจำลองที่ได้รับการฝึกอบรมด้วยข้อมูลล่าสุดที่เรามี
ในการเริ่มต้น เรารวบรวมข้อมูลลูกค้าล่าสุดที่มีอยู่และดำเนินการประมวลผลล่วงหน้าบางอย่างกับข้อมูลนั้น:
เราฝึกโมเดลที่รีเฟรชกับข้อมูลการฝึกที่อัปเดตนี้เพื่อให้คาดการณ์ได้อย่างแม่นยำ todays_data
:
เนื่องจากเราจะกำหนดเวลาสมุดบันทึกนี้เป็นรายงานรายวัน เราจึงต้องการบันทึกว่าโมเดลที่รีเฟรชของเราทำงานได้ดีเพียงใดในชุดการตรวจสอบของเรา เพื่อให้เรามั่นใจในการคาดการณ์ในอนาคต ผลลัพธ์ในภาพหน้าจอต่อไปนี้มาจากรายงานการอนุมานตามกำหนดเวลาของเรา
สุดท้าย คุณต้องการบันทึกผลลัพธ์ที่คาดการณ์ไว้ของข้อมูลวันนี้ลงในฐานข้อมูล เพื่อให้สามารถดำเนินการตามผลลัพธ์ของโมเดลนี้ได้
หลังจากเข้าใจสมุดบันทึกแล้ว คุณสามารถเรียกใช้สิ่งนี้เป็นงานชั่วคราวโดยใช้ วิ่งเลย ตัวเลือกที่อธิบายไว้ก่อนหน้าหรือทดสอบฟังก์ชันการตั้งเวลา
ทำความสะอาด
หากคุณทำตามตัวอย่างของเรา อย่าลืมหยุดชั่วคราวหรือลบกำหนดการงานโน้ตบุ๊กของคุณเพื่อหลีกเลี่ยงการเรียกเก็บเงินที่ต่อเนื่อง
สรุป
การนำโน้ตบุ๊กไปสู่การผลิตด้วยงานโน้ตบุ๊ก SageMaker ช่วยลดความยุ่งยากอย่างมากในการยกของหนักที่ไม่แตกต่างซึ่งต้องการโดยพนักงานข้อมูล ไม่ว่าคุณจะจัดตารางเวลาเวิร์กโฟลว์ ML แบบ end-to-end หรือชิ้นส่วนของจิ๊กซอว์ เราขอแนะนำให้คุณสร้างโน้ตบุ๊กในการผลิตโดยใช้ SageMaker Studio หรือ SageMaker Studio Lab! หากต้องการเรียนรู้เพิ่มเติมโปรดดู เวิร์กโฟลว์ที่ใช้โน้ตบุ๊ก.
เกี่ยวกับผู้แต่ง
ฌอน มอร์แกน เป็นสถาปนิกอาวุโส ML Solutions ที่ AWS เขามีประสบการณ์ในด้านเซมิคอนดักเตอร์และการวิจัยเชิงวิชาการ และใช้ประสบการณ์ของเขาเพื่อช่วยให้ลูกค้าบรรลุเป้าหมายใน AWS ในเวลาว่าง Sean เป็นผู้สนับสนุน/ผู้ดูแลโอเพ่นซอร์สที่เปิดใช้งานและเป็นหัวหน้ากลุ่มผลประโยชน์พิเศษสำหรับ TensorFlow Addons
สุเมธา สวามี เป็นผู้จัดการผลิตภัณฑ์หลักที่ Amazon Web Services เขานำทีม SageMaker Studio มาสร้างเป็น IDE ทางเลือกสำหรับวิทยาศาสตร์ข้อมูลเชิงโต้ตอบและเวิร์กโฟลว์วิศวกรรมข้อมูล เขาใช้เวลา 15 ปีที่ผ่านมาในการสร้างผลิตภัณฑ์สำหรับองค์กรและผู้บริโภคที่ยึดลูกค้าเป็นหลักโดยใช้การเรียนรู้ของเครื่อง ในเวลาว่างเขาชอบถ่ายภาพธรณีวิทยาที่น่าทึ่งของภาคตะวันตกเฉียงใต้ของอเมริกา
เอ็ดเวิร์ด ซัน เป็น SDE อาวุโสที่ทำงานให้กับ SageMaker Studio ที่ Amazon Web Services เขามุ่งเน้นไปที่การสร้างโซลูชัน ML แบบโต้ตอบและทำให้ประสบการณ์ของลูกค้าง่ายขึ้นเพื่อรวม SageMaker Studio เข้ากับเทคโนโลยียอดนิยมในวิศวกรรมข้อมูลและระบบนิเวศ ML ในเวลาว่าง เอ็ดเวิร์ดชื่นชอบการตั้งแคมป์ เดินป่า และตกปลา และชอบใช้เวลาอยู่กับครอบครัว
- AI
- ไอ อาร์ต
- เครื่องกำเนิดไออาร์ท
- หุ่นยนต์ไอ
- อเมซอน SageMaker
- สตูดิโอ Amazon SageMaker
- ปัญญาประดิษฐ์
- ใบรับรองปัญญาประดิษฐ์
- ปัญญาประดิษฐ์ในการธนาคาร
- หุ่นยนต์ปัญญาประดิษฐ์
- หุ่นยนต์ปัญญาประดิษฐ์
- ซอฟต์แวร์ปัญญาประดิษฐ์
- AWS Machine Learning AWS
- blockchain
- การประชุม blockchain ai
- เหรียญอัจฉริยะ
- ปัญญาประดิษฐ์สนทนา
- การประชุม crypto ai
- ดัล-อี
- การเรียนรู้ลึก ๆ
- google ai
- ระดับกลาง (200)
- เรียนรู้เครื่อง
- เพลโต
- เพลโตไอ
- เพลโตดาต้าอินเทลลิเจนซ์
- เกมเพลโต
- เพลโตดาต้า
- เพลโตเกม
- ขนาดไอ
- วากยสัมพันธ์
- ลมทะเล