การปรับปรุงความเสถียรและความยืดหยุ่นของท่อส่ง ML ที่นวัตกรรมบรรจุภัณฑ์ของ Amazon ด้วยท่อส่ง Amazon SageMaker

เผยแพร่ซ้ำโดยเพลโต

ผู้ติดตาม: 0

เพื่อสร้างความพึงพอใจให้กับลูกค้าและลดของเสียจากบรรจุภัณฑ์ให้เหลือน้อยที่สุด Amazon ต้องเลือกประเภทบรรจุภัณฑ์ที่เหมาะสมที่สุดสำหรับบรรจุภัณฑ์หลายพันล้านชิ้นที่จัดส่งทุกปี หากใช้การป้องกันน้อยเกินไปสำหรับสินค้าที่แตกหักง่าย เช่น แก้วกาแฟ สินค้านั้นจะได้รับความเสียหาย และ Amazon เสี่ยงต่อความไว้วางใจของลูกค้า การใช้การป้องกันมากเกินไปจะส่งผลให้ต้นทุนเพิ่มขึ้นและขยะรีไซเคิลเต็มถัง ด้วยผลิตภัณฑ์หลายร้อยล้านรายการ กลไกการตัดสินใจที่ปรับขนาดได้จึงเป็นสิ่งจำเป็นเพื่อเรียนรู้อย่างต่อเนื่องจากการทดสอบผลิตภัณฑ์และความคิดเห็นของลูกค้า

เพื่อแก้ปัญหาเหล่านี้ ทีมนวัตกรรมบรรจุภัณฑ์ของ Amazon ได้พัฒนาโมเดลการเรียนรู้ของเครื่อง (ML) ซึ่งจัดประเภทว่าผลิตภัณฑ์เหมาะสำหรับประเภทบรรจุภัณฑ์ของ Amazon เช่น จดหมาย ถุง หรือกล่อง หรือแม้แต่จัดส่งโดยไม่มีบรรจุภัณฑ์เพิ่มเติม ก่อนหน้านี้ ทีมงานได้พัฒนาไปป์ไลน์แบบกำหนดเองโดยอิงตาม ฟังก์ชันขั้นตอนของ AWS เพื่อดำเนินการฝึกอบรมรายสัปดาห์และงานอนุมานรายวันหรือรายเดือน อย่างไรก็ตาม เมื่อเวลาผ่านไป ไปป์ไลน์ไม่ได้ให้ความยืดหยุ่นเพียงพอที่จะเปิดตัวโมเดลด้วยสถาปัตยกรรมใหม่ การพัฒนาสำหรับไปป์ไลน์ใหม่ทำให้เกิดค่าใช้จ่ายและการประสานงานที่จำเป็นระหว่างนักวิทยาศาสตร์ข้อมูลและนักพัฒนา เพื่อเอาชนะปัญหาเหล่านี้และปรับปรุงความเร็วของการปรับใช้โมเดลและสถาปัตยกรรมใหม่ ทีมงานได้เลือกที่จะเตรียมการฝึกอบรมโมเดลและการอนุมานด้วย ท่อส่ง Amazon SageMaker.

ในโพสต์นี้ เราพูดถึงสถาปัตยกรรมการประสานการทำงานก่อนหน้านี้โดยอิงตาม Step Functions ร่างโครงสร้างการฝึกอบรมและการอนุมานโดยใช้ไปป์ไลน์ และเน้นย้ำถึงความยืดหยุ่นที่ทีม Amazon Packaging Innovation ทำได้

ความท้าทายของไปป์ไลน์ ML เดิมที่ Amazon Packaging Innovation

ในการรวมข้อเสนอแนะอย่างต่อเนื่องเกี่ยวกับประสิทธิภาพของแพ็คเกจ โมเดลใหม่จะได้รับการฝึกอบรมทุกสัปดาห์โดยใช้ฉลากที่เพิ่มขึ้นเรื่อยๆ การอนุมานสำหรับสินค้าคงคลังทั้งหมดของผลิตภัณฑ์จะดำเนินการเป็นรายเดือน และการอนุมานรายวันจะดำเนินการเพื่อส่งการคาดการณ์ที่ทันเวลาสำหรับสินค้าคงคลังที่เพิ่มใหม่

เพื่อให้กระบวนการฝึกอบรมแบบจำลองต่างๆ เป็นไปโดยอัตโนมัติและให้การคาดการณ์ ทีมงานได้พัฒนาไปป์ไลน์แบบกำหนดเองตาม Step Functions เพื่อจัดการขั้นตอนต่อไปนี้:

การเตรียมข้อมูลสำหรับงานฝึกอบรมและการอนุมานและการโหลดคำทำนายไปยังฐานข้อมูล (อเมซอน Redshift) ด้วย AWS กาว.
การฝึกแบบจำลองและการอนุมานด้วย อเมซอน SageMaker.
การคำนวณตัวชี้วัดประสิทธิภาพของแบบจำลองในชุดการตรวจสอบความถูกต้องด้วย ชุด AWS.
การใช้ อเมซอน ไดนาโมดีบี เพื่อจัดเก็บการกำหนดค่าแบบจำลอง (เช่น อัตราส่วนการแยกข้อมูลสำหรับการฝึกอบรมและการตรวจสอบ ตำแหน่งสิ่งประดิษฐ์ของแบบจำลอง ประเภทของแบบจำลอง และจำนวนอินสแตนซ์สำหรับการฝึกและการอนุมาน) ตัวชี้วัดประสิทธิภาพของแบบจำลอง และรุ่นล่าสุดของแบบจำลองที่ฝึกสำเร็จแล้ว
การคำนวณความแตกต่างในคะแนนประสิทธิภาพของแบบจำลอง การเปลี่ยนแปลงในการแจกแจงป้ายการฝึก และการเปรียบเทียบขนาดของข้อมูลที่ป้อนระหว่างรุ่นก่อนหน้าและรุ่นใหม่ด้วย AWS แลมบ์ดา ฟังก์ชั่น
ด้วยขั้นตอนจำนวนมาก ไปป์ไลน์ยังต้องการระบบเตือนภัยที่เชื่อถือได้ในแต่ละขั้นตอนเพื่อแจ้งเตือนผู้มีส่วนได้ส่วนเสียถึงปัญหาต่างๆ สำเร็จได้ด้วยการผสมผสานของ บริการ Amazon Simple Queue (Amazon SQS) และ บริการแจ้งเตือนแบบง่ายของ Amazon (อเมซอน SNS). การแจ้งเตือนถูกสร้างขึ้นเพื่อแจ้งผู้มีส่วนได้ส่วนเสียทางธุรกิจ นักวิทยาศาสตร์ข้อมูล และนักพัฒนาเกี่ยวกับขั้นตอนที่ล้มเหลวและการเบี่ยงเบนขนาดใหญ่ในแบบจำลองและข้อมูล

หลังจากใช้โซลูชันนี้มาเกือบ 2 ปีแล้ว ทีมงานตระหนักดีว่าการใช้งานนี้ทำงานได้ดีสำหรับเวิร์กโฟลว์ ML ทั่วไปซึ่งโมเดลเดียวได้รับการฝึกอบรมและให้คะแนนในชุดข้อมูลการตรวจสอบความถูกต้อง อย่างไรก็ตาม โซลูชันนี้ไม่ยืดหยุ่นเพียงพอสำหรับโมเดลที่ซับซ้อนและไม่ยืดหยุ่นต่อความล้มเหลว ตัวอย่างเช่น สถาปัตยกรรมไม่รองรับการฝึกโมเดลตามลำดับอย่างง่ายดาย เป็นการยากที่จะเพิ่มหรือลบขั้นตอนโดยไม่ต้องทำซ้ำไปป์ไลน์ทั้งหมดและแก้ไขโครงสร้างพื้นฐาน แม้แต่การเปลี่ยนแปลงง่ายๆ ในขั้นตอนการประมวลผลข้อมูล เช่น การปรับอัตราส่วนการแยกข้อมูลหรือการเลือกชุดคุณลักษณะต่างๆ ที่จำเป็นต้องมีการประสานงานร่วมกันจากทั้งนักวิทยาศาสตร์ข้อมูลและนักพัฒนา เมื่อไปป์ไลน์ล้มเหลวในทุกขั้นตอน จะต้องเริ่มต้นใหม่ตั้งแต่ต้น ซึ่งส่งผลให้มีการทำงานซ้ำและต้นทุนเพิ่มขึ้น เพื่อหลีกเลี่ยงการทำงานซ้ำๆ และต้องเริ่มต้นใหม่จากขั้นตอนที่ล้มเหลว ทีมงานจะสร้างสำเนาเครื่องสถานะแบบย่อขึ้นใหม่ การแก้ไขปัญหานี้นำไปสู่การเพิ่มจำนวนเครื่องในสถานะ โดยแต่ละรายการเริ่มต้นจากขั้นตอนที่ล้มเหลวโดยทั่วไป สุดท้าย หากงานฝึกอบรมพบความเบี่ยงเบนในการกระจายฉลาก คะแนนรุ่น หรือจำนวนป้ายกำกับ นักวิทยาศาสตร์ข้อมูลต้องตรวจสอบแบบจำลองและเมตริกด้วยตนเอง จากนั้นนักวิทยาศาสตร์ข้อมูลจะเข้าถึงตาราง DynamoDB ด้วยเวอร์ชันของโมเดลและอัปเดตตารางเพื่อให้แน่ใจว่ามีการใช้โมเดลที่ถูกต้องสำหรับงานอนุมานครั้งต่อไป

การบำรุงรักษาสถาปัตยกรรมนี้จำเป็นต้องมีทรัพยากรเฉพาะอย่างน้อยหนึ่งรายการและทรัพยากรเต็มเวลาเพิ่มเติมสำหรับการพัฒนา เนื่องจากความยากลำบากในการขยายไปป์ไลน์เพื่อรองรับกรณีการใช้งานใหม่ นักวิทยาศาสตร์ด้านข้อมูลจึงได้เริ่มพัฒนาเวิร์กโฟลว์ของตนเอง ซึ่งนำไปสู่ฐานโค้ดที่เติบโตขึ้น ตารางข้อมูลหลายตารางที่มีรูปแบบข้อมูลที่คล้ายกัน และการตรวจสอบโมเดลแบบกระจายศูนย์ การสะสมของปัญหาเหล่านี้ส่งผลให้ประสิทธิภาพการทำงานของทีมลดลงและค่าโสหุ้ยเพิ่มขึ้น

เพื่อจัดการกับความท้าทายเหล่านี้ ทีม Amazon Packaging Innovation ได้ประเมินโซลูชันอื่นๆ ที่มีอยู่สำหรับ MLOps รวมถึง SageMaker Pipelines (ประกาศวางจำหน่ายเดือนธันวาคม 2020). ไปป์ไลน์คือความสามารถของ SageMaker สำหรับการสร้าง จัดการ ทำให้เป็นอัตโนมัติ และปรับขนาดเวิร์กโฟลว์ ML ตั้งแต่ต้นทางถึงปลายทาง ไปป์ไลน์ช่วยให้คุณลดจำนวนขั้นตอนในเวิร์กโฟลว์ ML ทั้งหมด และมีความยืดหยุ่นเพียงพอที่จะอนุญาตให้นักวิทยาศาสตร์ข้อมูลกำหนดเวิร์กโฟลว์ ML ที่กำหนดเองได้ จะดูแลการตรวจสอบและการบันทึกขั้นตอน นอกจากนี้ยังมาพร้อมกับรีจีสทรีแบบจำลองที่กำหนดเวอร์ชันใหม่โดยอัตโนมัติ การลงทะเบียนแบบจำลองมีเวิร์กโฟลว์การอนุมัติในตัวเพื่อเลือกแบบจำลองสำหรับการอนุมานในการผลิต ไปป์ไลน์ยังอนุญาตให้แคชขั้นตอนการเรียกด้วยอาร์กิวเมนต์เดียวกัน หากพบการรันครั้งก่อน แคชจะถูกสร้างขึ้น ซึ่งช่วยให้สามารถรีสตาร์ทได้ง่าย แทนที่จะคำนวณขั้นตอนที่เสร็จสมบูรณ์ใหม่อีกครั้ง

ในกระบวนการประเมิน Pipelines โดดเด่นจากโซลูชันอื่นๆ ในด้านความยืดหยุ่นและความพร้อมใช้งานของฟีเจอร์สำหรับการสนับสนุนและขยายเวิร์กโฟลว์ปัจจุบันและอนาคต การเปลี่ยนไปใช้ Pipelines ช่วยเพิ่มเวลาของนักพัฒนาจากการบำรุงรักษาแพลตฟอร์มและการแก้ไขปัญหา และเปลี่ยนเส้นทางความสนใจไปที่การเพิ่มคุณสมบัติใหม่ ในโพสต์นี้ เรานำเสนอการออกแบบสำหรับเวิร์กโฟลว์การฝึกอบรมและการอนุมานที่ทีม Amazon Packaging Innovation โดยใช้ไปป์ไลน์ เรายังหารือเกี่ยวกับประโยชน์และการลดต้นทุนที่ทีมได้รับจากการเปลี่ยนไปใช้ไปป์ไลน์

ไปป์ไลน์การฝึกอบรม

ทีมงาน Amazon Packaging Innovation ฝึกฝนโมเดลสำหรับบรรจุภัณฑ์ทุกประเภทโดยใช้ฉลากที่เพิ่มขึ้นเรื่อยๆ ไดอะแกรมต่อไปนี้สรุปกระบวนการทั้งหมด

เวิร์กโฟลว์เริ่มต้นด้วยการแยกป้ายกำกับและคุณสมบัติจากฐานข้อมูล Amazon Redshift และยกเลิกการโหลดข้อมูลไปที่ บริการจัดเก็บข้อมูลอย่างง่ายของ Amazon (Amazon S3) ผ่านงานการแยก การแปลง และโหลดตามกำหนดเวลา (ETL) นอกจากข้อมูลที่ป้อนเข้าแล้ว อ็อบเจ็กต์ไฟล์ที่มีประเภทโมเดลและพารามิเตอร์จะถูกวางไว้ในบัคเก็ต S3 ไฟล์นี้ทำหน้าที่เป็นทริกเกอร์ไปป์ไลน์ผ่านฟังก์ชันแลมบ์ดา

ขั้นตอนต่อไปสามารถปรับแต่งได้อย่างสมบูรณ์และกำหนดโดยนักวิทยาศาสตร์ข้อมูลโดยใช้ SageMaker Python SDK สำหรับไปป์ไลน์ ในสถานการณ์ที่เรานำเสนอในโพสต์นี้ ข้อมูลที่ป้อนเข้าจะถูกแบ่งออกเป็นชุดการฝึกอบรมและการตรวจสอบ และบันทึกไว้ในบัคเก็ต S3 โดยเริ่มงาน SageMaker Processing

เมื่อข้อมูลพร้อมใน Amazon S3 งานฝึกอบรม SageMaker จะเริ่มต้นขึ้น หลังจากฝึกและสร้างแบบจำลองสำเร็จแล้ว ขั้นตอนการประเมินแบบจำลองจะดำเนินการกับข้อมูลการตรวจสอบความถูกต้องผ่านงานการแปลงชุดงาน SageMaker ตัววัดแบบจำลองจะถูกเปรียบเทียบกับตัววัดแบบจำลองของสัปดาห์ก่อนหน้าโดยใช้งาน SageMaker Processing ทีมงานได้กำหนดเกณฑ์ที่กำหนดเองไว้หลายเกณฑ์สำหรับการประเมินความเบี่ยงเบนในประสิทธิภาพของแบบจำลอง โมเดลถูกปฏิเสธหรืออนุมัติตามเกณฑ์เหล่านี้ ถ้าแบบจำลองถูกปฏิเสธ โมเดลที่อนุมัติก่อนหน้านี้จะถูกใช้สำหรับงานอนุมานครั้งต่อไป หากโมเดลได้รับการอนุมัติ เวอร์ชันของโมเดลจะถูกลงทะเบียนและโมเดลนั้นจะใช้สำหรับงานอนุมาน ผู้มีส่วนได้เสียได้รับการแจ้งเตือนเกี่ยวกับผลลัพธ์ผ่าน อเมซอน คลาวด์วอตช์ สัญญาณเตือน

ภาพหน้าจอต่อไปนี้จาก สตูดิโอ Amazon SageMaker แสดงขั้นตอนของไปป์ไลน์การฝึกอบรม

ไปป์ไลน์จะติดตามการทำงานของไปป์ไลน์แต่ละรายการ ซึ่งคุณตรวจสอบได้ใน Studio หรือคุณสามารถสอบถามความคืบหน้าของการวิ่งโดยใช้ โบโต3 หรือ อินเทอร์เฟซบรรทัดคำสั่ง AWS AWS (AWS CLI). คุณเห็นภาพเมตริกโมเดลใน Studio และเปรียบเทียบเวอร์ชันต่างๆ ของโมเดลได้

ไปป์ไลน์การอนุมาน

ทีมนวัตกรรมบรรจุภัณฑ์ของ Amazon จะรีเฟรชการคาดการณ์สำหรับสินค้าคงคลังทั้งหมดของผลิตภัณฑ์ทุกเดือน การคาดการณ์รายวันถูกสร้างขึ้นเพื่อให้คำแนะนำบรรจุภัณฑ์ที่ทันเวลาสำหรับสินค้าคงคลังที่เพิ่มใหม่โดยใช้แบบจำลองที่ผ่านการฝึกอบรมล่าสุด สิ่งนี้ต้องการให้ไปป์ไลน์การอนุมานทำงานทุกวันด้วยปริมาณข้อมูลที่แตกต่างกัน ไดอะแกรมต่อไปนี้แสดงเวิร์กโฟลว์นี้

เช่นเดียวกับไปป์ไลน์การฝึกอบรม การอนุมานเริ่มต้นด้วยการยกเลิกการโหลดข้อมูลจาก Amazon Redshift ไปยังบัคเก็ต S3 ออบเจ็กต์ไฟล์ที่วางไว้ใน Amazon S3 จะทริกเกอร์ฟังก์ชัน Lambda ที่เริ่มต้นไปป์ไลน์การอนุมาน มีการเตรียมคุณสมบัติสำหรับการอนุมานและข้อมูลจะถูกแบ่งออกเป็นไฟล์ที่มีขนาดเหมาะสมโดยใช้งาน SageMaker Processing ถัดไป ไปป์ไลน์ระบุโมเดลที่ได้รับอนุมัติล่าสุดเพื่อเรียกใช้การคาดการณ์และโหลดไปยังบัคเก็ต S3 สุดท้าย การคาดคะเนจะถูกโหลดกลับไปที่ Amazon Redshift โดยใช้ boto3-data API ภายในงาน SageMaker Processing

ภาพหน้าจอต่อไปนี้จาก Studio แสดงรายละเอียดไปป์ไลน์การอนุมาน

ประโยชน์ของการเลือกสถาปนิกเวิร์กโฟลว์ ML ด้วย SageMaker Pipelines

ในส่วนนี้ เราจะหารือเกี่ยวกับผลประโยชน์ที่ทีม Amazon Packaging Innovation ได้รับจากการเปลี่ยนไปใช้ไปป์ไลน์สำหรับการฝึกโมเดลและการอนุมาน

คุณสมบัติ MLOps ระดับการผลิตที่พร้อมใช้งานทันที

ขณะเปรียบเทียบโซลูชันภายในและภายนอกที่แตกต่างกันสำหรับโซลูชันไปป์ไลน์ ML ถัดไป นักวิทยาศาสตร์ข้อมูลคนเดียวสามารถสร้างต้นแบบและพัฒนาเวิร์กโฟลว์ ML เวอร์ชันเต็มด้วยไปป์ไลน์ในสภาพแวดล้อม Studio Jupyter ได้ในเวลาน้อยกว่า 3 สัปดาห์ แม้แต่ในขั้นตอนการสร้างต้นแบบ ก็เห็นได้ชัดว่าไปป์ไลน์ได้จัดเตรียมส่วนประกอบโครงสร้างพื้นฐานที่จำเป็นทั้งหมดที่จำเป็นสำหรับเวิร์กโฟลว์ระดับการผลิต: การกำหนดเวอร์ชันโมเดล การแคช และการเตือน ความพร้อมใช้งานของคุณสมบัติเหล่านี้ในทันทีหมายความว่าจะไม่ต้องเสียเวลาเพิ่มเติมในการพัฒนาและปรับแต่งคุณสมบัติเหล่านี้ นี่เป็นการแสดงให้เห็นอย่างชัดเจนถึงคุณค่า ซึ่งทำให้ทีม Amazon Packaging Innovation เชื่อมั่นว่า Pipelines เป็นโซลูชันที่เหมาะสม

ความยืดหยุ่นในการพัฒนาโมเดล ML

ประโยชน์ที่ใหญ่ที่สุดสำหรับนักวิทยาศาสตร์ข้อมูลในทีมคือความสามารถในการทดลองอย่างง่ายดายและทำซ้ำผ่านแบบจำลองต่างๆ ไม่ว่าพวกเขาจะชอบเฟรมเวิร์กใดสำหรับงาน ML และจำนวนขั้นตอนและฟีเจอร์ที่เกี่ยวข้องก็ตาม Pipelines ก็ตอบสนองความต้องการของพวกเขาได้ นักวิทยาศาสตร์ข้อมูลได้รับอำนาจในการทดลองโดยไม่ต้องรอเพื่อเริ่มต้นการพัฒนาซอฟต์แวร์เพื่อเพิ่มคุณสมบัติหรือขั้นตอนเพิ่มเติม

ลดต้นทุน

ความสามารถของไปป์ไลน์ของ SageMaker คือ ฟรี: คุณจ่ายเฉพาะทรัพยากรการประมวลผลและพื้นที่เก็บข้อมูลที่เกี่ยวข้องกับการฝึกอบรมและการอนุมาน อย่างไรก็ตาม เมื่อคิดถึงต้นทุน คุณจำเป็นต้องพิจารณาไม่เพียงแต่สำหรับค่าบริการที่ใช้ แต่ยังรวมถึงชั่วโมงของนักพัฒนาที่จำเป็นในการรักษาเวิร์กโฟลว์ ดีบัก และแพตช์ การประสานด้วย Pipelines นั้นง่ายกว่าเพราะประกอบด้วยชิ้นส่วนและโครงสร้างพื้นฐานที่คุ้นเคยน้อยลง ก่อนหน้านี้ การเพิ่มคุณสมบัติใหม่จำเป็นต้องมีอย่างน้อยสองคน (นักวิทยาศาสตร์ข้อมูลและวิศวกรซอฟต์แวร์) ที่ทีม Amazon Packaging Innovation เพื่อนำไปใช้ ด้วยไปป์ไลน์ที่ออกแบบใหม่ ความพยายามด้านวิศวกรรมจึงมุ่งตรงไปยังโครงสร้างพื้นฐานที่กำหนดเองเพิ่มเติมรอบไปป์ไลน์ เช่น การสร้างที่เก็บเดียวสำหรับการติดตามโค้ดการเรียนรู้ของเครื่อง การทำให้โมเดลปรับใช้ในบัญชี AWS ต่างๆ ง่ายขึ้น การพัฒนางาน ETL ที่ผสานรวมและทั่วไป ฟังก์ชั่นที่ใช้ซ้ำได้

ความสามารถในการแคชขั้นตอนด้วยอินพุตที่คล้ายกันยังช่วยลดต้นทุน เนื่องจากทีมงานมีโอกาสน้อยที่จะเรียกใช้ไปป์ไลน์ทั้งหมดอีกครั้ง พวกเขาสามารถเริ่มต้นได้อย่างง่ายดายจากจุดที่ล้มเหลวแทน

สรุป

ทีมงาน Amazon Packaging Innovation ฝึกโมเดล ML เป็นรายเดือน และอัปเดตการคาดการณ์สำหรับประเภทบรรจุภัณฑ์ของผลิตภัณฑ์ที่แนะนำเป็นประจำ คำแนะนำเหล่านี้ช่วยให้พวกเขาบรรลุเป้าหมายทั่วทั้งทีมและทั่วทั้งบริษัทโดยการลดของเสียและทำให้ลูกค้าพึงพอใจกับคำสั่งซื้อแต่ละรายการ ไปป์ไลน์การฝึกอบรมและการอนุมานต้องทำงานอย่างน่าเชื่อถือเป็นประจำ แต่ยังช่วยให้สามารถปรับปรุงโมเดลได้อย่างต่อเนื่อง

การเปลี่ยนไปใช้ไปป์ไลน์ช่วยให้ทีมปรับใช้สถาปัตยกรรมโมเดลหลายโมดอลใหม่สี่รูปแบบเพื่อใช้งานจริงได้ภายใน 2 เดือน การปรับใช้โมเดลใหม่โดยใช้สถาปัตยกรรมก่อนหน้าจะต้องใช้เวลา 5 วัน (ด้วยสถาปัตยกรรมโมเดลเดียวกัน) ถึง 1 เดือน (ด้วยสถาปัตยกรรมโมเดลใหม่) การปรับใช้โมเดลเดียวกันโดยใช้ไปป์ไลน์ทำให้ทีมสามารถลดเวลาในการพัฒนาลงเหลือ 4 ชั่วโมงด้วยสถาปัตยกรรมโมเดลเดียวกัน และ 5 วันด้วยสถาปัตยกรรมโมเดลใหม่ ซึ่งประเมินว่าสามารถประหยัดได้เกือบ 80% ของชั่วโมงการทำงาน

แหล่งข้อมูลเพิ่มเติม

สำหรับข้อมูลเพิ่มเติม โปรดดูแหล่งข้อมูลต่อไปนี้:

เกี่ยวกับผู้เขียน

อังกูร ชุกละ เป็นหัวหน้านักวิทยาศาสตร์ข้อมูลของ AWS-ProServe ในเมืองพาโลอัลโต Ankur มีประสบการณ์การให้คำปรึกษามากกว่า 15 ปีในการทำงานโดยตรงกับลูกค้าและช่วยแก้ปัญหาทางธุรกิจด้วยเทคโนโลยี เขาเป็นผู้นำด้านวิทยาศาสตร์ประยุกต์ระดับโลกและการริเริ่ม ML-Ops ภายใน AWS ในเวลาว่าง เขาชอบอ่านหนังสือและใช้เวลาอยู่กับครอบครัว

อาคัช สิงห์ลา เป็น Sr. System Dev Engineer กับทีม Amazon Packaging Innovation เขามีประสบการณ์มากกว่า 17 ปีในการแก้ปัญหาทางธุรกิจที่สำคัญผ่านเทคโนโลยีสำหรับธุรกิจหลายประเภท ปัจจุบันเขามุ่งเน้นไปที่การอัปเกรดโครงสร้างพื้นฐานของ NAWS สำหรับแอปพลิเคชันที่เน้นบรรจุภัณฑ์ที่หลากหลายเพื่อปรับขนาดให้ดียิ่งขึ้น

วิทาลินา โคมาชโก เป็นนักวิทยาศาสตร์ข้อมูลที่มี AWS Professional Services เธอจบปริญญาเอกด้านเภสัชวิทยาและพิษวิทยา แต่เปลี่ยนจากงานทดลองมาเป็นวิทยาศาสตร์ข้อมูลเพราะเธอต้องการ "เป็นเจ้าของการสร้างข้อมูลและการตีความผลลัพธ์" ก่อนหน้านี้ในอาชีพการงานของเธอ เธอทำงานกับบริษัทเทคโนโลยีชีวภาพและยา ที่ AWS เธอสนุกกับการแก้ปัญหาให้กับลูกค้าจากหลากหลายอุตสาหกรรมและเรียนรู้เกี่ยวกับความท้าทายที่ไม่เหมือนใคร

ประสันต์ เมยัปปาน เป็นนักวิทยาศาสตร์ประยุกต์อาวุโสที่มีนวัตกรรมบรรจุภัณฑ์ของ Amazon มากว่า 4 ปี เขามีประสบการณ์ในอุตสาหกรรมแมชชีนเลิร์นนิงมากกว่า 6 ปี และได้จัดส่งผลิตภัณฑ์เพื่อปรับปรุงประสบการณ์การค้นหาของลูกค้าและปรับปรุงประสบการณ์บรรจุภัณฑ์ของลูกค้า Prasanth หลงใหลเกี่ยวกับความยั่งยืนและสำเร็จการศึกษาระดับปริญญาเอกด้านการสร้างแบบจำลองทางสถิติของการเปลี่ยนแปลงสภาพภูมิอากาศ

แมทธิว เบลส์ เป็นนักวิทยาศาสตร์การวิจัยอาวุโสที่ทำงานเพื่อเพิ่มประสิทธิภาพการเลือกประเภทแพ็คเกจโดยใช้คำติชมของลูกค้าและการเรียนรู้ของเครื่อง ก่อนหน้าที่จะทำงานกับ Amazon นั้น Matt ทำงานเป็น post doc ที่ทำการจำลองฟิสิกส์อนุภาคในเยอรมนีและในชีวิตก่อนหน้านี้เป็นผู้จัดการฝ่ายผลิตอุปกรณ์รากฟันเทียมทางการแพทย์ที่มีกัมมันตภาพรังสีในการเริ่มต้น เขาถือปริญญาเอก สาขาฟิสิกส์จากมหาวิทยาลัยมิชิแกน

ประทับเวลา: November 3, 2022November 5, 2022

ประทับเวลา: กันยายน 30, 2022

ปรับปรุงความเสถียรและความยืดหยุ่นของไปป์ไลน์ ML ที่ Amazon Packaging Innovation ด้วย Amazon SageMaker Pipelines

เผยแพร่ซ้ำโดยเพลโต

ความท้าทายของไปป์ไลน์ ML เดิมที่ Amazon Packaging Innovation

ไปป์ไลน์การฝึกอบรม

ไปป์ไลน์การอนุมาน

ประโยชน์ของการเลือกสถาปนิกเวิร์กโฟลว์ ML ด้วย SageMaker Pipelines

คุณสมบัติ MLOps ระดับการผลิตที่พร้อมใช้งานทันที

ความยืดหยุ่นในการพัฒนาโมเดล ML

ลดต้นทุน

สรุป

แหล่งข้อมูลเพิ่มเติม

เกี่ยวกับผู้เขียน

เพิ่มเติมจาก AWS Machine Learning AWS

ใหม่ – ความสามารถ AI ที่สร้างแบบไม่ต้องใช้โค้ดพร้อมใช้งานแล้วใน Amazon SageMaker Canvas | อเมซอนเว็บเซอร์วิส

ฝึกโครงข่ายประสาทเทียมใหม่โดยอัตโนมัติด้วย Renate

สร้างไปป์ไลน์การแนะนำแบบกลุ่มโดยใช้ Amazon Personalize โดยไม่ต้องใช้โค้ด

จัดเรียงการถอดเสียงเป็นย่อหน้าด้วย Amazon Transcribe | บริการเว็บอเมซอน

การเปิดใช้งานเวิร์กโฟลว์ ML แบบไฮบริดบน Amazon EKS และ Amazon SageMaker ด้วย Kubeflow เพียงคลิกเดียวในการปรับใช้ AWS

ฝึกฝนและปรับใช้โมเดล ML ในสภาพแวดล้อมมัลติคลาวด์โดยใช้ Amazon SageMaker | อเมซอนเว็บเซอร์วิส

การคาดการณ์รายได้ขนาดใหญ่ที่ Bosch ด้วยโมเดลแบบกำหนดเองของ Amazon Forecast และ Amazon SageMaker

การติดฉลากล่วงหน้า PDF อัตโนมัติสำหรับ Amazon Comprehend | อเมซอนเว็บเซอร์วิส

การจัดการแรงกดดันจากการแข่งขันบุนเดสลีกา: การประเมินการแสดงของผู้เล่นในสถานการณ์ที่มีความกดดันสูงบน AWS

เกี่ยวกับเรา

การค้นหาแนวตั้ง & Ai

ระบบปฏิบัติการ

การติดต่อ

ลงชื่อเข้าใช้