Getir ลดระยะเวลาการฝึกอบรมโมเดลลง 90% ด้วย Amazon SageMaker และ AWS Batch ได้อย่างไร อเมซอนเว็บเซอร์วิส

เผยแพร่ซ้ำโดยเพลโต

ผู้ติดตาม: 0

นี่คือโพสต์รับเชิญที่ร่วมเขียนโดย Nafi Ahmet Turgut, Hasan Burak Yel และ Damla Šentürk จาก Getir

ก่อตั้งขึ้นในปี 2015, นำ ได้วางตำแหน่งตัวเองเป็นผู้บุกเบิกในด้านการจัดส่งของชำที่รวดเร็วเป็นพิเศษ บริษัทเทคโนโลยีที่เป็นนวัตกรรมนี้ได้ปฏิวัติกลุ่มการจัดส่งแบบ Last-Mile ด้วยการนำเสนอ "ของชำในไม่กี่นาที" ที่น่าสนใจ ด้วยการปรากฏตัวทั่วตุรกี สหราชอาณาจักร เนเธอร์แลนด์ เยอรมนี และสหรัฐอเมริกา Getir ได้กลายเป็นกำลังข้ามชาติที่ต้องคำนึงถึง ปัจจุบัน แบรนด์ Getir เป็นตัวแทนของกลุ่มบริษัทที่มีความหลากหลายซึ่งครอบคลุมธุรกิจแนวดิ่งที่แตกต่างกัน XNUMX แห่ง โดยทั้งหมดทำงานร่วมกันภายใต้ร่มเงาเดียว

ในโพสต์นี้ เราจะอธิบายวิธีที่เราสร้างไปป์ไลน์การคาดการณ์หมวดหมู่ผลิตภัณฑ์แบบครบวงจรเพื่อช่วยทีมเชิงพาณิชย์โดยใช้ อเมซอน SageMaker และ ชุด AWSลดระยะเวลาการฝึกโมเดลลง 90%

การทำความเข้าใจการเลือกสรรผลิตภัณฑ์ที่มีอยู่ของเราอย่างละเอียดถือเป็นความท้าทายที่สำคัญที่เราและธุรกิจจำนวนมากต้องเผชิญในตลาดที่มีการแข่งขันอย่างรวดเร็วและมีการแข่งขันสูงในปัจจุบัน วิธีแก้ปัญหาที่มีประสิทธิภาพสำหรับปัญหานี้คือการทำนายหมวดหมู่ผลิตภัณฑ์ โมเดลที่สร้างแผนผังหมวดหมู่ที่ครอบคลุมช่วยให้ทีมการค้าของเราสามารถเปรียบเทียบพอร์ตโฟลิโอผลิตภัณฑ์ที่มีอยู่ของเรากับผลิตภัณฑ์ของคู่แข่งของเรา โดยเสนอข้อได้เปรียบเชิงกลยุทธ์ ดังนั้นความท้าทายหลักของเราคือการสร้างและการนำแบบจำลองการคาดการณ์หมวดหมู่ผลิตภัณฑ์ที่แม่นยำไปใช้

เราใช้ประโยชน์จากเครื่องมืออันทรงพลังที่ AWS มอบให้เพื่อรับมือกับความท้าทายนี้และนำทางขอบเขตการเรียนรู้ของเครื่อง (ML) ที่ซับซ้อนและการวิเคราะห์เชิงคาดการณ์ที่ซับซ้อนได้อย่างมีประสิทธิภาพ ความพยายามของเรานำไปสู่การสร้างไปป์ไลน์การคาดการณ์หมวดหมู่ผลิตภัณฑ์แบบครบวงจรที่ประสบความสำเร็จ ซึ่งรวมเอาจุดแข็งของ SageMaker และ AWS Batch เข้าด้วยกัน

ความสามารถในการวิเคราะห์เชิงคาดการณ์นี้ โดยเฉพาะอย่างยิ่งการคาดการณ์ประเภทผลิตภัณฑ์ที่แม่นยำ ได้รับการพิสูจน์แล้วว่ามีคุณค่าอย่างยิ่ง ช่วยให้ทีมงานของเราได้รับข้อมูลเชิงลึกที่สำคัญซึ่งช่วยเพิ่มประสิทธิภาพการจัดการสินค้าคงคลัง ปรับปรุงการโต้ตอบกับลูกค้า และทำให้สถานะทางการตลาดของเราแข็งแกร่งขึ้น

วิธีการที่เราอธิบายในโพสต์นี้มีตั้งแต่ระยะเริ่มต้นของการรวบรวมชุดคุณลักษณะไปจนถึงการใช้งานขั้นสุดท้ายของไปป์ไลน์การคาดการณ์ สิ่งสำคัญในกลยุทธ์ของเราคือการใช้ SageMaker และ AWS Batch เพื่อปรับแต่งโมเดล BERT ที่ได้รับการฝึกอบรมล่วงหน้าสำหรับเจ็ดภาษาที่แตกต่างกัน นอกจากนี้ การผสานรวมอย่างราบรื่นของเรากับบริการพื้นที่จัดเก็บออบเจ็กต์ของ AWS บริการจัดเก็บข้อมูลอย่างง่ายของ Amazon (Amazon S3) เป็นกุญแจสำคัญในการจัดเก็บและเข้าถึงโมเดลที่ได้รับการปรับปรุงเหล่านี้อย่างมีประสิทธิภาพ

SageMaker เป็นบริการ ML ที่มีการจัดการเต็มรูปแบบ ด้วย SageMaker นักวิทยาศาสตร์ข้อมูลและนักพัฒนาสามารถสร้างและฝึกฝนโมเดล ML ได้อย่างรวดเร็วและง่ายดาย จากนั้นปรับใช้ในสภาพแวดล้อมที่โฮสต์พร้อมสำหรับการผลิตโดยตรง

ในฐานะบริการที่มีการจัดการเต็มรูปแบบ AWS Batch ช่วยให้คุณรันปริมาณงานการประมวลผลเป็นชุดทุกขนาด AWS Batch จัดเตรียมทรัพยากรการประมวลผลโดยอัตโนมัติและเพิ่มประสิทธิภาพการกระจายปริมาณงานตามปริมาณและขนาดของปริมาณงาน ด้วย AWS Batch คุณไม่จำเป็นต้องติดตั้งหรือจัดการซอฟต์แวร์การประมวลผลเป็นชุด ดังนั้นคุณจึงสามารถมุ่งเน้นไปที่การวิเคราะห์ผลลัพธ์และการแก้ปัญหาได้ เราใช้งาน GPU ที่ช่วยเรารันงานที่ใช้ GPU ของอินสแตนซ์

ภาพรวมของโซลูชัน

ห้าคนจากทีมวิทยาศาสตร์ข้อมูลและทีมโครงสร้างพื้นฐานของ Getir ทำงานร่วมกันในโครงการนี้ โปรเจ็กต์นี้แล้วเสร็จภายในหนึ่งเดือนและนำไปใช้งานจริงหลังจากการทดสอบหนึ่งสัปดาห์

ไดอะแกรมต่อไปนี้แสดงสถาปัตยกรรมของโซลูชัน

วิธีที่ Getir ลดระยะเวลาการฝึกโมเดลลง 90% ด้วย Amazon SageMaker และ AWS Batch | Amazon Web Services PlatoBlockchain ข้อมูลอัจฉริยะ ค้นหาแนวตั้ง AI.

ไปป์ไลน์แบบจำลองจะดำเนินการแยกกันสำหรับแต่ละประเทศ สถาปัตยกรรมประกอบด้วยงาน cron AWS Batch GPU สองงานสำหรับแต่ละประเทศ ซึ่งทำงานตามกำหนดเวลาที่กำหนด

เราเอาชนะความท้าทายบางอย่างด้วยการปรับใช้ทรัพยากร SageMaker และ AWS Batch GPU อย่างมีกลยุทธ์ กระบวนการที่ใช้ในการแก้ไขปัญหาแต่ละอย่างมีรายละเอียดอยู่ในส่วนต่อไปนี้

ปรับแต่งโมเดล BERT หลายภาษาอย่างละเอียดด้วยงาน AWS Batch GPU

เราค้นหาโซลูชันเพื่อรองรับหลายภาษาสำหรับฐานผู้ใช้ที่หลากหลายของเรา โมเดล BERT เป็นตัวเลือกที่ชัดเจนเนื่องจากความสามารถในการจัดการงานภาษาธรรมชาติที่ซับซ้อนได้อย่างมีประสิทธิภาพ เพื่อปรับแต่งโมเดลเหล่านี้ให้ตรงกับความต้องการของเรา เราได้ควบคุมพลังของ AWS โดยใช้งานอินสแตนซ์ GPU โหนดเดียว สิ่งนี้ทำให้เราสามารถปรับแต่งโมเดล BERT ที่ได้รับการฝึกอบรมล่วงหน้าสำหรับแต่ละภาษาจากเจ็ดภาษาที่เราต้องการการสนับสนุน ด้วยวิธีการนี้ เรารับประกันความแม่นยำสูงในการทำนายหมวดหมู่ผลิตภัณฑ์ และเอาชนะอุปสรรคด้านภาษาที่อาจเกิดขึ้นได้

พื้นที่จัดเก็บโมเดลที่มีประสิทธิภาพโดยใช้ Amazon S3

ขั้นตอนต่อไปของเราคือการจัดการกับการจัดเก็บและการจัดการโมเดล ด้วยเหตุนี้ เราจึงเลือก Amazon S3 ซึ่งขึ้นชื่อเรื่องความสามารถในการปรับขนาดและความปลอดภัย การจัดเก็บโมเดล BERT ที่ได้รับการปรับแต่งอย่างดีของเราบน Amazon S3 ช่วยให้เราสามารถเข้าถึงทีมต่างๆ ภายในองค์กรของเราได้อย่างง่ายดาย จึงทำให้กระบวนการปรับใช้ของเราคล่องตัวขึ้นอย่างมาก นี่เป็นส่วนสำคัญในการบรรลุความคล่องตัวในการดำเนินงานของเรา และการบูรณาการความพยายามด้าน ML ของเราอย่างราบรื่น

การสร้างไปป์ไลน์การคาดการณ์แบบครบวงจร

จำเป็นต้องมีไปป์ไลน์ที่มีประสิทธิภาพเพื่อใช้งานโมเดลที่ได้รับการฝึกอบรมล่วงหน้าของเราให้เกิดประโยชน์สูงสุด ก่อนอื่นเราได้ปรับใช้โมเดลเหล่านี้บน SageMaker ซึ่งเป็นการดำเนินการที่อนุญาตให้มีการคาดการณ์แบบเรียลไทม์โดยมีเวลาแฝงต่ำ จึงช่วยปรับปรุงประสบการณ์ผู้ใช้ของเรา สำหรับการคาดการณ์แบตช์ขนาดใหญ่ซึ่งมีความสำคัญเท่าเทียมกันต่อการดำเนินงานของเรา เราได้ใช้งาน AWS Batch GPU สิ่งนี้ทำให้มั่นใจได้ถึงการใช้ทรัพยากรของเราให้เกิดประโยชน์สูงสุด ทำให้เราได้รับความสมดุลที่สมบูรณ์แบบระหว่างประสิทธิภาพและประสิทธิผล

สำรวจความเป็นไปได้ในอนาคตด้วย SageMaker MME

ขณะที่เราพัฒนาและแสวงหาประสิทธิภาพในไปป์ไลน์ ML ของเราอย่างต่อเนื่อง แนวทางหนึ่งที่เรากระตือรือร้นที่จะสำรวจคือการใช้จุดสิ้นสุดหลายโมเดล (MME) ของ SageMaker เพื่อปรับใช้โมเดลที่ได้รับการปรับแต่งอย่างละเอียดของเรา ด้วย MME เราจึงสามารถปรับปรุงการปรับใช้โมเดลที่ได้รับการปรับแต่งอย่างละเอียดต่างๆ ได้ ทำให้มั่นใจได้ถึงการจัดการโมเดลที่มีประสิทธิภาพ ขณะเดียวกันก็ได้รับประโยชน์จากความสามารถดั้งเดิมของ SageMaker เช่น ตัวแปรเงา การปรับขนาดอัตโนมัติ และ อเมซอน คลาวด์วอตช์ บูรณาการ การสำรวจนี้สอดคล้องกับการแสวงหาอย่างต่อเนื่องของเราในการเพิ่มขีดความสามารถในการวิเคราะห์เชิงคาดการณ์และการมอบประสบการณ์ที่เหนือกว่าแก่ลูกค้าของเรา

สรุป

การผสานรวม SageMaker และ AWS Batch ที่ประสบความสำเร็จของเราไม่เพียงแต่จัดการกับความท้าทายเฉพาะของเราเท่านั้น แต่ยังช่วยเพิ่มประสิทธิภาพการดำเนินงานของเราอย่างมากอีกด้วย ด้วยการใช้ไปป์ไลน์การคาดการณ์หมวดหมู่ผลิตภัณฑ์ที่ซับซ้อน เราจึงสามารถเสริมศักยภาพทีมการค้าของเราด้วยข้อมูลเชิงลึกที่ขับเคลื่อนด้วยข้อมูล ซึ่งจะช่วยอำนวยความสะดวกในการตัดสินใจที่มีประสิทธิภาพมากขึ้น

ผลลัพธ์ของเราบ่งบอกถึงประสิทธิผลของแนวทางของเรามากมาย เราได้รับความแม่นยำในการคาดการณ์ถึง 80% จากรายละเอียดหมวดหมู่ทั้งสี่ระดับ ซึ่งมีบทบาทสำคัญในการกำหนดรูปแบบการจัดประเภทผลิตภัณฑ์สำหรับแต่ละประเทศที่เราให้บริการ ความแม่นยำระดับนี้ขยายขอบเขตการเข้าถึงของเราให้ก้าวข้ามอุปสรรคทางภาษา และรับประกันว่าเราตอบสนองฐานผู้ใช้ที่หลากหลายของเราด้วยความแม่นยำสูงสุด

ยิ่งไปกว่านั้น ด้วยการใช้งาน AWS Batch GPU ที่กำหนดเวลาไว้อย่างมีกลยุทธ์ เราจึงสามารถลดระยะเวลาการฝึกโมเดลของเราลงได้ถึง 90% ประสิทธิภาพนี้ได้ปรับปรุงกระบวนการของเราให้ดียิ่งขึ้นและเพิ่มความคล่องตัวในการปฏิบัติงานของเรา พื้นที่จัดเก็บโมเดลที่มีประสิทธิภาพโดยใช้ Amazon S3 มีบทบาทสำคัญในความสำเร็จนี้ โดยสร้างสมดุลทั้งการคาดการณ์แบบเรียลไทม์และแบบกลุ่ม

สำหรับข้อมูลเพิ่มเติมเกี่ยวกับวิธีเริ่มต้นสร้างไปป์ไลน์ ML ของคุณเองด้วย SageMaker โปรดดู ทรัพยากร Amazon SageMaker. AWS Batch เป็นตัวเลือกที่ยอดเยี่ยมหากคุณกำลังมองหาโซลูชันราคาประหยัดและปรับขนาดได้สำหรับการรันงานแบบแบตช์ที่มีค่าใช้จ่ายในการดำเนินงานต่ำ หากต้องการเริ่มต้น โปรดดู เริ่มต้นใช้งาน AWS Batch.

เกี่ยวกับผู้เขียน

นาฟี อาห์เมต ทูร์กุต สำเร็จการศึกษาระดับปริญญาโทสาขาวิศวกรรมไฟฟ้าและอิเล็กทรอนิกส์ และทำงานเป็นนักวิทยาศาสตร์การวิจัยระดับบัณฑิตศึกษา จุดมุ่งหมายของเขาคือการสร้างอัลกอริธึมการเรียนรู้ของเครื่องเพื่อจำลองความผิดปกติของเครือข่ายประสาท เขาร่วมงานกับ Getir ในปี 2019 และปัจจุบันทำงานเป็นผู้จัดการอาวุโสด้านวิทยาศาสตร์ข้อมูลและการวิเคราะห์ ทีมของเขามีหน้าที่รับผิดชอบในการออกแบบ ใช้งาน และบำรุงรักษาอัลกอริธึมการเรียนรู้ของเครื่องแบบครบวงจรและโซลูชันที่ขับเคลื่อนด้วยข้อมูลสำหรับ Getir

วิธีที่ Getir ลดระยะเวลาการฝึกโมเดลลง 90% ด้วย Amazon SageMaker และ AWS Batch | Amazon Web Services PlatoBlockchain ข้อมูลอัจฉริยะ ค้นหาแนวตั้ง AI. ฮาซัน บูรัค เยล สำเร็จการศึกษาระดับปริญญาตรีสาขาวิศวกรรมไฟฟ้าและอิเล็กทรอนิกส์จากมหาวิทยาลัยBoğaziçi เขาทำงานที่ Turkcell โดยเน้นที่การพยากรณ์อนุกรมเวลา การแสดงข้อมูลเป็นภาพ และระบบเครือข่ายอัตโนมัติเป็นหลัก เขาร่วมงานกับ Getir ในปี 2021 และปัจจุบันทำงานเป็นผู้จัดการ Data Science & Analytics โดยรับผิดชอบด้านการค้นหา การแนะนำ และการเติบโต

วิธีที่ Getir ลดระยะเวลาการฝึกโมเดลลง 90% ด้วย Amazon SageMaker และ AWS Batch | Amazon Web Services PlatoBlockchain ข้อมูลอัจฉริยะ ค้นหาแนวตั้ง AI. ดามลา เชนเติร์ก สำเร็จการศึกษาระดับปริญญาตรีสาขาวิศวกรรมคอมพิวเตอร์จากมหาวิทยาลัยกาลาตาซาราย เธอเรียนต่อระดับปริญญาโทสาขาวิศวกรรมคอมพิวเตอร์ที่มหาวิทยาลัยBoğaziçi เธอร่วมงานกับ Getir ในปี 2022 และทำงานเป็นนักวิทยาศาสตร์ข้อมูล เธอทำงานในโครงการเชิงพาณิชย์ ห่วงโซ่อุปทาน และโครงการที่เกี่ยวข้องกับการค้นพบ

วิธีที่ Getir ลดระยะเวลาการฝึกโมเดลลง 90% ด้วย Amazon SageMaker และ AWS Batch | Amazon Web Services PlatoBlockchain ข้อมูลอัจฉริยะ ค้นหาแนวตั้ง AI. เอสรา คายาบาลี เป็นสถาปนิกโซลูชันอาวุโสที่ AWS ซึ่งเชี่ยวชาญด้านโดเมนการวิเคราะห์ รวมถึงคลังข้อมูล Data Lake การวิเคราะห์ Big Data การสตรีมข้อมูลแบบแบตช์และแบบเรียลไทม์ และการบูรณาการข้อมูล เธอมีประสบการณ์ด้านการพัฒนาซอฟต์แวร์และสถาปัตยกรรมมาเป็นเวลา 12 ปี เธอมีความหลงใหลในการเรียนรู้และการสอนเทคโนโลยีคลาวด์

เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
PlatoData.Network Vertical Generative Ai เพิ่มพลังให้กับตัวเอง เข้าถึงได้ที่นี่.
เพลโตไอสตรีม. Web3 อัจฉริยะ ขยายความรู้ เข้าถึงได้ที่นี่.
เพลโตESG. คาร์บอน, คลีนเทค, พลังงาน, สิ่งแวดล้อม แสงอาทิตย์, การจัดการของเสีย. เข้าถึงได้ที่นี่.
เพลโตสุขภาพ เทคโนโลยีชีวภาพและข่าวกรองการทดลองทางคลินิก เข้าถึงได้ที่นี่.
ที่มา: https://aws.amazon.com/blogs/machine-learning/how-getir-reduced-model-training-durations-by-90-with-amazon-sagemaker-and-aws-batch/

ประทับเวลา: December 4, 2023

ประทับเวลา: เมษายน 8, 2022

วิธีที่ Getir ลดระยะเวลาการฝึกโมเดลลง 90% ด้วย Amazon SageMaker และ AWS Batch | อเมซอนเว็บเซอร์วิส

เผยแพร่ซ้ำโดยเพลโต

ภาพรวมของโซลูชัน

ปรับแต่งโมเดล BERT หลายภาษาอย่างละเอียดด้วยงาน AWS Batch GPU

พื้นที่จัดเก็บโมเดลที่มีประสิทธิภาพโดยใช้ Amazon S3

การสร้างไปป์ไลน์การคาดการณ์แบบครบวงจร

สำรวจความเป็นไปได้ในอนาคตด้วย SageMaker MME

สรุป

เกี่ยวกับผู้เขียน

เพิ่มเติมจาก AWS Machine Learning AWS

ดึงข้อมูลเชิงลึกจาก SAP ERP ด้วยโซลูชัน ML แบบไม่มีโค้ดด้วย Amazon AppFlow และ Amazon SageMaker Canvas

การสร้างคำอธิบายผลิตภัณฑ์โดยอัตโนมัติด้วย Amazon Bedrock | อเมซอนเว็บเซอร์วิส

ปรับแต่งพารามิเตอร์ที่ผ่านการฝึกอบรมในชุดข้อมูลขนาดใหญ่โดยใช้ Amazon SageMaker Data Wrangler

ตั้งค่าโครงการสรุปข้อความด้วย Hugging Face Transformers: ตอนที่ 1

ประสิทธิภาพการปลดล็อก: การควบคุมพลังของ Selective Execution ใน Amazon SageMaker Pipelines | บริการเว็บอเมซอน

ขอแนะนำการจัดประเภทแบบขั้นตอนเดียวและการจดจำเอนทิตีด้วย Amazon Comprehend สำหรับการประมวลผลเอกสารอัจฉริยะ

เริ่มต้นใช้งานตัวเชื่อมต่อ Amazon Kendra Box

เกี่ยวกับเรา

การค้นหาแนวตั้ง & Ai

ระบบปฏิบัติการ

การติดต่อ

ลงชื่อเข้าใช้