Cum a redus Getir cu 90% durata de formare a modelelor cu Amazon SageMaker și AWS Batch | Amazon Web Services

Cum a redus Getir cu 90% durata de formare a modelelor cu Amazon SageMaker și AWS Batch | Amazon Web Services

Aceasta este o postare pentru invitați în colaborare cu Nafi Ahmet Turgut, Hasan Burak Yel și Damla Şentürk din Getir.

Înființată în 2015, adus s-a poziționat ca pioniera în sfera livrării ultrarapide de alimente. Această companie tehnologică inovatoare a revoluționat segmentul de livrare de pe ultimul kilometru cu oferta sa convingătoare de „bacănii în câteva minute”. Cu o prezență în Turcia, Regatul Unit, Țările de Jos, Germania și Statele Unite, Getir a devenit o forță multinațională de luat în seamă. Astăzi, marca Getir reprezintă un conglomerat diversificat care cuprinde nouă verticale diferite, toate lucrând sinergic sub o umbrelă unică.

În această postare, explicăm modul în care am construit o conductă de predicție pentru categoriile de produse de la capăt la capăt pentru a ajuta echipele comerciale folosind Amazon SageMaker și Lot AWS, reducând durata antrenamentului modelului cu 90%.

Înțelegerea în detaliu a sortimentului nostru existent de produse este o provocare crucială cu care ne confruntăm, împreună cu multe companii, pe piața rapidă și competitivă de astăzi. O soluție eficientă la această problemă este predicția categoriilor de produse. Un model care generează un arbore de categorii cuprinzător permite echipelor noastre comerciale să compare portofoliul nostru de produse existent față de cel al concurenților noștri, oferind un avantaj strategic. Prin urmare, provocarea noastră centrală este crearea și implementarea unui model precis de predicție a categoriilor de produse.

Am valorificat instrumentele puternice oferite de AWS pentru a face față acestei provocări și a naviga în mod eficient în domeniul complex al învățării automate (ML) și al analizei predictive. Eforturile noastre au condus la crearea cu succes a unui pipeline de predicții pentru categorii de produse de la capăt la capăt, care combină punctele forte ale SageMaker și AWS Batch.

Această capacitate de analiză predictivă, în special prognoza precisă a categoriilor de produse, s-a dovedit neprețuită. A oferit echipelor noastre informații esențiale bazate pe date care au optimizat gestionarea stocurilor, au îmbunătățit interacțiunile cu clienții și au consolidat prezența noastră pe piață.

Metodologia pe care o explicăm în această postare variază de la faza inițială a colectării setului de caracteristici până la implementarea finală a conductei de predicție. Un aspect important al strategiei noastre a fost utilizarea SageMaker și AWS Batch pentru a perfecționa modelele BERT pre-antrenate pentru șapte limbi diferite. În plus, integrarea noastră perfectă cu serviciul de stocare a obiectelor AWS Serviciul Amazon de stocare simplă (Amazon S3) a fost cheia pentru stocarea și accesarea eficientă a acestor modele rafinate.

SageMaker este un serviciu ML gestionat complet. Cu SageMaker, oamenii de știință de date și dezvoltatorii pot construi și antrena rapid și fără efort modele ML, apoi le pot implementa direct într-un mediu găzduit pregătit pentru producție.

Ca serviciu complet gestionat, AWS Batch vă ajută să rulați sarcini de lucru de calcul în lot de orice scară. AWS Batch furnizează automat resurse de calcul și optimizează distribuția sarcinilor de lucru în funcție de cantitatea și scara sarcinilor de lucru. Cu AWS Batch, nu este nevoie să instalați sau să gestionați software de calcul batch, astfel încât să vă puteți concentra timpul pe analizarea rezultatelor și rezolvarea problemelor. Am folosit joburi GPU care ne ajută să rulăm joburi care folosesc GPU-urile unei instanțe.

Prezentare generală a soluției

Cinci oameni din echipa de știință a datelor a Getir și echipa de infrastructură au lucrat împreună la acest proiect. Proiectul a fost finalizat într-o lună și a fost implementat în producție după o săptămână de testare.

Următoarea diagramă prezintă arhitectura soluției.

How Getir reduced model training durations by 90% with Amazon SageMaker and AWS Batch | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Conducta modelului este rulată separat pentru fiecare țară. Arhitectura include două joburi cron AWS Batch GPU pentru fiecare țară, care rulează pe programe definite.

Am depășit unele provocări prin implementarea strategică a resurselor GPU SageMaker și AWS Batch. Procesul utilizat pentru a aborda fiecare dificultate este detaliat în secțiunile următoare.

Reglați fin modelele BERT multilingve cu sarcini GPU AWS Batch

Am căutat o soluție care să accepte mai multe limbi pentru baza noastră diversă de utilizatori. Modelele BERT au fost o alegere evidentă datorită capacității lor stabilite de a gestiona eficient sarcini complexe de limbaj natural. Pentru a adapta aceste modele la nevoile noastre, am valorificat puterea AWS utilizând joburi de instanță GPU cu un singur nod. Acest lucru ne-a permis să perfecționăm modelele BERT pregătite în prealabil pentru fiecare dintre cele șapte limbi pentru care aveam nevoie de asistență. Prin această metodă, am asigurat o mare precizie în prezicerea categoriilor de produse, depășind orice potențiale bariere lingvistice.

Stocare eficientă a modelelor folosind Amazon S3

Următorul nostru pas a fost să abordăm stocarea și gestionarea modelelor. Pentru aceasta, am ales Amazon S3, cunoscut pentru scalabilitatea și securitatea sa. Stocarea modelelor noastre BERT ajustate pe Amazon S3 ne-a permis să oferim acces ușor la diferite echipe din cadrul organizației noastre, simplificând astfel în mod semnificativ procesul nostru de implementare. Acesta a fost un aspect crucial în obținerea agilității în operațiunile noastre și o integrare perfectă a eforturilor noastre de ML.

Crearea unei conducte de predicție end-to-end

A fost necesară o conductă eficientă pentru a folosi cât mai bine modelele noastre pre-instruite. Am implementat mai întâi aceste modele pe SageMaker, o acțiune care a permis predicții în timp real cu o latență scăzută, îmbunătățind astfel experiența noastră de utilizator. Pentru predicții pe loturi la scară mai mare, care au fost la fel de vitale pentru operațiunile noastre, am folosit joburi AWS Batch GPU. Acest lucru a asigurat utilizarea optimă a resurselor noastre, oferindu-ne un echilibru perfect între performanță și eficiență.

Explorarea posibilităților viitoare cu SageMaker MME

Pe măsură ce continuăm să evoluăm și să căutăm eficiență în pipeline-ul nostru ML, o cale pe care dorim să o explorăm este utilizarea punctelor finale multimodel (MME) SageMaker pentru implementarea modelelor noastre ajustate. Cu ajutorul MME-urilor, putem eficientiza implementarea diferitelor modele reglate, asigurând o gestionare eficientă a modelelor, beneficiind în același timp de capabilitățile native ale SageMaker, cum ar fi variante de umbră, scalare automată și Amazon CloudWatch integrare. Această explorare se aliniază cu urmărirea noastră continuă de a îmbunătăți capacitățile noastre de analiză predictivă și de a oferi experiențe superioare clienților noștri.

Concluzie

Integrarea noastră cu succes a SageMaker și AWS Batch nu a abordat doar provocările noastre specifice, ci și a sporit semnificativ eficiența operațională. Prin implementarea unui canal sofisticat de predicție a categoriilor de produse, suntem capabili să împuternicim echipele noastre comerciale cu informații bazate pe date, facilitând astfel luarea de decizii mai eficientă.

Rezultatele noastre vorbesc mult despre eficacitatea abordării noastre. Am obținut o precizie de predicție de 80% la toate cele patru niveluri de granularitate a categoriilor, ceea ce joacă un rol important în modelarea sortimentelor de produse pentru fiecare țară pe care o deservim. Acest nivel de precizie ne extinde acoperirea dincolo de barierele lingvistice și ne asigură că răspundem cu cea mai mare acuratețe bazei noastre diverse de utilizatori.

În plus, prin utilizarea strategică a sarcinilor GPU AWS Batch programate, am reușit să reducem duratele antrenamentului modelului nostru cu 90%. Această eficiență ne-a simplificat și mai mult procesele și ne-a consolidat agilitatea operațională. Stocarea eficientă a modelelor folosind Amazon S3 a jucat un rol esențial în această realizare, echilibrând atât predicțiile în timp real, cât și cele pe lot.

Pentru mai multe informații despre cum să începeți să vă construiți propriile conducte ML cu SageMaker, consultați Resurse Amazon SageMaker. AWS Batch este o opțiune excelentă dacă sunteți în căutarea unei soluții scalabile, cu costuri reduse, pentru a rula lucrări batch cu cheltuieli operaționale reduse. Pentru a începe, vezi Noțiuni introductive cu AWS Batch.


Despre Autori

How Getir reduced model training durations by 90% with Amazon SageMaker and AWS Batch | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.Nafi Ahmet Turgut și-a terminat masterul în Inginerie Electrică și Electronică și a lucrat ca cercetător absolvent. Accentul său a fost construirea de algoritmi de învățare automată pentru a simula anomaliile rețelei nervoase. S-a alăturat Getir în 2019 și în prezent lucrează ca Senior Data Science & Analytics Manager. Echipa sa este responsabilă de proiectarea, implementarea și menținerea algoritmilor de învățare automată end-to-end și soluțiilor bazate pe date pentru Getir.

How Getir reduced model training durations by 90% with Amazon SageMaker and AWS Batch | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.Hasan Burak Yel și-a primit diploma de licență în Inginerie Electrică și Electronică la Universitatea Boğaziçi. A lucrat la Turkcell, concentrându-se în principal pe prognoza seriilor temporale, vizualizarea datelor și automatizarea rețelei. S-a alăturat Getir în 2021 și în prezent lucrează ca Manager Data Science & Analytics cu responsabilitatea domeniilor de căutare, recomandare și creștere.

How Getir reduced model training durations by 90% with Amazon SageMaker and AWS Batch | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.Damla Şentürk și-a luat diploma de licență în Inginerie Calculatoare la Universitatea Galatasaray. Ea își continuă masterul în Inginerie Calculatoare la Universitatea Boğaziçi. S-a alăturat Getir în 2022 și a lucrat ca Data Scientist. Ea a lucrat la proiecte comerciale, de lanț de aprovizionare și de descoperire.

How Getir reduced model training durations by 90% with Amazon SageMaker and AWS Batch | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.Esra Kayabalı este arhitect senior de soluții la AWS, specializat în domeniul de analiză, inclusiv depozitare de date, lacuri de date, analiză de date mari, streaming de date în loturi și în timp real și integrare a datelor. Are 12 ani de experiență în dezvoltare software și arhitectură. Este pasionată de învățarea și predarea tehnologiilor cloud.

Timestamp-ul:

Mai mult de la Învățare automată AWS