Hogyan csökkentette a Getir a modellképzés időtartamát 90%-kal az Amazon SageMaker és az AWS Batch segítségével | Amazon webszolgáltatások

Hogyan csökkentette a Getir a modellképzés időtartamát 90%-kal az Amazon SageMaker és az AWS Batch segítségével | Amazon webszolgáltatások

Ez egy vendégbejegyzés, amelynek társszerzője Nafi Ahmet Turgut, Hasan Burak Yel és Damla Şentürk a Getirből.

Alapítva 2015, hozott az ultragyors élelmiszer-kiszállítás területén az úttörő pozícióba helyezte magát. Ez az innovatív technológiai vállalat forradalmasította az utolsó mérföld szállítási szegmenst a lenyűgöző „élelmiszer percek alatt” kínálatával. Törökországban, az Egyesült Királyságban, Hollandiában, Németországban és az Egyesült Államokban jelenlévő Getir multinacionális erővé vált, amellyel számolni kell. Ma a Getir márka egy diverzifikált konglomerátumot képvisel, amely kilenc különböző vertikumot foglal magában, amelyek mindegyike szinergikusan működik egy egyedi esernyő alatt.

Ebben a bejegyzésben elmagyarázzuk, hogyan építettünk fel egy végponttól végpontig terjedő termékkategória előrejelzési folyamatot, amely segít a kereskedelmi csapatoknak Amazon SageMaker és a AWS köteg, 90%-kal csökkentve a modellképzés időtartamát.

Meglévő termékválasztékunk részletes megismerése kulcsfontosságú kihívás, amellyel sok vállalkozással együtt szembe kell néznünk a mai rohanó és versenypiacon. A probléma hatékony megoldása a termékkategóriák előrejelzése. Egy átfogó kategóriafát létrehozó modell lehetővé teszi kereskedelmi csapataink számára, hogy összehasonlítsák meglévő termékportfóliónkat versenytársainkkal, stratégiai előnyt kínálva. Ezért központi kihívásunk egy pontos termékkategória előrejelzési modell megalkotása és megvalósítása.

Kihasználtuk az AWS által biztosított hatékony eszközöket, hogy megbirkózzunk ezzel a kihívással, és hatékonyan eligazodjunk a gépi tanulás (ML) és a prediktív elemzés összetett területén. Erőfeszítéseink egy végponttól végpontig terjedő termékkategória előrejelzési folyamat sikeres létrehozásához vezettek, amely egyesíti a SageMaker és az AWS Batch erősségeit.

A prediktív analitikai képesség, különösen a termékkategóriák pontos előrejelzése, felbecsülhetetlen értékűnek bizonyult. Csapatunk számára olyan kritikus adatvezérelt betekintést nyújtott, amely optimalizálta a készletkezelést, javította az ügyfelekkel való interakciót, és megerősítette piaci jelenlétünket.

Az ebben a bejegyzésben ismertetett módszertan a funkciókészlet összegyűjtésének kezdeti fázisától az előrejelzési folyamat végső megvalósításáig terjed. Stratégiánk egyik fontos aspektusa a SageMaker és az AWS Batch használata az előre betanított BERT modellek hét különböző nyelvre történő finomítására. Ezenkívül az AWS objektumtárolási szolgáltatásával való zökkenőmentes integrációnk Amazon egyszerű tárolási szolgáltatás (Amazon S3) kulcsfontosságú volt ezeknek a kifinomult modelleknek a hatékony tárolásában és elérésében.

A SageMaker egy teljesen felügyelt ML szolgáltatás. A SageMaker segítségével az adattudósok és fejlesztők gyorsan és könnyedén építhetnek és taníthatnak ML modelleket, majd közvetlenül telepíthetik azokat egy termelésre kész hosztolt környezetben.

Teljesen felügyelt szolgáltatásként az AWS Batch segít bármilyen léptékű kötegelt számítási munkaterhelés futtatásában. Az AWS Batch automatikusan biztosítja a számítási erőforrásokat, és optimalizálja a terheléselosztást a terhelések mennyisége és mértéke alapján. Az AWS Batch segítségével nincs szükség kötegelt számítástechnikai szoftver telepítésére vagy kezelésére, így idejét az eredmények elemzésére és a problémák megoldására összpontosíthatja. GPU-feladatokat használtunk, amelyek segítenek a példány GPU-it használó feladatok futtatásában.

A megoldás áttekintése

A Getir adattudományi és infrastrukturális csapatából öten dolgoztak együtt ezen a projekten. A projekt egy hónap alatt befejeződött, és egy hét tesztelés után üzembe helyezték.

A következő ábra a megoldás architektúráját mutatja be.

Hogyan csökkentette a Getir a modellképzés időtartamát 90%-kal az Amazon SageMaker és az AWS Batch segítségével | Amazon Web Services PlatoBlockchain Data Intelligence. Függőleges keresés. Ai.

A modell-folyamat országonként külön fut. Az architektúra két AWS Batch GPU cron feladatot tartalmaz minden országban, meghatározott ütemezés szerint futva.

Leküzdöttünk néhány kihívást a SageMaker és az AWS Batch GPU erőforrások stratégiai telepítésével. Az egyes nehézségek megoldására használt folyamatot a következő szakaszok részletezik.

Többnyelvű BERT modellek finomhangolása AWS Batch GPU-feladatokkal

Megoldást kerestünk arra, hogy többféle nyelvet támogassunk változatos felhasználói bázisunk számára. A BERT-modellek kézenfekvő választásnak bizonyultak, mivel képesek voltak hatékonyan kezelni az összetett természetes nyelvi feladatokat. Annak érdekében, hogy ezeket a modelleket az igényeinkre szabhassuk, az AWS erejét egycsomópontos GPU-példányfeladatok használatával aknáztuk ki. Ez lehetővé tette számunkra, hogy finomhangoljuk az előre betanított BERT-modelleket mind a hét nyelvre, amelyekhez támogatásra volt szükségünk. Ezzel a módszerrel nagy pontosságot biztosítottunk a termékkategóriák előrejelzésében, leküzdve az esetleges nyelvi akadályokat.

Hatékony modelltárolás az Amazon S3 segítségével

Következő lépésünk a modelltárolás és -kezelés megoldása volt. Ehhez a méretezhetőségéről és biztonságáról ismert Amazon S3-at választottuk. A finomhangolt BERT-modellek Amazon S3-on való tárolása lehetővé tette számunkra, hogy könnyű hozzáférést biztosítsunk szervezetünk különböző csapataihoz, ezáltal jelentősen leegyszerűsítve a telepítési folyamatot. Ez kulcsfontosságú szempont volt a működésünk agilitásának és az ML erőfeszítéseink zökkenőmentes integrációjának eléréséhez.

Végpontok közötti előrejelzési folyamat létrehozása

Hatékony csővezetékre volt szükség az előre betanított modelleink legjobb kihasználásához. Ezeket a modelleket először a SageMaker-en vezettük be, amely művelet lehetővé tette a valós idejű előrejelzéseket alacsony késleltetéssel, ezáltal javítva a felhasználói élményünket. A nagyobb léptékű kötegelt előrejelzésekhez, amelyek ugyanolyan létfontosságúak voltak a működésünkhöz, AWS Batch GPU-feladatokat használtunk. Ez biztosította erőforrásaink optimális felhasználását, tökéletes egyensúlyt biztosítva számunkra a teljesítmény és a hatékonyság között.

A jövőbeli lehetőségek feltárása a SageMaker MME-kkel

Miközben folyamatosan fejlődünk és keressük a hatékonyságot az ML folyamatban, az egyik lehetőség, amelyet szívesen felfedezünk, a SageMaker multi-model végpontok (MME) használata finomhangolt modelljeink bevezetéséhez. Az MME-kkel potenciálisan egyszerűsíthetjük a különféle finomhangolt modellek telepítését, biztosítva a hatékony modellkezelést, miközben kihasználjuk a SageMaker natív képességeit, mint például az árnyékváltozatok, az automatikus skálázás és amazonfelhőóra integráció. Ez a feltárás összhangban van azzal a folyamatos törekvésünkkel, hogy javítsuk prediktív elemzési képességeinket, és kiváló élményt nyújtsunk ügyfeleinknek.

Következtetés

A SageMaker és az AWS Batch sikeres integrációja nemcsak a sajátos kihívásainkra adott választ, hanem jelentősen növelte működési hatékonyságunkat is. Egy kifinomult termékkategória-előrejelzési folyamat megvalósítása révén képessé tesszük kereskedelmi csapatainkat adatvezérelt betekintésre, ezáltal elősegítve a hatékonyabb döntéshozatalt.

Eredményeink sokat mondanak megközelítésünk hatékonyságáról. A kategória-részletesség mind a négy szintjén 80%-os előrejelzési pontosságot értünk el, ami fontos szerepet játszik a termékválaszték kialakításában minden általunk kiszolgált országban. Ez a fokú pontosság kiterjeszti hatókörünket a nyelvi korlátokon túlra, és biztosítja, hogy a lehető legnagyobb pontossággal szolgáljuk ki változatos felhasználói bázisunkat.

Sőt, az ütemezett AWS Batch GPU-feladatok stratégiai felhasználásával 90%-kal tudtuk csökkenteni a modellképzés időtartamát. Ez a hatékonyság tovább racionalizálta folyamatainkat és megerősítette működési agilitását. Ebben az eredményben kritikus szerepet játszott az Amazon S3-at használó hatékony modelltárolás, amely egyensúlyban tartja a valós idejű és a kötegelt előrejelzéseket.

További információért arról, hogyan kezdheti meg saját ML-folyamatainak felépítését a SageMakerrel, lásd: Amazon SageMaker források. Az AWS Batch kiváló lehetőség, ha olcsó, méretezhető megoldást keres kötegelt feladatok alacsony működési többletköltség melletti futtatásához. A kezdéshez lásd Az AWS Batch használatának megkezdése.


A szerzőkről

Hogyan csökkentette a Getir a modellképzés időtartamát 90%-kal az Amazon SageMaker és az AWS Batch segítségével | Amazon Web Services PlatoBlockchain Data Intelligence. Függőleges keresés. Ai.Nafi Ahmet Turgut Elektromos és elektronikai mérnöki diplomát szerzett, és diplomás kutatóként dolgozott. Fókuszában az ideghálózati anomáliák szimulálására szolgáló gépi tanulási algoritmusok felépítése volt. 2019-ben csatlakozott a Getirhez, jelenleg Senior Data Science & Analytics Managerként dolgozik. Csapata felelős a Getir teljes körű gépi tanulási algoritmusainak és adatvezérelt megoldásainak tervezéséért, megvalósításáért és karbantartásáért.

Hogyan csökkentette a Getir a modellképzés időtartamát 90%-kal az Amazon SageMaker és az AWS Batch segítségével | Amazon Web Services PlatoBlockchain Data Intelligence. Függőleges keresés. Ai.Hasan Burak Yel Elektromos és elektronikai mérnöki diplomáját a Boğaziçi Egyetemen szerezte. A Turkcellnél dolgozott, főként idősoros előrejelzéssel, adatvizualizációval és hálózati automatizálással foglalkozott. 2021-ben csatlakozott a Getirhez, és jelenleg Data Science & Analytics Managerként dolgozik a keresési, ajánlási és növekedési tartományokért.

Hogyan csökkentette a Getir a modellképzés időtartamát 90%-kal az Amazon SageMaker és az AWS Batch segítségével | Amazon Web Services PlatoBlockchain Data Intelligence. Függőleges keresés. Ai.Damla Şentürk a Galatasaray Egyetemen szerzett számítástechnikai mérnöki diplomát. A Boğaziçi Egyetemen folytatja számítástechnikai mérnöki mesterképzését. 2022-ben csatlakozott a Getirhez, és Data Scientistként dolgozik. Kereskedelmi, ellátási lánccal és felfedezéssel kapcsolatos projekteken dolgozott.

Hogyan csökkentette a Getir a modellképzés időtartamát 90%-kal az Amazon SageMaker és az AWS Batch segítségével | Amazon Web Services PlatoBlockchain Data Intelligence. Függőleges keresés. Ai.Esra Kayabalı az AWS vezető megoldástervezője, az analitika területére szakosodott, beleértve az adattárházat, az adatlakokat, a nagy adatelemzést, a kötegelt és valós idejű adatfolyamokat, valamint az adatintegrációt. 12 éves szoftverfejlesztési és építészeti tapasztalattal rendelkezik. Szenvedélye a felhőtechnológiák tanulása és tanítása.

Időbélyeg:

Még több AWS gépi tanulás