Lös affärsproblem end-to-end genom maskininlärning i Amazon SageMaker JumpStart-lösningar PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

Lös affärsproblem från början genom maskininlärning i Amazon SageMaker JumpStart-lösningar

Amazon SageMaker JumpStart tillhandahåller förutbildade modeller med öppen källkod för ett brett utbud av problemtyper för att hjälpa dig komma igång med maskininlärning (ML). JumpStart tillhandahåller också lösningsmallar som ställer in infrastruktur för vanliga användningsfall och körbara exempel anteckningsböcker för ML med Amazon SageMaker.

Som företagsanvändare får du göra följande med JumpStart-lösningar:

  • Utforska lösningarna och utvärdera vilka som passar dina affärsbehov.
  • Starta lösningar med ett enda klick Amazon SageMaker Studio. Detta startar en AWS molnformation mall för att skapa de nödvändiga resurserna.
  • Ändra lösningen för att möta dina behov med tillgång till underliggande notebook- och modelltillgångar.
  • Ta bort de förvärvade resurserna när de är klara.

Det här inlägget fokuserar på de fem ML-lösningar som nyligen lades till för att möta fem olika affärsutmaningar. När detta skrivs erbjuder JumpStart 23 affärslösningar som varierar från att upptäcka bedrägerier i finansiella transaktioner till att känna igen handstil. Antalet lösningar som erbjuds genom JumpStart ökar regelbundet när fler lösningar läggs till.

Lösningsöversikt

De fem nya lösningarna är följande:

  • Prisoptimering – Erbjuder anpassningsbara ML-modeller för att hjälpa dig att fatta optimala beslut för att sätta priset på din produkt eller tjänst för att uppnå ditt affärsmål, som att maximera intäkter, vinst eller andra anpassade mätvärden.
  • Förutsägelse av fågelarter – Visar hur du kan träna och finjustera en objektdetekteringsmodell. Den demonstrerar modellinställning genom träningsbildförstärkning och kartlägger de förbättringar av noggrannheten som sker över iterationerna (epoker) av träningsjobbet.
  • Förutsägelse av lungcanceröverlevnad – Visar hur du kan mata 2D- och 3D-radiofunktioner och patientdemografi till en ML-algoritm för att förutsäga en patients chanser att överleva lungcancer. Resultaten från denna förutsägelse kan hjälpa leverantörer att vidta lämpliga proaktiva åtgärder.
  • Klassificering av finansiell betalning – Demonstrerar hur man tränar och distribuerar en ML-modell för att klassificera finansiella transaktioner baserat på transaktionsinformation. Du kan också använda den här lösningen som ett mellansteg i bedrägeriupptäckt, personlig anpassning eller upptäckt av avvikelser.
  • Churn-förutsägelse för mobiltelefonkunder – Demonstrerar hur man snabbt utvecklar en churn-prediktionsmodell med hjälp av en datauppsättning för mobilsamtalstransaktioner. Detta är ett enkelt exempel för användare som är nya inom ML.

Förutsättningar

För att använda dessa lösningar, se till att du har tillgång till Studio med en exekveringsroll som låter dig köra SageMaker-funktionalitet. För din användarroll inom Studio, se till att SageMaker Projects och JumpStart alternativet är påslagen.

I de följande avsnitten går vi igenom var och en av de fem nya lösningarna och diskuterar hur det fungerar i detalj, tillsammans med några rekommendationer om hur du kan använda det för dina egna affärsbehov.

Prisoptimering

Företag gillar att använda olika spakar för att få bästa resultat. Till exempel är priset på en produkt eller tjänst en hävstång som ett företag kan kontrollera. Frågan är hur man bestämmer vilket pris man ska sätta en produkt eller tjänst till, för att maximera ett affärsmål som vinst eller intäkter.

Den här lösningen tillhandahåller anpassningsbara ML-modeller för att hjälpa dig att fatta optimala beslut för att sätta priset på din produkt eller tjänst för att uppnå ditt mål, såsom att maximera intäkter, vinst eller andra anpassade mätvärden. Lösningen använder ML och kausala slutledningsmetoder för att lära sig pris-volymrelationer från historiska data, och kan göra dynamiska prisrekommendationer i realtid för att optimera de anpassade objektiva mätvärdena.

Följande skärmdump visar exempel på indata.

Lösningen innehåller tre delar:

  • Priselasticitetsuppskattning – Detta uppskattas genom kausal slutledning via en dubbel ML-algoritm
  • Volymprognos – Detta prognostiseras med profetens algoritm
  • Prisoptimering – Detta uppnås genom en vad-om-simulering genom olika prisscenarier

Lösningen ger det rekommenderade priset för nästa dag för att maximera intäkterna. Dessutom inkluderar utdata den uppskattade priselasticiteten, som är ett värde som anger prisets effekt på volymen, och en prognosmodell som kan prognostisera nästa dags volym. Följande diagram visar hur en kausal modell som inkorporerade den beräknade priselasticiteten presterar mycket bättre under en vad-om-analys (med stora avvikelser från beteendepriset) än en prediktiv modell som använder Prophet för att prognostisera volym med hjälp av tidsseriedata.

Lös affärsproblem end-to-end genom maskininlärning i Amazon SageMaker JumpStart-lösningar PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

Du kan tillämpa den här lösningen på ditt företag för följande användningsfall:

  • Bestäm det optimala priset på varor för en butik
  • Uppskatta effekten av rabattkuponger på kundköp
  • Förutsäg effekten av olika incitamentsmetoder i alla företag

Förutsägelse av fågelarter

Det finns flera datorseende (CV)-applikationer för företag idag. En av dessa applikationer är objektdetektering, där en ML-algoritm upptäcker platsen för ett objekt i en bild genom att rita en avgränsande ruta runt det, och identifierar vilken typ av objekt det är. Att lära sig hur man tillämpar en objektdetekteringsmodell och finjusterar den kan vara av stort värde för en organisation som har CV-behov.

Den här lösningen ger ett exempel på hur man översätter begränsningsboxspecifikationer när bilder tillhandahålls till SageMaker-algoritmen. Denna lösning visar också hur man kan förbättra en objektdetekteringsmodell genom att lägga till träningsbilder som vänds horisontellt (spegelbilder).

En anteckningsbok tillhandahålls för att experimentera med objektdetekteringsutmaningar när det finns ett stort antal klasser (200 fågelarter). Anteckningsboken visar också hur man kartlägger de förbättringar av noggrannheten som sker under träningsjobbets epoker. Följande bild visar exempelbilder från fågeldataset.

Lös affärsproblem end-to-end genom maskininlärning i Amazon SageMaker JumpStart-lösningar PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

Denna lösning innehåller fem steg:

  1. Förbered data, inklusive nedladdning och RecordIO filgenerering.
  2. Skapa och träna en objektdetekteringsmodell.
  3. Implementera en slutpunkt och utvärdera modellens prestanda.
  4. Skapa och träna en objektdetekteringsmodell igen med den utökade datamängden.
  5. Distribuera en slutpunkt och utvärdera den utökade modellens prestanda.

Du får följande som utdata:

  • Objektdetekteringsresultat med bindningsrutor mot din testbild
  • En tränad objektdetekteringsmodell
  • En tränad objektdetekteringsmodell med ytterligare en utökad (vänd) datauppsättning
  • Två separata slutpunkter utplacerade med en av varje modell

Följande diagram visar modellförbättringar mot modelliterationer (epoker) under träning.

Lös affärsproblem end-to-end genom maskininlärning i Amazon SageMaker JumpStart-lösningar PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

Följande exempel är utmatade från två testbilder.

Lös affärsproblem end-to-end genom maskininlärning i Amazon SageMaker JumpStart-lösningar PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

Lös affärsproblem end-to-end genom maskininlärning i Amazon SageMaker JumpStart-lösningar PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

Du kan tillämpa den här lösningen på ditt företag för följande användningsfall:

  • Upptäck föremål på ett transportband i en förpackningsindustri
  • Upptäck pålägg på en pizza
  • Implementera operativa applikationer för leveranskedjan som involverar objektdetektering

Lungcanceröverlevnadsförutsägelse

COVID-19 väckte mycket mer uppmärksamhet åt lungrelaterade medicinska utmaningar. Det har också satt stor press på sjukhus, läkare, sjuksköterskor och radiologer. Föreställ dig en möjlighet där du kan tillämpa ML som ett kraftfullt verktyg för att hjälpa läkare och hjälpa dem att påskynda sitt arbete. I den här lösningen visar vi hur 2D- och 3D-radiofunktioner och patientdemografi kan matas till en ML-algoritm för att förutsäga en patients chanser att överleva lungcancer. Resultat från denna förutsägelse kan hjälpa leverantörer att vidta lämpliga proaktiva åtgärder.

Denna lösning visar hur man bygger en skalbar ML-pipeline för icke-småcellig lungcancer (NSCLC) Radiogenomics-datauppsättning, som består av RNA-sekvenseringsdata, kliniska data (som återspeglar EHR-data) och medicinska bilder. Att använda flera typer av data för att skapa en maskinmodell kallas multimodala ML. Denna lösning förutsäger överlevnadsresultat för patienter som diagnostiserats med icke-småcellig lungcancer.

Följande bild visar ett exempel på indata från icke-småcellig lungcancer (NSCLC) Radiogenomics dataset.

Lös affärsproblem end-to-end genom maskininlärning i Amazon SageMaker JumpStart-lösningar PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

Som en del av lösningen extraherades totalt RNA från tumörvävnaden och analyserades med RNA-sekvenseringsteknologi. Även om originaldata innehåller mer än 22,000 21 gener, behåller vi 10 gener från XNUMX starkt samuttryckta genkluster (metagener) som identifierades, validerades i allmänt tillgängliga genuttryckskohorter och korrelerade med prognos.

Kliniska journaler lagras i CSV-format. Varje rad motsvarar en patient, och kolumnerna innehåller information om patienterna, inklusive demografi, tumörstadium och överlevnadsstatus.

För genomiska data behåller vi 21 gener från 10 starkt samuttryckta genkluster (metagener) som identifierades, validerades i allmänt tillgängliga genuttryckskohorter och korrelerade med prognos.

För medicinsk avbildningsdata skapar vi 3D-radiofunktioner på patientnivå som förklarar storleken, formen och visuella egenskaperna hos de tumörer som observeras i CT-skanningarna. För varje patientstudie utförs följande steg:

  1. Läs 2D DICOM-snittfilerna för både CT-skanning och tumörsegmentering, kombinera dem till 3D-volymer, spara volymerna i NIfTI-format.
  2. Justera CT-volym och tumörsegmentering så att vi kan fokusera beräkningen inuti tumören.
  3. Beräkna radiofunktioner som beskriver tumörregionen med hjälp av pyradiomikbiblioteket.
  4. Extrahera 120 radiomiska egenskaper av åtta klasser, såsom statistiska representationer av fördelningen och samtidig förekomst av intensiteten inom tumörregionen av intresse, och formbaserade mätningar som beskriver tumören morfologiskt.

För att skapa en multimodal vy av en patient för modellträning, sammanfogar vi funktionsvektorerna från tre modaliteter. Vi behandlar sedan uppgifterna. Först normaliserar vi utbudet av oberoende funktioner med hjälp av funktionsskalning. Sedan utför vi principal component analysis (PCA) på funktionerna för att minska dimensionaliteten och identifiera de mest diskriminerande egenskaperna som bidrar med 95 % varians i data.

Detta resulterar i en dimensionsreduktion från 215 funktioner ner till 45 huvudkomponenter, som utgör funktioner för den övervakade eleven.

Lösningen producerar en ML-modell som förutsäger NSCLC-patienters överlevnadsstatus (döda eller levande) i en form av sannolikhet. Förutom modellen och förutsägelsen genererar vi även rapporter för att förklara modellen. Den medicinska bildbehandlingspipelinen producerar 3D-lung-CT-volymer och tumörsegmentering för visualiseringsändamål.

Du kan tillämpa den här lösningen på användningsfall inom hälsovård och biovetenskap.

Klassificering av finansiell betalning

Att ta alla finansiella transaktioner för ett företag eller en konsument och organisera dem i olika kategorier kan vara till stor hjälp. Det kan hjälpa användaren att lära sig hur mycket de har spenderat i vilken kategori, och det kan också larma när transaktioner eller utgifter i en viss kategori går upp eller ner oväntat.

Denna lösning visar hur man tränar och distribuerar en ML-modell för att klassificera finansiella transaktioner baserat på transaktionsinformation. Många banker tillhandahåller detta som en tjänst för att ge sina slutanvändare en överblick över deras utgiftsvanor. Du kan också använda den här lösningen som ett mellansteg i bedrägeriupptäckt, personlig anpassning eller upptäckt av avvikelser. Vi använder SageMaker för att träna och distribuera en XGBoost-modell med den nödvändiga underliggande infrastrukturen.

Den syntetiska datamängden som vi för att demonstrera denna lösning har följande funktioner:

  • transaktionskategori – Kategori för transaktionen, av följande 19 alternativ: Uncategorized, Entertainment, Education, Shopping, Personal Care, Health and Fitness, Food and Dining, Gifts and Donations, Investments, Bills and Utilities, Auto and Transport, Travel, Fees and Charges, Business Services, Personal Services, Taxes, Gambling, Homeoch Pension and insurances.
  • mottagare_id – En identifierare för den mottagande parten. Identifieraren består av 16 nummer.
  • avsändar ID – En identifierare för den sändande parten. Identifieraren består av 16 nummer.
  • mängd – Det belopp som överförs.
  • tidsstämpel – Tidsstämpeln för transaktionen i formatet ÅÅÅÅ-MM-DD TT:MM:SS.

De första fem observationerna av datamängden är följande:

Lös affärsproblem end-to-end genom maskininlärning i Amazon SageMaker JumpStart-lösningar PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

För denna lösning använder vi XGBoost, en populär och effektiv implementering med öppen källkod av algoritmen för gradientförstärkta träd. Gradientförstärkning är en övervakad inlärningsalgoritm som försöker att exakt förutsäga en målvariabel genom att kombinera en ensemble av uppskattningar från en uppsättning enklare och svagare modeller. Dess implementering är tillgänglig i SageMakers inbyggda algoritmer.

Den finansiella betalningsklassificeringslösningen innehåller fyra steg:

  1. Förbered data.
  2. Bygg en funktionsbutik.
  3. Skapa och träna en XGBoost-modell.
  4. Implementera en slutpunkt och utvärdera modellens prestanda.

Vi får följande utdata:

  • En tränad XGBoost-modell baserad på vår exempeldatauppsättning
  • En SageMaker-slutpunkt som kan förutsäga transaktionskategorin

Efter att ha kört den här lösningen bör du se en klassificeringsrapport som liknar följande.

Lös affärsproblem end-to-end genom maskininlärning i Amazon SageMaker JumpStart-lösningar PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

Möjliga tillämpningar för ditt företag inkluderar följande:

  • Olika finansiella applikationer inom retail och investment banking
  • När transaktioner måste klassificeras i alla användningsfall (inte bara ekonomiskt)

Churn-förutsägelse för mobiltelefonkunder

Att förutsäga kundförlust är ett mycket vanligt affärsbehov. Många studier visar att kostnaden för att behålla en befintlig kund är mycket mindre än att skaffa en ny kund. Utmaningen kommer ofta från att företag har svårt att förstå varför en kund churning, eller bygger en modell som förutsäger churning.

I det här exemplet kan användare som är nya inom ML uppleva hur en churn-prediktionsmodell snabbt kan utvecklas med hjälp av en datauppsättning för mobilsamtalstransaktioner. Denna lösning använder SageMaker för att träna och distribuera en XGBoost-modell på en kundprofildatauppsättning för att förutsäga om en kund sannolikt kommer att lämna en mobiltelefonoperatör.

Datauppsättningen som denna lösning använder är allmänt tillgänglig och nämns i boken Discovering Knowledge in Data av Daniel T. Larose. Det tillskrivs av författaren University of California Irvine Repository of Machine Learning Dataset.

Denna datauppsättning använder följande 21 attribut för att beskriva profilen för en kund hos en okänd amerikansk mobiloperatör.

  • Stat: den amerikanska stat där kunden är bosatt, indikerad med en tvåbokstavsförkortning; till exempel OH eller NJ
  • Kontolängd: antalet dagar som detta konto har varit aktivt
  • Riktnummer: det tresiffriga riktnumret för motsvarande kunds telefonnummer
  • Telefon: det återstående sjusiffriga telefonnumret
  • Int'l Plan: om kunden har en internationell samtalsplan: ja/nej
  • VMail Plan: om kunden har en röstmeddelandefunktion: ja/nej
  • VMail-meddelande: det genomsnittliga antalet röstmeddelanden per månad
  • Dagsminst: det totala antalet samtalsminuter som används under dagen
  • Dagsamtal: det totala antalet samtal under dagen
  • Dagavgift: den fakturerade kostnaden för samtal dagtid
  • Eve Mins, Eve Calls, Eve Charge: den fakturerade kostnaden för samtal under kvällen
  • Night Mins, Night Calls, Night Charge: den fakturerade kostnaden för samtal under natten
  • Intl Mins, Intl Calls, Intl Charge: den fakturerade kostnaden för internationella samtal
  • CustServ-samtal: antalet samtal till kundtjänst
  • Churn?: om kunden lämnade tjänsten: sant/falskt

Denna lösning innehåller tre steg:

  1. Förbered data.
  2. Skapa och träna en XGBoost-modell.
  3. Implementera en slutpunkt och utvärdera modellens prestanda.

Vi får följande utdata:

  • En tränad XGBoost-modell baserad på vår exempeldatauppsättning för att förutsäga användarchurn
  • En SageMaker-slutpunkt som kan förutsäga användarchurn

Denna modell hjälper till att uppskatta hur många av de 5,000 XNUMX mobiltelefonkunderna som sannolikt kommer att sluta använda sin nuvarande mobiltelefonoperatör.

Följande diagram visar en sannolikhetsfördelning av churn som en utdata från modellen.

Lös affärsproblem end-to-end genom maskininlärning i Amazon SageMaker JumpStart-lösningar PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

Du kan tillämpa detta på ditt företag för följande användningsfall:

  • Förutsäg kundförlust i ditt eget företag
  • Klassificera vilka kunder som får öppna din marknadsföringsmail och vilka som inte kommer att göra det (binär klassificering)
  • Förutsäg vilka elever som sannolikt kommer att hoppa av en kurs

Rengör resurser

När du är klar med att köra en lösning i JumpStart, se till att välja Ta bort alla resurser så alla resurser som du har skapat i processen raderas och din fakturering stoppas.

Lös affärsproblem end-to-end genom maskininlärning i Amazon SageMaker JumpStart-lösningar PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

Sammanfattning

Det här inlägget visade dig hur du löser olika affärsproblem genom att tillämpa ML, baserat på JumpStart-lösningar. Även om detta inlägg fokuserade på de fem nya lösningarna som nyligen lades till JumpStart, finns det totalt 23 tillgängliga lösningar. Vi uppmuntrar dig att logga in på Studio och titta på JumpStart-lösningarna själva och börja få omedelbart värde ur dem. För mer information, se Amazon SageMaker Studio och SageMaker JumpStart.

Obs: Om du inte ser alla ovanstående fem lösningar i JumpStart-konsolen i din AWS-region, vänta en vecka och kontrollera igen. Vi släpper ut dem till olika regioner i etapper.


Om författarna

Lös affärsproblem end-to-end genom maskininlärning i Amazon SageMaker JumpStart-lösningar PlatoBlockchain Data Intelligence. Vertikal sökning. Ai. Dr Raju Penmatcha är en AI/ML Specialist Solutions Architect in AI Platforms på AWS. Han arbetar på tjänstsviten med låg kod/ingen kod i SageMaker som hjälper kunder att enkelt bygga och distribuera modeller och lösningar för maskininlärning. När han inte hjälper kunder gillar han att resa till nya platser.

Lös affärsproblem end-to-end genom maskininlärning i Amazon SageMaker JumpStart-lösningar PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.Manan Shah är en mjukvaruutvecklingschef på Amazon Web Services. Han är en ML-entusiast och fokuserar på att bygga no-code/low-code AI/ML-produkter. Han strävar efter att ge andra begåvade, tekniska människor möjlighet att bygga fantastisk programvara.

Tidsstämpel:

Mer från AWS maskininlärning