Løs forretningsproblemer ende-til-ende gennem maskinlæring i Amazon SageMaker JumpStart-løsninger PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Løs forretningsproblemer ende-til-ende gennem maskinlæring i Amazon SageMaker JumpStart-løsninger

Amazon SageMaker JumpStart leverer forudtrænede open source-modeller til en lang række problemtyper for at hjælpe dig i gang med maskinlæring (ML). JumpStart leverer også løsningsskabeloner, der opsætter infrastruktur til almindelige brugstilfælde og eksekverbare eksempelnotebooks til ML med Amazon SageMaker.

Som erhvervsbruger kan du gøre følgende med JumpStart-løsninger:

  • Udforsk løsningerne og vurder, hvilke der passer godt til din virksomheds behov.
  • Start løsninger med et enkelt klik ind Amazon SageMaker Studio. Dette lancerer en AWS CloudFormation skabelon for at oprette de nødvendige ressourcer.
  • Rediger løsningen, så den opfylder dine behov med adgang til underliggende notebook- og modelaktiver.
  • Slet de erhvervede ressourcer, når du er færdig.

Dette indlæg fokuserer på de fem ML-løsninger, der for nylig blev tilføjet for at løse fem forskellige forretningsmæssige udfordringer. Når dette skrives, tilbyder JumpStart 23 forretningsløsninger, der varierer fra at opdage svindel i finansielle transaktioner til at genkende håndskrift. Antallet af løsninger, der tilbydes gennem JumpStart, stiger med jævne mellemrum, efterhånden som flere løsninger føjes til det.

Løsningsoversigt

De fem nye løsninger er som følger:

  • Prisoptimering – Tilbyder tilpassede ML-modeller til at hjælpe dig med at træffe optimale beslutninger for at sætte prisen på dit produkt eller din tjeneste for at nå dit forretningsmål, såsom maksimering af omsætning, fortjeneste eller andre tilpassede metrics.
  • Forudsigelse af fuglearter – Viser, hvordan du kan træne og finjustere en objektdetekteringsmodel. Den demonstrerer modeljustering gennem træningsbilledforstørrelse og kortlægger de nøjagtighedsforbedringer, der sker på tværs af iterationerne (epoker) af træningsopgaven.
  • Forudsigelse af lungekræft overlevelse – Viser, hvordan du kan fodre 2D- og 3D-radiomiske funktioner og patientdemografi til en ML-algoritme for at forudsige en patients overlevelseschancer for lungekræft. Resultaterne fra denne forudsigelse kan hjælpe udbydere med at træffe passende proaktive foranstaltninger.
  • Klassificering af finansiel betaling – Demonstrerer, hvordan man træner og implementerer en ML-model til at klassificere finansielle transaktioner baseret på transaktionsoplysninger. Du kan også bruge denne løsning som et mellemtrin i registrering af svindel, personalisering eller afsløring af uregelmæssigheder.
  • Churn forudsigelse for mobiltelefonkunder – Demonstrerer, hvordan man hurtigt udvikler en churn-forudsigelsesmodel ved hjælp af et mobilopkaldstransaktionsdatasæt. Dette er et simpelt eksempel for brugere, der er nye til ML.

Forudsætninger

For at bruge disse løsninger skal du sørge for, at du har adgang til Studio med en eksekveringsrolle, der giver dig mulighed for at køre SageMaker-funktionalitet. For din brugerrolle i Studio skal du sørge for, at SageMaker Projects og JumpStart indstillingen er tændt.

I de følgende afsnit gennemgår vi hver af de fem nye løsninger og diskuterer, hvordan det fungerer i detaljer, sammen med nogle anbefalinger til, hvordan du kan bruge det til dine egne forretningsbehov.

Prisoptimering

Virksomheder kan lide at bruge forskellige håndtag for at opnå de bedste resultater. For eksempel er prisen på et produkt eller en tjeneste en løftestang, som en virksomhed kan kontrollere. Spørgsmålet er, hvordan man beslutter, hvilken pris man skal sætte et produkt eller en service til, for at maksimere et forretningsmål som fortjeneste eller omsætning.

Denne løsning giver brugerdefinerbare ML-modeller til at hjælpe dig med at træffe optimale beslutninger for at fastsætte prisen på dit produkt eller din tjeneste for at nå dit mål, såsom maksimering af omsætning, fortjeneste eller andre tilpassede metrics. Løsningen bruger ML og kausal inferens-tilgange til at lære pris-volumen-relationer fra historiske data og er i stand til at lave dynamiske prisanbefalinger i realtid for at optimere de tilpassede objektive metrics.

Følgende skærmbillede viser eksempler på inputdata.

Løsningen består af tre dele:

  • Priselasticitetsvurdering – Dette estimeres ved kausal inferens via en dobbelt ML-algoritme
  • Volumen prognose – Dette forudsiges ved hjælp af profetens algoritme
  • Prisoptimering – Dette opnås ved en hvad hvis-simulering gennem forskellige prisscenarier

Løsningen giver den vejledende pris for den næste dag for at maksimere omsætningen. Derudover omfatter outputtet den estimerede priselasticitet, som er en værdi, der angiver prisens effekt på volumen, og en prognosemodel, som er i stand til at forudsige næste dags volumen. Følgende diagram viser, hvordan en kausal model, der inkorporerede den beregnede priselasticitet, klarer sig meget bedre under en what-if-analyse (med store afvigelser fra adfærdsprisen) end en forudsigelig model, der bruger Prophet til at forudsige volumen ved hjælp af tidsseriedata.

Løs forretningsproblemer ende-til-ende gennem maskinlæring i Amazon SageMaker JumpStart-løsninger PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Du kan anvende denne løsning til din virksomhed til følgende brugssituationer:

  • Bestem den optimale pris på varer til en detailbutik
  • Estimer effekten af ​​rabatkuponer på kundekøb
  • Forudsige effekten af ​​forskellige incitamentmetoder i enhver virksomhed

Forudsigelse af fuglearter

Der er adskillige computer vision (CV) applikationer til virksomheder i dag. En af disse applikationer er objektdetektering, hvor en ML-algoritme registrerer placeringen af ​​et objekt i et billede ved at tegne en afgrænsningsramme rundt om det og identificerer den type objekt, det er. At lære at anvende en objektdetekteringsmodel og finjustere den kan være af stor værdi for en organisation, der har CV-behov.

Denne løsning giver et eksempel på, hvordan man oversætter bounding box-specifikationer, når man leverer billeder til SageMaker-algoritmen. Denne løsning viser også, hvordan man forbedrer en objektdetekteringsmodel ved at tilføje træningsbilleder, der vendes vandret (spejlbilleder).

Der er en notesbog til at eksperimentere med objektdetekteringsudfordringer, når der er et stort antal klasser (200 fuglearter). Notesbogen viser også, hvordan man kortlægger de nøjagtighedsforbedringer, der sker på tværs af træningsjobbets epoker. Det følgende billede viser eksempler på billeder fra fugledatasættet.

Løs forretningsproblemer ende-til-ende gennem maskinlæring i Amazon SageMaker JumpStart-løsninger PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Denne løsning indeholder fem trin:

  1. Forbered dataene, herunder download og RecordIO filgenerering.
  2. Opret og træne en objektdetekteringsmodel.
  3. Implementer et slutpunkt og evaluer modellens ydeevne.
  4. Opret og træne en objektdetekteringsmodel igen med det udvidede datasæt.
  5. Implementer et slutpunkt og evaluer den udvidede modelydeevne.

Du får følgende som output:

  • Objektdetekteringsresultater med bindingsbokse mod dit testbillede
  • En trænet objektdetekteringsmodel
  • En trænet objektdetektionsmodel med et ekstra udvidet (vendt) datasæt
  • To separate endepunkter implementeret med et af hver model

Følgende diagram viser modelforbedring i forhold til modeliterationer (epoker) under træning.

Løs forretningsproblemer ende-til-ende gennem maskinlæring i Amazon SageMaker JumpStart-løsninger PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

De følgende eksempler er output fra to testbilleder.

Løs forretningsproblemer ende-til-ende gennem maskinlæring i Amazon SageMaker JumpStart-løsninger PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Løs forretningsproblemer ende-til-ende gennem maskinlæring i Amazon SageMaker JumpStart-løsninger PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Du kan anvende denne løsning til din virksomhed til følgende brugssituationer:

  • Opdag genstande på et transportbånd i en emballageindustri
  • Opdag toppings på en pizza
  • Implementer forsyningskædens operationelle applikationer, der involverer objektdetektering

Forudsigelse af lungekræft overlevelse

COVID-19 bragte meget mere opmærksomhed til lungerelaterede medicinske udfordringer. Det har også lagt et stort pres på hospitaler, læger, sygeplejersker og radiologer. Forestil dig en mulighed, hvor du kan anvende ML som et kraftfuldt værktøj til at hjælpe læger og hjælpe dem med at fremskynde deres arbejde. I denne løsning viser vi, hvordan 2D- og 3D-radiomiske funktioner og patientdemografi kan føres til en ML-algoritme for at forudsige en patients overlevelseschancer for lungekræft. Resultater fra denne forudsigelse kan hjælpe udbydere med at tage passende proaktive foranstaltninger.

Denne løsning demonstrerer, hvordan man bygger en skalerbar ML-pipeline til Non-Small Cell Lung Cancer (NSCLC) Radiogenomics-datasættet, som består af RNA-sekventeringsdata, kliniske data (som afspejler EPJ-data) og medicinske billeder. Brug af flere typer data til at skabe en maskinmodel kaldes multimodale ML. Denne løsning forudsiger overlevelsesresultatet for patienter diagnosticeret med ikke-småcellet lungekræft.

Følgende billede viser et eksempel på inputdata fra ikke-småcellet lungekræft (NSCLC) Radiogenomics-datasæt.

Løs forretningsproblemer ende-til-ende gennem maskinlæring i Amazon SageMaker JumpStart-løsninger PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Som en del af opløsningen blev total-RNA ekstraheret fra tumorvævet og analyseret med RNA-sekventeringsteknologi. Selvom de originale data indeholder mere end 22,000 gener, beholder vi 21 gener fra 10 stærkt co-udtrykte genklynger (metagenes), der blev identificeret, valideret i offentligt tilgængelige gen-ekspressionskohorter og korreleret med prognose.

De kliniske journaler gemmes i CSV-format. Hver række svarer til en patient, og kolonnerne indeholder oplysninger om patienterne, herunder demografi, tumorstadie og overlevelsesstatus.

For genomiske data beholder vi 21 gener fra 10 stærkt co-udtrykte genklynger (metagener), der blev identificeret, valideret i offentligt tilgængelige gen-ekspressionskohorter og korreleret med prognose.

Til medicinsk billeddannelsesdata skaber vi 3D-radiomiske funktioner på patientniveau, der forklarer størrelsen, formen og visuelle egenskaber af de tumorer, der observeres i CT-scanningerne. For hver patientundersøgelse udføres følgende trin:

  1. Læs 2D DICOM-udsnitsfilerne til både CT-scanning og tumorsegmentering, kombiner dem til 3D-volumener, gem mængderne i NIfTI-format.
  2. Juster CT-volumen og tumorsegmentering, så vi kan fokusere beregningen inde i tumoren.
  3. Beregn radiomiske træk, der beskriver tumorregionen ved hjælp af pyradiomikbiblioteket.
  4. Uddrag 120 radiomiske træk af otte klasser, såsom statistiske repræsentationer af fordelingen og samtidig forekomst af intensiteten inden for tumorområdet af interesse, og formbaserede målinger, der beskriver tumoren morfologisk.

For at skabe et multimodalt billede af en patient til modeltræning, samler vi funktionsvektorerne fra tre modaliteter. Vi behandler derefter dataene. Først normaliserer vi rækken af ​​uafhængige funktioner ved hjælp af funktionsskalering. Derefter udfører vi principal component analyse (PCA) på funktionerne for at reducere dimensionaliteten og identificere de mest diskriminerende funktioner, der bidrager med 95 % varians i dataene.

Dette resulterer i en dimensionsreduktion fra 215 funktioner ned til 45 hovedkomponenter, som udgør funktioner for den overvågede elev.

Løsningen producerer en ML-model, der forudsiger NSCLC-patienters overlevelsesstatus (død eller levende) i en form for sandsynlighed. Udover modellen og forudsigelsen genererer vi også rapporter for at forklare modellen. Den medicinske billeddannelsespipeline producerer 3D-lunge-CT-volumener og tumorsegmentering til visualiseringsformål.

Du kan anvende denne løsning til brugssager i sundhedssektoren og biovidenskab.

Klassificering af finansiel betaling

Det kan være ganske nyttigt at tage alle økonomiske transaktioner fra en virksomhed eller en forbruger og organisere dem i forskellige kategorier. Det kan hjælpe brugeren med at lære, hvor meget de har brugt i hvilken kategori, og det kan også give alarmer, når transaktioner eller forbrug i en given kategori stiger eller falder uventet.

Denne løsning viser, hvordan man træner og implementerer en ML-model til at klassificere finansielle transaktioner baseret på transaktionsoplysninger. Mange banker leverer dette som en service for at give deres slutbrugere et overblik over deres forbrugsvaner. Du kan også bruge denne løsning som et mellemtrin i registrering af svindel, personalisering eller afsløring af uregelmæssigheder. Vi bruger SageMaker til at træne og implementere en XGBoost-model med den nødvendige underliggende infrastruktur.

Det syntetiske datasæt, som vi skal demonstrere denne løsning, har følgende funktioner:

  • transaktionskategori – Transaktionskategorien ud af følgende 19 muligheder: Uncategorized, Entertainment, Education, Shopping, Personal Care, Health and Fitness, Food and Dining, Gifts and Donations, Investments, Bills and Utilities, Auto and Transport, Travel, Fees and Charges, Business Services, Personal Services, Taxes, Gambling, Homeog Pension and insurances.
  • modtager_id – En identifikator for den modtagende part. Identifikationen består af 16 numre.
  • sender_id – En identifikator for den afsendende part. Identifikationen består af 16 numre.
  • beløb – Det beløb, der overføres.
  • tidsstempel – Tidsstemplet for transaktionen i formatet ÅÅÅÅ-MM-DD TT:MM:SS.

De første fem observationer af datasættet er som følger:

Løs forretningsproblemer ende-til-ende gennem maskinlæring i Amazon SageMaker JumpStart-løsninger PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Til denne løsning bruger vi XGBoost, en populær og effektiv open source-implementering af algoritmen for gradientboostede træer. Gradientboosting er en overvåget læringsalgoritme, der forsøger at præcist forudsige en målvariabel ved at kombinere et ensemble af estimater fra et sæt enklere og svagere modeller. Dens implementering er tilgængelig i SageMaker indbyggede algoritmer.

Den finansielle betalingsklassificeringsløsning indeholder fire trin:

  1. Forbered dataene.
  2. Byg en featurebutik.
  3. Opret og træne en XGBoost-model.
  4. Implementer et slutpunkt og evaluer modellens ydeevne.

Vi får følgende output:

  • En trænet XGBoost-model baseret på vores eksempeldatasæt
  • Et SageMaker-slutpunkt, der kan forudsige transaktionskategorien

Efter at have kørt denne løsning, bør du se en klassificeringsrapport, der ligner følgende.

Løs forretningsproblemer ende-til-ende gennem maskinlæring i Amazon SageMaker JumpStart-løsninger PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Mulige anvendelser for din virksomhed omfatter følgende:

  • Forskellige finansielle applikationer inden for detail- og investeringsbankvirksomhed
  • Når transaktioner skal klassificeres i enhver use case (ikke kun økonomisk)

Churn-forudsigelse for mobiltelefonkunder

Forudsigelse af kundeafgang er et meget almindeligt forretningsbehov. Adskillige undersøgelser viser, at omkostningerne ved at fastholde en eksisterende kunde er meget mindre end at skaffe en ny kunde. Udfordringen kommer ofte fra virksomheder, der har svært ved at forstå, hvorfor en kunde churning, eller at bygge en model, der forudsiger churning.

I dette eksempel kan brugere, der er nye til ML, opleve, hvordan en churn-forudsigelsesmodel hurtigt kan udvikles ved hjælp af et mobilopkaldstransaktionsdatasæt. Denne løsning bruger SageMaker til at træne og implementere en XGBoost-model på et kundeprofildatasæt for at forudsige, om en kunde sandsynligvis vil forlade en mobiltelefonoperatør.

Datasættet, som denne løsning bruger, er offentligt tilgængeligt og er nævnt i bogen Discovering Knowledge in Data af Daniel T. Larose. Det tilskrives af forfatteren University of California Irvine Repository of Machine Learning Datasets.

Dette datasæt bruger følgende 21 attributter til at beskrive profilen for en kunde hos en ukendt amerikansk mobiloperatør.

  • Stat: den amerikanske stat, hvor kunden er bosat, angivet med en forkortelse på to bogstaver; for eksempel OH eller NJ
  • Kontolængde: det antal dage, denne konto har været aktiv
  • Områdekode: det trecifrede områdenummer for den tilsvarende kundes telefonnummer
  • Telefon: det resterende syvcifrede telefonnummer
  • Int'l Plan: om kunden har en international opkaldsplan: ja/nej
  • VMail Plan: om kunden har en voicemail-funktion: ja/nej
  • VMail-besked: det gennemsnitlige antal voicemail-beskeder pr. måned
  • Dagsminutter: det samlede antal opkaldsminutter brugt i løbet af dagen
  • Dagsopkald: Det samlede antal opkald foretaget i løbet af dagen
  • Dagsgebyr: de fakturerede omkostninger for opkald i dagtimerne
  • Eve Mins, Eve Calls, Eve Charge: den fakturerede pris for opkald foretaget i løbet af aftenen
  • Night Mins, Night Calls, Night Charge: den fakturerede pris for opkald foretaget om natten
  • Intl Mins, Intl Calls, Intl Charge: De fakturerede omkostninger for internationale opkald
  • CustServ-opkald: antallet af opkald til kundeservice
  • Churn?: om kunden forlod tjenesten: sand/falsk

Denne løsning indeholder tre faser:

  1. Forbered dataene.
  2. Opret og træne en XGBoost-model.
  3. Implementer et slutpunkt og evaluer modellens ydeevne.

Vi får følgende output:

  • En trænet XGBoost-model baseret på vores eksempeldatasæt til at forudsige brugerafgang
  • Et SageMaker-slutpunkt, der kan forudsige brugerafgang

Denne model hjælper med at vurdere, hvor mange af de 5,000 mobiltelefonkunder, der sandsynligvis stopper med at bruge deres nuværende mobiltelefonoperatør.

Følgende diagram viser en sandsynlighedsfordeling af churn som et output fra modellen.

Løs forretningsproblemer ende-til-ende gennem maskinlæring i Amazon SageMaker JumpStart-løsninger PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Du kan anvende dette på din virksomhed i følgende tilfælde:

  • Forudsige kundeafgang i din egen virksomhed
  • Klassificer, hvilke kunder der må åbne din marketing-e-mail, og hvem der ikke vil (binær klassificering)
  • Forudsige, hvilke elever der sandsynligvis vil droppe ud af et kursus

Ryd op i ressourcer

Når du er færdig med at køre en løsning i JumpStart, skal du sørge for at vælge Slet alle ressourcer så alle de ressourcer, som du har oprettet i processen, slettes, og din fakturering stoppes.

Løs forretningsproblemer ende-til-ende gennem maskinlæring i Amazon SageMaker JumpStart-løsninger PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Resumé

Dette indlæg viste dig, hvordan du løser forskellige forretningsproblemer ved at anvende ML, baseret på JumpStart-løsninger. Selvom dette indlæg fokuserede på de fem nye løsninger, der for nylig blev tilføjet til JumpStart, er der i alt 23 tilgængelige løsninger. Vi opfordrer dig til at logge ind på Studio og selv se på JumpStart-løsningerne og begynde at få øjeblikkelig værdi ud af dem. For mere information, se Amazon SageMaker Studio , SageMaker JumpStart.

Bemærk: Hvis du ikke kan se alle ovenstående fem løsninger i JumpStart-konsollen i din AWS-region, skal du vente i en uge og tjekke igen. Vi frigiver dem til forskellige regioner i etaper.


Om forfatterne

Løs forretningsproblemer ende-til-ende gennem maskinlæring i Amazon SageMaker JumpStart-løsninger PlatoBlockchain Data Intelligence. Lodret søgning. Ai. Dr. Raju Penmatcha er AI/ML Specialist Solutions Architect i AI-platforme hos AWS. Han arbejder på lav-kode/no-kode suite af tjenester i SageMaker, der hjælper kunder med nemt at bygge og implementere maskinlæringsmodeller og -løsninger. Når han ikke hjælper kunder, kan han godt lide at rejse til nye steder.

Løs forretningsproblemer ende-til-ende gennem maskinlæring i Amazon SageMaker JumpStart-løsninger PlatoBlockchain Data Intelligence. Lodret søgning. Ai.Manan Shah er softwareudviklingschef hos Amazon Web Services. Han er en ML-entusiast og fokuserer på at bygge no-code/low-code AI/ML-produkter. Han stræber efter at give andre talentfulde, tekniske folk mulighed for at bygge fantastisk software.

Tidsstempel:

Mere fra AWS maskinindlæring