Løs forretningsproblemer ende-til-ende gjennom maskinlæring i Amazon SageMaker JumpStart-løsninger PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Løs forretningsproblemer ende-til-ende gjennom maskinlæring i Amazon SageMaker JumpStart-løsninger

Amazon SageMaker JumpStart tilbyr forhåndsopplærte, åpen kildekode-modeller for et bredt spekter av problemtyper for å hjelpe deg med å komme i gang med maskinlæring (ML). JumpStart tilbyr også løsningsmaler som setter opp infrastruktur for vanlige brukstilfeller, og kjørbare eksempelnotatbøker for ML med Amazon SageMaker.

Som bedriftsbruker kan du gjøre følgende med JumpStart-løsninger:

  • Utforsk løsningene og vurder hvilke som passer godt til bedriftens behov.
  • Lanser løsninger med et enkelt klikk Amazon SageMaker Studio. Dette lanserer en AWS skyformasjon mal for å lage de nødvendige ressursene.
  • Endre løsningen for å møte dine behov med tilgang til underliggende notebook- og modellressurser.
  • Slett de innhentede ressursene når de er ferdige.

Dette innlegget fokuserer på de fem ML-løsningene som nylig ble lagt til for å møte fem forskjellige forretningsutfordringer. Når dette skrives, tilbyr JumpStart 23 forretningsløsninger som varierer fra å oppdage svindel i finansielle transaksjoner til å gjenkjenne håndskrift. Antallet løsninger som tilbys gjennom JumpStart øker med jevne mellomrom etter hvert som flere løsninger legges til det.

Løsningsoversikt

De fem nye løsningene er som følger:

  • Prisoptimalisering – Tilbyr tilpassbare ML-modeller for å hjelpe deg med å ta optimale beslutninger for å sette prisen på produktet eller tjenesten for å oppnå forretningsmålet ditt, for eksempel maksimering av inntekter, fortjeneste eller andre tilpassede beregninger.
  • Forutsigelse av fuglearter – Viser hvordan du kan trene og finjustere en objektdeteksjonsmodell. Den demonstrerer modelljustering gjennom treningsbildeforstørrelse, og kartlegger nøyaktighetsforbedringene som skjer på tvers av iterasjonene (epokene) av treningsjobben.
  • Lungekreft overlevelsesprediksjon – Viser hvordan du kan mate 2D- og 3D-radiomikrofunksjoner og pasientdemografi til en ML-algoritme for å forutsi en pasients overlevelsessjanser for lungekreft. Resultatene fra denne spådommen kan hjelpe tilbydere å ta passende proaktive tiltak.
  • Klassifisering av finansiell betaling – Demonstrerer hvordan man trener og distribuerer en ML-modell for å klassifisere finansielle transaksjoner basert på transaksjonsinformasjon. Du kan også bruke denne løsningen som et mellomtrinn i svindeloppdagelse, personalisering eller oppdagelse av anomalier.
  • Churn-prediksjon for mobiltelefonkunder – Demonstrerer hvordan du raskt kan utvikle en churn-prediksjonsmodell ved hjelp av et mobilanropstransaksjonsdatasett. Dette er et enkelt eksempel for brukere som er nye innen ML.

Forutsetninger

For å bruke disse løsningene, sørg for at du har tilgang til Studio med en utførelsesrolle som lar deg kjøre SageMaker-funksjonalitet. For brukerrollen din i Studio, sørg for at SageMaker Projects og JumpStart alternativet er slått på.

I de følgende delene går vi gjennom hver av de fem nye løsningene og diskuterer hvordan det fungerer i detalj, sammen med noen anbefalinger om hvordan du kan bruke det til dine egne forretningsbehov.

Prisoptimalisering

Bedrifter liker å bruke ulike spaker for å oppnå de beste resultatene. For eksempel er prisen på et produkt eller en tjeneste en spak som en virksomhet kan kontrollere. Spørsmålet er hvordan man bestemmer hvilken pris man skal sette et produkt eller en tjeneste til, for å maksimere et forretningsmål som fortjeneste eller inntekt.

Denne løsningen gir tilpassbare ML-modeller for å hjelpe deg med å ta optimale beslutninger for å sette prisen på produktet eller tjenesten for å oppnå målet ditt, for eksempel maksimering av inntekter, fortjeneste eller andre tilpassede beregninger. Løsningen bruker ML og kausal inferens tilnærminger for å lære pris-volum-relasjoner fra historiske data, og er i stand til å lage dynamiske prisanbefalinger i sanntid for å optimalisere de tilpassede målberegningene.

Følgende skjermbilde viser eksempelinndataene.

Løsningen består av tre deler:

  • Priselastisitetsestimat – Dette estimeres ved kausal slutning via en dobbel ML-algoritme
  • Volumprognose – Dette er spådd ved hjelp av profetens algoritme
  • Prisoptimalisering – Dette oppnås ved en hva-hvis-simulering gjennom ulike prisscenarier

Løsningen gir anbefalt pris for neste dag for å maksimere inntektene. I tillegg inkluderer utgangene estimert priselastisitet, som er en verdi som indikerer effekten av pris på volum, og en prognosemodell som er i stand til å forutsi neste dags volum. Følgende diagram viser hvordan en årsaksmodell som inkorporerer den beregnede priselastisiteten presterer mye bedre under en hva-hvis-analyse (med store avvik fra atferdspris) enn en prediktiv modell som bruker Prophet for å forutsi volum ved å bruke tidsseriedata.

Løs forretningsproblemer ende-til-ende gjennom maskinlæring i Amazon SageMaker JumpStart-løsninger PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Du kan bruke denne løsningen på virksomheten din for følgende bruksområder:

  • Bestem den optimale prisen på varer for en butikk
  • Estimer effekten av rabattkuponger på kundekjøp
  • Forutsi effekten av ulike insentivmetoder i enhver virksomhet

Forutsigelse av fuglearter

Det finnes flere applikasjoner for datasyn (CV) for bedrifter i dag. En av disse applikasjonene er objektdeteksjon, der en ML-algoritme oppdager plasseringen til et objekt i et bilde ved å tegne en avgrensende ramme rundt det, og identifiserer typen objekt det er. Å lære å bruke en objektdeteksjonsmodell og finjustere den kan være av stor verdi for en organisasjon som har CV-behov.

Denne løsningen gir et eksempel på hvordan du kan oversette spesifikasjoner for grenseboks når du gir bilder til SageMaker-algoritmen. Denne løsningen viser også hvordan man kan forbedre en objektdeteksjonsmodell ved å legge til treningsbilder som snus horisontalt (speilbilder).

En notatbok er gitt for å eksperimentere med gjenstandsdeteksjonsutfordringer når det er et stort antall klasser (200 fuglearter). Notatboken viser også hvordan du kan kartlegge nøyaktighetsforbedringene som skjer gjennom epoker av treningsjobben. Følgende bilde viser eksempelbilder fra fugledatasettet.

Løs forretningsproblemer ende-til-ende gjennom maskinlæring i Amazon SageMaker JumpStart-løsninger PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Denne løsningen inneholder fem trinn:

  1. Forbered dataene, inkludert nedlasting og RecordIO filgenerering.
  2. Lag og tren en objektdeteksjonsmodell.
  3. Distribuer et endepunkt og evaluer modellens ytelse.
  4. Opprett og tren opp en objektdeteksjonsmodell igjen med det utvidede datasettet.
  5. Distribuer et endepunkt og evaluer den utvidede modellens ytelse.

Du får følgende som utgang:

  • Objektdeteksjonsresultater med bindingsbokser mot testbildet ditt
  • En trent objektdeteksjonsmodell
  • En trent objektdeteksjonsmodell med et ekstra utvidet (snudd) datasett
  • To separate endepunkter utplassert med ett av hver modell

Følgende diagram viser modellforbedring mot modelliterasjoner (epoker) under trening.

Løs forretningsproblemer ende-til-ende gjennom maskinlæring i Amazon SageMaker JumpStart-løsninger PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Følgende eksempler er utdata fra to testbilder.

Løs forretningsproblemer ende-til-ende gjennom maskinlæring i Amazon SageMaker JumpStart-løsninger PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Løs forretningsproblemer ende-til-ende gjennom maskinlæring i Amazon SageMaker JumpStart-løsninger PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Du kan bruke denne løsningen på virksomheten din for følgende bruksområder:

  • Oppdag gjenstander på et transportbånd i en emballasjeindustri
  • Finn pålegg på en pizza
  • Implementer operative applikasjoner i forsyningskjeden som involverer gjenstandsdeteksjon

Lungekreft overlevelsesprediksjon

COVID-19 ga mye mer oppmerksomhet til lungerelaterte medisinske utfordringer. Det har også lagt mye press på sykehus, leger, sykepleiere og radiologer. Tenk deg en mulighet der du kan bruke ML som et kraftig verktøy for å hjelpe leger og hjelpe dem å få fart på arbeidet. I denne løsningen viser vi hvordan 2D- og 3D-radiomiske egenskaper og pasientdemografi kan mates til en ML-algoritme for å forutsi en pasients lungekreftoverlevelsessjanser. Resultater fra denne spådommen kan hjelpe tilbydere med å ta passende proaktive tiltak.

Denne løsningen demonstrerer hvordan man bygger en skalerbar ML-pipeline for Non-Small Cell Lung Cancer (NSCLC) Radiogenomics-datasettet, som består av RNA-sekvenseringsdata, kliniske data (som gjenspeiler EPJ-data) og medisinske bilder. Å bruke flere typer data for å lage en maskinmodell kalles multimodal ML. Denne løsningen forutsier overlevelsesresultatet for pasienter diagnostisert med ikke-småcellet lungekreft.

Følgende bilde viser et eksempel på inngangsdata fra ikke-småcellet lungekreft (NSCLC) Radiogenomics-datasettet.

Løs forretningsproblemer ende-til-ende gjennom maskinlæring i Amazon SageMaker JumpStart-løsninger PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Som en del av løsningen ble total-RNA ekstrahert fra tumorvevet og analysert med RNA-sekvenseringsteknologi. Selv om de originale dataene inneholder mer enn 22,000 21 gener, beholder vi 10 gener fra XNUMX sterkt samuttrykte genklynger (metagenes) som ble identifisert, validert i offentlig tilgjengelige genuttrykkskohorter og korrelert med prognose.

De kliniske journalene lagres i CSV-format. Hver rad tilsvarer en pasient, og kolonnene inneholder informasjon om pasientene, inkludert demografi, tumorstadium og overlevelsesstatus.

For genomiske data beholder vi 21 gener fra 10 sterkt samuttrykte genklynger (metagenes) som ble identifisert, validert i offentlig tilgjengelige genuttrykkskohorter og korrelert med prognose.

For medisinske bildedata lager vi 3D-radiomikrofunksjoner på pasientnivå som forklarer størrelsen, formen og visuelle egenskapene til svulstene observert i CT-skanningen. For hver pasientstudie utføres følgende trinn:

  1. Les 2D DICOM-snittfilene for både CT-skanning og tumorsegmentering, kombiner dem til 3D-volumer, lagre volumene i NIfTI-format.
  2. Juster CT-volum og tumorsegmentering slik at vi kan fokusere beregningen inne i svulsten.
  3. Beregn radiomiske trekk som beskriver svulstregionen ved hjelp av pyradiomikbiblioteket.
  4. Trekk ut 120 radiomiske trekk fra åtte klasser, for eksempel statistiske representasjoner av fordelingen og samtidig forekomst av intensiteten i tumorområdet av interesse, og formbaserte målinger som beskriver svulsten morfologisk.

For å lage en multimodal visning av en pasient for modelltrening, slår vi sammen funksjonsvektorene fra tre modaliteter. Vi behandler deretter dataene. Først normaliserer vi utvalget av uavhengige funksjoner ved å bruke funksjonsskalering. Deretter utfører vi hovedkomponentanalyse (PCA) på funksjonene for å redusere dimensjonaliteten og identifisere de mest diskriminerende funksjonene som bidrar med 95 % varians i dataene.

Dette resulterer i en dimensjonalitetsreduksjon fra 215 funksjoner ned til 45 hovedkomponenter, som utgjør funksjoner for den veiledede eleven.

Løsningen produserer en ML-modell som forutsier NSCLC-pasienters overlevelsesstatus (død eller levende) i en form for sannsynlighet. I tillegg til modellen og prediksjonen, genererer vi også rapporter for å forklare modellen. Den medisinske bildebehandlingsrørledningen produserer 3D-lunge-CT-volumer og tumorsegmentering for visualiseringsformål.

Du kan bruke denne løsningen på brukssaker innen helsevesen og biovitenskap.

Klassifisering av finansiell betaling

Å ta alle økonomiske transaksjoner til en bedrift eller en forbruker og organisere dem i ulike kategorier kan være ganske nyttig. Det kan hjelpe brukeren med å lære hvor mye de har brukt i hvilken kategori, og det kan også varsle når transaksjoner eller utgifter i en gitt kategori går opp eller ned uventet.

Denne løsningen viser hvordan man trener og distribuerer en ML-modell for å klassifisere finansielle transaksjoner basert på transaksjonsinformasjon. Mange banker tilbyr dette som en tjeneste for å gi sluttbrukerne en oversikt over forbruksvanene. Du kan også bruke denne løsningen som et mellomtrinn i svindeloppdagelse, personalisering eller oppdagelse av anomalier. Vi bruker SageMaker til å trene og distribuere en XGBoost-modell med nødvendig underliggende infrastruktur.

Det syntetiske datasettet som vi skal demonstrere denne løsningen har følgende funksjoner:

  • transaksjonskategori – Transaksjonskategorien, av følgende 19 alternativer: Uncategorized, Entertainment, Education, Shopping, Personal Care, Health and Fitness, Food and Dining, Gifts and Donations, Investments, Bills and Utilities, Auto and Transport, Travel, Fees and Charges, Business Services, Personal Services, Taxes, Gambling, Homeog Pension and insurances.
  • mottaker_id – En identifikator for den mottakende parten. Identifikatoren består av 16 tall.
  • avsenders ID – En identifikator for avsenderparten. Identifikatoren består av 16 tall.
  • beløp – Beløpet som overføres.
  • tidsstempel – Transaksjonens tidsstempel i formatet ÅÅÅÅ-MM-DD TT:MM:SS.

De fem første observasjonene av datasettet er som følger:

Løs forretningsproblemer ende-til-ende gjennom maskinlæring i Amazon SageMaker JumpStart-løsninger PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

For denne løsningen bruker vi XGBoost, en populær og effektiv åpen kildekode-implementering av algoritmen for gradientforsterkede trær. Gradient boosting er en overvåket læringsalgoritme som prøver å forutsi en målvariabel nøyaktig ved å kombinere et ensemble av estimater fra et sett med enklere og svakere modeller. Implementeringen er tilgjengelig i SageMaker innebygde algoritmer.

Den økonomiske betalingsklassifiseringsløsningen inneholder fire trinn:

  1. Forbered dataene.
  2. Bygg en funksjonsbutikk.
  3. Lag og tren opp en XGBoost-modell.
  4. Distribuer et endepunkt og evaluer modellens ytelse.

Vi får følgende utgang:

  • En trent XGBoost-modell basert på vårt eksempeldatasett
  • Et SageMaker-endepunkt som kan forutsi transaksjonskategorien

Etter å ha kjørt denne løsningen, bør du se en klassifiseringsrapport som ligner på følgende.

Løs forretningsproblemer ende-til-ende gjennom maskinlæring i Amazon SageMaker JumpStart-løsninger PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Mulige applikasjoner for virksomheten din inkluderer følgende:

  • Ulike finansielle applikasjoner innen detaljhandel og investeringsbank
  • Når transaksjoner må klassifiseres i ethvert brukstilfelle (ikke bare økonomisk)

Churn-prediksjon for mobiltelefonkunder

Å forutsi kundefragang er et veldig vanlig forretningsbehov. Tallrike studier viser at kostnadene ved å beholde en eksisterende kunde er mye mindre enn å skaffe en ny kunde. Utfordringen kommer ofte fra bedrifter som har vanskelig for å forstå hvorfor en kunde churner, eller bygger en modell som forutsier churning.

I dette eksemplet kan brukere som er nye til ML, oppleve hvordan en churn-prediksjonsmodell raskt kan utvikles ved hjelp av et mobilanropstransaksjonsdatasett. Denne løsningen bruker SageMaker til å trene og distribuere en XGBoost-modell på et kundeprofildatasett for å forutsi om en kunde sannsynligvis vil forlate en mobiltelefonoperatør.

Datasettet denne løsningen bruker er offentlig tilgjengelig og er nevnt i boken Discovering Knowledge in Data av Daniel T. Larose. Det tilskrives av forfatteren University of California Irvine Repository of Machine Learning Datasets.

Dette datasettet bruker følgende 21 attributter for å beskrive profilen til en kunde hos en ukjent amerikansk mobiloperatør.

  • Stat: den amerikanske staten der kunden er bosatt, angitt med en forkortelse på to bokstaver; for eksempel OH eller NJ
  • Kontolengde: antall dager denne kontoen har vært aktiv
  • Retningsnummer: det tresifrede retningsnummeret til den tilsvarende kundens telefonnummer
  • Telefon: det resterende syvsifrede telefonnummeret
  • Int'l Plan: om kunden har en internasjonal ringeplan: ja/nei
  • VMail Plan: om kunden har en talepostfunksjon: ja/nei
  • VMail-melding: gjennomsnittlig antall talepostmeldinger per måned
  • Dagsminutter: totalt antall ringeminutter brukt i løpet av dagen
  • Dagsanrop: det totale antallet anrop som er foretatt i løpet av dagen
  • Dagavgift: fakturert kostnad for samtaler på dagtid
  • Eve Mins, Eve Calls, Eve Charge: fakturert kostnad for samtaler på kveldstid
  • Night Mins, Night Calls, Night Charge: fakturert kostnad for samtaler om natten
  • Intl Mins, Intl Calls, Intl Charge: fakturert kostnad for internasjonale samtaler
  • CustServ-anrop: antall anrop til kundeservice
  • Churn?: om kunden forlot tjenesten: sant/usant

Denne løsningen inneholder tre trinn:

  1. Forbered dataene.
  2. Lag og tren opp en XGBoost-modell.
  3. Distribuer et endepunkt og evaluer modellens ytelse.

Vi får følgende utgang:

  • En trent XGBoost-modell basert på vårt eksempeldatasett for å forutsi brukeravgang
  • Et SageMaker-endepunkt som kan forutsi brukeravgang

Denne modellen hjelper til med å anslå hvor mange av de 5,000 mobiltelefonkundene som sannsynligvis slutter å bruke sin nåværende mobiltelefonoperatør.

Følgende diagram viser en sannsynlighetsfordeling av churn som en utgang fra modellen.

Løs forretningsproblemer ende-til-ende gjennom maskinlæring i Amazon SageMaker JumpStart-løsninger PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Du kan bruke dette på bedriften din for følgende brukstilfeller:

  • Forutse kundefragang i din egen virksomhet
  • Klassifiser hvilke kunder som kan åpne markedsførings-e-posten din og hvem som ikke vil (binær klassifisering)
  • Forutsi hvilke studenter som sannsynligvis faller fra et kurs

Rydd opp i ressursene

Når du er ferdig med å kjøre en løsning i JumpStart, sørg for å velge Slett alle ressurser så alle ressursene du har opprettet i prosessen blir slettet og faktureringen din stoppes.

Løs forretningsproblemer ende-til-ende gjennom maskinlæring i Amazon SageMaker JumpStart-løsninger PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Oppsummering

Dette innlegget viste deg hvordan du løser ulike forretningsproblemer ved å bruke ML, basert på JumpStart-løsninger. Selv om dette innlegget fokuserte på de fem nye løsningene som nylig ble lagt til JumpStart, er det totalt 23 tilgjengelige løsninger. Vi oppfordrer deg til å logge på Studio og se på JumpStart-løsningene selv og begynne å hente umiddelbar verdi ut av dem. For mer informasjon, se Amazon SageMaker Studio og SageMaker JumpStart.

Merk: Hvis du ikke ser alle de fem løsningene ovenfor i JumpStart-konsollen i AWS-regionen din, vennligst vent i en uke og sjekk igjen. Vi slipper dem ut til ulike regioner i etappevis.


Om forfatterne

Løs forretningsproblemer ende-til-ende gjennom maskinlæring i Amazon SageMaker JumpStart-løsninger PlatoBlockchain Data Intelligence. Vertikalt søk. Ai. Dr. Raju Penmatcha er en AI/ML Specialist Solutions Architect i AI-plattformer ved AWS. Han jobber med tjenestepakken med lav kode/ingen kode i SageMaker som hjelper kunder med å enkelt bygge og distribuere maskinlæringsmodeller og -løsninger. Når han ikke hjelper kunder, liker han å reise til nye steder.

Løs forretningsproblemer ende-til-ende gjennom maskinlæring i Amazon SageMaker JumpStart-løsninger PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.Manan Shah er en programvareutviklingssjef hos Amazon Web Services. Han er en ML-entusiast og fokuserer på å bygge no-code/low-code AI/ML-produkter. Han streber etter å gi andre talentfulle, tekniske mennesker mulighet til å bygge god programvare.

Tidstempel:

Mer fra AWS maskinlæring