Rešite poslovne težave od konca do konca s pomočjo strojnega učenja v rešitvah Amazon SageMaker JumpStart

Ponovno objavil Platon

Spremljevalci: 0

Amazon SageMaker JumpStart ponuja vnaprej usposobljene odprtokodne modele za širok nabor vrst problemov, ki vam pomagajo začeti s strojnim učenjem (ML). JumpStart ponuja tudi predloge rešitev, ki nastavijo infrastrukturo za običajne primere uporabe, in primere izvedljivih prenosnih računalnikov za ML z Amazon SageMaker.

Kot poslovni uporabnik lahko z rešitvami JumpStart naredite naslednje:

Raziščite rešitve in ocenite, katere se dobro ujemajo z vašimi poslovnimi potrebami.
Zagon rešitev z enim klikom Amazon SageMaker Studio. To sproži an Oblikovanje oblaka AWS predlogo za ustvarjanje potrebnih virov.
Spremenite rešitev, da bo ustrezala vašim potrebam z dostopom do osnovnega prenosnega računalnika in sredstev modela.
Ko končate, izbrišite pridobljene vire.

Ta objava se osredotoča na pet rešitev ML, ki so bile nedavno dodane za reševanje petih različnih poslovnih izzivov. Od tega pisanja JumpStart ponuja 23 poslovnih rešitev, ki se razlikujejo od odkrivanja goljufij pri finančnih transakcijah do prepoznavanja rokopisa. Število rešitev, ki jih ponuja JumpStart, se redno povečuje z dodajanjem novih rešitev.

Pregled rešitev

Pet novih rešitev je naslednjih:

Optimizacija cen – Ponuja prilagodljive modele ML, ki vam pomagajo sprejemati optimalne odločitve za nastavitev cene vašega izdelka ali storitve, da dosežete svoj poslovni cilj, kot je povečanje prihodkov, dobička ali drugih meritev po meri.
Napoved vrste ptic – Prikazuje, kako lahko trenirate in natančno prilagodite model zaznavanja objektov. Prikazuje prilagajanje modela s povečanjem slike za usposabljanje in prikazuje izboljšave natančnosti, ki se pojavijo med ponovitvami (obdobji) opravila za usposabljanje.
Napoved preživetja pljučnega raka – Prikazuje, kako lahko 2D- in 3D-radiomične funkcije in demografske podatke bolnikov vnesete v algoritem ML, da napoveste možnosti preživetja bolnikovega pljučnega raka. Rezultati te napovedi lahko pomagajo ponudnikom, da sprejmejo ustrezne proaktivne ukrepe.
Razvrstitev finančnih plačil – Prikazuje, kako usposobiti in uvesti model ML za razvrščanje finančnih transakcij na podlagi informacij o transakcijah. To rešitev lahko uporabite tudi kot vmesni korak pri odkrivanju goljufij, personalizaciji ali odkrivanju nepravilnosti.
Napoved odliva za stranke mobilnih telefonov – Prikazuje, kako hitro razviti model napovedi opuščanja z uporabo nabora podatkov o transakcijah mobilnih klicev. To je preprost primer za uporabnike, ki so novi v ML.

Predpogoji

Če želite uporabiti te rešitve, se prepričajte, da imate dostop do programa Studio z izvajalsko vlogo, ki vam omogoča zagon funkcionalnosti SageMaker. Za svojo uporabniško vlogo v Studiu se prepričajte, da je Projekti SageMaker in JumpStart možnost je vklopljena.

V naslednjih razdelkih gremo skozi vsako od petih novih rešitev in podrobno razpravljamo o tem, kako deluje, skupaj z nekaj priporočili, kako jo lahko uporabite za lastne poslovne potrebe.

Optimizacija cen

Podjetja rada uporabljajo različne vzvode za doseganje najboljših rezultatov. Na primer, cena izdelka ali storitve je vzvod, ki ga podjetje lahko nadzoruje. Vprašanje je, kako se odločiti, kakšno ceno postaviti za izdelek ali storitev, da bi maksimirali poslovni cilj, kot je dobiček ali prihodek.

Ta rešitev ponuja prilagodljive modele ML, ki vam pomagajo sprejemati optimalne odločitve za nastavitev cene vašega izdelka ali storitve, da dosežete svoj cilj, kot je maksimiranje prihodka, dobička ali drugih meritev po meri. Rešitev uporablja pristope ML in vzročnega sklepanja za učenje razmerij med ceno in obsegom iz preteklih podatkov in je sposobna oblikovati dinamična cenovna priporočila v realnem času za optimizacijo ciljnih meritev po meri.

Naslednji posnetek zaslona prikazuje vzorčne vhodne podatke.

Rešitev vključuje tri dele:

Ocena cenovne elastičnosti – To je ocenjeno z vzročnim sklepanjem prek dvojnega algoritma ML
Napoved količine – To je napovedano z algoritmom Prophet
Optimizacija cen – To se doseže s simulacijo kaj če prek različnih cenovnih scenarijev

Rešitev zagotavlja priporočeno ceno za naslednji dan za čim večji prihodek. Poleg tega rezultati vključujejo ocenjeno cenovno elastičnost, ki je vrednost, ki kaže učinek cene na obseg, in model napovedi, ki lahko napove obseg za naslednji dan. Naslednji grafikon prikazuje, kako vzročni model, ki je vključeval izračunano cenovno elastičnost, deluje veliko bolje pri analizi kaj če (z velikimi odstopanji od vedenjske cene) kot napovedni model, ki uporablja Prophet za napovedovanje obsega z uporabo podatkov časovnih vrst.

To rešitev lahko uporabite v svojem podjetju za naslednje primere uporabe:

Določite optimalno ceno blaga za maloprodajno trgovino
Ocenite učinek kuponov za popust na nakupe strank
Predvidite učinek različnih metod spodbujanja v katerem koli poslu

Napoved vrst ptic

Danes obstaja več aplikacij za računalniški vid (CV) za podjetja. Ena od teh aplikacij je zaznavanje predmetov, kjer algoritem ML zazna lokacijo predmeta na sliki tako, da okoli njega nariše omejevalni okvir, in identificira vrsto predmeta. Učenje uporabe modela zaznavanja predmetov in njegove natančne nastavitve je lahko zelo koristno za organizacijo, ki potrebuje življenjepis.

Ta rešitev nudi primer, kako prevesti specifikacije omejevalnega okvirja, ko algoritmu SageMaker posredujete slike. Ta rešitev tudi prikazuje, kako izboljšati model zaznavanja objektov z dodajanjem učnih slik, ki so obrnjene vodoravno (zrcalne slike).

Na voljo je zvezek za eksperimentiranje z izzivi zaznavanja predmetov, ko je veliko razredov (200 vrst ptic). Beležnica tudi prikazuje, kako začrtati izboljšave natančnosti, ki se pojavijo v različnih obdobjih usposabljanja. Naslednja slika prikazuje primere slik iz nabora podatkov o pticah.

Ta rešitev vsebuje pet korakov:

Pripravite podatke, vključno s prenosom in RecordIO ustvarjanje datoteke.
Ustvarite in učite model zaznavanja objektov.
Razmestite končno točko in ocenite zmogljivost modela.
Ponovno ustvarite in učite model zaznavanja objektov z razširjenim naborom podatkov.
Razmestite končno točko in ocenite zmogljivost razširjenega modela.

Kot rezultat dobite naslednje:

Rezultati zaznavanja predmetov z veznimi okvirji proti vaši testni sliki
Izurjeni model zaznavanja predmetov
Usposobljen model zaznavanja objektov z dodatnim razširjenim (obrnjenim) naborom podatkov
Dve ločeni končni točki, nameščeni z enim od vsakega modela

Naslednji grafikon prikazuje izboljšanje modela glede na ponovitve modela (epohe) med usposabljanjem.

Naslednji primeri so rezultat dveh testnih slik.

To rešitev lahko uporabite v svojem podjetju za naslednje primere uporabe:

Zaznavanje predmetov na tekočem traku v embalažni industriji
Zaznavanje prelivov na pici
Implementirajte operativne aplikacije dobavne verige, ki vključujejo zaznavanje predmetov

Napoved preživetja pljučnega raka

COVID-19 je prinesel veliko več pozornosti zdravstvenim izzivom, povezanim s pljuči. Prav tako je povzročil velik pritisk na bolnišnice, zdravnike, medicinske sestre in radiologe. Predstavljajte si možnost, da lahko uporabite ML kot močno orodje za pomoč zdravnikom in jim pomagate pospešiti njihovo delo. V tej rešitvi prikazujemo, kako je mogoče 2D in 3D radijske značilnosti in demografske podatke bolnikov vnesti v algoritem ML za napovedovanje možnosti preživetja bolnikovega pljučnega raka. Rezultati te napovedi lahko pomagajo ponudnikom, da sprejmejo ustrezne proaktivne ukrepe.

Ta rešitev prikazuje, kako zgraditi razširljiv cevovod ML za nabor radiogenomike nedrobnoceličnega pljučnega raka (NSCLC), ki je sestavljen iz podatkov o zaporedju RNK, kliničnih podatkov (ki odražajo podatke EHR) in medicinskih slik. Uporaba več vrst podatkov za ustvarjanje strojnega modela se imenuje večmodalni ML. Ta rešitev napoveduje izid preživetja bolnikov z diagnozo nedrobnoceličnega pljučnega raka.

Naslednja slika prikazuje primer vhodnih podatkov iz nabora radiogenomičnih podatkov o nedrobnoceličnem pljučnem raku (NSCLC).

Kot del raztopine je bila iz tumorskega tkiva ekstrahirana celotna RNA in analizirana s tehnologijo sekvenciranja RNA. Čeprav izvirni podatki vsebujejo več kot 22,000 genov, hranimo 21 genov iz 10 visoko soizraženih genskih skupin (metagenov), ki so bili identificirani, potrjeni v javno dostopnih kohortah izražanja genov in povezani z prognozo.

Klinični zapisi so shranjeni v formatu CSV. Vsaka vrstica ustreza bolniku, stolpci pa vsebujejo informacije o bolnikih, vključno z demografskimi podatki, stopnjo tumorja in statusom preživetja.

Za genomske podatke hranimo 21 genov iz 10 visoko soizraženih genskih skupin (metagenov), ki so bili identificirani, potrjeni v javno dostopnih kohortah genskega izražanja in povezani z napovedjo.

Za podatke medicinskega slikanja ustvarimo 3D radiološke značilnosti na ravni pacienta, ki pojasnjujejo velikost, obliko in vizualne lastnosti tumorjev, opaženih pri CT-pregledih. Za vsako študijo bolnika se izvedejo naslednji koraki:

Preberite datoteke rezin 2D DICOM za skeniranje CT in segmentacijo tumorja, jih združite v 3D volumne, shranite volumne v formatu NIfTI.
Uskladite volumen CT in segmentacijo tumorja, da lahko osredotočimo izračun znotraj tumorja.
Izračunajte radiomične značilnosti, ki opisujejo regijo tumorja z uporabo knjižnice piradiomike.
Izvlecite 120 radijskih značilnosti osmih razredov, kot so statistični prikazi porazdelitve in sočasnega pojava intenzivnosti znotraj zanimivega tumorskega območja ter meritve na podlagi oblike, ki morfološko opisujejo tumor.

Za ustvarjanje večmodalnega pogleda pacienta za modelno usposabljanje združimo vektorje značilnosti iz treh modalitet. Podatke nato obdelamo. Najprej normaliziramo obseg neodvisnih funkcij s skaliranjem funkcij. Nato izvedemo analizo glavnih komponent (PCA) na funkcijah, da zmanjšamo dimenzionalnost in identificiramo najbolj diskriminatorne značilnosti, ki prispevajo 95 % variance v podatkih.

Posledica tega je zmanjšanje dimenzij z 215 funkcij na 45 glavnih komponent, ki predstavljajo funkcije za nadzorovanega učenca.

Rešitev ustvari model ML, ki napove status preživetja bolnikov z nedrobnoceličnim pljučnim rakom (živ ali mrtev) v obliki verjetnosti. Poleg modela in napovedi ustvarjamo tudi poročila za razlago modela. Cevovod za medicinsko slikanje proizvaja 3D volumne CT pljuč in segmentacijo tumorja za namene vizualizacije.

To rešitev lahko uporabite za primere uporabe v zdravstvu in znanostih o življenju.

Finančna klasifikacija plačil

Če vzamemo vse finančne transakcije podjetja ali potrošnika in jih organiziramo v različne kategorije, je lahko zelo koristno. Uporabniku lahko pomaga ugotoviti, koliko je porabil v kateri kategoriji, prav tako pa lahko sproži opozorila, ko se transakcije ali poraba v določeni kategoriji nepričakovano povečajo ali zmanjšajo.

Ta rešitev prikazuje, kako usposobiti in uvesti model ML za razvrščanje finančnih transakcij na podlagi informacij o transakcijah. Številne banke to ponujajo kot storitev, s katero svojim končnim uporabnikom omogočijo pregled nad njihovimi potrošniškimi navadami. To rešitev lahko uporabite tudi kot vmesni korak pri odkrivanju goljufij, personalizaciji ali odkrivanju nepravilnosti. SageMaker uporabljamo za usposabljanje in uvajanje modela XGBoost z zahtevano osnovno infrastrukturo.

Sintetični nabor podatkov, s katerim želimo prikazati to rešitev, ima naslednje lastnosti:

kategorija_transakcije – Kategorija transakcije, od naslednjih 19 možnosti: Uncategorized, Entertainment, Education, Shopping, Personal Care, Health and Fitness, Food and Dining, Gifts and Donations, Investments, Bills and Utilities, Auto and Transport, Travel, Fees and Charges, Business Services, Personal Services, Taxes, Gambling, Homein Pension and insurances.
sprejemnik_id – Identifikator za prejemno stranko. Identifikator je sestavljen iz 16 številk.
sender_id – Identifikator pošiljatelja. Identifikator je sestavljen iz 16 številk.
znesek – Znesek, ki se prenese.
Časovni žig – Časovni žig transakcije v obliki LLLL-MM-DD HH:MM:SS.

Prvih pet opazovanj nabora podatkov je naslednjih:

Za to rešitev uporabljamo XGBoost, priljubljeno in učinkovito odprtokodno izvedbo algoritma gradientno povečanih dreves. Gradientno povečevanje je algoritem za nadzorovano učenje, ki poskuša natančno napovedati ciljno spremenljivko s kombiniranjem niza ocen iz nabora enostavnejših in šibkejših modelov. Njegova implementacija je na voljo v vgrajenih algoritmih SageMaker.

Rešitev za klasifikacijo finančnih plačil vsebuje štiri korake:

Pripravite podatke.
Zgradite trgovino s funkcijami.
Ustvarite in usposobite model XGBoost.
Razmestite končno točko in ocenite zmogljivost modela.

Dobimo naslednji rezultat:

Usposobljen model XGBoost, ki temelji na našem vzorčnem nizu podatkov
Končna točka SageMaker, ki lahko predvidi kategorijo transakcije

Po zagonu te rešitve bi morali videti poročilo o klasifikaciji, podobno naslednjemu.

Možne aplikacije za vaše podjetje vključujejo naslednje:

Različne finančne aplikacije v bančništvu s prebivalstvom in investicijskem bančništvu
Ko je treba transakcije razvrstiti v kateri koli primer uporabe (ne samo v finančnem)

Napoved odliva za stranke mobilnih telefonov

Predvidevanje odliva strank je zelo pogosta poslovna potreba. Številne študije kažejo, da je strošek obdržanja obstoječe stranke veliko nižji od pridobitve nove stranke. Izziv pogosto prihaja iz podjetij, ki težko razumejo, zakaj stranka odhaja, ali izdelajo model, ki predvideva odpuščanje.

V tem primeru lahko uporabniki, ki so novi v ML, izkusijo, kako je mogoče hitro razviti model napovedi opuščanja z uporabo nabora podatkov o transakcijah mobilnih klicev. Ta rešitev uporablja SageMaker za usposabljanje in uvajanje modela XGBoost v naboru podatkov profila stranke, da napove, ali bo stranka verjetno zapustila operaterja mobilne telefonije.

Nabor podatkov, ki ga uporablja ta rešitev, je javno dostopen in je omenjen v knjigi Daniela T. Larosea Discovering Knowledge in Data. Avtor ga pripisuje repozitoriju podatkovnih nizov strojnega učenja Irvine Univerze v Kaliforniji.

Ta nabor podatkov uporablja naslednjih 21 atributov za opis profila stranke neznanega mobilnega operaterja v ZDA.

Država: zvezna država ZDA, v kateri stranka prebiva, označena z dvočrkovno okrajšavo; na primer OH ali NJ
Trajanje računa: število dni, ko je bil ta račun aktiven
Območna koda: trimestna območna koda ustrezne telefonske številke stranke
Telefon: preostala sedemmestna telefonska številka
Int'l Plan: ali ima stranka mednarodni klicni načrt: da/ne
Načrt VMail: ali ima stranka funkcijo glasovne pošte: da/ne
Sporočilo VMail: povprečno število glasovnih sporočil na mesec
Dnevne minute: skupno število porabljenih minut klicev čez dan
Dnevni klici: skupno število klicev v dnevu
Dnevni stroški: zaračunani stroški dnevnih klicev
Eve Mins, Eve Calls, Eve Charge: zaračunani stroški za klice zvečer
Nočne minute, nočni klici, nočni stroški: zaračunani stroški za klice ponoči
Intl Mins, Intl Calls, Intl Charge: zaračunani stroški za mednarodne klice
Klici CustServ: število klicev v službo za stranke
Odliv?: ali je stranka zapustila storitev: drži/ne drži

Ta rešitev vsebuje tri stopnje:

Pripravite podatke.
Ustvarite in usposobite model XGBoost.
Razmestite končno točko in ocenite zmogljivost modela.

Dobimo naslednji rezultat:

Usposobljen model XGBoost, ki temelji na našem vzorčnem naboru podatkov za napovedovanje odliva uporabnikov
Končna točka SageMaker, ki lahko predvidi odliv uporabnikov

Ta model pomaga oceniti, koliko od 5,000 uporabnikov mobilnih telefonov bo verjetno prenehalo uporabljati svojega trenutnega operaterja mobilne telefonije.

Naslednji grafikon prikazuje verjetnostno porazdelitev odliva kot rezultat modela.

To lahko uporabite v svojem podjetju za naslednje primere uporabe:

Predvidite odliv strank v svojem podjetju
Razvrstite, katere stranke lahko odprejo vašo tržno e-pošto in katere ne (binarna klasifikacija)
Predvidite, kateri študenti bodo verjetno opustili tečaj

Očistite vire

Ko končate z izvajanjem rešitve v JumpStartu, se prepričajte, da ste izbrali Izbriši vse vire tako so vsi viri, ki ste jih ustvarili v procesu, izbrisani in vaše obračunavanje je ustavljeno.

Povzetek

Ta objava vam je pokazala, kako rešiti različne poslovne probleme z uporabo ML, ki temelji na rešitvah JumpStart. Čeprav se je ta objava osredotočila na pet novih rešitev, ki so bile nedavno dodane v JumpStart, je skupno na voljo 23 rešitev. Priporočamo vam, da se prijavite v Studio in si sami ogledate rešitve JumpStart ter začnete iz njih pridobivati takojšnjo vrednost. Za več informacij glejte Amazon SageMaker Studio in SageMaker JumpStart.

Opomba: Če v konzoli JumpStart vaše regije AWS ne vidite vseh zgornjih petih rešitev, počakajte en teden in preverite znova. Postopoma jih sproščamo v različne regije.

O avtorjih

Dr. Raju Penmatcha je specialist za rešitve AI/ML za platforme AI pri AWS. Dela na naboru storitev z nizko kodo/brez kode v SageMakerju, ki strankam pomagajo preprosto zgraditi in uvesti modele in rešitve strojnega učenja. Ko ne pomaga strankam, rad potuje v nove kraje.

Manan Šah je vodja razvoja programske opreme pri Amazon Web Services. Je navdušenec nad ML in se osredotoča na izdelavo izdelkov AI/ML brez kode/z nizko kodo. Prizadeva si opolnomočiti druge nadarjene, tehnične ljudi za izdelavo odlične programske opreme.

Časovni žig: Oktober 31, 2022November 1, 2022

Časovni žig: November 22, 2023

Rešujte poslovne težave od konca do konca s pomočjo strojnega učenja v rešitvah Amazon SageMaker JumpStart

Ponovno objavil Platon

Pregled rešitev

Predpogoji

Optimizacija cen

Napoved vrst ptic

Napoved preživetja pljučnega raka

Finančna klasifikacija plačil

Napoved odliva za stranke mobilnih telefonov

Očistite vire

Povzetek

O avtorjih

Več od Strojno učenje AWS

Izvedite inteligentno iskanje po e-pošti v svojem delovnem prostoru Google z uporabo priključka Gmail za Amazon Kendra

Analizirajte napade glodalcev z uporabo geoprostorskih zmogljivosti Amazon SageMaker | Spletne storitve Amazon

Uporabite vzorce Github z Amazon SageMaker Data Wrangler

Inteligentno iščite po vsebini Alfresco z Amazon Kendra

AWS in Mistral AI se zavezujeta k demokratizaciji generativne umetne inteligence z okrepljenim sodelovanjem | Spletne storitve Amazon

O nas

Navpično iskanje in Ai

Platforma

Ostanite povezani

Račun