Rešujte poslovne probleme od konca do konca s strojnim učenjem v rešitvah Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

Rešujte poslovne težave od konca do konca s pomočjo strojnega učenja v rešitvah Amazon SageMaker JumpStart

Amazon SageMaker JumpStart ponuja vnaprej usposobljene odprtokodne modele za širok nabor vrst problemov, ki vam pomagajo začeti s strojnim učenjem (ML). JumpStart ponuja tudi predloge rešitev, ki nastavijo infrastrukturo za običajne primere uporabe, in primere izvedljivih prenosnih računalnikov za ML z Amazon SageMaker.

Kot poslovni uporabnik lahko z rešitvami JumpStart naredite naslednje:

  • Raziščite rešitve in ocenite, katere se dobro ujemajo z vašimi poslovnimi potrebami.
  • Zagon rešitev z enim klikom Amazon SageMaker Studio. To sproži an Oblikovanje oblaka AWS predlogo za ustvarjanje potrebnih virov.
  • Spremenite rešitev, da bo ustrezala vašim potrebam z dostopom do osnovnega prenosnega računalnika in sredstev modela.
  • Ko končate, izbrišite pridobljene vire.

Ta objava se osredotoča na pet rešitev ML, ki so bile nedavno dodane za reševanje petih različnih poslovnih izzivov. Od tega pisanja JumpStart ponuja 23 poslovnih rešitev, ki se razlikujejo od odkrivanja goljufij pri finančnih transakcijah do prepoznavanja rokopisa. Število rešitev, ki jih ponuja JumpStart, se redno povečuje z dodajanjem novih rešitev.

Pregled rešitev

Pet novih rešitev je naslednjih:

  • Optimizacija cen – Ponuja prilagodljive modele ML, ki vam pomagajo sprejemati optimalne odločitve za nastavitev cene vašega izdelka ali storitve, da dosežete svoj poslovni cilj, kot je povečanje prihodkov, dobička ali drugih meritev po meri.
  • Napoved vrste ptic – Prikazuje, kako lahko trenirate in natančno prilagodite model zaznavanja objektov. Prikazuje prilagajanje modela s povečanjem slike za usposabljanje in prikazuje izboljšave natančnosti, ki se pojavijo med ponovitvami (obdobji) opravila za usposabljanje.
  • Napoved preživetja pljučnega raka – Prikazuje, kako lahko 2D- in 3D-radiomične funkcije in demografske podatke bolnikov vnesete v algoritem ML, da napoveste možnosti preživetja bolnikovega pljučnega raka. Rezultati te napovedi lahko pomagajo ponudnikom, da sprejmejo ustrezne proaktivne ukrepe.
  • Razvrstitev finančnih plačil – Prikazuje, kako usposobiti in uvesti model ML za razvrščanje finančnih transakcij na podlagi informacij o transakcijah. To rešitev lahko uporabite tudi kot vmesni korak pri odkrivanju goljufij, personalizaciji ali odkrivanju nepravilnosti.
  • Napoved odliva za stranke mobilnih telefonov – Prikazuje, kako hitro razviti model napovedi opuščanja z uporabo nabora podatkov o transakcijah mobilnih klicev. To je preprost primer za uporabnike, ki so novi v ML.

Predpogoji

Če želite uporabiti te rešitve, se prepričajte, da imate dostop do programa Studio z izvajalsko vlogo, ki vam omogoča zagon funkcionalnosti SageMaker. Za svojo uporabniško vlogo v Studiu se prepričajte, da je Projekti SageMaker in JumpStart možnost je vklopljena.

V naslednjih razdelkih gremo skozi vsako od petih novih rešitev in podrobno razpravljamo o tem, kako deluje, skupaj z nekaj priporočili, kako jo lahko uporabite za lastne poslovne potrebe.

Optimizacija cen

Podjetja rada uporabljajo različne vzvode za doseganje najboljših rezultatov. Na primer, cena izdelka ali storitve je vzvod, ki ga podjetje lahko nadzoruje. Vprašanje je, kako se odločiti, kakšno ceno postaviti za izdelek ali storitev, da bi maksimirali poslovni cilj, kot je dobiček ali prihodek.

Ta rešitev ponuja prilagodljive modele ML, ki vam pomagajo sprejemati optimalne odločitve za nastavitev cene vašega izdelka ali storitve, da dosežete svoj cilj, kot je maksimiranje prihodka, dobička ali drugih meritev po meri. Rešitev uporablja pristope ML in vzročnega sklepanja za učenje razmerij med ceno in obsegom iz preteklih podatkov in je sposobna oblikovati dinamična cenovna priporočila v realnem času za optimizacijo ciljnih meritev po meri.

Naslednji posnetek zaslona prikazuje vzorčne vhodne podatke.

Rešitev vključuje tri dele:

  • Ocena cenovne elastičnosti – To je ocenjeno z vzročnim sklepanjem prek dvojnega algoritma ML
  • Napoved količine – To je napovedano z algoritmom Prophet
  • Optimizacija cen – To se doseže s simulacijo kaj če prek različnih cenovnih scenarijev

Rešitev zagotavlja priporočeno ceno za naslednji dan za čim večji prihodek. Poleg tega rezultati vključujejo ocenjeno cenovno elastičnost, ki je vrednost, ki kaže učinek cene na obseg, in model napovedi, ki lahko napove obseg za naslednji dan. Naslednji grafikon prikazuje, kako vzročni model, ki je vključeval izračunano cenovno elastičnost, deluje veliko bolje pri analizi kaj če (z velikimi odstopanji od vedenjske cene) kot napovedni model, ki uporablja Prophet za napovedovanje obsega z uporabo podatkov časovnih vrst.

Rešujte poslovne probleme od konca do konca s strojnim učenjem v rešitvah Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

To rešitev lahko uporabite v svojem podjetju za naslednje primere uporabe:

  • Določite optimalno ceno blaga za maloprodajno trgovino
  • Ocenite učinek kuponov za popust na nakupe strank
  • Predvidite učinek različnih metod spodbujanja v katerem koli poslu

Napoved vrst ptic

Danes obstaja več aplikacij za računalniški vid (CV) za podjetja. Ena od teh aplikacij je zaznavanje predmetov, kjer algoritem ML zazna lokacijo predmeta na sliki tako, da okoli njega nariše omejevalni okvir, in identificira vrsto predmeta. Učenje uporabe modela zaznavanja predmetov in njegove natančne nastavitve je lahko zelo koristno za organizacijo, ki potrebuje življenjepis.

Ta rešitev nudi primer, kako prevesti specifikacije omejevalnega okvirja, ko algoritmu SageMaker posredujete slike. Ta rešitev tudi prikazuje, kako izboljšati model zaznavanja objektov z dodajanjem učnih slik, ki so obrnjene vodoravno (zrcalne slike).

Na voljo je zvezek za eksperimentiranje z izzivi zaznavanja predmetov, ko je veliko razredov (200 vrst ptic). Beležnica tudi prikazuje, kako začrtati izboljšave natančnosti, ki se pojavijo v različnih obdobjih usposabljanja. Naslednja slika prikazuje primere slik iz nabora podatkov o pticah.

Rešujte poslovne probleme od konca do konca s strojnim učenjem v rešitvah Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

Ta rešitev vsebuje pet korakov:

  1. Pripravite podatke, vključno s prenosom in RecordIO ustvarjanje datoteke.
  2. Ustvarite in učite model zaznavanja objektov.
  3. Razmestite končno točko in ocenite zmogljivost modela.
  4. Ponovno ustvarite in učite model zaznavanja objektov z razširjenim naborom podatkov.
  5. Razmestite končno točko in ocenite zmogljivost razširjenega modela.

Kot rezultat dobite naslednje:

  • Rezultati zaznavanja predmetov z veznimi okvirji proti vaši testni sliki
  • Izurjeni model zaznavanja predmetov
  • Usposobljen model zaznavanja objektov z dodatnim razširjenim (obrnjenim) naborom podatkov
  • Dve ločeni končni točki, nameščeni z enim od vsakega modela

Naslednji grafikon prikazuje izboljšanje modela glede na ponovitve modela (epohe) med usposabljanjem.

Rešujte poslovne probleme od konca do konca s strojnim učenjem v rešitvah Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

Naslednji primeri so rezultat dveh testnih slik.

Rešujte poslovne probleme od konca do konca s strojnim učenjem v rešitvah Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

Rešujte poslovne probleme od konca do konca s strojnim učenjem v rešitvah Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

To rešitev lahko uporabite v svojem podjetju za naslednje primere uporabe:

  • Zaznavanje predmetov na tekočem traku v embalažni industriji
  • Zaznavanje prelivov na pici
  • Implementirajte operativne aplikacije dobavne verige, ki vključujejo zaznavanje predmetov

Napoved preživetja pljučnega raka

COVID-19 je prinesel veliko več pozornosti zdravstvenim izzivom, povezanim s pljuči. Prav tako je povzročil velik pritisk na bolnišnice, zdravnike, medicinske sestre in radiologe. Predstavljajte si možnost, da lahko uporabite ML kot močno orodje za pomoč zdravnikom in jim pomagate pospešiti njihovo delo. V tej rešitvi prikazujemo, kako je mogoče 2D in 3D radijske značilnosti in demografske podatke bolnikov vnesti v algoritem ML za napovedovanje možnosti preživetja bolnikovega pljučnega raka. Rezultati te napovedi lahko pomagajo ponudnikom, da sprejmejo ustrezne proaktivne ukrepe.

Ta rešitev prikazuje, kako zgraditi razširljiv cevovod ML za nabor radiogenomike nedrobnoceličnega pljučnega raka (NSCLC), ki je sestavljen iz podatkov o zaporedju RNK, kliničnih podatkov (ki odražajo podatke EHR) in medicinskih slik. Uporaba več vrst podatkov za ustvarjanje strojnega modela se imenuje večmodalni ML. Ta rešitev napoveduje izid preživetja bolnikov z diagnozo nedrobnoceličnega pljučnega raka.

Naslednja slika prikazuje primer vhodnih podatkov iz nabora radiogenomičnih podatkov o nedrobnoceličnem pljučnem raku (NSCLC).

Rešujte poslovne probleme od konca do konca s strojnim učenjem v rešitvah Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

Kot del raztopine je bila iz tumorskega tkiva ekstrahirana celotna RNA in analizirana s tehnologijo sekvenciranja RNA. Čeprav izvirni podatki vsebujejo več kot 22,000 genov, hranimo 21 genov iz 10 visoko soizraženih genskih skupin (metagenov), ki so bili identificirani, potrjeni v javno dostopnih kohortah izražanja genov in povezani z prognozo.

Klinični zapisi so shranjeni v formatu CSV. Vsaka vrstica ustreza bolniku, stolpci pa vsebujejo informacije o bolnikih, vključno z demografskimi podatki, stopnjo tumorja in statusom preživetja.

Za genomske podatke hranimo 21 genov iz 10 visoko soizraženih genskih skupin (metagenov), ki so bili identificirani, potrjeni v javno dostopnih kohortah genskega izražanja in povezani z napovedjo.

Za podatke medicinskega slikanja ustvarimo 3D radiološke značilnosti na ravni pacienta, ki pojasnjujejo velikost, obliko in vizualne lastnosti tumorjev, opaženih pri CT-pregledih. Za vsako študijo bolnika se izvedejo naslednji koraki:

  1. Preberite datoteke rezin 2D DICOM za skeniranje CT in segmentacijo tumorja, jih združite v 3D volumne, shranite volumne v formatu NIfTI.
  2. Uskladite volumen CT in segmentacijo tumorja, da lahko osredotočimo izračun znotraj tumorja.
  3. Izračunajte radiomične značilnosti, ki opisujejo regijo tumorja z uporabo knjižnice piradiomike.
  4. Izvlecite 120 radijskih značilnosti osmih razredov, kot so statistični prikazi porazdelitve in sočasnega pojava intenzivnosti znotraj zanimivega tumorskega območja ter meritve na podlagi oblike, ki morfološko opisujejo tumor.

Za ustvarjanje večmodalnega pogleda pacienta za modelno usposabljanje združimo vektorje značilnosti iz treh modalitet. Podatke nato obdelamo. Najprej normaliziramo obseg neodvisnih funkcij s skaliranjem funkcij. Nato izvedemo analizo glavnih komponent (PCA) na funkcijah, da zmanjšamo dimenzionalnost in identificiramo najbolj diskriminatorne značilnosti, ki prispevajo 95 % variance v podatkih.

Posledica tega je zmanjšanje dimenzij z 215 funkcij na 45 glavnih komponent, ki predstavljajo funkcije za nadzorovanega učenca.

Rešitev ustvari model ML, ki napove status preživetja bolnikov z nedrobnoceličnim pljučnim rakom (živ ali mrtev) v obliki verjetnosti. Poleg modela in napovedi ustvarjamo tudi poročila za razlago modela. Cevovod za medicinsko slikanje proizvaja 3D volumne CT pljuč in segmentacijo tumorja za namene vizualizacije.

To rešitev lahko uporabite za primere uporabe v zdravstvu in znanostih o življenju.

Finančna klasifikacija plačil

Če vzamemo vse finančne transakcije podjetja ali potrošnika in jih organiziramo v različne kategorije, je lahko zelo koristno. Uporabniku lahko pomaga ugotoviti, koliko je porabil v kateri kategoriji, prav tako pa lahko sproži opozorila, ko se transakcije ali poraba v določeni kategoriji nepričakovano povečajo ali zmanjšajo.

Ta rešitev prikazuje, kako usposobiti in uvesti model ML za razvrščanje finančnih transakcij na podlagi informacij o transakcijah. Številne banke to ponujajo kot storitev, s katero svojim končnim uporabnikom omogočijo pregled nad njihovimi potrošniškimi navadami. To rešitev lahko uporabite tudi kot vmesni korak pri odkrivanju goljufij, personalizaciji ali odkrivanju nepravilnosti. SageMaker uporabljamo za usposabljanje in uvajanje modela XGBoost z zahtevano osnovno infrastrukturo.

Sintetični nabor podatkov, s katerim želimo prikazati to rešitev, ima naslednje lastnosti:

  • kategorija_transakcije – Kategorija transakcije, od naslednjih 19 možnosti: Uncategorized, Entertainment, Education, Shopping, Personal Care, Health and Fitness, Food and Dining, Gifts and Donations, Investments, Bills and Utilities, Auto and Transport, Travel, Fees and Charges, Business Services, Personal Services, Taxes, Gambling, Homein Pension and insurances.
  • sprejemnik_id – Identifikator za prejemno stranko. Identifikator je sestavljen iz 16 številk.
  • sender_id – Identifikator pošiljatelja. Identifikator je sestavljen iz 16 številk.
  • znesek – Znesek, ki se prenese.
  • Časovni žig – Časovni žig transakcije v obliki LLLL-MM-DD HH:MM:SS.

Prvih pet opazovanj nabora podatkov je naslednjih:

Rešujte poslovne probleme od konca do konca s strojnim učenjem v rešitvah Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

Za to rešitev uporabljamo XGBoost, priljubljeno in učinkovito odprtokodno izvedbo algoritma gradientno povečanih dreves. Gradientno povečevanje je algoritem za nadzorovano učenje, ki poskuša natančno napovedati ciljno spremenljivko s kombiniranjem niza ocen iz nabora enostavnejših in šibkejših modelov. Njegova implementacija je na voljo v vgrajenih algoritmih SageMaker.

Rešitev za klasifikacijo finančnih plačil vsebuje štiri korake:

  1. Pripravite podatke.
  2. Zgradite trgovino s funkcijami.
  3. Ustvarite in usposobite model XGBoost.
  4. Razmestite končno točko in ocenite zmogljivost modela.

Dobimo naslednji rezultat:

  • Usposobljen model XGBoost, ki temelji na našem vzorčnem nizu podatkov
  • Končna točka SageMaker, ki lahko predvidi kategorijo transakcije

Po zagonu te rešitve bi morali videti poročilo o klasifikaciji, podobno naslednjemu.

Rešujte poslovne probleme od konca do konca s strojnim učenjem v rešitvah Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

Možne aplikacije za vaše podjetje vključujejo naslednje:

  • Različne finančne aplikacije v bančništvu s prebivalstvom in investicijskem bančništvu
  • Ko je treba transakcije razvrstiti v kateri koli primer uporabe (ne samo v finančnem)

Napoved odliva za stranke mobilnih telefonov

Predvidevanje odliva strank je zelo pogosta poslovna potreba. Številne študije kažejo, da je strošek obdržanja obstoječe stranke veliko nižji od pridobitve nove stranke. Izziv pogosto prihaja iz podjetij, ki težko razumejo, zakaj stranka odhaja, ali izdelajo model, ki predvideva odpuščanje.

V tem primeru lahko uporabniki, ki so novi v ML, izkusijo, kako je mogoče hitro razviti model napovedi opuščanja z uporabo nabora podatkov o transakcijah mobilnih klicev. Ta rešitev uporablja SageMaker za usposabljanje in uvajanje modela XGBoost v naboru podatkov profila stranke, da napove, ali bo stranka verjetno zapustila operaterja mobilne telefonije.

Nabor podatkov, ki ga uporablja ta rešitev, je javno dostopen in je omenjen v knjigi Daniela T. Larosea Discovering Knowledge in Data. Avtor ga pripisuje repozitoriju podatkovnih nizov strojnega učenja Irvine Univerze v Kaliforniji.

Ta nabor podatkov uporablja naslednjih 21 atributov za opis profila stranke neznanega mobilnega operaterja v ZDA.

  • Država: zvezna država ZDA, v kateri stranka prebiva, označena z dvočrkovno okrajšavo; na primer OH ali NJ
  • Trajanje računa: število dni, ko je bil ta račun aktiven
  • Območna koda: trimestna območna koda ustrezne telefonske številke stranke
  • Telefon: preostala sedemmestna telefonska številka
  • Int'l Plan: ali ima stranka mednarodni klicni načrt: da/ne
  • Načrt VMail: ali ima stranka funkcijo glasovne pošte: da/ne
  • Sporočilo VMail: povprečno število glasovnih sporočil na mesec
  • Dnevne minute: skupno število porabljenih minut klicev čez dan
  • Dnevni klici: skupno število klicev v dnevu
  • Dnevni stroški: zaračunani stroški dnevnih klicev
  • Eve Mins, Eve Calls, Eve Charge: zaračunani stroški za klice zvečer
  • Nočne minute, nočni klici, nočni stroški: zaračunani stroški za klice ponoči
  • Intl Mins, Intl Calls, Intl Charge: zaračunani stroški za mednarodne klice
  • Klici CustServ: število klicev v službo za stranke
  • Odliv?: ali je stranka zapustila storitev: drži/ne drži

Ta rešitev vsebuje tri stopnje:

  1. Pripravite podatke.
  2. Ustvarite in usposobite model XGBoost.
  3. Razmestite končno točko in ocenite zmogljivost modela.

Dobimo naslednji rezultat:

  • Usposobljen model XGBoost, ki temelji na našem vzorčnem naboru podatkov za napovedovanje odliva uporabnikov
  • Končna točka SageMaker, ki lahko predvidi odliv uporabnikov

Ta model pomaga oceniti, koliko od 5,000 uporabnikov mobilnih telefonov bo verjetno prenehalo uporabljati svojega trenutnega operaterja mobilne telefonije.

Naslednji grafikon prikazuje verjetnostno porazdelitev odliva kot rezultat modela.

Rešujte poslovne probleme od konca do konca s strojnim učenjem v rešitvah Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

To lahko uporabite v svojem podjetju za naslednje primere uporabe:

  • Predvidite odliv strank v svojem podjetju
  • Razvrstite, katere stranke lahko odprejo vašo tržno e-pošto in katere ne (binarna klasifikacija)
  • Predvidite, kateri študenti bodo verjetno opustili tečaj

Očistite vire

Ko končate z izvajanjem rešitve v JumpStartu, se prepričajte, da ste izbrali Izbriši vse vire tako so vsi viri, ki ste jih ustvarili v procesu, izbrisani in vaše obračunavanje je ustavljeno.

Rešujte poslovne probleme od konca do konca s strojnim učenjem v rešitvah Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

Povzetek

Ta objava vam je pokazala, kako rešiti različne poslovne probleme z uporabo ML, ki temelji na rešitvah JumpStart. Čeprav se je ta objava osredotočila na pet novih rešitev, ki so bile nedavno dodane v JumpStart, je skupno na voljo 23 rešitev. Priporočamo vam, da se prijavite v Studio in si sami ogledate rešitve JumpStart ter začnete iz njih pridobivati ​​takojšnjo vrednost. Za več informacij glejte Amazon SageMaker Studio in SageMaker JumpStart.

Opomba: Če v konzoli JumpStart vaše regije AWS ne vidite vseh zgornjih petih rešitev, počakajte en teden in preverite znova. Postopoma jih sproščamo v različne regije.


O avtorjih

Rešujte poslovne probleme od konca do konca s strojnim učenjem v rešitvah Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Navpično iskanje. Ai. Dr. Raju Penmatcha je specialist za rešitve AI/ML za platforme AI pri AWS. Dela na naboru storitev z nizko kodo/brez kode v SageMakerju, ki strankam pomagajo preprosto zgraditi in uvesti modele in rešitve strojnega učenja. Ko ne pomaga strankam, rad potuje v nove kraje.

Rešujte poslovne probleme od konca do konca s strojnim učenjem v rešitvah Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.Manan Šah je vodja razvoja programske opreme pri Amazon Web Services. Je navdušenec nad ML in se osredotoča na izdelavo izdelkov AI/ML brez kode/z nizko kodo. Prizadeva si opolnomočiti druge nadarjene, tehnične ljudi za izdelavo odlične programske opreme.

Časovni žig:

Več od Strojno učenje AWS