Z rastjo sprejemanja spletnih aplikacij in naraščajočim številom uporabnikov interneta digitalne goljufije iz leta v leto naraščajo. Amazonski detektor prevare zagotavlja popolnoma upravljano storitev, ki vam pomaga bolje prepoznati potencialno goljufive spletne dejavnosti z uporabo tehnik naprednega strojnega učenja (ML) in več kot 20 let Amazonovega strokovnega znanja o odkrivanju goljufij.
Za pomoč pri hitrejšem odkrivanju goljufij v različnih primerih uporabe Amazon Fraud Detector ponuja posebne modele s prilagojenimi algoritmi, obogatitvami in transformacijami funkcij. Usposabljanje modela je popolnoma avtomatizirano in brez težav, sledite pa lahko navodilom v navodila ali sorodni blog posts za začetek. Pri usposobljenih modelih pa se morate odločiti, ali je model pripravljen za uporabo. To zahteva določeno znanje o strojnem stroju, statistiki in odkrivanju goljufij, zato bi bilo morda koristno poznati nekaj tipičnih pristopov.
Ta objava vam bo pomagala diagnosticirati delovanje modela in izbrati pravi model za uvedbo. Sprehodimo se skozi meritve, ki jih ponuja Amazon Fraud Detector, vam pomagamo diagnosticirati morebitne težave in nudimo predloge za izboljšanje delovanja modela. Pristopa sta uporabna za predloge modelov Online Fraud Insights (OFI) in Transaction Fraud Insights (TFI).
Pregled rešitev
Ta objava ponuja celovit postopek za diagnosticiranje učinkovitosti vašega modela. Najprej predstavi vse meritve modela, prikazane na konzoli Amazon Fraud Detector, vključno z AUC, porazdelitvijo rezultatov, matriko zmede, krivuljo ROC in pomembnostjo spremenljivke modela. Nato predstavimo tristopenjski pristop za diagnosticiranje uspešnosti modela z uporabo različnih metrik. Nazadnje ponujamo predloge za izboljšanje delovanja modela za tipične težave.
Predpogoji
Preden se poglobite v svoj model Amazon Fraud Detector, morate izpolniti naslednje predpogoje:
- Ustvarite račun AWS.
- Ustvarite nabor podatkov o dogodkih za usposabljanje modelov.
- Naložite svoje podatke do Preprosta storitev shranjevanja Amazon (Amazon S3) ali vnesite svoje podatke o dogodkih v Amazon Fraud Detector.
- Zgradite model detektorja goljufij Amazon.
Interpretirajte meritve modela
Ko je usposabljanje modela končano, Amazon Fraud Detector oceni vaš model z uporabo dela podatkov modeliranja, ki niso bili uporabljeni pri usposabljanju modela. Vrne meritve vrednotenja na Model različica strani za ta model. Te meritve odražajo zmogljivost modela, ki jo lahko pričakujete na dejanskih podatkih po uvedbi v produkcijo.
Naslednji posnetek zaslona prikazuje primer delovanja modela, ki ga vrne Amazon Fraud Detector. Izberete lahko različne pragove pri porazdelitvi rezultatov (levo), matrika zmede (desno) pa se ustrezno posodobi.
Za preverjanje uspešnosti in odločanje o pravilih strategije lahko uporabite naslednje ugotovitve:
- AUC (površina pod krivuljo) – Celotna zmogljivost tega modela. Model z AUC 0.50 ni nič boljši od metanja kovanca, ker predstavlja naključno priložnost, medtem ko bo "popoln" model imel rezultat 1.0. Višji kot je AUC, bolje lahko vaš model razlikuje med goljufijami in zakonitimi.
- Porazdelitev rezultatov – Histogram porazdelitev rezultatov modela ob predpostavki vzorčne populacije 100,000 dogodkov. Amazon Fraud Detector ustvari ocene modela med 0–1000, pri čemer nižja kot je ocena, nižje je tveganje goljufije. Boljše ločevanje med zakonito (zeleno) in lažno (modro) populacijo običajno kaže na boljši model. Za več podrobnosti glejte Rezultati modela.
- Matrica zmede – Tabela, ki opisuje zmogljivost modela za izbrani dani prag ocene, vključno z resnično pozitivnimi, resnično negativnimi, lažno pozitivnimi, lažno negativnimi, resnično pozitivno stopnjo (TPR) in lažno pozitivno stopnjo (FPR). Štetje v tabeli predvideva primer populacije 100,0000 dogodkov. Za več podrobnosti glejte Meritve uspešnosti modela.
- Krivulja ROC (Receiver Operator Characteristic). – Graf, ki ponazarja diagnostično sposobnost modela, kot je prikazano na naslednjem posnetku zaslona. Prikazuje pravo pozitivno stopnjo kot funkcijo lažno pozitivne stopnje preko vseh možnih pragov rezultatov modela. Oglejte si ta grafikon tako, da izberete Napredne meritve. Če ste usposobili več različic enega modela, lahko izberete različne pragove FPR, da preverite spremembo zmogljivosti.
- Pomen spremenljivke modela – Razvrstitev spremenljivk modela na podlagi njihovega prispevka k ustvarjenemu modelu, kot je prikazano na naslednjem posnetku zaslona. Spremenljivka modela z najvišjo vrednostjo je za model pomembnejša od drugih spremenljivk modela v naboru podatkov za to različico modela in je privzeto navedena na vrhu. Za več podrobnosti glejte Pomen spremenljivke modela.
Diagnosticirajte delovanje modela
Pred uvedbo modela v produkcijo morate uporabiti meritve, ki jih je vrnil Amazon Fraud Detector, da boste razumeli delovanje modela in diagnosticirali možne težave. Pogoste težave modelov ML lahko razdelimo v dve glavni kategoriji: težave, povezane s podatki, in težave, povezane z modelom. Amazon Fraud Detector je poskrbel za težave, povezane z modelom, s skrbno uporabo naborov za preverjanje veljavnosti in testiranje za oceno in prilagoditev vašega modela v ozadju. Izvedete lahko naslednje korake, da preverite, ali je vaš model pripravljen za uvedbo ali ima morebitne težave, povezane s podatki:
- Preverite splošno delovanje modela (AUC in porazdelitev točk).
- Pregled poslovnih zahtev (matrika zmede in tabela).
- Preverite pomembnost spremenljivke modela.
Preverite splošno delovanje modela: AUC in porazdelitev točk
Natančnejša napoved prihodnjih dogodkov je vedno glavni cilj napovednega modela. AUC, ki ga vrne Amazon Fraud Detector, je izračunan na pravilno vzorčenem testnem nizu, ki ni bil uporabljen pri usposabljanju. Na splošno velja, da je model z vrednostjo AUC večjo od 0.9 dober model.
Če opazite model z zmogljivostjo, manjšo od 0.8, to običajno pomeni, da ima model prostor za izboljšave (o pogostih težavah pri nizki zmogljivosti modela razpravljamo pozneje v tej objavi). Upoštevajte, da je definicija "dobre" uspešnosti močno odvisna od vašega podjetja in osnovnega modela. Še vedno lahko sledite korakom v tej objavi, da izboljšate svoj model detektorja goljufij Amazon, čeprav je njegov AUC večji od 0.8.
Po drugi strani pa, če je AUC nad 0.99, to pomeni, da lahko model skoraj popolnoma loči goljufije in legitimne dogodke na testnem nizu. To je včasih scenarij »predober, da bi bil resničen« (o pogostih težavah pri zelo visoki zmogljivosti modela razpravljamo pozneje v tej objavi).
Poleg celotne AUC vam lahko porazdelitev rezultatov pove tudi, kako dobro je model nameščen. V idealnem primeru bi morali videti večino zakonitih in goljufij na obeh koncih lestvice, kar pomeni, da lahko rezultat modela natančno razvrsti dogodke na testnem nizu.
V naslednjem primeru ima porazdelitev rezultatov AUC 0.96.
Če sta se legitimna porazdelitev in distribucija goljufije prekrivala ali koncentrirala v središču, to verjetno pomeni, da model ne deluje dobro pri razlikovanju dogodkov goljufije od zakonitih dogodkov, kar lahko pomeni, da se je distribucija preteklih podatkov spremenila ali da potrebujete več podatkov ali funkcij.
Sledi primer porazdelitve rezultatov z AUC 0.64.
Če najdete točko ločevanja, ki lahko skoraj popolnoma razdeli goljufije in zakonite dogodke, obstaja velika verjetnost, da ima model težavo z uhajanjem oznak ali pa je vzorce goljufij prelahko zaznati, kar bi moralo pritegniti vašo pozornost.
V naslednjem primeru ima porazdelitev rezultatov AUC 1.0.
Pregled poslovnih zahtev: matrika in tabela zmede
Čeprav je AUC priročen indikator uspešnosti modela, se morda ne bo neposredno prevedel v vaše poslovne zahteve. Amazon Fraud Detector zagotavlja tudi meritve, kot so stopnja zajetja goljufij (resnična pozitivna stopnja), odstotek zakonitih dogodkov, ki so nepravilno predvideni kot goljufije (lažna pozitivna stopnja), in več, ki se pogosteje uporabljajo kot poslovne zahteve. Ko usposobite model z razmeroma dobrim AUC, morate model primerjati s svojimi poslovnimi zahtevami s temi meritvami.
Matrika in tabela zmede vam nudita vmesnik za pregled učinka in preverjanje, ali ustreza vašim poslovnim potrebam. Upoštevajte, da so številke odvisne od praga modela, kjer so dogodki z rezultati, višjimi od praga, razvrščeni kot goljufije, dogodki z rezultati, nižjimi od praga, pa so razvrščeni kot zakoniti. Izberete lahko, kateri prag boste uporabili glede na vaše poslovne zahteve.
Na primer, če je vaš cilj zajeti 73 % goljufij, lahko (kot je prikazano v spodnjem primeru) izberete prag, kot je 855, ki vam omogoča, da zajamete 73 % vseh goljufij. Vendar pa bo model tudi napačno razvrstil 3 % legitimnih dogodkov kot goljufive. Če je ta FPR sprejemljiv za vaše podjetje, potem je model dober za uvedbo. V nasprotnem primeru morate izboljšati zmogljivost modela.
Drug primer je, če so stroški za blokiranje ali izpodbijanje zakonite stranke izjemno visoki, potem želite nizek FPR in visoko natančnost. V tem primeru lahko izberete prag 950, kot je prikazano v naslednjem primeru, s čimer bo 1 % zakonitih strank napačno razvrščen kot goljufij, 80 % ugotovljenih goljufij pa bo dejansko goljufivih.
Poleg tega lahko izberete več pragov in dodelite različne rezultate, kot so blokiranje, preiskava, sprejem. Če ne najdete ustreznih pragov in pravil, ki izpolnjujejo vse vaše poslovne zahteve, razmislite o usposabljanju modela z več podatki in atributi.
Preverite pomembnost spremenljivke modela
O Pomen spremenljivke modela podokno prikazuje, kako vsaka spremenljivka prispeva k vašemu modelu. Če ima ena spremenljivka znatno višjo vrednost pomembnosti od drugih, lahko to pomeni, da je oznaka uhajala ali da je vzorce goljufij prelahko odkriti. Upoštevajte, da je pomembnost spremenljivke združena nazaj v vaše vhodne spremenljivke. Če opazite nekoliko večji pomen IP_ADDRESS
, CARD_BIN
, EMAIL_ADDRESS
, PHONE_NUMBER
, BILLING_ZIP
ali SHIPPING_ZIP
, morda zaradi moči obogatitve.
Naslednji primer prikazuje pomembnost spremenljivke modela z uporabo morebitnega uhajanja etikete investigation_status
.
Pomembnost spremenljivke modela vam daje tudi namige o tem, katere dodatne spremenljivke bi lahko potencialno prinesle dvig modela. Če na primer opazite nizek AUC in so funkcije, povezane s prodajalcem, zelo pomembne, lahko razmislite o zbiranju več funkcij naročila, kot je SELLER_CATEGORY
, SELLER_ADDRESS
in SELLER_ACTIVE_YEARS
in te spremenljivke dodajte v svoj model.
Pogoste težave pri nizki zmogljivosti modela
V tem razdelku razpravljamo o pogostih težavah, na katere lahko naletite v zvezi z nizko zmogljivostjo modela.
Porazdelitev zgodovinskih podatkov je spremenjena
Zgodovinski zamik porazdelitve podatkov se zgodi, ko pride do velike poslovne spremembe ali težave z zbiranjem podatkov. Na primer, če ste nedavno lansirali svoj izdelek na novem trgu, IP_ADDRESS
, EMAIL
in ADDRESS
sorodne funkcije bi lahko bile popolnoma drugačne, prav tako bi se lahko spremenil način delovanja goljufije. Amazon Fraud Detector uporablja EVENT_TIMESTAMP
za razdelitev podatkov in ovrednotenje vašega modela na ustrezni podmnožici dogodkov v vašem naboru podatkov. Če se porazdelitev vaših zgodovinskih podatkov znatno spremeni, se lahko niz ocenjevanja zelo razlikuje od podatkov za usposabljanje in poročana zmogljivost modela je lahko nizka.
Morebitno težavo s spremembo porazdelitve podatkov lahko preverite tako, da raziščete svoje zgodovinske podatke:
- Uporaba Profiler podatkov Amazon Fraud Detector orodje za preverjanje, ali sta se stopnja goljufij in manjkajoča oznaka sčasoma spremenila.
- Preverite, ali se je porazdelitev spremenljivke skozi čas bistveno spremenila, zlasti za značilnosti z visoko pomembnostjo spremenljivke.
- Preverite porazdelitev spremenljivk v času po ciljnih spremenljivkah. Če v nedavnih podatkih opazite znatno več dogodkov goljufije iz ene kategorije, boste morda želeli preveriti, ali je sprememba razumna na podlagi vaše poslovne presoje.
Če ugotovite, da je delež manjkajočih nalepk zelo visok ali da je stopnja goljufij dosledno padala v zadnjih datumih, je to morda pokazatelj, da nalepke niso popolnoma zrele. Izključite najnovejše podatke ali počakajte dlje, da zberete točne oznake, in nato ponovno usposobite svoj model.
Če opazite močno povečanje stopnje goljufij in spremenljivk na določene datume, boste morda želeli še enkrat preveriti, ali gre za izstopajočo vrednost ali težavo z zbiranjem podatkov. V tem primeru bi morali izbrisati te dogodke in ponovno usposobiti model.
Če ugotovite, da zastareli podatki ne morejo predstavljati vašega trenutnega in prihodnjega poslovanja, iz usposabljanja izključite staro obdobje podatkov. Če uporabljate shranjene dogodke v Amazon Fraud Detector, lahko preprosto znova usposobite novo različico in med konfiguriranjem usposabljanja izberete ustrezno časovno obdobje. To lahko pomeni tudi, da se način delovanja goljufij v vašem podjetju sčasoma razmeroma hitro spreminja. Po uvedbi modela boste morda morali pogosto znova usposobiti svoj model.
Nepravilna preslikava tipa spremenljivke
Amazon Fraud Detector obogati in preoblikuje podatke na podlagi vrst spremenljivk. Pomembno je, da svoje spremenljivke preslikate v pravilno vrsto, tako da lahko model Amazon Fraud Detector prevzame največjo vrednost vaših podatkov. Na primer, če zemljevid IP
k CATEGORICAL
tip namesto IP_ADDRESS
, ne razumeš IP-
povezane obogatitve v ozadju.
Na splošno Amazon Fraud Detector predlaga naslednje ukrepe:
- Preslikajte svoje spremenljivke v določene vrste, kot je npr
IP_ADDRESS
,EMAIL_ADDRESS
,CARD_BIN
inPHONE_NUMBER
, tako da lahko Amazon Fraud Detector izvleče in obogati dodatne informacije. - Če ne najdete določenega tipa spremenljivke, ga preslikajte v enega od treh generičnih tipov:
NUMERIC
,CATEGORICAL
aliFREE_FORM_TEXT
. - Če je spremenljivka v besedilni obliki in ima visoko kardinalnost, kot je ocena stranke ali opis izdelka, jo preslikajte v
FREE_FORM_TEXT
spremenljive vrste, tako da Amazon Fraud Detector namesto vas izloči besedilne funkcije in vdelave v ozadju. Na primer, če zemljevidurl_string
doFREE_FORM_TEXT
, je sposoben tokenizirati URL in izvleči informacije za vnašanje v nadaljnji model, kar mu bo pomagalo izvedeti več skritih vzorcev iz URL-ja.
Če ugotovite, da je katera od vaših vrst spremenljivk nepravilno preslikana v konfiguraciji spremenljivk, lahko spremenite svojo vrsto spremenljivke in nato ponovno usposobite model.
Nezadostni podatki ali funkcije
Amazon Fraud Detector potrebuje vsaj 10,000 zapisov za usposabljanje modela Online Fraud Insights (OFI) ali Transaction Fraud Insights (TFI), pri čemer je najmanj 400 od teh zapisov opredeljenih kot goljufivi. TFI prav tako zahteva, da goljufivi in zakoniti zapisi izvirajo iz vsaj 100 različnih subjektov, da se zagotovi raznolikost nabora podatkov. Poleg tega Amazon Fraud Detector zahteva, da imajo podatki o modeliranju vsaj dve spremenljivki. To so minimalne podatkovne zahteve za izdelavo uporabnega modela detektorja goljufij Amazon. Vendar uporaba več zapisov in spremenljivk običajno pomaga modelom ML, da se iz vaših podatkov bolje naučijo osnovnih vzorcev. Ko opazite nizek AUC ali ne najdete pragov, ki ustrezajo vašim poslovnim zahtevam, razmislite o prekvalificiranju modela z več podatki ali dodajanju novih funkcij v model. Običajno najdemo EMAIL_ADDRESS
, IP
, PAYMENT_TYPE
, BILLING_ADDRESS
, SHIPPING_ADDRESS
in DEVICE
povezane spremenljivke so pomembne pri odkrivanju goljufij.
Drug možen vzrok je, da nekatere vaše spremenljivke vsebujejo preveč manjkajočih vrednosti. Če želite preveriti, ali se to dogaja, preverite sporočila o usposabljanju modela in se obrnite na Odpravite težave s podatki o usposabljanju za predloge.
Pogoste težave pri zelo visoki zmogljivosti modela
V tem razdelku razpravljamo o pogostih težavah, povezanih z zelo visoko zmogljivostjo modela.
Puščanje nalepke
Do uhajanja oznak pride, ko podatkovni nizi za usposabljanje uporabljajo informacije, za katere se ne pričakuje, da bodo na voljo v času predvidevanja. Precenjuje uporabnost modela, ko se izvaja v proizvodnem okolju.
Visoka vrednost AUC (blizu 1), popolnoma ločena porazdelitev rezultatov in bistveno višja pomembnost spremenljivke ene spremenljivke so lahko indikatorji morebitnih težav z uhajanjem etikete. Prav tako lahko preverite korelacijo med funkcijami in oznako z uporabo Data Profiler. Korelacija značilnosti in oznake graf prikazuje korelacijo med vsako funkcijo in oznako. Če ima ena funkcija več kot 0.99 korelacije z oznako, morate preveriti, ali se funkcija uporablja pravilno na podlagi poslovne presoje. Na primer, če želite zgraditi model tveganja za odobritev ali zavrnitev vloge za posojilo, ne smete uporabljati funkcij, kot je AMOUNT_PAID
, ker se plačila zgodijo po zaključku postopka prevzema zavarovanja. Če spremenljivka ni na voljo v času, ko naredite napoved, morate to spremenljivko odstraniti iz konfiguracije modela in znova usposobiti nov model.
Naslednji primer prikazuje korelacijo med vsako spremenljivko in oznako. investigation_status
ima visoko korelacijo (blizu 1) z nalepko, zato morate še enkrat preveriti, ali obstaja težava z uhajanjem nalepke.
Preprosti vzorci goljufij
Ko so vzorci goljufij v vaših podatkih preprosti, lahko opazite tudi zelo visoko zmogljivost modela. Na primer, predpostavimo, da vsi dogodki goljufije v podatkih modeliranja prihajajo prek istega notranjega ponudnika storitev; model je preprosto izbrati IP-
povezane spremenljivke in vrne "popoln" model z visoko pomembnostjo IP
.
Preprosti vzorci goljufije ne pomenijo vedno težave s podatki. Morda je res, da je način delovanja goljufij v vašem podjetju enostavno ujeti. Preden naredite zaključek, se morate prepričati, da so oznake, uporabljene pri usposabljanju modelov, točne in da podatki modeliranja zajemajo čim več vzorcev goljufije. Na primer, če svoje dogodke goljufije označite na podlagi pravil, kot je označevanje vseh aplikacij iz določenega BILLING_ZIP
plus PRODUCT_CATEGORY
kot goljufijo, lahko model zlahka ujame te goljufije s simulacijo pravil in doseganjem visoke AUC.
Porazdelitev oznak po različnih kategorijah ali posodah za vsako funkcijo lahko preverite z uporabo Data Profiler. Na primer, če opazite, da večina goljufij izvira iz ene ali več kategorij izdelkov, je to morda pokazatelj preprostih vzorcev goljufije in morate potrditi, da ne gre za napako pri zbiranju podatkov ali procesu. Če je funkcija všeč CUSTOMER_ID
, morate to funkcijo izključiti pri usposabljanju modela.
Naslednji primer prikazuje distribucijo oznak v različnih kategorijah product_category
. Vse goljufije prihajajo iz dveh kategorij izdelkov.
Nepravilno vzorčenje podatkov
Do nepravilnega vzorčenja podatkov lahko pride, ko ste vzorčili in poslali le del svojih podatkov v Amazon Fraud Detector. Če podatki niso pravilno vzorčeni in niso reprezentativni za promet v proizvodnji, bo sporočena zmogljivost modela netočna in model bi lahko bil neuporaben za napovedovanje proizvodnje. Na primer, če so vsi dogodki goljufije v podatkih modeliranja vzorčeni iz Azije in vsi zakoniti dogodki vzorčeni iz ZDA, se bo model morda naučil ločevati goljufijo in zakonito na podlagi BILLING_COUNTRY
. V tem primeru model ni generičen za uporabo pri drugih populacijah.
Običajno predlagamo pošiljanje vseh zadnjih dogodkov brez vzorčenja. Na podlagi velikosti podatkov in stopnje goljufij Amazon Fraud Detector izvede vzorčenje pred usposabljanjem modela namesto vas. Če so vaši podatki preveliki (več kot 100 GB) in se odločite za vzorčenje in pošiljanje le podmnožice, morate naključno vzorčiti svoje podatke in se prepričati, da je vzorec reprezentativen za celotno populacijo. Za TFI bi morali svoje podatke vzorčiti po subjektih, kar pomeni, da bi morali, če je vzorčena ena entiteta, vključiti vso njeno zgodovino, tako da so agregati na ravni entitete pravilno izračunani. Upoštevajte, da če v Amazon Fraud Detector pošljete samo podmnožico podatkov, bodo lahko agregati v realnem času med sklepanjem netočni, če prejšnji dogodki entitet niso poslani.
Drugo neustrezno vzorčenje podatkov je lahko samo uporaba kratkega obdobja podatkov, na primer podatkov za en dan, za izdelavo modela. Podatki so lahko pristranski, zlasti če so napadi na vaše podjetje ali goljufije sezonski. Običajno priporočamo, da v modeliranje vključite podatke za vsaj dva cikla (na primer 2 tedna ali 2 meseca), da zagotovite raznolikost vrst goljufij.
zaključek
Po diagnosticiranju in razrešitvi vseh morebitnih težav bi morali pridobiti uporaben model detektorja goljufij Amazon in biti prepričani o njegovi učinkovitosti. Za naslednji korak, ti lahko ustvari detektor z modelom in vašimi poslovnimi pravili, in bodite pripravljeni, da ga uvedete v produkcijo za oceno senčnega načina.
Dodatek
Kako izključiti spremenljivke za modelno usposabljanje
Po poglobljenem potopu boste morda identificirali spremenljivo informacijo o cilju uhajanja in jo želeli izključiti iz usposabljanja modela. Različico modela lahko znova usposobite tako, da izključite spremenljivke, ki jih ne želite, tako da dokončate naslednje korake:
- Na konzoli Amazon Fraud Detector v podoknu za krmarjenje izberite Modeli.
- o Modeli strani izberite model, ki ga želite prekvalificirati.
- o Proces izberite meni Usposobite novo različico.
- Izberite časovno obdobje, ki ga želite uporabiti, in izberite Naslednji.
- o Konfigurirajte trening strani, počistite izbiro spremenljivke, ki je ne želite uporabiti pri usposabljanju modela.
- Določite svoje oznake goljufij in legitimne oznake ter kako želite, da Amazon Fraud Detector uporablja neoznačene dogodke, nato izberite Naslednji.
- Preglejte konfiguracijo modela in izberite Ustvari in uri model.
Kako spremeniti vrsto spremenljivke dogodka
Spremenljivke predstavljajo podatkovne elemente, ki se uporabljajo pri preprečevanju goljufij. V Amazon Fraud Detector so vse spremenljivke globalne in so v skupni rabi za vse dogodke in modele, kar pomeni, da je ena spremenljivka lahko uporabljena v več dogodkih. Na primer, IP bi lahko bil povezan z dogodki prijave in bi lahko bil povezan tudi s transakcijskimi dogodki. Seveda je Amazon Fraud Detector zaklenil vrsto spremenljivke in vrsto podatkov, ko je spremenljivka ustvarjena. Če želite izbrisati obstoječo spremenljivko, morate najprej izbrisati vse povezane vrste dogodkov in modele. Vire, povezane z določeno spremenljivko, lahko preverite tako, da se pomaknete na Amazon Fraud Detector in izberete Spremenljivke v podoknu za krmarjenje ter izbiro imena spremenljivke in Povezani viri.
Izbrišite spremenljivko in vse povezane vrste dogodkov
Če želite izbrisati spremenljivko, izvedite naslednje korake:
- Na konzoli Amazon Fraud Detector v podoknu za krmarjenje izberite Spremenljivke.
- Izberite spremenljivko, ki jo želite izbrisati.
- Izberite Povezani viri za ogled seznama vseh vrst dogodkov, ki uporabljajo to spremenljivko.
Pred brisanjem spremenljivke morate izbrisati te povezane vrste dogodkov. - Na seznamu izberite vrste dogodkov, da odprete stran s povezanimi vrstami dogodkov.
- Izberite Shranjeni dogodki da preverite, ali so pod to vrsto dogodka shranjeni kakršni koli podatki.
- Če so v Amazon Fraud Detector shranjeni dogodki, izberite Izbrišite shranjene dogodke za brisanje shranjenih dogodkov.
Ko je opravilo brisanja končano, se prikaže sporočilo »Shranjeni dogodki za to vrsto dogodka so bili uspešno izbrisani«. - Izberite Povezani viri.
Če so detektorji in modeli povezani s to vrsto dogodka, morate te vire najprej izbrisati. - Če so detektorji povezani, izvedite naslednje korake, da izbrišete vse povezane detektorje:
- Izberite detektor, na katerega želite iti Podrobnosti o detektorju stran.
- v Modelske različice podoknu izberite različico detektorja.
- Na strani z različico detektorja izberite Proces.
- Če je različica detektorja aktivna, izberite deaktiviranje, izberite Deaktivirajte to različico detektorja, ne da bi jo zamenjali z drugo različico, in izberite Deaktiviraj različico detektorja.
- Ko je različica detektorja deaktivirana, izberite Proces in nato Brisanje.
- Ponovite te korake, da izbrišete vse različice detektorja.
- o Podrobnosti o detektorju stran, izberite Povezana pravila.
- Izberite pravilo za brisanje.
- Izberite Proces in Izbriši različico pravila.
- Vnesite ime pravila za potrditev in izberite Izbriši različico.
- Ponovite te korake, da izbrišete vsa povezana pravila.
- Ko izbrišete vse različice detektorja in povezana pravila, pojdite na Podrobnosti o detektorju stran, izberite Proces, in izberite Izbriši detektor.
- Vnesite ime detektorja in izberite Izbriši detektor.
- Ponovite te korake, da izbrišete naslednji detektor.
- Če so kateri koli modeli povezani z vrsto dogodka, izvedite naslednje korake, da jih izbrišete:
- Izberite ime modela.
- v Modelske različice izberite različico.
- Če je status modela
Active
, izberite Proces in Razmestitev različice modela. - Vnesite
undeploy
za potrditev in izbiro Razmestitev različice modela.
Stanje se spremeni vUndeploying
. Postopek traja nekaj minut. - Po statusu postane
Ready to deploy
, izberite Dejanja in Izbriši. - Ponovite te korake, da izbrišete vse različice modela.
- Na strani s podrobnostmi o modelu izberite Dejanja in Izbriši model.
- Vnesite ime modela in izberite Izbriši model.
- Ponovite te korake, da izbrišete naslednji model.
- Ko izbrišete vse povezane detektorje in modele, izberite Proces in Izbriši vrsto dogodka o Podrobnosti o dogodku stran.
- Vnesite ime vrste dogodka in izberite Izbriši vrsto dogodka.
- V podoknu za krmarjenje izberite Spremenljivkein izberite spremenljivko, ki jo želite izbrisati.
- Ponovite prejšnje korake, da izbrišete vse vrste dogodkov, povezane s spremenljivko.
- o Spremenljive podrobnosti stran, izberite Proces in Izbrisati.
- Vnesite ime spremenljivke in izberite Izbriši spremenljivko.
Ustvarite novo spremenljivko s pravilno vrsto spremenljivke
Ko ste izbrisali spremenljivko in vse povezane vrste dogodkov, shranjene dogodke, modele in detektorje iz Amazon Fraud Detector, lahko ustvarite novo spremenljivko z istim imenom in jo preslikate v pravilno vrsto spremenljivke.
- Na konzoli Amazon Fraud Detector v podoknu za krmarjenje izberite Spremenljivke.
- Izberite ustvarjanje.
- Vnesite ime spremenljivke, ki jo želite spremeniti (tisto, ki ste jo prej izbrisali).
- Izberite pravilno vrsto spremenljivke, v katero želite spremeniti.
- Izberite Ustvari spremenljivko.
Naložite podatke in ponovno usposobite model
Ko posodobite vrsto spremenljivke, lahko znova naložite podatke in usposobite nov model. Za navodila glejte Zaznajte goljufije pri spletnih transakcijah z novimi funkcijami Amazon Fraud Detector.
Kako dodati nove spremenljivke obstoječi vrsti dogodka
Če želite obstoječi vrsti dogodka dodati nove spremenljivke, izvedite naslednje korake:
- Dodajte nove spremenljivke prejšnji vadbeni datoteki CVS.
- Naložite novo datoteko s podatki o vadbi v vedro S3. Zabeležite si lokacijo Amazon S3 vaše vadbene datoteke (npr.
s3://bucketname/path/to/some/object.csv
) in ime vaše vloge. - Na konzoli Amazon Fraud Detector v podoknu za krmarjenje izberite Dogodki.
- o Vrste dogodkov strani izberite ime vrste dogodka, ki ji želite dodati spremenljivke.
- o Vrsta dogodka stran s podrobnostmi, izberite Proces, Potem Dodajte spremenljivke.
- Pod Izberite, kako določite spremenljivke tega dogodka, izberite Izberite spremenljivke iz nabora podatkov o vadbi.
- Za vlogo IAM izberite obstoječo vlogo IAM ali ustvarite novo vlogo za dostop do podatkov v Amazon S3.
- za Lokacija podatkov, vnesite lokacijo S3 nove vadbene datoteke in izberite Naloži.
Nove spremenljivke, ki niso prisotne v obstoječi vrsti dogodka, bi morale biti prikazane na seznamu.
- Izberite Dodajte spremenljivke.
Zdaj so nove spremenljivke dodane obstoječi vrsti dogodka. Če uporabljate shranjene dogodke v Amazon Fraud Detector, nove spremenljivke shranjenih dogodkov še vedno manjkajo. Podatke o usposabljanju z novimi spremenljivkami morate uvoziti v Amazon Fraud Detector in nato znova usposobiti novo različico modela. Pri nalaganju novih podatkov o vadbi z istimi EVENT_ID
in EVENT_TIMESTAMP
, nove spremenljivke dogodkov prepišejo prejšnje spremenljivke dogodkov, shranjene v Amazon Fraud Detector.
O avtorjih
Julia Xu je raziskovalec pri Amazon Fraud Detector. Navdušena je nad reševanjem izzivov strank s tehnikami strojnega učenja. V prostem času uživa v pohodništvu, slikanju in raziskovanju novih kavarn.
Hao Zhou je raziskovalec pri Amazon Fraud Detector. Ima doktorat iz elektrotehnike na Northwestern University, ZDA. Navdušen je nad uporabo tehnik strojnega učenja za boj proti goljufijam in zlorabam.
Abhishek Ravi je višji produktni vodja pri Amazon Fraud Detector. Navdušen je nad izkoriščanjem tehničnih zmogljivosti za izdelavo izdelkov, ki navdušujejo stranke.
- Coinsmart. Najboljša evropska borza bitcoinov in kriptovalut.
- Platoblockchain. Web3 Metaverse Intelligence. Razširjeno znanje. PROST DOSTOP.
- CryptoHawk. Altcoin radar. Brezplačen preizkus.
- Vir: https://aws.amazon.com/blogs/machine-learning/diagnose-model-performance-before-deployment-for-amazon-fraud-detector/
- "
- 000
- 10
- 100
- 20 let
- 9
- a
- sposobnost
- O meni
- dostop
- ustrezno
- Račun
- natančna
- čez
- dejavnosti
- aktivna
- dejavnosti
- dodano
- Poleg tega
- Dodatne
- Sprejetje
- napredno
- algoritmi
- vsi
- omogoča
- vedno
- Amazon
- primerno
- uporaba
- aplikacije
- uporabna
- Uporaba
- pristop
- pristopi
- primerno
- odobri
- OBMOČJE
- asia
- povezan
- pozornosti
- lastnosti
- Avtomatizirano
- Na voljo
- AWS
- Izhodišče
- ker
- pred
- spodaj
- Boljše
- med
- Block
- meja
- prinašajo
- izgradnjo
- poslovni
- izračuna
- Zmogljivosti
- zajemanje
- ki
- primeru
- primeri
- wrestling
- Kategorija
- Vzrok
- nekatere
- izzivi
- izziv
- spremenite
- Izberite
- razvrščeni
- Kava
- Coin
- zbiranje
- Zbiranje
- zbirka
- boj proti
- kako
- Skupno
- dokončanje
- popolnoma
- dokončanje
- Prepričani
- konfiguracija
- zmeda
- Razmislite
- Konzole
- Priročen
- bi
- ustvarjajo
- ustvaril
- Trenutna
- krivulja
- stranka
- Stranke, ki so
- datum
- Termini
- globoko
- Odvisno
- odvisno
- razporedi
- uvajanja
- uvajanje
- opis
- Podrobnosti
- Odkrivanje
- drugačen
- digitalni
- neposredno
- razpravlja
- prikazovalniki
- distribucija
- Distribucije
- raznolikost
- Ne
- padla
- med
- vsak
- enostavno
- elementi
- konec koncev
- konča
- Inženiring
- obogatiti
- Vnesite
- subjekti
- entiteta
- okolje
- zlasti
- oceniti
- Ocena
- Event
- dogodki
- Primer
- izključuje
- obstoječih
- pričakovati
- Pričakuje
- strokovno znanje
- Izvlečki
- hitreje
- Feature
- Lastnosti
- končno
- prva
- sledi
- po
- obrazec
- goljufija
- brezplačno
- iz
- funkcija
- Prihodnost
- splošno
- ustvarila
- Globalno
- Cilj
- dobro
- več
- Zelen
- Rast
- se zgodi
- pomoč
- pomoč
- Pomaga
- visoka
- več
- zelo
- zgodovinski
- zgodovina
- drži
- Kako
- Kako
- Vendar
- HTTPS
- identificirati
- vpliv
- Pomembnost
- Pomembno
- izboljšanje
- Izboljšanje
- vključujejo
- Vključno
- Navedite
- Podatki
- vhod
- vpogledi
- vmesnik
- Internet
- razišče
- IP
- vprašanje
- Vprašanja
- IT
- Job
- sodbe
- Vedite
- znanje
- label
- označevanje
- Oznake
- velika
- večja
- Zadnji
- začela
- uhajanje
- UČITE
- učenje
- Stopnja
- vzvod
- Seznam
- Navedeno
- kraj aktivnosti
- zaklenjeno
- stroj
- strojno učenje
- Znamka
- Izdelava
- upravlja
- upravitelj
- map
- Tržna
- Matrix
- pomeni
- sporočil
- Meritve
- morda
- minimalna
- ML
- Model
- modeli
- mesecev
- več
- Najbolj
- več
- krmarjenje
- ostalo
- potrebe
- negativna
- Nove funkcije
- Nova tržnica
- Naslednja
- Številka
- številke
- Ponudbe
- na spletu
- operater
- Da
- Ostalo
- drugače
- Splošni
- del
- strastno
- Plačila
- odstotek
- performance
- Obdobje
- Točka
- prebivalstvo
- pozitiven
- mogoče
- potencial
- moč
- napoved
- predstaviti
- Preprečevanje
- prejšnja
- primarni
- Težave
- Postopek
- Izdelek
- proizvodnja
- Izdelki
- zagotavljajo
- če
- Ponudnik
- zagotavlja
- hitro
- območje
- v realnem času
- razumno
- nedavno
- Pred kratkim
- Priporočamo
- evidence
- odražajo
- o
- predstavljajo
- predstavnik
- predstavlja
- Zahteve
- zahteva
- Raziskave
- viri
- vrnitev
- vrne
- pregleda
- narašča
- Tveganje
- vloga
- pravila
- Run
- Enako
- Lestvica
- Znanstvenik
- izbran
- Storitev
- nastavite
- Shadow
- deli
- trgovin
- Kratke Hlače
- Prikaži
- pokazale
- Enostavno
- Velikosti
- So
- trdna
- Reševanje
- nekaj
- specifična
- po delih
- začel
- Statistika
- Status
- Še vedno
- shranjevanje
- Strategija
- Uspešno
- ciljna
- tehnični
- tehnike
- predloge
- Test
- Testiranje
- O
- 3
- Prag
- skozi
- čas
- orodje
- vrh
- TPR
- Prometa
- Vlak
- usposabljanje
- transakcija
- transformacije
- Vrste
- tipično
- pod
- razumeli
- univerza
- Nadgradnja
- us
- ZDA
- uporaba
- Uporabniki
- navadno
- pripomoček
- potrjevanje
- vrednost
- različica
- Poglej
- Počakaj
- Kaj
- ali
- medtem
- brez
- vredno
- bi
- leto
- let
- Vaša rutina za