Diagnose Model Performance Before Deployment For Amazon Fraud Detector

Újra kiadta Platón

Követő: 0

Az online alkalmazások terjedésének növekedésével és az internet-felhasználók számának növekedésével a digitális csalások száma évről évre növekszik. Amazon csalásészlelő teljes körűen felügyelt szolgáltatást nyújt, amely segít jobban azonosítani a potenciálisan csalárd online tevékenységeket fejlett gépi tanulási (ML) technikák és az Amazon több mint 20 éves csalásfelderítési szakértelmének segítségével.

Annak érdekében, hogy több felhasználási esetben is gyorsabban elkapja a csalást, az Amazon Fraud Detector speciális modelleket kínál testre szabott algoritmusokkal, gazdagításokkal és funkcióátalakításokkal. A modellképzés teljesen automatizált és problémamentes, és követheti az utasításokat a használati útmutató vagy kapcsolódó blogbejegyzések kezdeni. A betanított modellek esetén azonban el kell döntenie, hogy a modell készen áll-e a bevezetésre. Ez bizonyos ismereteket igényel az ML, a statisztikák és a csalások felderítése terén, és hasznos lehet néhány tipikus megközelítés ismerete.

Ez a bejegyzés segít diagnosztizálni a modell teljesítményét, és kiválasztani a megfelelő modellt a telepítéshez. Végigjárjuk az Amazon Fraud Detector által biztosított mérőszámokat, segítünk diagnosztizálni a lehetséges problémákat, és javaslatokat teszünk a modell teljesítményének javítására. A megközelítések az Online Fraud Insights (OFI) és a Tranzakciócsalás Insights (TFI) modellsablonokra egyaránt alkalmazhatók.

Megoldás áttekintése

Ez a bejegyzés teljes körű folyamatot kínál a modell teljesítményének diagnosztizálására. Először bemutatja az Amazon Fraud Detector konzolon megjelenő összes modellmutatót, beleértve az AUC-t, a pontszámok eloszlását, a zavaros mátrixot, a ROC-görbét és a modellváltozók fontosságát. Ezután bemutatunk egy háromlépéses megközelítést a modell teljesítményének diagnosztizálására különböző mérőszámok segítségével. Végül javaslatokat teszünk a modell teljesítményének javítására a tipikus problémák esetén.

Előfeltételek

Mielőtt mélyen belemerülne Amazon csalásérzékelő modelljébe, teljesítenie kell a következő előfeltételeket:

Hozzon létre egy AWS-fiókot.
Hozzon létre egy eseményadatkészletet modellképzéshez.
Töltse fel adatait nak nek Amazon egyszerű tárolási szolgáltatás (Amazon S3) ill feldolgozza eseményadatait az Amazon Fraud Detectorba.
Építsen egy Amazon csalásérzékelő modellt.

A modell mérőszámainak értelmezése

A modell betanítása után az Amazon Fraud Detector kiértékeli a modellt a modellképzés során nem használt modelladatok egy részének felhasználásával. Visszaadja az értékelési mutatókat a Modell verzió oldal az adott modellhez. Ezek a mutatók azt a modellteljesítményt tükrözik, amelyet valós adatokon elvárhat az éles üzembe helyezés után.

A következő képernyőkép az Amazon Fraud Detector által visszaadott modell teljesítményét mutatja be. Különböző küszöbértékeket választhat a pontszámeloszlásnál (balra), és a zavaró mátrix (jobbra) ennek megfelelően frissül.

A teljesítmény ellenőrzéséhez és a stratégiai szabályok meghatározásához a következő eredményeket használhatja:

AUC (görbe alatti terület) – A modell általános teljesítménye. A 0.50-es AUC-értékkel rendelkező modell semmivel sem jobb, mint egy érmefeldobás, mert véletlenszerű esélyt képvisel, míg a „tökéletes” modell 1.0 pontot kap. Minél magasabb az AUC, annál jobban meg tudja különböztetni a modellt a csalások és a törvényesek között.
Pontszám eloszlás – A modell pontszám eloszlásának hisztogramja, 100,000 0 eseményből álló példapopulációt feltételezve. Az Amazon Fraud Detector 1000 és XNUMX közötti modellpontszámokat generál, ahol minél alacsonyabb a pontszám, annál kisebb a csalási kockázat. A legitim (zöld) és a csaló (kék) populációk jobb elkülönítése általában jobb modellt jelez. További részletekért lásd Modell pontszámok.
Zavart mátrix – Egy táblázat, amely leírja a modell teljesítményét a kiválasztott adott ponthatárhoz, beleértve a valódi pozitív, a valódi negatív, a hamis pozitív, a hamis negatív, a valódi pozitív arányt (TPR) és a hamis pozitív arányt (FPR). A táblázatban szereplő számok 100,0000 XNUMX eseményből álló példapopulációt feltételeznek. További részletekért lásd Modell teljesítménymutatói.
ROC (Receiver Operator Characteristic) görbe – A modell diagnosztikai képességét illusztráló diagram, amint az a következő képernyőképen látható. A valódi pozitív arányt a hamis pozitív arány függvényében ábrázolja az összes lehetséges modellpontérték küszöbén. Tekintse meg ezt a diagramot a kiválasztással Haladó mérőszámok. Ha egy modell több verzióját is betanította, választhat különböző FPR küszöbértékeket a teljesítményváltozás ellenőrzéséhez.
Modell változó fontossága – A modellváltozók rangsorolása a generált modellhez való hozzájárulásuk alapján, amint az a következő képernyőképen látható. A legmagasabb értékű modellváltozó fontosabb a modell számára, mint az adott modellváltozat adatkészletének többi modellváltozója, és alapértelmezés szerint a tetején szerepel. További részletekért lásd Modell változó fontossága.

A modell teljesítményének diagnosztizálása

A modell éles üzembe helyezése előtt használja az Amazon Fraud Detector által visszaadott mérőszámokat, hogy megértse a modell teljesítményét és diagnosztizálja a lehetséges problémákat. Az ML modellek gyakori problémái két fő kategóriába sorolhatók: adatokkal kapcsolatos kérdések és modellekkel kapcsolatos problémák. Az Amazon Fraud Detector gondoskodott a modellel kapcsolatos problémákról azáltal, hogy gondosan használt érvényesítési és tesztelési készleteket, hogy kiértékelje és hangolja a modellt a háttérben. Az alábbi lépések végrehajtásával ellenőrizheti, hogy a modell készen áll-e a telepítésre, vagy lehetséges-e az adatokkal kapcsolatos problémák:

Ellenőrizze a modell általános teljesítményét (AUC és pontszámeloszlás).
Tekintse át az üzleti követelményeket (zavaros mátrix és táblázat).
Ellenőrizze a modellváltozó fontosságát.

Ellenőrizze a modell általános teljesítményét: AUC és pontszámeloszlás

A jövőbeli események pontosabb előrejelzése mindig a prediktív modell elsődleges célja. Az Amazon Fraud Detector által visszaadott AUC-értéket egy megfelelően mintavételezett tesztkészlet alapján számítják ki, amelyet nem használnak a képzésben. Általában a 0.9-nél nagyobb AUC-értékkel rendelkező modell jó modellnek tekinthető.

Ha 0.8-nál kisebb teljesítményű modellt figyel meg, az általában azt jelenti, hogy a modellen van még mit javítani (a cikkben később tárgyaljuk az alacsony modellteljesítmény gyakori problémáit). Vegye figyelembe, hogy a „jó” teljesítmény meghatározása nagymértékben függ az Ön vállalkozásától és az alapmodelltől. Továbbra is követheti az ebben a bejegyzésben található lépéseket, hogy javítsa Amazon csalásérzékelő modelljét, még akkor is, ha az AUC nagyobb, mint 0.8.

Másrészt, ha az AUC 0.99 felett van, ez azt jelenti, hogy a modell szinte tökéletesen el tudja választani a csalást és a legitim eseményeket a tesztkészleten. Ez néha „túl szép, hogy igaz legyen” forgatókönyv (a bejegyzésben később tárgyaljuk a modellek nagyon magas teljesítményével kapcsolatos gyakori problémákat).

A teljes AUC mellett a pontszám eloszlása is megmutatja, hogy a modell milyen jól illeszkedik. Ideális esetben a jogszerű és csalás nagy része a skála két végén található, ami azt jelzi, hogy a modell pontszáma pontosan rangsorolja az eseményeket a tesztkészleten.

A következő példában a pontszám eloszlás AUC értéke 0.96.

Ha a jogszerű és a csalás megoszlása átfedésben van, vagy a középpontban összpontosult, ez valószínűleg azt jelenti, hogy a modell nem teljesít jól a csalási események és a jogszerű események megkülönböztetésében, ami azt jelezheti, hogy megváltozott a korábbi adatok eloszlása, vagy több adatra vagy szolgáltatásra van szüksége.

A következő egy példa a pontszám eloszlására 0.64 AUC-val.

Ha talál egy töréspontot, amely szinte tökéletesen szétválasztja a csalást és a jogszerű eseményeket, nagy az esélye annak, hogy a modellnél címkeszivárgási probléma van, vagy a csalási minták túl könnyen észlelhetők, ami felkelti a figyelmet.

A következő példában a pontszám eloszlás AUC értéke 1.0.

Tekintse át az üzleti követelményeket: Zavar mátrix és táblázat

Bár az AUC a modell teljesítményének kényelmes mutatója, nem biztos, hogy közvetlenül tükrözi az Ön üzleti követelményeit. Az Amazon Fraud Detector olyan mérőszámokat is biztosít, mint a csalás rögzítési aránya (igazi pozitív arány), a helytelenül csalásként előre jelzett jogszerű események százalékos aránya (hamis pozitív arány) és még sok más, amelyeket gyakrabban használnak üzleti követelményként. Miután betanított egy ésszerűen jó AUC-értékkel rendelkező modellt, össze kell hasonlítania a modellt az üzleti követelményeivel ezekkel a mutatókkal.

A zavart okozó mátrix és a táblázat olyan felületet biztosít, amellyel áttekintheti a hatást, és ellenőrizheti, hogy megfelel-e üzleti igényeinek. Vegye figyelembe, hogy a számok a modell küszöbértékétől függenek, ahol a küszöbértéknél nagyobb pontszámú események csalásnak, a küszöbnél alacsonyabb pontszámú események pedig legálisnak minősülnek. Kiválaszthatja, hogy melyik küszöböt használja az üzleti igényeitől függően.

Például, ha a cél a csalások 73%-ának rögzítése, akkor (amint az az alábbi példában látható) választhat egy küszöböt, például 855-öt, amely lehetővé teszi az összes csalás 73%-ának rögzítését. A modell azonban 3%-át is rosszul minősíti csalónak. Ha ez az FPR elfogadható az Ön vállalkozása számára, akkor a modell alkalmas a telepítésre. Ellenkező esetben javítania kell a modell teljesítményét.

Egy másik példa, ha egy jogos ügyfél blokkolásának vagy kihívásának költsége rendkívül magas, akkor alacsony FPR-t és nagy pontosságot szeretne. Ebben az esetben választhat egy 950-es küszöböt, amint az a következő példában látható, ami a jogos ügyfelek 1%-át nem minősíti csalásnak, és az azonosított csalások 80%-a valóban csaló lesz.

Ezenkívül több küszöböt is kiválaszthat, és különböző eredményeket rendelhet hozzá, például blokkolni, megvizsgálni, átadni. Ha nem talál megfelelő küszöbértékeket és szabályokat, amelyek megfelelnek minden üzleti követelményének, fontolja meg a modell képzését több adattal és attribútummal.

Ellenőrizze a modellváltozó fontosságát

A Modell változó fontossága A panelen látható, hogy az egyes változók hogyan járulnak hozzá a modellhez. Ha az egyik változó lényegesen nagyobb fontosságú, mint a többi, az arra utalhat, hogy címkeszivárog, vagy hogy a csalási minták túl könnyen észlelhetők. Ne feledje, hogy a változó fontossága a bemeneti változókra összesítésre kerül. Ha valamivel nagyobb jelentőséggel bír IP_ADDRESS, CARD_BIN, EMAIL_ADDRESS, PHONE_NUMBER, BILLING_ZIPvagy SHIPPING_ZIP, lehet, hogy a gazdagító ereje miatt.

A következő példa bemutatja a modell változó fontosságát potenciális címkeszivárgással investigation_status.

A modellváltozók fontossága arra is utal, hogy milyen további változók hozhatják fel a modellt. Ha például alacsony AUC-értéket észlel, és az eladóval kapcsolatos jellemzők nagy jelentőséggel bírnak, fontolóra veheti több rendelési jellemző összegyűjtését, mint pl. SELLER_CATEGORY, SELLER_ADDRESSés SELLER_ACTIVE_YEARS, és adja hozzá ezeket a változókat a modellhez.

Gyakori problémák a modell alacsony teljesítményével kapcsolatban

Ebben a részben a modell alacsony teljesítményével kapcsolatos gyakori problémákat tárgyaljuk.

A történeti adatok megoszlása megváltozott

A korábbi adatelosztási eltolódás akkor következik be, ha nagy üzleti változás vagy adatgyűjtési probléma áll be. Például, ha nemrégiben dobta piacra termékét egy új piacon, a IP_ADDRESS, EMAILés ADDRESS a kapcsolódó jellemzők teljesen eltérőek lehetnek, és a csalási mód is változhat. Amazon Fraud Detector használ EVENT_TIMESTAMP az adatok felosztása és a modell értékelése az adatkészletben lévő események megfelelő részhalmazán. Ha a korábbi adatok eloszlása jelentősen megváltozik, akkor az értékelési halmaz nagyon eltérhet a betanítási adatoktól, és a jelentett modell teljesítménye alacsony lehet.

Az előzményadatok feltárásával ellenőrizheti a lehetséges adatelosztási változással kapcsolatos problémákat:

Használja a Amazon Fraud Detector Data Profiler eszköz annak ellenőrzésére, hogy a csalási arány és a hiányzó címke aránya változott-e az idő múlásával.
Ellenőrizze, hogy a változó időbeli eloszlása jelentősen változott-e, különösen a nagy változó jelentőségű jellemzők esetében.
Ellenőrizze a változó időbeli eloszlását célváltozók szerint. Ha egy kategóriából lényegesen több csalási eseményt észlel a legutóbbi adatokban, érdemes ellenőrizni, hogy a változtatás ésszerű-e az üzleti megítélése alapján.

Ha úgy találja, hogy a címke hiányzó aránya nagyon magas, vagy a csalások aránya folyamatosan csökkent a legutóbbi dátumok során, ez azt jelezheti, hogy a címkék még nem érettek ki teljesen. Ki kell zárnia a legfrissebb adatokat, vagy várnia kell tovább a pontos címkék összegyűjtésével, majd újra kell képeznie a modellt.

Ha bizonyos dátumokon a csalási arány és a változók éles megugrását észleli, érdemes még egyszer ellenőriznie, hogy kiugró vagy adatgyűjtési probléma-e. Ebben az esetben törölnie kell ezeket az eseményeket, és újra kell tanítania a modellt.

Ha úgy találja, hogy az elavult adatok nem reprezentálják jelenlegi és jövőbeni üzleti tevékenységét, akkor a régi adatidőszakot ki kell zárni a képzésből. Ha tárolt eseményeket használ az Amazon Fraud Detectorban, egyszerűen áttaníthat egy új verziót, és kiválaszthatja a megfelelő dátumtartományt a képzési feladat konfigurálása közben. Ez arra is utalhat, hogy a csalási mód az Ön vállalkozásában az idő múlásával viszonylag gyorsan változik. A modell üzembe helyezése után előfordulhat, hogy gyakran újra betanítania kell a modellt.

Nem megfelelő változótípus-leképezés

Az Amazon Fraud Detector a változótípusok alapján gazdagítja és átalakítja az adatokat. Fontos, hogy a változókat a megfelelő típusra képezze le, hogy az Amazon Fraud Detector modell a maximális értéket tudja felvenni az adatokból. Például ha feltérképezed IP hoz CATEGORICAL típus helyett IP_ADDRESS, nem érted a IP-kapcsolódó gazdagítások a háttérben.

Az Amazon Fraud Detector általában a következő műveleteket javasolja:

Változóit rendelje hozzá meghatározott típusokhoz, mint pl IP_ADDRESS, EMAIL_ADDRESS, CARD_BINés PHONE_NUMBER, így az Amazon Fraud Detector további információkat nyerhet ki és gazdagíthat.
Ha nem találja az adott változótípust, rendelje hozzá a három általános típus valamelyikéhez: NUMERIC, CATEGORICALvagy FREE_FORM_TEXT.
Ha egy változó szöveges formájú és nagy számosságú, például vásárlói vélemény vagy termékleírás, akkor le kell képeznie a FREE_FORM_TEXT változó típusú, így az Amazon Fraud Detector kivonja helyetted a háttérben található szöveges funkciókat és beágyazásokat. Például ha feltérképezed url_string nak nek FREE_FORM_TEXT, képes tokenizálni az URL-t, és információkat kinyerni a downstream modellbe, ami segít abban, hogy több rejtett mintát tudjon meg az URL-ből.

Ha úgy találja, hogy valamelyik változótípus hibásan van leképezve a változókonfigurációban, módosíthatja a változó típusát, majd újra betaníthatja a modellt.

Nincs elegendő adat vagy szolgáltatás

Az Amazon Fraud Detectornak legalább 10,000 400 rekordra van szüksége az Online Fraud Insights (OFI) vagy a Transaction Fraud Insights (TFI) modell betanításához, amelyek közül legalább 100-at csalásként azonosítottak. A TFI azt is megköveteli, hogy mind a csalárd rekordok, mind a jogszerű rekordok legalább XNUMX különböző entitástól származzanak, hogy biztosítsák az adatkészlet sokszínűségét. Ezenkívül az Amazon Fraud Detector megköveteli, hogy a modellezési adatok legalább két változóval rendelkezzenek. Ezek a minimális adatkövetelmények egy hasznos Amazon Fraud Detector modell felépítéséhez. Több rekord és változó használata azonban általában segít az ML modelleknek, hogy jobban megtanulják a mögöttes mintákat az adatokból. Ha alacsony AUC-t észlel, vagy nem talál olyan küszöbértéket, amely megfelelne az üzleti követelményeinek, fontolja meg a modell átképzését több adattal, vagy új funkciókkal egészítse ki a modellt. Általában találunk EMAIL_ADDRESS, IP, PAYMENT_TYPE, BILLING_ADDRESS, SHIPPING_ADDRESSés DEVICE a kapcsolódó változók fontosak a csalás felderítésében.

Egy másik lehetséges ok az, hogy egyes változói túl sok hiányzó értéket tartalmaznak. Ha meg szeretné tudni, hogy ez megtörténik-e, ellenőrizze a modell képzési üzeneteit, és olvassa el a következőt Az edzési adatokkal kapcsolatos problémák elhárítása javaslatokhoz.

A nagyon magas modellteljesítmény gyakori problémái

Ebben a részben a nagyon magas modellteljesítménnyel kapcsolatos gyakori problémákat tárgyaljuk.

Címke szivárgás

Címkeszivárgás akkor fordul elő, ha a betanítási adatkészletek olyan információkat használnak fel, amelyek várhatóan nem állnak rendelkezésre az előrejelzés időpontjában. Éles környezetben futtatva túlbecsüli a modell hasznosságát.

A magas AUC (közel 1), a tökéletesen elkülönülő pontszámeloszlás és az egyik változó szignifikánsan magasabb változó jelentősége a lehetséges címkeszivárgási problémák jelzői lehetnek. A funkciók és a címke közötti összefüggést a gombbal is ellenőrizheti Adatprofilozó Az Jellemző és címke összefüggés diagram az egyes jellemzők és a címke közötti összefüggést mutatja. Ha az egyik funkció 0.99-nél nagyobb korrelációt mutat a címkével, ellenőrizze, hogy a funkciót megfelelően használják-e az üzleti megítélés alapján. Például egy hitelkérelem jóváhagyására vagy elutasítására szolgáló kockázati modell felépítéséhez ne használjon olyan funkciókat, mint pl AMOUNT_PAID, mert a kifizetések a jegyzési folyamat után történnek. Ha egy változó nem áll rendelkezésre az előrejelzés elkészítésekor, akkor távolítsa el a változót a modell konfigurációjából, és tanítson át egy új modellt.

A következő példa az egyes változók és címkék közötti összefüggést mutatja be. investigation_status erősen korrelál (közel 1-hez) a címkével, ezért érdemes még egyszer ellenőrizni, hogy van-e címkeszivárgási probléma.

Egyszerű csalási minták

Ha az adatok csalási mintái egyszerűek, akkor a modell nagyon magas teljesítményét is megfigyelheti. Tegyük fel például, hogy a modellezési adatokban szereplő összes csalási esemény ugyanazon a belső szolgáltatón keresztül érkezik; a modellnek egyszerű kiválasztani a IP-kapcsolódó változókat, és egy „tökéletes” modellt adnak vissza, amelynek nagy jelentősége van IP.

Az egyszerű csalási minták nem mindig jeleznek adatproblémát. Igaz lehet, hogy a vállalkozásában alkalmazott csalási módokat könnyű megragadni. Mielőtt azonban következtetést vonna le, meg kell győződnie arról, hogy a modellképzésben használt címkék pontosak, és a modellezési adatok a lehető legtöbb csalási mintát fedik le. Például, ha szabályok alapján címkézi fel csalási eseményeit, például egy adott alkalmazás összes alkalmazását BILLING_ZIP plusz PRODUCT_CATEGORY mint csalás, a modell könnyen elkaphatja ezeket a csalásokat a szabályok szimulálásával és magas AUC elérésével.

A címkék eloszlását az egyes funkciók különböző kategóriáiban vagy tárolóiban ellenőrizheti a Adatprofilozó. Ha például azt észleli, hogy a legtöbb csalási esemény egy vagy néhány termékkategóriából származik, akkor ez egyszerű csalási mintákat jelezhet, és meg kell erősítenie, hogy nem adatgyűjtési vagy feldolgozási hibáról van szó. Ha a funkció olyan CUSTOMER_ID, ki kell zárnia a funkciót a modellképzésben.

A következő példa a címke megoszlását mutatja be a különböző kategóriák között product_category. Minden csalás két termékkategóriából származik.

Nem megfelelő adatmintavétel

Helytelen adatmintavétel történhet, ha mintát vett, és az adatoknak csak egy részét küldte el az Amazon Fraud Detectornak. Ha az adatok mintavételezése nem megfelelő, és nem reprezentálja a termelési forgalmat, a jelentett modell teljesítménye pontatlan lesz, és a modell használhatatlan lehet a termelés előrejelzéséhez. Például, ha a modellezési adatokban szereplő összes csalási esemény Ázsiából, és az összes legális esemény az Egyesült Államokból származik, a modell megtanulhatja elkülöníteni a csalást a legálistól BILLING_COUNTRY. Ebben az esetben a modell nem általános ahhoz, hogy más populációkra alkalmazzuk.

Általában azt javasoljuk, hogy az összes legutóbbi eseményt mintavétel nélkül küldje el. Az adatméret és a csalási arány alapján az Amazon Fraud Detector mintavételezést végez a modellképzés előtt. Ha az adatok túl nagyok (több mint 100 GB), és úgy dönt, hogy mintát vesz, és csak egy részhalmazt küld el, véletlenszerűen kell mintát vennie az adatokból, és győződjön meg arról, hogy a minta a teljes sokaságot reprezentálja. A TFI esetében entitásonként kell mintát vennie az adatokból, ami azt jelenti, hogy egy entitás mintavételezése esetén az összes előzményt bele kell foglalnia, hogy az entitásszintű aggregátumok helyesen kerüljenek kiszámításra. Vegye figyelembe, hogy ha csak az adatok egy részhalmazát küldi el az Amazon Fraud Detectornak, a valós idejű aggregátumok a következtetés során pontatlanok lehetnek, ha az entitások korábbi eseményeit nem küldi el.

Egy másik helytelen adatmintavétel lehet, ha csak egy rövid időszakot, például egynapi adatokat használnak fel a modell felépítéséhez. Az adatok elfogultak lehetnek, különösen akkor, ha az üzleti vagy csalási támadások szezonálisak. Általában legalább két ciklus (például 2 hét vagy 2 hónap) értékű adat felvételét javasoljuk a modellezésbe a csalástípusok sokféleségének biztosítása érdekében.

Következtetés

Az összes lehetséges probléma diagnosztizálása és megoldása után be kell szereznie egy hasznos Amazon Fraud Detector modellt, és biztosnak kell lennie a teljesítményében. A következő lépéshez te létrehozhat egy detektort a modellel és az üzleti szabályokkal, és készen álljon az éles üzembe helyezésére az árnyék mód kiértékeléséhez.

Függelék

Hogyan lehet kizárni a változókat a modellképzéshez

A mélymerülés után előfordulhat, hogy egy változó szivárgási célinformációt azonosíthat, és szeretné kizárni a modellképzésből. A következő lépések végrehajtásával újra betaníthatja a modellverziót a nem kívánt változók kizárásával:

Az Amazon Fraud Detector konzol navigációs paneljén válassza a lehetőséget Modellek.
A Modellek oldalon válassza ki az áttanítani kívánt modellt.
A Hozzászólások menüben válasszon Vonat új verzió.
Válassza ki a használni kívánt dátumtartományt, és válassza ki Következő.
A Konfigurálja az edzést oldalon törölje annak a változónak a kijelölését, amelyet nem szeretne a modellképzésben használni.
Adja meg csalási címkéit és jogos címkéit, valamint azt, hogy az Amazon Fraud Detector hogyan használja fel a címkézetlen eseményeket, majd válassza Következő.
Tekintse át a modell konfigurációját, és válassza ki Modell létrehozása és betanítása.

Az eseményváltozó típusának megváltoztatása

A változók a csalásmegelőzésben használt adatelemeket jelentik. Az Amazon Fraud Detectorban az összes változó globális, és minden esemény és modell között meg van osztva, ami azt jelenti, hogy egy változó több eseményben is használható. Például az IP társítható bejelentkezési eseményekhez, és társítható tranzakciós eseményekhez is. Természetesen az Amazon Fraud Detector zárolta a változó típusát és az adattípust a változó létrehozása után. Egy meglévő változó törléséhez először törölnie kell az összes kapcsolódó eseménytípust és modellt. Ellenőrizheti az adott változóhoz társított erőforrásokat, ha az Amazon Fraud Detector oldalra lép, és kiválasztja Változók a navigációs ablakban, és válassza ki a változó nevét és Kapcsolódó források.

Törölje a változót és az összes kapcsolódó eseménytípust

A változó törléséhez hajtsa végre a következő lépéseket:

Az Amazon Fraud Detector konzol navigációs paneljén válassza a lehetőséget Változók.
Válassza ki a törölni kívánt változót.
A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Kapcsolódó források az ezt a változót használt összes eseménytípus listájának megtekintéséhez.
A változó törlése előtt törölnie kell ezeket a kapcsolódó eseménytípusokat.
Válassza ki az eseménytípusokat a listából, hogy a kapcsolódó eseménytípus oldalra lépjen.
A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Tárolt események annak ellenőrzésére, hogy nincs-e tárolva adat ebben az eseménytípusban.
Ha vannak események tárolva az Amazon Fraud Detectorban, válassza a lehetőséget Törölje a tárolt eseményeket a tárolt események törléséhez.
Amikor a törlési feladat befejeződött, megjelenik a „Az ehhez az eseménytípushoz tartozó tárolt események sikeresen törölve” üzenet.
A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Kapcsolódó források.
Ha ehhez az eseménytípushoz érzékelők és modellek vannak társítva, először törölnie kell ezeket az erőforrásokat.
Ha érzékelők vannak társítva, hajtsa végre a következő lépéseket az összes társított érzékelő törléséhez:
1. Válassza ki azt az érzékelőt, amelyhez a Az érzékelő részletei cimre.
2. A Modell verziók ablaktáblában válassza ki az érzékelő verzióját.
3. Az érzékelő verzió oldalán válassza a lehetőséget Hozzászólások.
4. Ha az érzékelő verziója aktív, válassza a lehetőséget deaktiválása, választ Deaktiválja ezt az érzékelő verziót anélkül, hogy másik verzióra cserélné, és válasszon Az érzékelő verziójának kikapcsolása.
5. Az érzékelő verziójának deaktiválása után válassza a lehetőséget Hozzászólások és azután töröl.
6. Ismételje meg ezeket a lépéseket az összes detektorverzió törléséhez.
7. A Az érzékelő részletei oldalon válassza a lehetőséget Kapcsolódó szabályok.
8. Válassza ki a törölni kívánt szabályt.
9. A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Hozzászólások és a Törölje a szabály verzióját.
10. Írja be a szabály nevét a megerősítéshez és válassza ki Verzió törlése.
11. Ismételje meg ezeket a lépéseket az összes kapcsolódó szabály törléséhez.
12. Miután az összes detektorverziót és a kapcsolódó szabályokat törölte, lépjen a Az érzékelő részletei oldalon válassza a lehetőséget Hozzászólások, és válasszon Törölje az érzékelőt.
13. Írja be az érzékelő nevét, és válassza ki Törölje az érzékelőt.
14. Ismételje meg ezeket a lépéseket a következő érzékelő törléséhez.
Ha bármilyen modell társítva van az eseménytípushoz, hajtsa végre a következő lépéseket a törléshez:
1. Válassza ki a modell nevét.
2. A Modell verziók panelen válassza ki a verziót.
3. Ha a modell állapota Active, választ Hozzászólások és a A modellverzió telepítésének visszavonása.
4. belép undeploy megerősítéshez és kiválasztásához A modellverzió telepítésének visszavonása.
  Az állapot a következőre változik: Undeploying. A folyamat néhány percet vesz igénybe.
5. Miután az állapot válik Ready to deploy, válassza a Műveletek és a Törlés lehetőséget.
6. Ismételje meg ezeket a lépéseket az összes modellverzió törléséhez.
7. A Modell részletei oldalon válassza a Műveletek és a Modell törlése lehetőséget.
8. Adja meg a modell nevét, és válassza a Modell törlése lehetőséget.
9. Ismételje meg ezeket a lépéseket a következő modell törléséhez.
Az összes kapcsolódó érzékelő és modell törlése után válassza a lehetőséget Hozzászólások és a Törölje az esemény típusát a Esemény részletei cimre.
Adja meg az eseménytípus nevét, és válassza ki Törölje az esemény típusát.
A navigációs panelen válassza a lehetőséget Változók, és válassza ki a törölni kívánt változót.
Ismételje meg a korábbi lépéseket a változóhoz társított összes eseménytípus törléséhez.
A Változó részletek oldalon válassza a lehetőséget Hozzászólások és a Törlése.
Írja be a változó nevét, és válassza ki Változó törlése.

Hozzon létre egy új változót a megfelelő változótípussal

Miután törölte a változót és az összes kapcsolódó eseménytípust, tárolt eseményeket, modelleket és detektorokat az Amazon Fraud Detector alkalmazásból, létrehozhat egy új, azonos nevű változót, és leképezheti a megfelelő változótípusra.

Az Amazon Fraud Detector konzol navigációs paneljén válassza a lehetőséget Változók.
A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Teremt.
Adja meg a módosítani kívánt változó nevét (azt, amelyet korábban törölt).
Válassza ki a megfelelő változótípust, amelyre módosítani kíván.
A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Változó létrehozása.

Töltse fel az adatokat, és képezze újra a modellt

A változótípus frissítése után újra feltöltheti az adatokat, és betaníthat egy új modellt. Az utasításokat lásd Észlelje az online tranzakciós csalásokat az Amazon Fraud Detector új funkcióival.

Új változók hozzáadása egy meglévő eseménytípushoz

Ha új változókat szeretne hozzáadni a meglévő eseménytípushoz, tegye a következőket:

Adja hozzá az új változókat az előző képzési CVS-fájlhoz.
Töltse fel az új edzési adatfájlt egy S3 vödörbe. Jegyezze fel az edzésfájl Amazon S3 helyét (például s3://bucketname/path/to/some/object.csv) és a szereped nevét.
Az Amazon Fraud Detector konzol navigációs paneljén válassza a lehetőséget Eseményeket.
A Eseménytípusok oldalon válassza ki a változókat hozzáadni kívánt eseménytípus nevét.
A Esemény típus részletek oldalon válasszon Hozzászólások, Akkor Változók hozzáadása.
Alatt Válassza ki, hogyan definiálja az esemény változóit, választ Válasszon változókat egy edzési adatkészletből.
Az IAM-szerepkörhöz válasszon ki egy meglévő IAM-szerepkört, vagy hozzon létre egy új szerepkört, hogy hozzáférjen az adatokhoz az Amazon S3-ban.
A Adatok helye, adja meg az új edzésfájl S3 helyét, és válassza ki Feltöltése.
A meglévő eseménytípusban nem szereplő új változóknak meg kell jelenniük a listában.
A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Változók hozzáadása.

Most az új változókat hozzáadtuk a meglévő eseménytípushoz. Ha tárolt eseményeket használ az Amazon Fraud Detectorban, a tárolt események új változói továbbra is hiányoznak. Importálnia kell a betanítási adatokat az új változókkal az Amazon Fraud Detectorba, majd újra kell tanítania egy új modellverziót. Az új edzésadatok feltöltésekor ugyanazzal EVENT_ID és a EVENT_TIMESTAMP, az új eseményváltozók felülírják az Amazon Fraud Detectorban tárolt korábbi eseményváltozókat.

A szerzőkről

Julia Xu az Amazon Fraud Detector kutatója. Szenvedélyesen foglalkozik az ügyfelek kihívásainak gépi tanulási technikák segítségével történő megoldásával. Szabadidejében szívesen túrázik, fest, és új kávézókat fedez fel.

Hao Zhou az Amazon Fraud Detector kutatója. Az USA-beli Northwestern Egyetemen szerzett villamosmérnöki PhD fokozatot. Szenvedélye a gépi tanulási technikák alkalmazása a csalások és visszaélések leküzdésére.

Abhishek Ravi vezető termékmenedzser az Amazon Fraud Detectornál. Szenvedélyesen aknázza ki technikai képességeit, hogy olyan termékeket készítsen, amelyek örömet okoznak az ügyfeleknek.

Időbélyeg: Június 29, 2022

Időbélyeg: 29. február 2024.