ด้วยการเติบโตของการใช้แอปพลิเคชันออนไลน์และจำนวนผู้ใช้อินเทอร์เน็ตที่เพิ่มขึ้น การฉ้อโกงทางดิจิทัลจึงเพิ่มขึ้นทุกปี เครื่องตรวจจับการฉ้อโกงของ Amazon ให้บริการที่มีการจัดการเต็มรูปแบบเพื่อช่วยให้คุณระบุกิจกรรมออนไลน์ที่อาจเป็นการฉ้อโกงได้ดีขึ้นโดยใช้เทคนิคการเรียนรู้ของเครื่อง (ML) ขั้นสูง และความเชี่ยวชาญในการตรวจจับการฉ้อโกงมากกว่า 20 ปีจาก Amazon
เพื่อช่วยให้คุณตรวจจับการฉ้อโกงได้เร็วขึ้นในหลายกรณีการใช้งาน Amazon Fraud Detector นำเสนอโมเดลเฉพาะด้วยอัลกอริธึมที่ปรับแต่ง การปรับแต่ง และการแปลงคุณสมบัติ การฝึกโมเดลเป็นแบบอัตโนมัติทั้งหมดและไม่ยุ่งยาก และคุณสามารถทำตามคำแนะนำใน คู่มือผู้ใช้ หรือที่เกี่ยวข้อง บล็อกโพสต์ ที่จะเริ่มต้น. อย่างไรก็ตาม ด้วยโมเดลที่ผ่านการฝึกอบรม คุณต้องตัดสินใจว่าโมเดลนั้นพร้อมสำหรับการปรับใช้หรือไม่ สิ่งนี้ต้องการความรู้บางอย่างใน ML, สถิติ และการตรวจจับการฉ้อโกง และอาจเป็นประโยชน์หากทราบวิธีการทั่วไปบางอย่าง
โพสต์นี้จะช่วยคุณวิเคราะห์ประสิทธิภาพของโมเดลและเลือกโมเดลที่เหมาะสมสำหรับการปรับใช้ เราแนะนำเมตริกที่ Amazon Fraud Detector จัดเตรียมไว้ให้ ช่วยคุณวินิจฉัยปัญหาที่อาจเกิดขึ้น และให้คำแนะนำในการปรับปรุงประสิทธิภาพของโมเดล แนวทางดังกล่าวใช้ได้กับทั้งเทมเพลตโมเดล Online Fraud Insights (OFI) และ Transaction Fraud Insights (TFI)
ภาพรวมโซลูชัน
โพสต์นี้มีขั้นตอนแบบ end-to-end เพื่อวิเคราะห์ประสิทธิภาพของแบบจำลองของคุณ ขั้นแรกจะแนะนำเมตริกโมเดลทั้งหมดที่แสดงบนคอนโซล Amazon Fraud Detector รวมถึง AUC การกระจายคะแนน เมทริกซ์ความสับสน เส้นโค้ง ROC และความสำคัญของตัวแปรโมเดล จากนั้นเราจะนำเสนอแนวทางสามขั้นตอนในการวินิจฉัยประสิทธิภาพของแบบจำลองโดยใช้เมตริกต่างๆ สุดท้าย เราให้คำแนะนำในการปรับปรุงประสิทธิภาพของโมเดลสำหรับปัญหาทั่วไป
เบื้องต้น
ก่อนเจาะลึกโมเดล Amazon Fraud Detector คุณต้องปฏิบัติตามข้อกำหนดเบื้องต้นต่อไปนี้:
- สร้างบัญชี AWS
- สร้างชุดข้อมูลเหตุการณ์ สำหรับการฝึกโมเดล
- อัพโหลดข้อมูลของคุณ ไปยัง บริการจัดเก็บข้อมูลอย่างง่ายของ Amazon (Amazon S3) หรือ นำเข้าข้อมูลเหตุการณ์ของคุณไปยัง Amazon Fraud Detector.
- สร้างแบบจำลอง Amazon Fraud Detector.
ตีความเมตริกโมเดล
หลังจากการฝึกโมเดลเสร็จสิ้น Amazon Fraud Detector จะประเมินโมเดลของคุณโดยใช้ข้อมูลการสร้างโมเดลบางส่วนที่ไม่ได้ใช้ในการฝึกโมเดล ส่งคืนตัวชี้วัดการประเมินบน รุ่นรุ่น หน้าสำหรับรุ่นนั้นๆ ตัวชี้วัดเหล่านั้นสะท้อนถึงประสิทธิภาพของแบบจำลองที่คุณคาดหวังได้จากข้อมูลจริงหลังจากปรับใช้กับการผลิต
ภาพหน้าจอต่อไปนี้แสดงตัวอย่างประสิทธิภาพของโมเดลที่ส่งคืนโดย Amazon Fraud Detector คุณสามารถเลือกเกณฑ์ที่แตกต่างกันในการแจกแจงคะแนน (ซ้าย) และเมทริกซ์ความสับสน (ขวา) จะได้รับการอัปเดตตามนั้น
คุณสามารถใช้ผลการวิจัยต่อไปนี้เพื่อตรวจสอบประสิทธิภาพและตัดสินใจเกี่ยวกับกฎกลยุทธ์:
- AUC (พื้นที่ใต้เส้นโค้ง) – ประสิทธิภาพโดยรวมของรุ่นนี้ โมเดลที่มี AUC 0.50 นั้นไม่ได้ดีไปกว่าการพลิกเหรียญเพราะมันแสดงถึงโอกาสแบบสุ่ม ในขณะที่โมเดลที่ "สมบูรณ์แบบ" จะมีคะแนน 1.0 ยิ่ง AUC สูงเท่าไหร่ โมเดลของคุณสามารถแยกแยะความแตกต่างระหว่างการฉ้อโกงและความถูกต้องตามกฎหมายได้ดียิ่งขึ้น
- การกระจายคะแนน – ฮิสโตแกรมของการแจกแจงคะแนนแบบจำลองโดยสมมติว่ามีประชากรตัวอย่าง 100,000 เหตุการณ์ Amazon Fraud Detector สร้างคะแนนโมเดลระหว่าง 0–1000 โดยที่คะแนนยิ่งต่ำ ความเสี่ยงในการฉ้อโกงก็จะยิ่งลดลง การแยกระหว่างประชากรที่ถูกกฎหมาย (สีเขียว) กับการฉ้อโกง (สีน้ำเงิน) ที่ดีขึ้น โดยทั่วไปแล้วจะบ่งบอกถึงรูปแบบที่ดีกว่า ดูรายละเอียดเพิ่มเติมได้ที่ คะแนนนางแบบ.
- เมทริกซ์ความสับสน – ตารางที่อธิบายประสิทธิภาพของแบบจำลองสำหรับเกณฑ์คะแนนที่กำหนด ซึ่งรวมถึงผลบวกจริง ผลลบจริง ผลบวกลวง ค่าลบเท็จ อัตราผลบวกจริง (TPR) และอัตราผลบวกลวง (FPR) การนับบนโต๊ะสมมติตัวอย่างประชากร 100,0000 เหตุการณ์ ดูรายละเอียดเพิ่มเติมได้ที่ ตัวชี้วัดประสิทธิภาพของแบบจำลอง.
- เส้นโค้ง ROC (ตัวดำเนินการผู้รับ) – พล็อตที่แสดงให้เห็นถึงความสามารถในการวินิจฉัยของแบบจำลองดังที่แสดงในภาพหน้าจอต่อไปนี้ มันพล็อตอัตราบวกที่แท้จริงเป็นฟังก์ชันของอัตราการบวกลวงเหนือเกณฑ์คะแนนแบบจำลองที่เป็นไปได้ทั้งหมด ดูแผนภูมินี้โดยเลือก เมตริกขั้นสูง. หากคุณได้ฝึกโมเดลเดียวหลายเวอร์ชัน คุณสามารถเลือกเกณฑ์ FPR ที่แตกต่างกันเพื่อตรวจสอบการเปลี่ยนแปลงประสิทธิภาพได้
- ความสำคัญของตัวแปรแบบจำลอง – อันดับของตัวแปรโมเดลตามการมีส่วนร่วมกับโมเดลที่สร้างขึ้น ดังที่แสดงในภาพหน้าจอต่อไปนี้ ตัวแปรโมเดลที่มีค่าสูงสุดมีความสำคัญต่อโมเดลมากกว่าตัวแปรโมเดลอื่นๆ ในชุดข้อมูลสำหรับเวอร์ชันของโมเดลนั้น และจะแสดงอยู่ที่ด้านบนสุดโดยค่าเริ่มต้น ดูรายละเอียดเพิ่มเติมได้ที่ ความสำคัญของตัวแปรแบบจำลอง.
วิเคราะห์ประสิทธิภาพของโมเดล
ก่อนปรับใช้โมเดลของคุณในการผลิต คุณควรใช้ตัววัดที่ Amazon Fraud Detector ส่งคืนเพื่อทำความเข้าใจประสิทธิภาพของโมเดลและวิเคราะห์ปัญหาที่เป็นไปได้ ปัญหาทั่วไปของแบบจำลอง ML สามารถแบ่งออกเป็นสองประเภทหลัก: ปัญหาที่เกี่ยวข้องกับข้อมูลและปัญหาที่เกี่ยวข้องกับแบบจำลอง Amazon Fraud Detector ได้ดูแลปัญหาที่เกี่ยวข้องกับโมเดลโดยใช้ชุดการตรวจสอบและการทดสอบอย่างรอบคอบเพื่อประเมินและปรับแต่งโมเดลของคุณในแบ็กเอนด์ คุณสามารถทำตามขั้นตอนต่อไปนี้เพื่อตรวจสอบว่าโมเดลของคุณพร้อมสำหรับการปรับใช้หรือมีปัญหาเกี่ยวกับข้อมูลที่เป็นไปได้:
- ตรวจสอบประสิทธิภาพของแบบจำลองโดยรวม (AUC และการกระจายคะแนน)
- ตรวจสอบข้อกำหนดทางธุรกิจ (เมทริกซ์ความสับสนและตาราง)
- ตรวจสอบความสำคัญของตัวแปรโมเดล
ตรวจสอบประสิทธิภาพของแบบจำลองโดยรวม: AUC และการกระจายคะแนน
การทำนายเหตุการณ์ในอนาคตที่แม่นยำยิ่งขึ้นนั้นเป็นเป้าหมายหลักของแบบจำลองการคาดการณ์เสมอ AUC ที่ส่งคืนโดย Amazon Fraud Detector จะคำนวณจากชุดการทดสอบที่สุ่มตัวอย่างอย่างเหมาะสมซึ่งไม่ได้ใช้ในการฝึกอบรม โดยทั่วไป โมเดลที่มี AUC มากกว่า 0.9 ถือเป็นแบบจำลองที่ดี
หากคุณสังเกตแบบจำลองที่มีประสิทธิภาพน้อยกว่า 0.8 แสดงว่าแบบจำลองนั้นมีพื้นที่สำหรับการปรับปรุง (เราจะพูดถึงปัญหาทั่วไปสำหรับประสิทธิภาพของแบบจำลองต่ำในโพสต์นี้) โปรดทราบว่าคำจำกัดความของประสิทธิภาพ "ดี" ขึ้นอยู่กับธุรกิจของคุณและรูปแบบพื้นฐานเป็นอย่างมาก คุณยังคงทำตามขั้นตอนในโพสต์นี้เพื่อปรับปรุงโมเดล Amazon Fraud Detector ได้แม้ว่า AUC จะมากกว่า 0.8
ในทางกลับกัน หาก AUC มากกว่า 0.99 แสดงว่าโมเดลสามารถแยกการฉ้อโกงและเหตุการณ์ที่ถูกต้องตามกฎหมายออกจากชุดทดสอบได้เกือบทั้งหมด บางครั้งนี่เป็นสถานการณ์ที่ "ดีเกินจริง" (เราจะพูดถึงปัญหาทั่วไปสำหรับประสิทธิภาพของโมเดลที่สูงมากในโพสต์นี้)
นอกจาก AUC โดยรวมแล้ว การกระจายคะแนนยังสามารถบอกคุณได้ว่าโมเดลนั้นติดตั้งได้ดีเพียงใด ตามหลักการแล้ว คุณควรเห็นจำนวนมากของการถูกกฎหมายและการฉ้อโกงที่ปลายทั้งสองด้านของมาตราส่วน ซึ่งบ่งชี้ว่าคะแนนแบบจำลองสามารถจัดอันดับเหตุการณ์ในชุดทดสอบได้อย่างถูกต้อง
ในตัวอย่างต่อไปนี้ การแจกแจงคะแนนมี AUC เท่ากับ 0.96
หากการกระจายที่ถูกกฎหมายและการกระจายการฉ้อโกงทับซ้อนกันหรือกระจุกตัวอยู่ในศูนย์ อาจหมายความว่าแบบจำลองนั้นทำงานได้ไม่ดีในการแยกแยะเหตุการณ์การฉ้อโกงออกจากเหตุการณ์ที่ถูกต้องตามกฎหมาย ซึ่งอาจบ่งชี้ว่าการกระจายข้อมูลในอดีตมีการเปลี่ยนแปลงหรือว่าคุณต้องการข้อมูลหรือคุณสมบัติเพิ่มเติม
ต่อไปนี้เป็นตัวอย่างการแจกแจงคะแนนที่มี AUC 0.64
หากคุณพบจุดแยกที่สามารถแยกแยะการฉ้อโกงและเหตุการณ์ที่ถูกต้องได้เกือบทั้งหมด มีโอกาสสูงที่แบบจำลองจะมีปัญหาการรั่วไหลของฉลากหรือรูปแบบการฉ้อโกงนั้นง่ายต่อการตรวจจับ ซึ่งควรดึงดูดความสนใจของคุณ
ในตัวอย่างต่อไปนี้ การแจกแจงคะแนนมี AUC เท่ากับ 1.0
ตรวจสอบข้อกำหนดทางธุรกิจ: เมทริกซ์ความสับสนและตาราง
แม้ว่า AUC จะเป็นตัวบ่งชี้ที่สะดวกสำหรับประสิทธิภาพของแบบจำลอง แต่ก็อาจไม่ได้แปลตรงตามความต้องการทางธุรกิจของคุณโดยตรง Amazon Fraud Detector ยังมีตัววัด เช่น อัตราการดักจับการทุจริต (อัตราผลบวกที่แท้จริง) เปอร์เซ็นต์ของเหตุการณ์ที่ถูกต้องตามกฎหมายที่คาดการณ์อย่างไม่ถูกต้องว่าเป็นการฉ้อโกง (อัตราที่ผิดพลาด) และอื่นๆ ซึ่งมักใช้เป็นข้อกำหนดทางธุรกิจมากกว่า หลังจากที่คุณฝึกโมเดลด้วย AUC ที่ดีพอสมควรแล้ว คุณต้องเปรียบเทียบโมเดลกับความต้องการทางธุรกิจของคุณด้วยเมตริกเหล่านั้น
เมทริกซ์ความสับสนและตารางมีอินเทอร์เฟซสำหรับตรวจสอบผลกระทบและตรวจสอบว่าตรงกับความต้องการทางธุรกิจของคุณหรือไม่ โปรดทราบว่าตัวเลขขึ้นอยู่กับเกณฑ์ของแบบจำลอง โดยที่เหตุการณ์ที่มีคะแนนมากกว่าเกณฑ์นั้นจะถูกจัดประเภทเป็นการฉ้อโกง และเหตุการณ์ที่มีคะแนนต่ำกว่าเกณฑ์จะถูกจัดประเภทว่าถูกกฎหมาย คุณสามารถเลือกเกณฑ์ที่จะใช้ขึ้นอยู่กับความต้องการทางธุรกิจของคุณ
ตัวอย่างเช่น หากเป้าหมายของคุณคือการจับ 73% ของการฉ้อโกง ดังนั้น (ตามที่แสดงในตัวอย่างด้านล่าง) คุณสามารถเลือกเกณฑ์เช่น 855 ซึ่งช่วยให้คุณจับ 73% ของการฉ้อโกงทั้งหมด อย่างไรก็ตาม โมเดลดังกล่าวยังจัดประเภทเหตุการณ์ที่ถูกต้องตามกฎหมาย 3% ผิดว่าเป็นการฉ้อโกง หาก FPR นี้เป็นที่ยอมรับสำหรับธุรกิจของคุณ โมเดลนั้นก็เหมาะสำหรับการปรับใช้ มิฉะนั้น คุณต้องปรับปรุงประสิทธิภาพของโมเดล
อีกตัวอย่างหนึ่งคือ หากค่าใช้จ่ายในการบล็อกหรือท้าทายลูกค้าที่ถูกต้องตามกฎหมายนั้นสูงมาก คุณต้องการ FPR ที่ต่ำและมีความแม่นยำสูง ในกรณีดังกล่าว คุณสามารถเลือกเกณฑ์ที่ 950 ตามที่แสดงในตัวอย่างต่อไปนี้ ซึ่งจะจำแนกลูกค้าที่ถูกต้องตามกฎหมาย 1% ผิดว่าเป็นการฉ้อโกง และ 80% ของการฉ้อโกงที่ระบุจะเป็นการฉ้อโกง
นอกจากนี้ คุณสามารถเลือกเกณฑ์ได้หลายแบบและกำหนดผลลัพธ์ที่แตกต่างกัน เช่น บล็อก สอบสวน ผ่าน หากคุณไม่พบเกณฑ์และกฎเกณฑ์ที่เหมาะสมที่ตรงกับความต้องการทางธุรกิจทั้งหมดของคุณ คุณควรพิจารณาฝึกอบรมโมเดลของคุณด้วยข้อมูลและแอตทริบิวต์เพิ่มเติม
ตรวจสอบความสำคัญของตัวแปรโมเดล
พื้นที่ ความสำคัญของตัวแปรแบบจำลอง บานหน้าต่างจะแสดงว่าตัวแปรแต่ละตัวมีส่วนสนับสนุนโมเดลของคุณอย่างไร หากตัวแปรหนึ่งมีค่าความสำคัญสูงกว่าตัวแปรอื่นอย่างมาก ตัวแปรนั้นอาจบ่งบอกถึงการรั่วไหลของฉลากหรือรูปแบบการฉ้อโกงนั้นง่ายต่อการตรวจจับ โปรดทราบว่าความสำคัญของตัวแปรจะถูกรวมกลับไปที่ตัวแปรอินพุตของคุณ หากคุณสังเกตเห็นความสำคัญที่สูงขึ้นเล็กน้อยของ IP_ADDRESS
, CARD_BIN
, EMAIL_ADDRESS
, PHONE_NUMBER
, BILLING_ZIP
,หรือ SHIPPING_ZIP
อาจเป็นเพราะพลังแห่งการเสริมแต่ง
ตัวอย่างต่อไปนี้แสดงความสำคัญของตัวแปรแบบจำลองที่อาจเกิดการรั่วไหลของฉลากโดยใช้ investigation_status
.
ความสำคัญของตัวแปรแบบจำลองยังช่วยให้คุณทราบถึงสิ่งที่ตัวแปรเพิ่มเติมที่อาจนำการยกระดับมาสู่แบบจำลอง ตัวอย่างเช่น หากคุณสังเกตเห็นว่า AUC ต่ำและคุณลักษณะที่เกี่ยวข้องกับผู้ขายมีความสำคัญสูง คุณอาจพิจารณารวบรวมคุณลักษณะการสั่งซื้อเพิ่มเติม เช่น SELLER_CATEGORY
, SELLER_ADDRESS
และ SELLER_ACTIVE_YEARS
และเพิ่มตัวแปรเหล่านั้นลงในโมเดลของคุณ
ปัญหาทั่วไปสำหรับประสิทธิภาพของโมเดลต่ำ
ในส่วนนี้ เราจะพูดถึงปัญหาทั่วไปที่คุณอาจพบเกี่ยวกับประสิทธิภาพของแบบจำลองต่ำ
การเปลี่ยนแปลงการกระจายข้อมูลในอดีต
การกระจายข้อมูลในอดีตเกิดขึ้นเมื่อคุณมีการเปลี่ยนแปลงธุรกิจขนาดใหญ่หรือมีปัญหาในการรวบรวมข้อมูล ตัวอย่างเช่น หากคุณเพิ่งเปิดตัวผลิตภัณฑ์ของคุณในตลาดใหม่ IP_ADDRESS
, EMAIL
และ ADDRESS
คุณลักษณะที่เกี่ยวข้องอาจแตกต่างกันโดยสิ้นเชิง และวิธีปฏิบัติในการฉ้อโกงก็สามารถเปลี่ยนแปลงได้เช่นกัน Amazon Fraud Detector ใช้ EVENT_TIMESTAMP
เพื่อแยกข้อมูลและประเมินแบบจำลองของคุณกับชุดย่อยของเหตุการณ์ที่เหมาะสมในชุดข้อมูลของคุณ หากการกระจายข้อมูลในอดีตของคุณเปลี่ยนแปลงอย่างมีนัยสำคัญ ชุดการประเมินอาจแตกต่างจากข้อมูลการฝึกอย่างมาก และประสิทธิภาพของแบบจำลองที่รายงานอาจต่ำ
คุณสามารถตรวจสอบปัญหาการเปลี่ยนแปลงการกระจายข้อมูลที่อาจเกิดขึ้นได้โดยสำรวจข้อมูลในอดีตของคุณ:
- ใช้ ตัวสร้างโปรไฟล์ข้อมูลตัวตรวจจับการฉ้อโกงของ Amazon เครื่องมือตรวจสอบว่าอัตราการฉ้อโกงและอัตราการขาดของฉลากเปลี่ยนแปลงไปตามกาลเวลาหรือไม่
- ตรวจสอบว่าการกระจายตัวแปรเมื่อเวลาผ่านไปมีการเปลี่ยนแปลงอย่างมีนัยสำคัญ โดยเฉพาะอย่างยิ่งสำหรับคุณลักษณะที่มีความสำคัญตัวแปรสูง
- ตรวจสอบการกระจายตัวแปรตามช่วงเวลาตามตัวแปรเป้าหมาย หากคุณสังเกตเห็นเหตุการณ์การฉ้อโกงจากหมวดหมู่หนึ่งๆ ในข้อมูลล่าสุด คุณอาจต้องการตรวจสอบว่าการเปลี่ยนแปลงนั้นสมเหตุสมผลหรือไม่โดยใช้วิจารณญาณทางธุรกิจของคุณ
หากคุณพบว่าอัตราการติดฉลากขาดหายไปนั้นสูงมาก หรืออัตราการฉ้อโกงลดลงอย่างต่อเนื่องในช่วงวันที่ล่าสุด อาจเป็นตัวบ่งชี้ว่าฉลากยังไม่เติบโตเต็มที่ คุณควรแยกข้อมูลล่าสุดออกหรือรอนานขึ้นเพื่อรวบรวมป้ายกำกับที่ถูกต้อง จากนั้นจึงฝึกโมเดลของคุณใหม่
หากคุณสังเกตเห็นอัตราการฉ้อโกงและตัวแปรที่เพิ่มขึ้นอย่างรวดเร็วในวันที่ระบุ คุณอาจต้องการตรวจสอบอีกครั้งว่าเป็นปัญหาผิดปกติหรือการรวบรวมข้อมูลหรือไม่ ในกรณีนั้น คุณควรลบเหตุการณ์เหล่านั้นและฝึกโมเดลใหม่
หากคุณพบว่าข้อมูลที่ล้าสมัยไม่สามารถแสดงถึงธุรกิจในปัจจุบันและอนาคตของคุณได้ คุณควรแยกข้อมูลเก่าออกจากการฝึกอบรม หากคุณกำลังใช้เหตุการณ์ที่จัดเก็บไว้ใน Amazon Fraud Detector คุณสามารถฝึกเวอร์ชันใหม่และเลือกช่วงวันที่ที่เหมาะสมในขณะที่กำหนดค่างานการฝึกอบรมได้ นอกจากนี้ยังอาจบ่งชี้ว่าวิธีการทุจริตในธุรกิจของคุณเปลี่ยนแปลงไปอย่างรวดเร็วเมื่อเวลาผ่านไป หลังจากการปรับใช้โมเดล คุณอาจต้องฝึกโมเดลของคุณใหม่บ่อยๆ
การแมปประเภทตัวแปรที่ไม่เหมาะสม
Amazon Fraud Detector ปรับปรุงและแปลงข้อมูลตามประเภทตัวแปร สิ่งสำคัญคือคุณต้องจับคู่ตัวแปรของคุณกับประเภทที่ถูกต้อง เพื่อให้โมเดล Amazon Fraud Detector สามารถรับค่าสูงสุดของข้อมูลของคุณได้ ตัวอย่างเช่น หากคุณ map IP
ไป CATEGORICAL
พิมพ์แทน IP_ADDRESS
, คุณไม่ได้รับ IP-
การตกแต่งที่เกี่ยวข้องในแบ็กเอนด์
โดยทั่วไป Amazon Fraud Detector จะแนะนำการดำเนินการต่อไปนี้:
- จับคู่ตัวแปรของคุณกับประเภทเฉพาะ เช่น
IP_ADDRESS
,EMAIL_ADDRESS
,CARD_BIN
และPHONE_NUMBER
เพื่อให้ Amazon Fraud Detector สามารถดึงข้อมูลและเสริมข้อมูลเพิ่มเติมได้ - หากคุณไม่พบตัวแปรประเภทใดประเภทหนึ่ง ให้จับคู่ตัวแปรดังกล่าวกับประเภททั่วไปสามประเภท:
NUMERIC
,CATEGORICAL
,หรือFREE_FORM_TEXT
. - หากตัวแปรอยู่ในรูปแบบข้อความและมีความสำคัญสูง เช่น บทวิจารณ์ของลูกค้าหรือคำอธิบายผลิตภัณฑ์ คุณควรแมปตัวแปรนั้นกับ
FREE_FORM_TEXT
ประเภทตัวแปร เพื่อให้ Amazon Fraud Detector แยกคุณสมบัติข้อความและการฝังบนแบ็กเอนด์ให้คุณ ตัวอย่างเช่น หากคุณ mapurl_string
ไปยังFREE_FORM_TEXT
มันสามารถโทเค็น URL และดึงข้อมูลเพื่อป้อนลงในโมเดลดาวน์สตรีม ซึ่งจะช่วยให้เรียนรู้รูปแบบที่ซ่อนอยู่เพิ่มเติมจาก URL
หากคุณพบว่าประเภทตัวแปรของคุณมีการแมปอย่างไม่ถูกต้องในการกำหนดค่าตัวแปร คุณสามารถเปลี่ยนประเภทตัวแปรแล้วฝึกแบบจำลองใหม่ได้
ข้อมูลหรือคุณสมบัติไม่เพียงพอ
Amazon Fraud Detector ต้องการอย่างน้อย 10,000 ระเบียนในการฝึกอบรม Online Fraud Insights (OFI) หรือโมเดล Transaction Fraud Insights (TFI) โดยมีอย่างน้อย 400 ระเบียนที่ระบุว่าเป็นการฉ้อโกง TFI ยังกำหนดให้ทั้งบันทึกที่เป็นการฉ้อโกงและบันทึกที่ถูกต้องต้องมาจากหน่วยงานต่างๆ อย่างน้อย 100 แห่ง เพื่อให้แน่ใจว่าชุดข้อมูลมีความหลากหลาย นอกจากนี้ Amazon Fraud Detector ยังต้องการให้ข้อมูลการสร้างแบบจำลองมีตัวแปรอย่างน้อยสองตัว นี่คือข้อกำหนดข้อมูลขั้นต่ำในการสร้างโมเดล Amazon Fraud Detector ที่มีประโยชน์ อย่างไรก็ตาม การใช้ระเบียนและตัวแปรมากขึ้นมักจะช่วยให้โมเดล ML เรียนรู้รูปแบบพื้นฐานจากข้อมูลของคุณได้ดีขึ้น เมื่อคุณสังเกต AUC ต่ำหรือไม่พบเกณฑ์ที่ตรงกับความต้องการทางธุรกิจของคุณ คุณควรพิจารณาฝึกอบรมแบบจำลองของคุณใหม่ด้วยข้อมูลมากขึ้นหรือเพิ่มคุณลักษณะใหม่ให้กับแบบจำลองของคุณ ปกติเราจะพบว่า EMAIL_ADDRESS
, IP
, PAYMENT_TYPE
, BILLING_ADDRESS
, SHIPPING_ADDRESS
และ DEVICE
ตัวแปรที่เกี่ยวข้องมีความสำคัญในการตรวจจับการฉ้อโกง
สาเหตุที่เป็นไปได้อีกประการหนึ่งคือตัวแปรบางตัวของคุณมีค่าที่ขาดหายไปมากเกินไป เพื่อดูว่าเกิดขึ้นหรือไม่ ให้ตรวจสอบข้อความการฝึกแบบจำลองและอ้างอิงถึง แก้ไขปัญหาข้อมูลการฝึกอบรม สำหรับคำแนะนำ
ปัญหาทั่วไปสำหรับประสิทธิภาพของโมเดลที่สูงมาก
ในส่วนนี้ เราจะพูดถึงปัญหาทั่วไปที่เกี่ยวข้องกับประสิทธิภาพของแบบจำลองที่สูงมาก
ฉลากรั่ว
ฉลากรั่วเกิดขึ้นเมื่อชุดข้อมูลการฝึกใช้ข้อมูลที่คาดว่าจะไม่พร้อมใช้งานในเวลาคาดการณ์ โดยจะประเมินค่ายูทิลิตี้ของแบบจำลองสูงเกินไปเมื่อทำงานในสภาพแวดล้อมที่ใช้งานจริง
AUC สูง (ใกล้เคียงกับ 1) การกระจายคะแนนอย่างสมบูรณ์ และความสำคัญของตัวแปรที่สูงขึ้นอย่างมีนัยสำคัญของตัวแปรหนึ่งอาจเป็นตัวบ่งชี้ถึงปัญหาการรั่วไหลของฉลากที่อาจเกิดขึ้น คุณยังสามารถตรวจสอบความสัมพันธ์ระหว่างคุณสมบัติและฉลากได้โดยใช้ปุ่ม ตัวสร้างโปรไฟล์ข้อมูล. คุณสมบัติและความสัมพันธ์ของป้ายกำกับ พล็อตแสดงความสัมพันธ์ระหว่างแต่ละคุณลักษณะและป้ายกำกับ หากคุณลักษณะหนึ่งมีความสัมพันธ์กับป้ายกำกับมากกว่า 0.99 คุณควรตรวจสอบว่ามีการใช้คุณลักษณะนี้อย่างเหมาะสมตามการตัดสินใจทางธุรกิจหรือไม่ ตัวอย่างเช่น ในการสร้างแบบจำลองความเสี่ยงเพื่ออนุมัติหรือปฏิเสธการขอสินเชื่อ คุณไม่ควรใช้คุณสมบัติเช่น AMOUNT_PAID
เนื่องจากการชำระเงินเกิดขึ้นหลังจากขั้นตอนการจัดจำหน่าย หากตัวแปรไม่พร้อมใช้งานในขณะที่คุณคาดการณ์ คุณควรลบตัวแปรนั้นออกจากการกำหนดค่าโมเดลและฝึกโมเดลใหม่อีกครั้ง
ตัวอย่างต่อไปนี้แสดงความสัมพันธ์ระหว่างแต่ละตัวแปรและป้ายกำกับ investigation_status
มีความสัมพันธ์สูง (ใกล้เคียงกับ 1) กับฉลาก ดังนั้นคุณควรตรวจสอบอีกครั้งว่ามีปัญหาการรั่วของฉลากหรือไม่
รูปแบบการฉ้อโกงอย่างง่าย
เมื่อรูปแบบการฉ้อโกงในข้อมูลของคุณเป็นเรื่องง่าย คุณอาจสังเกตเห็นประสิทธิภาพของแบบจำลองที่สูงมาก ตัวอย่างเช่น สมมติว่าเหตุการณ์การฉ้อโกงทั้งหมดในข้อมูลการสร้างแบบจำลองมาจากผู้ให้บริการภายในเดียวกัน มันตรงไปตรงมาสำหรับรุ่นที่จะเลือก IP-
ตัวแปรที่เกี่ยวข้องและส่งคืนโมเดล "สมบูรณ์แบบ" ที่มีความสำคัญสูงของ IP
.
รูปแบบการฉ้อโกงแบบธรรมดาไม่ได้บ่งบอกถึงปัญหาข้อมูลเสมอไป อาจเป็นความจริงที่วิธีการทุจริตในธุรกิจของคุณนั้นง่ายต่อการจับ อย่างไรก็ตาม ก่อนที่จะสรุป คุณต้องตรวจสอบให้แน่ใจว่าฉลากที่ใช้ในการฝึกแบบจำลองนั้นถูกต้อง และข้อมูลการสร้างแบบจำลองครอบคลุมรูปแบบการฉ้อโกงให้ได้มากที่สุด ตัวอย่างเช่น หากคุณติดป้ายกำกับเหตุการณ์การฉ้อโกงตามกฎ เช่น การติดป้ายกำกับแอปพลิเคชันทั้งหมดจาก BILLING_ZIP
บวก PRODUCT_CATEGORY
ในรูปแบบการฉ้อโกง โมเดลสามารถจับการฉ้อโกงเหล่านั้นได้อย่างง่ายดายโดยการจำลองกฎและบรรลุ AUC ที่สูง
คุณสามารถตรวจสอบการแจกแจงฉลากตามหมวดหมู่ต่างๆ หรือถังขยะของแต่ละฟีเจอร์ได้โดยใช้ปุ่ม ตัวสร้างโปรไฟล์ข้อมูล. ตัวอย่างเช่น หากคุณสังเกตว่าเหตุการณ์การฉ้อโกงส่วนใหญ่มาจากหมวดหมู่ผลิตภัณฑ์หนึ่งหรือสองสามหมวดหมู่ อาจเป็นตัวบ่งชี้ถึงรูปแบบการฉ้อโกงทั่วไป และคุณต้องยืนยันว่าไม่ใช่การรวบรวมข้อมูลหรือข้อผิดพลาดในกระบวนการ หากคุณสมบัติเป็นเหมือน CUSTOMER_ID
คุณควรยกเว้นคุณลักษณะนี้ในการฝึกโมเดล
ตัวอย่างต่อไปนี้แสดงการกระจายฉลากตามหมวดหมู่ต่างๆ ของ product_category
. การฉ้อโกงทั้งหมดมาจากผลิตภัณฑ์สองประเภท
การสุ่มตัวอย่างข้อมูลที่ไม่เหมาะสม
การสุ่มตัวอย่างข้อมูลที่ไม่เหมาะสมอาจเกิดขึ้นเมื่อคุณสุ่มตัวอย่างและส่งข้อมูลของคุณเพียงบางส่วนไปยัง Amazon Fraud Detector หากข้อมูลไม่ได้สุ่มตัวอย่างอย่างถูกต้องและไม่ได้เป็นตัวแทนของปริมาณการใช้งานในการผลิต ประสิทธิภาพของแบบจำลองที่รายงานจะไม่ถูกต้องและแบบจำลองอาจไม่มีประโยชน์สำหรับการคาดการณ์การผลิต ตัวอย่างเช่น หากเหตุการณ์การฉ้อโกงทั้งหมดในข้อมูลการสร้างแบบจำลองนั้นสุ่มตัวอย่างจากเอเชียและเหตุการณ์ที่ถูกกฎหมายทั้งหมดนั้นสุ่มตัวอย่างจากสหรัฐอเมริกา แบบจำลองอาจเรียนรู้ที่จะแยกการฉ้อโกงและกฎหมายโดยพิจารณาจาก BILLING_COUNTRY
. ในกรณีนั้น แบบจำลองนี้ไม่ใช่แบบทั่วไปที่จะนำไปใช้กับประชากรอื่นๆ
โดยปกติ เราแนะนำให้ส่งกิจกรรมล่าสุดทั้งหมดโดยไม่มีการสุ่มตัวอย่าง ตามขนาดข้อมูลและอัตราการฉ้อโกง Amazon Fraud Detector จะสุ่มตัวอย่างก่อนการฝึกโมเดลให้คุณ หากข้อมูลของคุณมีขนาดใหญ่เกินไป (มากกว่า 100 GB) และคุณตัดสินใจที่จะสุ่มตัวอย่างและส่งเฉพาะชุดย่อย คุณควรสุ่มตัวอย่างข้อมูลของคุณ และตรวจสอบให้แน่ใจว่ากลุ่มตัวอย่างเป็นตัวแทนของประชากรทั้งหมด สำหรับ TFI คุณควรสุ่มตัวอย่างข้อมูลของคุณตามเอนทิตี ซึ่งหมายความว่าหากมีการสุ่มตัวอย่างเอนทิตีหนึ่ง คุณควรรวมประวัติทั้งหมดเพื่อให้มีการคำนวณการรวมระดับเอนทิตีอย่างถูกต้อง โปรดทราบว่าหากคุณส่งข้อมูลเพียงชุดย่อยไปยัง Amazon Fraud Detector การรวมแบบเรียลไทม์ระหว่างการอนุมานอาจไม่ถูกต้องหากไม่มีการส่งเหตุการณ์ก่อนหน้าของเอนทิตี
การสุ่มตัวอย่างข้อมูลที่ไม่เหมาะสมอีกอย่างหนึ่งอาจใช้ข้อมูลในช่วงเวลาสั้นๆ เช่น ข้อมูลในหนึ่งวัน เพื่อสร้างแบบจำลองเท่านั้น ข้อมูลอาจมีอคติ โดยเฉพาะอย่างยิ่งหากธุรกิจหรือการฉ้อโกงของคุณมีฤดูกาล เรามักจะแนะนำให้ใส่ข้อมูลอย่างน้อยสองรอบ (เช่น 2 สัปดาห์หรือ 2 เดือน) ในการสร้างแบบจำลองเพื่อให้แน่ใจว่าความหลากหลายของประเภทการฉ้อโกง
สรุป
หลังจากวินิจฉัยและแก้ไขปัญหาที่อาจเกิดขึ้นทั้งหมดแล้ว คุณควรได้รับโมเดล Amazon Fraud Detector ที่มีประโยชน์และมั่นใจในประสิทธิภาพ สำหรับขั้นตอนต่อไป คุณ สามารถสร้างตัวตรวจจับด้วยโมเดลและกฎเกณฑ์ทางธุรกิจของคุณและพร้อมที่จะปรับใช้ในการผลิตสำหรับการประเมินโหมดเงา
ภาคผนวก
วิธีแยกตัวแปรสำหรับการฝึกโมเดล
หลังจากการดำน้ำลึก คุณอาจระบุข้อมูลเป้าหมายการรั่วไหลของตัวแปร และต้องการแยกข้อมูลออกจากการฝึกแบบจำลอง คุณสามารถฝึกเวอร์ชันของโมเดลใหม่ได้ ยกเว้นตัวแปรที่คุณไม่ต้องการโดยทำตามขั้นตอนต่อไปนี้:
- บนคอนโซล Amazon Fraud Detector ในบานหน้าต่างนำทาง ให้เลือก Models.
- เกี่ยวกับ Models หน้า เลือกรุ่นที่คุณต้องการฝึกใหม่
- เกี่ยวกับ สถานะ เมนูให้เลือก เทรนเวอร์ชั่นใหม่.
- เลือกช่วงวันที่ที่คุณต้องการใช้แล้วเลือก ถัดไป.
- เกี่ยวกับ กำหนดค่าการฝึกอบรม ให้ยกเลิกการเลือกตัวแปรที่คุณไม่ต้องการใช้ในการฝึกโมเดล
- ระบุป้ายกำกับการฉ้อโกงและป้ายกำกับที่ถูกต้อง และวิธีที่คุณต้องการให้ Amazon Fraud Detector ใช้เหตุการณ์ที่ไม่มีป้ายกำกับ จากนั้นเลือก ถัดไป.
- ตรวจสอบการกำหนดค่าแบบจำลองและเลือก สร้างและฝึกโมเดล.
วิธีเปลี่ยนประเภทตัวแปรเหตุการณ์
ตัวแปรแสดงถึงองค์ประกอบข้อมูลที่ใช้ในการป้องกันการฉ้อโกง ใน Amazon Fraud Detector ตัวแปรทั้งหมดเป็นแบบสากลและมีการแชร์ในเหตุการณ์และโมเดลทั้งหมด ซึ่งหมายความว่าตัวแปรเดียวสามารถใช้ได้ในหลายเหตุการณ์ ตัวอย่างเช่น IP อาจเชื่อมโยงกับเหตุการณ์การลงชื่อเข้าใช้ และอาจเชื่อมโยงกับเหตุการณ์ธุรกรรมด้วย โดยปกติ Amazon Fraud Detector จะล็อกประเภทตัวแปรและประเภทข้อมูลเมื่อสร้างตัวแปรแล้ว หากต้องการลบตัวแปรที่มีอยู่ คุณต้องลบประเภทเหตุการณ์และโมเดลที่เกี่ยวข้องทั้งหมดก่อน คุณสามารถตรวจสอบทรัพยากรที่เกี่ยวข้องกับตัวแปรเฉพาะได้โดยไปที่ Amazon Fraud Detector โดยเลือก ตัวแปร ในบานหน้าต่างนำทาง และเลือกชื่อตัวแปรและ ทรัพยากรที่เกี่ยวข้อง.
ลบตัวแปรและประเภทเหตุการณ์ที่เกี่ยวข้องทั้งหมด
หากต้องการลบตัวแปร ให้ทำตามขั้นตอนต่อไปนี้:
- บนคอนโซล Amazon Fraud Detector ในบานหน้าต่างนำทาง ให้เลือก ตัวแปร.
- เลือกตัวแปรที่คุณต้องการลบ
- Choose ทรัพยากรที่เกี่ยวข้อง เพื่อดูรายการประเภทเหตุการณ์ทั้งหมดที่ใช้ตัวแปรนี้
คุณต้องลบประเภทเหตุการณ์ที่เกี่ยวข้องก่อนที่จะลบตัวแปร - เลือกประเภทเหตุการณ์ในรายการเพื่อไปที่หน้าประเภทเหตุการณ์ที่เกี่ยวข้อง
- Choose เหตุการณ์ที่เก็บไว้ เพื่อตรวจสอบว่าข้อมูลใดถูกจัดเก็บภายใต้ประเภทเหตุการณ์นี้
- หากมีเหตุการณ์ที่จัดเก็บไว้ใน Amazon Fraud Detector ให้เลือก ลบเหตุการณ์ที่เก็บไว้ เพื่อลบเหตุการณ์ที่เก็บไว้
เมื่องานการลบเสร็จสมบูรณ์ ข้อความ “เหตุการณ์ที่เก็บไว้สำหรับประเภทเหตุการณ์นี้ถูกลบสำเร็จแล้ว” จะปรากฏขึ้น - Choose ทรัพยากรที่เกี่ยวข้อง.
หากตัวตรวจจับและโมเดลเชื่อมโยงกับประเภทเหตุการณ์นี้ คุณต้องลบทรัพยากรเหล่านั้นก่อน - หากตัวตรวจจับมีความเกี่ยวข้องกัน ให้ทำตามขั้นตอนต่อไปนี้เพื่อลบตัวตรวจจับที่เกี่ยวข้องทั้งหมด:
- เลือกเครื่องตรวจจับเพื่อไปที่ รายละเอียดเครื่องตรวจจับ หน้า.
- ตัว Vortex Indicator ได้ถูกนำเสนอลงในนิตยสาร รุ่นรุ่น บานหน้าต่าง เลือกเวอร์ชันของตัวตรวจจับ
- ในหน้าเวอร์ชันตัวตรวจจับ ให้เลือก สถานะ.
- หากเวอร์ชันตัวตรวจจับทำงานอยู่ ให้เลือก ยกเลิกการใช้งานเลือก ปิดใช้งานเวอร์ชันตัวตรวจจับนี้โดยไม่ต้องแทนที่ด้วยเวอร์ชันอื่นและเลือก ปิดใช้งานเวอร์ชันตัวตรวจจับ
- หลังจากปิดใช้งานเวอร์ชันตัวตรวจจับแล้ว ให้เลือก สถานะ แล้วก็ ลบ.
- ทำซ้ำขั้นตอนเหล่านี้เพื่อลบเวอร์ชันของตัวตรวจจับทั้งหมด
- เกี่ยวกับ รายละเอียดเครื่องตรวจจับ หน้าให้เลือก กฎที่เกี่ยวข้อง.
- เลือกกฎที่จะลบ
- Choose สถานะ และ ลบเวอร์ชันกฎ.
- ป้อนชื่อกฎเพื่อยืนยันและเลือก ลบเวอร์ชั่น.
- ทำซ้ำขั้นตอนเหล่านี้เพื่อลบกฎที่เกี่ยวข้องทั้งหมด
- หลังจากลบเวอร์ชันตัวตรวจจับและกฎที่เกี่ยวข้องทั้งหมดแล้ว ให้ไปที่ รายละเอียดเครื่องตรวจจับ หน้าให้เลือก สถานะและเลือก ลบตัวตรวจจับ.
- ป้อนชื่อเครื่องตรวจจับและเลือก ลบตัวตรวจจับ.
- ทำซ้ำขั้นตอนเหล่านี้เพื่อลบตัวตรวจจับถัดไป
- หากโมเดลใดเชื่อมโยงกับประเภทเหตุการณ์ ให้ทำตามขั้นตอนต่อไปนี้เพื่อลบออก:
- เลือกชื่อรุ่น
- ตัว Vortex Indicator ได้ถูกนำเสนอลงในนิตยสาร รุ่นรุ่น บานหน้าต่าง เลือกเวอร์ชัน
- หากสถานะของรุ่นคือ
Active
เลือก สถานะ และ เลิกใช้งานรุ่นรุ่น. - เข้าสู่
undeploy
เพื่อยืนยันและเลือก เลิกใช้งานรุ่นรุ่น.
สถานะเปลี่ยนเป็นUndeploying
. กระบวนการนี้ใช้เวลาสักครู่จึงจะเสร็จสมบูรณ์ - หลังจากที่สถานะกลายเป็น
Ready to deploy
เลือกการดำเนินการและลบ - ทำซ้ำขั้นตอนเหล่านี้เพื่อลบรุ่นทุกรุ่น
- ในหน้ารายละเอียดแบบจำลอง ให้เลือกการดำเนินการและลบแบบจำลอง
- ป้อนชื่อรุ่นและเลือกลบรุ่น
- ทำซ้ำขั้นตอนเหล่านี้เพื่อลบโมเดลถัดไป
- หลังจากลบตัวตรวจจับและรุ่นที่เกี่ยวข้องทั้งหมดแล้ว ให้เลือก สถานะ และ ลบประเภทเหตุการณ์ บน รายละเอียดกิจกรรม หน้า.
- ใส่ชื่อประเภทกิจกรรมแล้วเลือก ลบประเภทเหตุการณ์.
- ในบานหน้าต่างนำทาง เลือก ตัวแปรและเลือกตัวแปรที่คุณต้องการลบ
- ทำซ้ำขั้นตอนก่อนหน้าเพื่อลบประเภทเหตุการณ์ทั้งหมดที่เกี่ยวข้องกับตัวแปร
- เกี่ยวกับ รายละเอียดตัวแปร หน้าให้เลือก สถานะ และ ลบ
- ป้อนชื่อตัวแปรแล้วเลือก ลบตัวแปร.
สร้างตัวแปรใหม่ด้วยประเภทตัวแปรที่ถูกต้อง
หลังจากที่คุณลบตัวแปรและประเภทเหตุการณ์ที่เกี่ยวข้อง เหตุการณ์ที่จัดเก็บ โมเดล และตัวตรวจจับจาก Amazon Fraud Detector แล้ว คุณสามารถสร้างตัวแปรใหม่ในชื่อเดียวกันและจับคู่ตัวแปรนั้นกับประเภทตัวแปรที่ถูกต้องได้
- บนคอนโซล Amazon Fraud Detector ในบานหน้าต่างนำทาง ให้เลือก ตัวแปร.
- Choose สร้างบัญชีตัวแทน.
- ป้อนชื่อตัวแปรที่คุณต้องการแก้ไข (ชื่อที่คุณลบไปก่อนหน้านี้)
- เลือกประเภทตัวแปรที่ถูกต้องที่คุณต้องการเปลี่ยน
- Choose สร้างตัวแปร
อัปโหลดข้อมูลและฝึกโมเดลใหม่
หลังจากที่คุณอัปเดตประเภทตัวแปรแล้ว คุณสามารถอัปโหลดข้อมูลอีกครั้งและฝึกโมเดลใหม่ได้ สำหรับคำแนะนำ โปรดดูที่ ตรวจจับการฉ้อโกงธุรกรรมออนไลน์ด้วยคุณสมบัติใหม่ของ Amazon Fraud Detector.
วิธีเพิ่มตัวแปรใหม่ให้กับประเภทเหตุการณ์ที่มีอยู่
ในการเพิ่มตัวแปรใหม่ให้กับประเภทเหตุการณ์ที่มีอยู่ ให้ทำตามขั้นตอนต่อไปนี้:
- เพิ่มตัวแปรใหม่ให้กับไฟล์ CVS การฝึกก่อนหน้านี้
- อัปโหลดไฟล์ข้อมูลการฝึกใหม่ไปยังบัคเก็ต S3 สังเกตตำแหน่ง Amazon S3 ของไฟล์การฝึกของคุณ (เช่น
s3://bucketname/path/to/some/object.csv
) และชื่อบทบาทของคุณ - บนคอนโซล Amazon Fraud Detector ในบานหน้าต่างนำทาง ให้เลือก เหตุการณ์ที่เกิดขึ้น
- เกี่ยวกับ ประเภทเหตุการณ์ หน้า เลือกชื่อของประเภทเหตุการณ์ที่คุณต้องการเพิ่มตัวแปร
- เกี่ยวกับ ประเภทเหตุการณ์ หน้ารายละเอียดเลือก สถานะแล้ว เพิ่มตัวแปร.
- ภายใต้ เลือกวิธีกำหนดตัวแปรของเหตุการณ์นี้เลือก เลือกตัวแปรจากชุดข้อมูลการฝึก.
- สำหรับบทบาท IAM ให้เลือกบทบาท IAM ที่มีอยู่หรือสร้างบทบาทใหม่ในการเข้าถึงข้อมูลใน Amazon S3
- สำหรับ ตำแหน่งข้อมูลป้อนตำแหน่ง S3 ของไฟล์การฝึกใหม่แล้วเลือก อัพโหลด
ตัวแปรใหม่ที่ไม่มีอยู่ในประเภทเหตุการณ์ที่มีอยู่ควรแสดงในรายการ
- Choose เพิ่มตัวแปร
ตอนนี้ ตัวแปรใหม่ได้ถูกเพิ่มเข้าไปในประเภทเหตุการณ์ที่มีอยู่แล้ว หากคุณกำลังใช้เหตุการณ์ที่จัดเก็บไว้ใน Amazon Fraud Detector ตัวแปรใหม่ของเหตุการณ์ที่จัดเก็บไว้จะยังคงหายไป คุณต้องนำเข้าข้อมูลการฝึกด้วยตัวแปรใหม่ไปยัง Amazon Fraud Detector จากนั้นจึงฝึกเวอร์ชันใหม่ของโมเดลใหม่ เมื่ออัพโหลดข้อมูลการฝึกใหม่ด้วยตัวเดียวกัน EVENT_ID
และ EVENT_TIMESTAMP
ตัวแปรเหตุการณ์ใหม่จะเขียนทับตัวแปรเหตุการณ์ก่อนหน้าที่จัดเก็บไว้ใน Amazon Fraud Detector
เกี่ยวกับผู้เขียน
จูเลียซู เป็นนักวิทยาศาสตร์วิจัยที่มี Amazon Fraud Detector เธอหลงใหลในการแก้ปัญหาท้าทายของลูกค้าโดยใช้เทคนิคแมชชีนเลิร์นนิง ในเวลาว่าง เธอชอบเดินป่า วาดภาพ และสำรวจร้านกาแฟใหม่ๆ
ห่าวโจว เป็นนักวิทยาศาสตร์วิจัยที่มี Amazon Fraud Detector เขาสำเร็จการศึกษาระดับปริญญาเอกด้านวิศวกรรมไฟฟ้าจาก Northwestern University ประเทศสหรัฐอเมริกา เขาหลงใหลในการใช้เทคนิคแมชชีนเลิร์นนิงเพื่อต่อต้านการฉ้อโกงและการละเมิด
อภิเษก ราวี เป็นผู้จัดการผลิตภัณฑ์อาวุโสของ Amazon Fraud Detector เขาหลงใหลในการใช้ประโยชน์จากความสามารถทางเทคนิคเพื่อสร้างผลิตภัณฑ์ที่สร้างความพึงพอใจให้กับลูกค้า
- "
- 000
- 10
- 100
- 9
- a
- ความสามารถ
- เกี่ยวกับเรา
- เข้า
- ตาม
- ลงชื่อเข้าใช้
- ถูกต้อง
- ข้าม
- การปฏิบัติ
- คล่องแคล่ว
- กิจกรรม
- ที่เพิ่ม
- นอกจากนี้
- เพิ่มเติม
- การนำมาใช้
- สูง
- อัลกอริทึม
- ทั้งหมด
- ช่วยให้
- เสมอ
- อเมซอน
- เหมาะสม
- การใช้งาน
- การใช้งาน
- ประยุกต์
- การประยุกต์ใช้
- เข้าใกล้
- วิธีการ
- เหมาะสม
- อนุมัติ
- AREA
- เอเชีย
- ที่เกี่ยวข้อง
- ความสนใจ
- แอตทริบิวต์
- อัตโนมัติ
- ใช้ได้
- AWS
- baseline
- เพราะ
- ก่อน
- ด้านล่าง
- ดีกว่า
- ระหว่าง
- ปิดกั้น
- ชายแดน
- นำมาซึ่ง
- สร้าง
- ธุรกิจ
- คำนวณ
- ความสามารถในการ
- จับ
- ซึ่ง
- กรณี
- กรณี
- จับ
- หมวดหมู่
- ก่อให้เกิด
- บาง
- ความท้าทาย
- ท้าทาย
- เปลี่ยนแปลง
- Choose
- จัด
- กาแฟ
- เหรียญ
- รวบรวม
- การเก็บรวบรวม
- ชุด
- การต่อสู้
- อย่างไร
- ร่วมกัน
- สมบูรณ์
- อย่างสมบูรณ์
- เสร็จสิ้น
- มั่นใจ
- องค์ประกอบ
- ความสับสน
- พิจารณา
- ปลอบใจ
- สะดวกสบาย
- ได้
- สร้าง
- ที่สร้างขึ้น
- ปัจจุบัน
- เส้นโค้ง
- ลูกค้า
- ลูกค้า
- ข้อมูล
- วันที่
- ลึก
- ทั้งนี้ขึ้นอยู่กับ
- ขึ้นอยู่กับ
- ปรับใช้
- ปรับใช้
- การใช้งาน
- ลักษณะ
- รายละเอียด
- การตรวจพบ
- ต่าง
- ดิจิตอล
- โดยตรง
- สนทนา
- แสดง
- การกระจาย
- การกระจาย
- ความหลากหลาย
- ไม่
- ปรับตัวลดลง
- ในระหว่าง
- แต่ละ
- อย่างง่ายดาย
- องค์ประกอบ
- จบสิ้น
- สิ้นสุด
- ชั้นเยี่ยม
- ประเทือง
- เข้าสู่
- หน่วยงาน
- เอกลักษณ์
- สิ่งแวดล้อม
- โดยเฉพาะอย่างยิ่ง
- ประเมินค่า
- การประเมินผล
- เหตุการณ์
- เหตุการณ์
- ตัวอย่าง
- ไม่รวม
- ที่มีอยู่
- คาดหวัง
- ที่คาดหวัง
- ความชำนาญ
- สารสกัดจาก
- เร็วขึ้น
- ลักษณะ
- คุณสมบัติ
- ในที่สุด
- ชื่อจริง
- ปฏิบัติตาม
- ดังต่อไปนี้
- ฟอร์ม
- การหลอกลวง
- ฟรี
- ราคาเริ่มต้นที่
- ฟังก์ชัน
- อนาคต
- General
- สร้าง
- เหตุการณ์ที่
- เป้าหมาย
- ดี
- มากขึ้น
- สีเขียว
- การเจริญเติบโต
- เกิดขึ้น
- ช่วย
- เป็นประโยชน์
- จะช่วยให้
- จุดสูง
- สูงกว่า
- อย่างสูง
- ทางประวัติศาสตร์
- ประวัติ
- ถือ
- สรุป ความน่าเชื่อถือของ Olymp Trade?
- ทำอย่างไร
- อย่างไรก็ตาม
- HTTPS
- แยกแยะ
- ส่งผลกระทบ
- ความสำคัญ
- สำคัญ
- ปรับปรุง
- การปรับปรุง
- ประกอบด้วย
- รวมทั้ง
- แสดง
- ข้อมูล
- อินพุต
- ข้อมูลเชิงลึก
- อินเตอร์เฟซ
- อินเทอร์เน็ต
- สอบสวน
- IP
- ปัญหา
- ปัญหา
- IT
- การสัมภาษณ์
- คำตัดสิน
- ทราบ
- ความรู้
- ฉลาก
- การติดฉลาก
- ป้ายกำกับ
- ใหญ่
- ที่มีขนาดใหญ่
- ล่าสุด
- เปิดตัว
- รั่วไหล
- เรียนรู้
- การเรียนรู้
- ชั้น
- การใช้ประโยชน์
- รายการ
- จดทะเบียน
- ที่ตั้ง
- ล็อค
- เครื่อง
- เรียนรู้เครื่อง
- ทำ
- การทำ
- การจัดการ
- ผู้จัดการ
- แผนที่
- ตลาด
- มดลูก
- วิธี
- ข้อความ
- ตัวชี้วัด
- อาจ
- ขั้นต่ำ
- ML
- แบบ
- โมเดล
- เดือน
- ข้อมูลเพิ่มเติม
- มากที่สุด
- หลาย
- การนำทาง
- การเดินเรือ
- ความต้องการ
- เชิงลบ
- คุณสมบัติใหม่
- ตลาดใหม่
- ถัดไป
- จำนวน
- ตัวเลข
- เสนอ
- ออนไลน์
- ผู้ประกอบการ
- ใบสั่ง
- อื่นๆ
- มิฉะนั้น
- ทั้งหมด
- ส่วนหนึ่ง
- หลงใหล
- การชำระเงิน
- เปอร์เซ็นต์
- การปฏิบัติ
- ระยะเวลา
- จุด
- ประชากร
- บวก
- เป็นไปได้
- ที่มีศักยภาพ
- อำนาจ
- คำทำนาย
- นำเสนอ
- การป้องกัน
- ก่อน
- ประถม
- ปัญหาที่เกิดขึ้น
- กระบวนการ
- ผลิตภัณฑ์
- การผลิต
- ผลิตภัณฑ์
- ให้
- ให้
- ผู้จัดหา
- ให้
- อย่างรวดเร็ว
- พิสัย
- เรียลไทม์
- เหมาะสม
- เมื่อเร็ว ๆ นี้
- เมื่อเร็ว ๆ นี้
- แนะนำ
- บันทึก
- สะท้อน
- เกี่ยวกับ
- แสดง
- ตัวแทน
- แสดงให้เห็นถึง
- ความต้องการ
- ต้อง
- การวิจัย
- แหล่งข้อมูล
- กลับ
- รับคืน
- ทบทวน
- ที่เพิ่มขึ้น
- ความเสี่ยง
- บทบาท
- กฎระเบียบ
- วิ่ง
- เดียวกัน
- ขนาด
- นักวิทยาศาสตร์
- เลือก
- บริการ
- ชุด
- เงา
- ที่ใช้ร่วมกัน
- ร้านขายของ
- สั้น
- โชว์
- แสดง
- ง่าย
- ขนาด
- So
- ของแข็ง
- การแก้
- บาง
- โดยเฉพาะ
- แยก
- ข้อความที่เริ่ม
- สถิติ
- Status
- ยังคง
- การเก็บรักษา
- กลยุทธ์
- ประสบความสำเร็จ
- เป้า
- วิชาการ
- เทคนิค
- แม่แบบ
- ทดสอบ
- การทดสอบ
- พื้นที่
- สาม
- ธรณีประตู
- ตลอด
- เวลา
- เครื่องมือ
- ด้านบน
- TPR
- การจราจร
- รถไฟ
- การฝึกอบรม
- การทำธุกรรม
- การแปลง
- ชนิด
- เป็นปกติ
- ภายใต้
- เข้าใจ
- มหาวิทยาลัย
- บันทึก
- us
- สหรัฐอเมริกา
- ใช้
- ผู้ใช้
- มักจะ
- ประโยชน์
- การตรวจสอบ
- ความคุ้มค่า
- รุ่น
- รายละเอียด
- รอ
- อะไร
- ว่า
- ในขณะที่
- ไม่มี
- คุ้มค่า
- จะ
- ปี
- ปี
- ของคุณ