วิเคราะห์ประสิทธิภาพของโมเดลก่อนปรับใช้สำหรับ Amazon Fraud Detector

เผยแพร่ซ้ำโดยเพลโต

ผู้ติดตาม: 0

ด้วยการเติบโตของการใช้แอปพลิเคชันออนไลน์และจำนวนผู้ใช้อินเทอร์เน็ตที่เพิ่มขึ้น การฉ้อโกงทางดิจิทัลจึงเพิ่มขึ้นทุกปี เครื่องตรวจจับการฉ้อโกงของ Amazon ให้บริการที่มีการจัดการเต็มรูปแบบเพื่อช่วยให้คุณระบุกิจกรรมออนไลน์ที่อาจเป็นการฉ้อโกงได้ดีขึ้นโดยใช้เทคนิคการเรียนรู้ของเครื่อง (ML) ขั้นสูง และความเชี่ยวชาญในการตรวจจับการฉ้อโกงมากกว่า 20 ปีจาก Amazon

เพื่อช่วยให้คุณตรวจจับการฉ้อโกงได้เร็วขึ้นในหลายกรณีการใช้งาน Amazon Fraud Detector นำเสนอโมเดลเฉพาะด้วยอัลกอริธึมที่ปรับแต่ง การปรับแต่ง และการแปลงคุณสมบัติ การฝึกโมเดลเป็นแบบอัตโนมัติทั้งหมดและไม่ยุ่งยาก และคุณสามารถทำตามคำแนะนำใน คู่มือผู้ใช้ หรือที่เกี่ยวข้อง บล็อกโพสต์ ที่จะเริ่มต้น. อย่างไรก็ตาม ด้วยโมเดลที่ผ่านการฝึกอบรม คุณต้องตัดสินใจว่าโมเดลนั้นพร้อมสำหรับการปรับใช้หรือไม่ สิ่งนี้ต้องการความรู้บางอย่างใน ML, สถิติ และการตรวจจับการฉ้อโกง และอาจเป็นประโยชน์หากทราบวิธีการทั่วไปบางอย่าง

โพสต์นี้จะช่วยคุณวิเคราะห์ประสิทธิภาพของโมเดลและเลือกโมเดลที่เหมาะสมสำหรับการปรับใช้ เราแนะนำเมตริกที่ Amazon Fraud Detector จัดเตรียมไว้ให้ ช่วยคุณวินิจฉัยปัญหาที่อาจเกิดขึ้น และให้คำแนะนำในการปรับปรุงประสิทธิภาพของโมเดล แนวทางดังกล่าวใช้ได้กับทั้งเทมเพลตโมเดล Online Fraud Insights (OFI) และ Transaction Fraud Insights (TFI)

ภาพรวมโซลูชัน

โพสต์นี้มีขั้นตอนแบบ end-to-end เพื่อวิเคราะห์ประสิทธิภาพของแบบจำลองของคุณ ขั้นแรกจะแนะนำเมตริกโมเดลทั้งหมดที่แสดงบนคอนโซล Amazon Fraud Detector รวมถึง AUC การกระจายคะแนน เมทริกซ์ความสับสน เส้นโค้ง ROC และความสำคัญของตัวแปรโมเดล จากนั้นเราจะนำเสนอแนวทางสามขั้นตอนในการวินิจฉัยประสิทธิภาพของแบบจำลองโดยใช้เมตริกต่างๆ สุดท้าย เราให้คำแนะนำในการปรับปรุงประสิทธิภาพของโมเดลสำหรับปัญหาทั่วไป

เบื้องต้น

ก่อนเจาะลึกโมเดล Amazon Fraud Detector คุณต้องปฏิบัติตามข้อกำหนดเบื้องต้นต่อไปนี้:

สร้างบัญชี AWS
สร้างชุดข้อมูลเหตุการณ์ สำหรับการฝึกโมเดล
อัพโหลดข้อมูลของคุณ ไปยัง บริการจัดเก็บข้อมูลอย่างง่ายของ Amazon (Amazon S3) หรือ นำเข้าข้อมูลเหตุการณ์ของคุณไปยัง Amazon Fraud Detector.
สร้างแบบจำลอง Amazon Fraud Detector.

ตีความเมตริกโมเดล

หลังจากการฝึกโมเดลเสร็จสิ้น Amazon Fraud Detector จะประเมินโมเดลของคุณโดยใช้ข้อมูลการสร้างโมเดลบางส่วนที่ไม่ได้ใช้ในการฝึกโมเดล ส่งคืนตัวชี้วัดการประเมินบน รุ่นรุ่น หน้าสำหรับรุ่นนั้นๆ ตัวชี้วัดเหล่านั้นสะท้อนถึงประสิทธิภาพของแบบจำลองที่คุณคาดหวังได้จากข้อมูลจริงหลังจากปรับใช้กับการผลิต

ภาพหน้าจอต่อไปนี้แสดงตัวอย่างประสิทธิภาพของโมเดลที่ส่งคืนโดย Amazon Fraud Detector คุณสามารถเลือกเกณฑ์ที่แตกต่างกันในการแจกแจงคะแนน (ซ้าย) และเมทริกซ์ความสับสน (ขวา) จะได้รับการอัปเดตตามนั้น

คุณสามารถใช้ผลการวิจัยต่อไปนี้เพื่อตรวจสอบประสิทธิภาพและตัดสินใจเกี่ยวกับกฎกลยุทธ์:

AUC (พื้นที่ใต้เส้นโค้ง) – ประสิทธิภาพโดยรวมของรุ่นนี้ โมเดลที่มี AUC 0.50 นั้นไม่ได้ดีไปกว่าการพลิกเหรียญเพราะมันแสดงถึงโอกาสแบบสุ่ม ในขณะที่โมเดลที่ "สมบูรณ์แบบ" จะมีคะแนน 1.0 ยิ่ง AUC สูงเท่าไหร่ โมเดลของคุณสามารถแยกแยะความแตกต่างระหว่างการฉ้อโกงและความถูกต้องตามกฎหมายได้ดียิ่งขึ้น
การกระจายคะแนน – ฮิสโตแกรมของการแจกแจงคะแนนแบบจำลองโดยสมมติว่ามีประชากรตัวอย่าง 100,000 เหตุการณ์ Amazon Fraud Detector สร้างคะแนนโมเดลระหว่าง 0–1000 โดยที่คะแนนยิ่งต่ำ ความเสี่ยงในการฉ้อโกงก็จะยิ่งลดลง การแยกระหว่างประชากรที่ถูกกฎหมาย (สีเขียว) กับการฉ้อโกง (สีน้ำเงิน) ที่ดีขึ้น โดยทั่วไปแล้วจะบ่งบอกถึงรูปแบบที่ดีกว่า ดูรายละเอียดเพิ่มเติมได้ที่ คะแนนนางแบบ.
เมทริกซ์ความสับสน – ตารางที่อธิบายประสิทธิภาพของแบบจำลองสำหรับเกณฑ์คะแนนที่กำหนด ซึ่งรวมถึงผลบวกจริง ผลลบจริง ผลบวกลวง ค่าลบเท็จ อัตราผลบวกจริง (TPR) และอัตราผลบวกลวง (FPR) การนับบนโต๊ะสมมติตัวอย่างประชากร 100,0000 เหตุการณ์ ดูรายละเอียดเพิ่มเติมได้ที่ ตัวชี้วัดประสิทธิภาพของแบบจำลอง.
เส้นโค้ง ROC (ตัวดำเนินการผู้รับ) – พล็อตที่แสดงให้เห็นถึงความสามารถในการวินิจฉัยของแบบจำลองดังที่แสดงในภาพหน้าจอต่อไปนี้ มันพล็อตอัตราบวกที่แท้จริงเป็นฟังก์ชันของอัตราการบวกลวงเหนือเกณฑ์คะแนนแบบจำลองที่เป็นไปได้ทั้งหมด ดูแผนภูมินี้โดยเลือก เมตริกขั้นสูง. หากคุณได้ฝึกโมเดลเดียวหลายเวอร์ชัน คุณสามารถเลือกเกณฑ์ FPR ที่แตกต่างกันเพื่อตรวจสอบการเปลี่ยนแปลงประสิทธิภาพได้
ความสำคัญของตัวแปรแบบจำลอง – อันดับของตัวแปรโมเดลตามการมีส่วนร่วมกับโมเดลที่สร้างขึ้น ดังที่แสดงในภาพหน้าจอต่อไปนี้ ตัวแปรโมเดลที่มีค่าสูงสุดมีความสำคัญต่อโมเดลมากกว่าตัวแปรโมเดลอื่นๆ ในชุดข้อมูลสำหรับเวอร์ชันของโมเดลนั้น และจะแสดงอยู่ที่ด้านบนสุดโดยค่าเริ่มต้น ดูรายละเอียดเพิ่มเติมได้ที่ ความสำคัญของตัวแปรแบบจำลอง.

วิเคราะห์ประสิทธิภาพของโมเดล

ก่อนปรับใช้โมเดลของคุณในการผลิต คุณควรใช้ตัววัดที่ Amazon Fraud Detector ส่งคืนเพื่อทำความเข้าใจประสิทธิภาพของโมเดลและวิเคราะห์ปัญหาที่เป็นไปได้ ปัญหาทั่วไปของแบบจำลอง ML สามารถแบ่งออกเป็นสองประเภทหลัก: ปัญหาที่เกี่ยวข้องกับข้อมูลและปัญหาที่เกี่ยวข้องกับแบบจำลอง Amazon Fraud Detector ได้ดูแลปัญหาที่เกี่ยวข้องกับโมเดลโดยใช้ชุดการตรวจสอบและการทดสอบอย่างรอบคอบเพื่อประเมินและปรับแต่งโมเดลของคุณในแบ็กเอนด์ คุณสามารถทำตามขั้นตอนต่อไปนี้เพื่อตรวจสอบว่าโมเดลของคุณพร้อมสำหรับการปรับใช้หรือมีปัญหาเกี่ยวกับข้อมูลที่เป็นไปได้:

ตรวจสอบประสิทธิภาพของแบบจำลองโดยรวม (AUC และการกระจายคะแนน)
ตรวจสอบข้อกำหนดทางธุรกิจ (เมทริกซ์ความสับสนและตาราง)
ตรวจสอบความสำคัญของตัวแปรโมเดล

ตรวจสอบประสิทธิภาพของแบบจำลองโดยรวม: AUC และการกระจายคะแนน

การทำนายเหตุการณ์ในอนาคตที่แม่นยำยิ่งขึ้นนั้นเป็นเป้าหมายหลักของแบบจำลองการคาดการณ์เสมอ AUC ที่ส่งคืนโดย Amazon Fraud Detector จะคำนวณจากชุดการทดสอบที่สุ่มตัวอย่างอย่างเหมาะสมซึ่งไม่ได้ใช้ในการฝึกอบรม โดยทั่วไป โมเดลที่มี AUC มากกว่า 0.9 ถือเป็นแบบจำลองที่ดี

หากคุณสังเกตแบบจำลองที่มีประสิทธิภาพน้อยกว่า 0.8 แสดงว่าแบบจำลองนั้นมีพื้นที่สำหรับการปรับปรุง (เราจะพูดถึงปัญหาทั่วไปสำหรับประสิทธิภาพของแบบจำลองต่ำในโพสต์นี้) โปรดทราบว่าคำจำกัดความของประสิทธิภาพ "ดี" ขึ้นอยู่กับธุรกิจของคุณและรูปแบบพื้นฐานเป็นอย่างมาก คุณยังคงทำตามขั้นตอนในโพสต์นี้เพื่อปรับปรุงโมเดล Amazon Fraud Detector ได้แม้ว่า AUC จะมากกว่า 0.8

ในทางกลับกัน หาก AUC มากกว่า 0.99 แสดงว่าโมเดลสามารถแยกการฉ้อโกงและเหตุการณ์ที่ถูกต้องตามกฎหมายออกจากชุดทดสอบได้เกือบทั้งหมด บางครั้งนี่เป็นสถานการณ์ที่ "ดีเกินจริง" (เราจะพูดถึงปัญหาทั่วไปสำหรับประสิทธิภาพของโมเดลที่สูงมากในโพสต์นี้)

นอกจาก AUC โดยรวมแล้ว การกระจายคะแนนยังสามารถบอกคุณได้ว่าโมเดลนั้นติดตั้งได้ดีเพียงใด ตามหลักการแล้ว คุณควรเห็นจำนวนมากของการถูกกฎหมายและการฉ้อโกงที่ปลายทั้งสองด้านของมาตราส่วน ซึ่งบ่งชี้ว่าคะแนนแบบจำลองสามารถจัดอันดับเหตุการณ์ในชุดทดสอบได้อย่างถูกต้อง

ในตัวอย่างต่อไปนี้ การแจกแจงคะแนนมี AUC เท่ากับ 0.96

หากการกระจายที่ถูกกฎหมายและการกระจายการฉ้อโกงทับซ้อนกันหรือกระจุกตัวอยู่ในศูนย์ อาจหมายความว่าแบบจำลองนั้นทำงานได้ไม่ดีในการแยกแยะเหตุการณ์การฉ้อโกงออกจากเหตุการณ์ที่ถูกต้องตามกฎหมาย ซึ่งอาจบ่งชี้ว่าการกระจายข้อมูลในอดีตมีการเปลี่ยนแปลงหรือว่าคุณต้องการข้อมูลหรือคุณสมบัติเพิ่มเติม

ต่อไปนี้เป็นตัวอย่างการแจกแจงคะแนนที่มี AUC 0.64

หากคุณพบจุดแยกที่สามารถแยกแยะการฉ้อโกงและเหตุการณ์ที่ถูกต้องได้เกือบทั้งหมด มีโอกาสสูงที่แบบจำลองจะมีปัญหาการรั่วไหลของฉลากหรือรูปแบบการฉ้อโกงนั้นง่ายต่อการตรวจจับ ซึ่งควรดึงดูดความสนใจของคุณ

ในตัวอย่างต่อไปนี้ การแจกแจงคะแนนมี AUC เท่ากับ 1.0

ตรวจสอบข้อกำหนดทางธุรกิจ: เมทริกซ์ความสับสนและตาราง

แม้ว่า AUC จะเป็นตัวบ่งชี้ที่สะดวกสำหรับประสิทธิภาพของแบบจำลอง แต่ก็อาจไม่ได้แปลตรงตามความต้องการทางธุรกิจของคุณโดยตรง Amazon Fraud Detector ยังมีตัววัด เช่น อัตราการดักจับการทุจริต (อัตราผลบวกที่แท้จริง) เปอร์เซ็นต์ของเหตุการณ์ที่ถูกต้องตามกฎหมายที่คาดการณ์อย่างไม่ถูกต้องว่าเป็นการฉ้อโกง (อัตราที่ผิดพลาด) และอื่นๆ ซึ่งมักใช้เป็นข้อกำหนดทางธุรกิจมากกว่า หลังจากที่คุณฝึกโมเดลด้วย AUC ที่ดีพอสมควรแล้ว คุณต้องเปรียบเทียบโมเดลกับความต้องการทางธุรกิจของคุณด้วยเมตริกเหล่านั้น

เมทริกซ์ความสับสนและตารางมีอินเทอร์เฟซสำหรับตรวจสอบผลกระทบและตรวจสอบว่าตรงกับความต้องการทางธุรกิจของคุณหรือไม่ โปรดทราบว่าตัวเลขขึ้นอยู่กับเกณฑ์ของแบบจำลอง โดยที่เหตุการณ์ที่มีคะแนนมากกว่าเกณฑ์นั้นจะถูกจัดประเภทเป็นการฉ้อโกง และเหตุการณ์ที่มีคะแนนต่ำกว่าเกณฑ์จะถูกจัดประเภทว่าถูกกฎหมาย คุณสามารถเลือกเกณฑ์ที่จะใช้ขึ้นอยู่กับความต้องการทางธุรกิจของคุณ

ตัวอย่างเช่น หากเป้าหมายของคุณคือการจับ 73% ของการฉ้อโกง ดังนั้น (ตามที่แสดงในตัวอย่างด้านล่าง) คุณสามารถเลือกเกณฑ์เช่น 855 ซึ่งช่วยให้คุณจับ 73% ของการฉ้อโกงทั้งหมด อย่างไรก็ตาม โมเดลดังกล่าวยังจัดประเภทเหตุการณ์ที่ถูกต้องตามกฎหมาย 3% ผิดว่าเป็นการฉ้อโกง หาก FPR นี้เป็นที่ยอมรับสำหรับธุรกิจของคุณ โมเดลนั้นก็เหมาะสำหรับการปรับใช้ มิฉะนั้น คุณต้องปรับปรุงประสิทธิภาพของโมเดล

อีกตัวอย่างหนึ่งคือ หากค่าใช้จ่ายในการบล็อกหรือท้าทายลูกค้าที่ถูกต้องตามกฎหมายนั้นสูงมาก คุณต้องการ FPR ที่ต่ำและมีความแม่นยำสูง ในกรณีดังกล่าว คุณสามารถเลือกเกณฑ์ที่ 950 ตามที่แสดงในตัวอย่างต่อไปนี้ ซึ่งจะจำแนกลูกค้าที่ถูกต้องตามกฎหมาย 1% ผิดว่าเป็นการฉ้อโกง และ 80% ของการฉ้อโกงที่ระบุจะเป็นการฉ้อโกง

นอกจากนี้ คุณสามารถเลือกเกณฑ์ได้หลายแบบและกำหนดผลลัพธ์ที่แตกต่างกัน เช่น บล็อก สอบสวน ผ่าน หากคุณไม่พบเกณฑ์และกฎเกณฑ์ที่เหมาะสมที่ตรงกับความต้องการทางธุรกิจทั้งหมดของคุณ คุณควรพิจารณาฝึกอบรมโมเดลของคุณด้วยข้อมูลและแอตทริบิวต์เพิ่มเติม

ตรวจสอบความสำคัญของตัวแปรโมเดล

พื้นที่ ความสำคัญของตัวแปรแบบจำลอง บานหน้าต่างจะแสดงว่าตัวแปรแต่ละตัวมีส่วนสนับสนุนโมเดลของคุณอย่างไร หากตัวแปรหนึ่งมีค่าความสำคัญสูงกว่าตัวแปรอื่นอย่างมาก ตัวแปรนั้นอาจบ่งบอกถึงการรั่วไหลของฉลากหรือรูปแบบการฉ้อโกงนั้นง่ายต่อการตรวจจับ โปรดทราบว่าความสำคัญของตัวแปรจะถูกรวมกลับไปที่ตัวแปรอินพุตของคุณ หากคุณสังเกตเห็นความสำคัญที่สูงขึ้นเล็กน้อยของ IP_ADDRESS, CARD_BIN, EMAIL_ADDRESS, PHONE_NUMBER, BILLING_ZIP,หรือ SHIPPING_ZIPอาจเป็นเพราะพลังแห่งการเสริมแต่ง

ตัวอย่างต่อไปนี้แสดงความสำคัญของตัวแปรแบบจำลองที่อาจเกิดการรั่วไหลของฉลากโดยใช้ investigation_status.

ความสำคัญของตัวแปรแบบจำลองยังช่วยให้คุณทราบถึงสิ่งที่ตัวแปรเพิ่มเติมที่อาจนำการยกระดับมาสู่แบบจำลอง ตัวอย่างเช่น หากคุณสังเกตเห็นว่า AUC ต่ำและคุณลักษณะที่เกี่ยวข้องกับผู้ขายมีความสำคัญสูง คุณอาจพิจารณารวบรวมคุณลักษณะการสั่งซื้อเพิ่มเติม เช่น SELLER_CATEGORY, SELLER_ADDRESSและ SELLER_ACTIVE_YEARSและเพิ่มตัวแปรเหล่านั้นลงในโมเดลของคุณ

ปัญหาทั่วไปสำหรับประสิทธิภาพของโมเดลต่ำ

ในส่วนนี้ เราจะพูดถึงปัญหาทั่วไปที่คุณอาจพบเกี่ยวกับประสิทธิภาพของแบบจำลองต่ำ

การเปลี่ยนแปลงการกระจายข้อมูลในอดีต

การกระจายข้อมูลในอดีตเกิดขึ้นเมื่อคุณมีการเปลี่ยนแปลงธุรกิจขนาดใหญ่หรือมีปัญหาในการรวบรวมข้อมูล ตัวอย่างเช่น หากคุณเพิ่งเปิดตัวผลิตภัณฑ์ของคุณในตลาดใหม่ IP_ADDRESS, EMAILและ ADDRESS คุณลักษณะที่เกี่ยวข้องอาจแตกต่างกันโดยสิ้นเชิง และวิธีปฏิบัติในการฉ้อโกงก็สามารถเปลี่ยนแปลงได้เช่นกัน Amazon Fraud Detector ใช้ EVENT_TIMESTAMP เพื่อแยกข้อมูลและประเมินแบบจำลองของคุณกับชุดย่อยของเหตุการณ์ที่เหมาะสมในชุดข้อมูลของคุณ หากการกระจายข้อมูลในอดีตของคุณเปลี่ยนแปลงอย่างมีนัยสำคัญ ชุดการประเมินอาจแตกต่างจากข้อมูลการฝึกอย่างมาก และประสิทธิภาพของแบบจำลองที่รายงานอาจต่ำ

คุณสามารถตรวจสอบปัญหาการเปลี่ยนแปลงการกระจายข้อมูลที่อาจเกิดขึ้นได้โดยสำรวจข้อมูลในอดีตของคุณ:

ใช้ ตัวสร้างโปรไฟล์ข้อมูลตัวตรวจจับการฉ้อโกงของ Amazon เครื่องมือตรวจสอบว่าอัตราการฉ้อโกงและอัตราการขาดของฉลากเปลี่ยนแปลงไปตามกาลเวลาหรือไม่
ตรวจสอบว่าการกระจายตัวแปรเมื่อเวลาผ่านไปมีการเปลี่ยนแปลงอย่างมีนัยสำคัญ โดยเฉพาะอย่างยิ่งสำหรับคุณลักษณะที่มีความสำคัญตัวแปรสูง
ตรวจสอบการกระจายตัวแปรตามช่วงเวลาตามตัวแปรเป้าหมาย หากคุณสังเกตเห็นเหตุการณ์การฉ้อโกงจากหมวดหมู่หนึ่งๆ ในข้อมูลล่าสุด คุณอาจต้องการตรวจสอบว่าการเปลี่ยนแปลงนั้นสมเหตุสมผลหรือไม่โดยใช้วิจารณญาณทางธุรกิจของคุณ

หากคุณพบว่าอัตราการติดฉลากขาดหายไปนั้นสูงมาก หรืออัตราการฉ้อโกงลดลงอย่างต่อเนื่องในช่วงวันที่ล่าสุด อาจเป็นตัวบ่งชี้ว่าฉลากยังไม่เติบโตเต็มที่ คุณควรแยกข้อมูลล่าสุดออกหรือรอนานขึ้นเพื่อรวบรวมป้ายกำกับที่ถูกต้อง จากนั้นจึงฝึกโมเดลของคุณใหม่

หากคุณสังเกตเห็นอัตราการฉ้อโกงและตัวแปรที่เพิ่มขึ้นอย่างรวดเร็วในวันที่ระบุ คุณอาจต้องการตรวจสอบอีกครั้งว่าเป็นปัญหาผิดปกติหรือการรวบรวมข้อมูลหรือไม่ ในกรณีนั้น คุณควรลบเหตุการณ์เหล่านั้นและฝึกโมเดลใหม่

หากคุณพบว่าข้อมูลที่ล้าสมัยไม่สามารถแสดงถึงธุรกิจในปัจจุบันและอนาคตของคุณได้ คุณควรแยกข้อมูลเก่าออกจากการฝึกอบรม หากคุณกำลังใช้เหตุการณ์ที่จัดเก็บไว้ใน Amazon Fraud Detector คุณสามารถฝึกเวอร์ชันใหม่และเลือกช่วงวันที่ที่เหมาะสมในขณะที่กำหนดค่างานการฝึกอบรมได้ นอกจากนี้ยังอาจบ่งชี้ว่าวิธีการทุจริตในธุรกิจของคุณเปลี่ยนแปลงไปอย่างรวดเร็วเมื่อเวลาผ่านไป หลังจากการปรับใช้โมเดล คุณอาจต้องฝึกโมเดลของคุณใหม่บ่อยๆ

การแมปประเภทตัวแปรที่ไม่เหมาะสม

Amazon Fraud Detector ปรับปรุงและแปลงข้อมูลตามประเภทตัวแปร สิ่งสำคัญคือคุณต้องจับคู่ตัวแปรของคุณกับประเภทที่ถูกต้อง เพื่อให้โมเดล Amazon Fraud Detector สามารถรับค่าสูงสุดของข้อมูลของคุณได้ ตัวอย่างเช่น หากคุณ map IP ไป CATEGORICAL พิมพ์แทน IP_ADDRESS, คุณไม่ได้รับ IP-การตกแต่งที่เกี่ยวข้องในแบ็กเอนด์

โดยทั่วไป Amazon Fraud Detector จะแนะนำการดำเนินการต่อไปนี้:

จับคู่ตัวแปรของคุณกับประเภทเฉพาะ เช่น IP_ADDRESS, EMAIL_ADDRESS, CARD_BINและ PHONE_NUMBERเพื่อให้ Amazon Fraud Detector สามารถดึงข้อมูลและเสริมข้อมูลเพิ่มเติมได้
หากคุณไม่พบตัวแปรประเภทใดประเภทหนึ่ง ให้จับคู่ตัวแปรดังกล่าวกับประเภททั่วไปสามประเภท: NUMERIC, CATEGORICAL,หรือ FREE_FORM_TEXT.
หากตัวแปรอยู่ในรูปแบบข้อความและมีความสำคัญสูง เช่น บทวิจารณ์ของลูกค้าหรือคำอธิบายผลิตภัณฑ์ คุณควรแมปตัวแปรนั้นกับ FREE_FORM_TEXT ประเภทตัวแปร เพื่อให้ Amazon Fraud Detector แยกคุณสมบัติข้อความและการฝังบนแบ็กเอนด์ให้คุณ ตัวอย่างเช่น หากคุณ map url_string ไปยัง FREE_FORM_TEXTมันสามารถโทเค็น URL และดึงข้อมูลเพื่อป้อนลงในโมเดลดาวน์สตรีม ซึ่งจะช่วยให้เรียนรู้รูปแบบที่ซ่อนอยู่เพิ่มเติมจาก URL

หากคุณพบว่าประเภทตัวแปรของคุณมีการแมปอย่างไม่ถูกต้องในการกำหนดค่าตัวแปร คุณสามารถเปลี่ยนประเภทตัวแปรแล้วฝึกแบบจำลองใหม่ได้

ข้อมูลหรือคุณสมบัติไม่เพียงพอ

Amazon Fraud Detector ต้องการอย่างน้อย 10,000 ระเบียนในการฝึกอบรม Online Fraud Insights (OFI) หรือโมเดล Transaction Fraud Insights (TFI) โดยมีอย่างน้อย 400 ระเบียนที่ระบุว่าเป็นการฉ้อโกง TFI ยังกำหนดให้ทั้งบันทึกที่เป็นการฉ้อโกงและบันทึกที่ถูกต้องต้องมาจากหน่วยงานต่างๆ อย่างน้อย 100 แห่ง เพื่อให้แน่ใจว่าชุดข้อมูลมีความหลากหลาย นอกจากนี้ Amazon Fraud Detector ยังต้องการให้ข้อมูลการสร้างแบบจำลองมีตัวแปรอย่างน้อยสองตัว นี่คือข้อกำหนดข้อมูลขั้นต่ำในการสร้างโมเดล Amazon Fraud Detector ที่มีประโยชน์ อย่างไรก็ตาม การใช้ระเบียนและตัวแปรมากขึ้นมักจะช่วยให้โมเดล ML เรียนรู้รูปแบบพื้นฐานจากข้อมูลของคุณได้ดีขึ้น เมื่อคุณสังเกต AUC ต่ำหรือไม่พบเกณฑ์ที่ตรงกับความต้องการทางธุรกิจของคุณ คุณควรพิจารณาฝึกอบรมแบบจำลองของคุณใหม่ด้วยข้อมูลมากขึ้นหรือเพิ่มคุณลักษณะใหม่ให้กับแบบจำลองของคุณ ปกติเราจะพบว่า EMAIL_ADDRESS, IP, PAYMENT_TYPE, BILLING_ADDRESS, SHIPPING_ADDRESSและ DEVICE ตัวแปรที่เกี่ยวข้องมีความสำคัญในการตรวจจับการฉ้อโกง

สาเหตุที่เป็นไปได้อีกประการหนึ่งคือตัวแปรบางตัวของคุณมีค่าที่ขาดหายไปมากเกินไป เพื่อดูว่าเกิดขึ้นหรือไม่ ให้ตรวจสอบข้อความการฝึกแบบจำลองและอ้างอิงถึง แก้ไขปัญหาข้อมูลการฝึกอบรม สำหรับคำแนะนำ

ปัญหาทั่วไปสำหรับประสิทธิภาพของโมเดลที่สูงมาก

ในส่วนนี้ เราจะพูดถึงปัญหาทั่วไปที่เกี่ยวข้องกับประสิทธิภาพของแบบจำลองที่สูงมาก

ฉลากรั่ว

ฉลากรั่วเกิดขึ้นเมื่อชุดข้อมูลการฝึกใช้ข้อมูลที่คาดว่าจะไม่พร้อมใช้งานในเวลาคาดการณ์ โดยจะประเมินค่ายูทิลิตี้ของแบบจำลองสูงเกินไปเมื่อทำงานในสภาพแวดล้อมที่ใช้งานจริง

AUC สูง (ใกล้เคียงกับ 1) การกระจายคะแนนอย่างสมบูรณ์ และความสำคัญของตัวแปรที่สูงขึ้นอย่างมีนัยสำคัญของตัวแปรหนึ่งอาจเป็นตัวบ่งชี้ถึงปัญหาการรั่วไหลของฉลากที่อาจเกิดขึ้น คุณยังสามารถตรวจสอบความสัมพันธ์ระหว่างคุณสมบัติและฉลากได้โดยใช้ปุ่ม ตัวสร้างโปรไฟล์ข้อมูล. คุณสมบัติและความสัมพันธ์ของป้ายกำกับ พล็อตแสดงความสัมพันธ์ระหว่างแต่ละคุณลักษณะและป้ายกำกับ หากคุณลักษณะหนึ่งมีความสัมพันธ์กับป้ายกำกับมากกว่า 0.99 คุณควรตรวจสอบว่ามีการใช้คุณลักษณะนี้อย่างเหมาะสมตามการตัดสินใจทางธุรกิจหรือไม่ ตัวอย่างเช่น ในการสร้างแบบจำลองความเสี่ยงเพื่ออนุมัติหรือปฏิเสธการขอสินเชื่อ คุณไม่ควรใช้คุณสมบัติเช่น AMOUNT_PAIDเนื่องจากการชำระเงินเกิดขึ้นหลังจากขั้นตอนการจัดจำหน่าย หากตัวแปรไม่พร้อมใช้งานในขณะที่คุณคาดการณ์ คุณควรลบตัวแปรนั้นออกจากการกำหนดค่าโมเดลและฝึกโมเดลใหม่อีกครั้ง

ตัวอย่างต่อไปนี้แสดงความสัมพันธ์ระหว่างแต่ละตัวแปรและป้ายกำกับ investigation_status มีความสัมพันธ์สูง (ใกล้เคียงกับ 1) กับฉลาก ดังนั้นคุณควรตรวจสอบอีกครั้งว่ามีปัญหาการรั่วของฉลากหรือไม่

รูปแบบการฉ้อโกงอย่างง่าย

เมื่อรูปแบบการฉ้อโกงในข้อมูลของคุณเป็นเรื่องง่าย คุณอาจสังเกตเห็นประสิทธิภาพของแบบจำลองที่สูงมาก ตัวอย่างเช่น สมมติว่าเหตุการณ์การฉ้อโกงทั้งหมดในข้อมูลการสร้างแบบจำลองมาจากผู้ให้บริการภายในเดียวกัน มันตรงไปตรงมาสำหรับรุ่นที่จะเลือก IP-ตัวแปรที่เกี่ยวข้องและส่งคืนโมเดล "สมบูรณ์แบบ" ที่มีความสำคัญสูงของ IP.

รูปแบบการฉ้อโกงแบบธรรมดาไม่ได้บ่งบอกถึงปัญหาข้อมูลเสมอไป อาจเป็นความจริงที่วิธีการทุจริตในธุรกิจของคุณนั้นง่ายต่อการจับ อย่างไรก็ตาม ก่อนที่จะสรุป คุณต้องตรวจสอบให้แน่ใจว่าฉลากที่ใช้ในการฝึกแบบจำลองนั้นถูกต้อง และข้อมูลการสร้างแบบจำลองครอบคลุมรูปแบบการฉ้อโกงให้ได้มากที่สุด ตัวอย่างเช่น หากคุณติดป้ายกำกับเหตุการณ์การฉ้อโกงตามกฎ เช่น การติดป้ายกำกับแอปพลิเคชันทั้งหมดจาก BILLING_ZIP บวก PRODUCT_CATEGORY ในรูปแบบการฉ้อโกง โมเดลสามารถจับการฉ้อโกงเหล่านั้นได้อย่างง่ายดายโดยการจำลองกฎและบรรลุ AUC ที่สูง

คุณสามารถตรวจสอบการแจกแจงฉลากตามหมวดหมู่ต่างๆ หรือถังขยะของแต่ละฟีเจอร์ได้โดยใช้ปุ่ม ตัวสร้างโปรไฟล์ข้อมูล. ตัวอย่างเช่น หากคุณสังเกตว่าเหตุการณ์การฉ้อโกงส่วนใหญ่มาจากหมวดหมู่ผลิตภัณฑ์หนึ่งหรือสองสามหมวดหมู่ อาจเป็นตัวบ่งชี้ถึงรูปแบบการฉ้อโกงทั่วไป และคุณต้องยืนยันว่าไม่ใช่การรวบรวมข้อมูลหรือข้อผิดพลาดในกระบวนการ หากคุณสมบัติเป็นเหมือน CUSTOMER_IDคุณควรยกเว้นคุณลักษณะนี้ในการฝึกโมเดล

ตัวอย่างต่อไปนี้แสดงการกระจายฉลากตามหมวดหมู่ต่างๆ ของ product_category. การฉ้อโกงทั้งหมดมาจากผลิตภัณฑ์สองประเภท

การสุ่มตัวอย่างข้อมูลที่ไม่เหมาะสม

การสุ่มตัวอย่างข้อมูลที่ไม่เหมาะสมอาจเกิดขึ้นเมื่อคุณสุ่มตัวอย่างและส่งข้อมูลของคุณเพียงบางส่วนไปยัง Amazon Fraud Detector หากข้อมูลไม่ได้สุ่มตัวอย่างอย่างถูกต้องและไม่ได้เป็นตัวแทนของปริมาณการใช้งานในการผลิต ประสิทธิภาพของแบบจำลองที่รายงานจะไม่ถูกต้องและแบบจำลองอาจไม่มีประโยชน์สำหรับการคาดการณ์การผลิต ตัวอย่างเช่น หากเหตุการณ์การฉ้อโกงทั้งหมดในข้อมูลการสร้างแบบจำลองนั้นสุ่มตัวอย่างจากเอเชียและเหตุการณ์ที่ถูกกฎหมายทั้งหมดนั้นสุ่มตัวอย่างจากสหรัฐอเมริกา แบบจำลองอาจเรียนรู้ที่จะแยกการฉ้อโกงและกฎหมายโดยพิจารณาจาก BILLING_COUNTRY. ในกรณีนั้น แบบจำลองนี้ไม่ใช่แบบทั่วไปที่จะนำไปใช้กับประชากรอื่นๆ

โดยปกติ เราแนะนำให้ส่งกิจกรรมล่าสุดทั้งหมดโดยไม่มีการสุ่มตัวอย่าง ตามขนาดข้อมูลและอัตราการฉ้อโกง Amazon Fraud Detector จะสุ่มตัวอย่างก่อนการฝึกโมเดลให้คุณ หากข้อมูลของคุณมีขนาดใหญ่เกินไป (มากกว่า 100 GB) และคุณตัดสินใจที่จะสุ่มตัวอย่างและส่งเฉพาะชุดย่อย คุณควรสุ่มตัวอย่างข้อมูลของคุณ และตรวจสอบให้แน่ใจว่ากลุ่มตัวอย่างเป็นตัวแทนของประชากรทั้งหมด สำหรับ TFI คุณควรสุ่มตัวอย่างข้อมูลของคุณตามเอนทิตี ซึ่งหมายความว่าหากมีการสุ่มตัวอย่างเอนทิตีหนึ่ง คุณควรรวมประวัติทั้งหมดเพื่อให้มีการคำนวณการรวมระดับเอนทิตีอย่างถูกต้อง โปรดทราบว่าหากคุณส่งข้อมูลเพียงชุดย่อยไปยัง Amazon Fraud Detector การรวมแบบเรียลไทม์ระหว่างการอนุมานอาจไม่ถูกต้องหากไม่มีการส่งเหตุการณ์ก่อนหน้าของเอนทิตี

การสุ่มตัวอย่างข้อมูลที่ไม่เหมาะสมอีกอย่างหนึ่งอาจใช้ข้อมูลในช่วงเวลาสั้นๆ เช่น ข้อมูลในหนึ่งวัน เพื่อสร้างแบบจำลองเท่านั้น ข้อมูลอาจมีอคติ โดยเฉพาะอย่างยิ่งหากธุรกิจหรือการฉ้อโกงของคุณมีฤดูกาล เรามักจะแนะนำให้ใส่ข้อมูลอย่างน้อยสองรอบ (เช่น 2 สัปดาห์หรือ 2 เดือน) ในการสร้างแบบจำลองเพื่อให้แน่ใจว่าความหลากหลายของประเภทการฉ้อโกง

สรุป

หลังจากวินิจฉัยและแก้ไขปัญหาที่อาจเกิดขึ้นทั้งหมดแล้ว คุณควรได้รับโมเดล Amazon Fraud Detector ที่มีประโยชน์และมั่นใจในประสิทธิภาพ สำหรับขั้นตอนต่อไป คุณ สามารถสร้างตัวตรวจจับด้วยโมเดลและกฎเกณฑ์ทางธุรกิจของคุณและพร้อมที่จะปรับใช้ในการผลิตสำหรับการประเมินโหมดเงา

ภาคผนวก

วิธีแยกตัวแปรสำหรับการฝึกโมเดล

หลังจากการดำน้ำลึก คุณอาจระบุข้อมูลเป้าหมายการรั่วไหลของตัวแปร และต้องการแยกข้อมูลออกจากการฝึกแบบจำลอง คุณสามารถฝึกเวอร์ชันของโมเดลใหม่ได้ ยกเว้นตัวแปรที่คุณไม่ต้องการโดยทำตามขั้นตอนต่อไปนี้:

บนคอนโซล Amazon Fraud Detector ในบานหน้าต่างนำทาง ให้เลือก Models.
เกี่ยวกับ Models หน้า เลือกรุ่นที่คุณต้องการฝึกใหม่
เกี่ยวกับ สถานะ เมนูให้เลือก เทรนเวอร์ชั่นใหม่.
เลือกช่วงวันที่ที่คุณต้องการใช้แล้วเลือก ถัดไป.
เกี่ยวกับ กำหนดค่าการฝึกอบรม ให้ยกเลิกการเลือกตัวแปรที่คุณไม่ต้องการใช้ในการฝึกโมเดล
ระบุป้ายกำกับการฉ้อโกงและป้ายกำกับที่ถูกต้อง และวิธีที่คุณต้องการให้ Amazon Fraud Detector ใช้เหตุการณ์ที่ไม่มีป้ายกำกับ จากนั้นเลือก ถัดไป.
ตรวจสอบการกำหนดค่าแบบจำลองและเลือก สร้างและฝึกโมเดล.

วิธีเปลี่ยนประเภทตัวแปรเหตุการณ์

ตัวแปรแสดงถึงองค์ประกอบข้อมูลที่ใช้ในการป้องกันการฉ้อโกง ใน Amazon Fraud Detector ตัวแปรทั้งหมดเป็นแบบสากลและมีการแชร์ในเหตุการณ์และโมเดลทั้งหมด ซึ่งหมายความว่าตัวแปรเดียวสามารถใช้ได้ในหลายเหตุการณ์ ตัวอย่างเช่น IP อาจเชื่อมโยงกับเหตุการณ์การลงชื่อเข้าใช้ และอาจเชื่อมโยงกับเหตุการณ์ธุรกรรมด้วย โดยปกติ Amazon Fraud Detector จะล็อกประเภทตัวแปรและประเภทข้อมูลเมื่อสร้างตัวแปรแล้ว หากต้องการลบตัวแปรที่มีอยู่ คุณต้องลบประเภทเหตุการณ์และโมเดลที่เกี่ยวข้องทั้งหมดก่อน คุณสามารถตรวจสอบทรัพยากรที่เกี่ยวข้องกับตัวแปรเฉพาะได้โดยไปที่ Amazon Fraud Detector โดยเลือก ตัวแปร ในบานหน้าต่างนำทาง และเลือกชื่อตัวแปรและ ทรัพยากรที่เกี่ยวข้อง.

ลบตัวแปรและประเภทเหตุการณ์ที่เกี่ยวข้องทั้งหมด

หากต้องการลบตัวแปร ให้ทำตามขั้นตอนต่อไปนี้:

บนคอนโซล Amazon Fraud Detector ในบานหน้าต่างนำทาง ให้เลือก ตัวแปร.
เลือกตัวแปรที่คุณต้องการลบ
Choose ทรัพยากรที่เกี่ยวข้อง เพื่อดูรายการประเภทเหตุการณ์ทั้งหมดที่ใช้ตัวแปรนี้
คุณต้องลบประเภทเหตุการณ์ที่เกี่ยวข้องก่อนที่จะลบตัวแปร
เลือกประเภทเหตุการณ์ในรายการเพื่อไปที่หน้าประเภทเหตุการณ์ที่เกี่ยวข้อง
Choose เหตุการณ์ที่เก็บไว้ เพื่อตรวจสอบว่าข้อมูลใดถูกจัดเก็บภายใต้ประเภทเหตุการณ์นี้
หากมีเหตุการณ์ที่จัดเก็บไว้ใน Amazon Fraud Detector ให้เลือก ลบเหตุการณ์ที่เก็บไว้ เพื่อลบเหตุการณ์ที่เก็บไว้
เมื่องานการลบเสร็จสมบูรณ์ ข้อความ “เหตุการณ์ที่เก็บไว้สำหรับประเภทเหตุการณ์นี้ถูกลบสำเร็จแล้ว” จะปรากฏขึ้น
Choose ทรัพยากรที่เกี่ยวข้อง.
หากตัวตรวจจับและโมเดลเชื่อมโยงกับประเภทเหตุการณ์นี้ คุณต้องลบทรัพยากรเหล่านั้นก่อน
หากตัวตรวจจับมีความเกี่ยวข้องกัน ให้ทำตามขั้นตอนต่อไปนี้เพื่อลบตัวตรวจจับที่เกี่ยวข้องทั้งหมด:
1. เลือกเครื่องตรวจจับเพื่อไปที่ รายละเอียดเครื่องตรวจจับ หน้า.
2. ตัว Vortex Indicator ได้ถูกนำเสนอลงในนิตยสาร รุ่นรุ่น บานหน้าต่าง เลือกเวอร์ชันของตัวตรวจจับ
3. ในหน้าเวอร์ชันตัวตรวจจับ ให้เลือก สถานะ.
4. หากเวอร์ชันตัวตรวจจับทำงานอยู่ ให้เลือก ยกเลิกการใช้งานเลือก ปิดใช้งานเวอร์ชันตัวตรวจจับนี้โดยไม่ต้องแทนที่ด้วยเวอร์ชันอื่นและเลือก ปิดใช้งานเวอร์ชันตัวตรวจจับ
5. หลังจากปิดใช้งานเวอร์ชันตัวตรวจจับแล้ว ให้เลือก สถานะ แล้วก็ ลบ.
6. ทำซ้ำขั้นตอนเหล่านี้เพื่อลบเวอร์ชันของตัวตรวจจับทั้งหมด
7. เกี่ยวกับ รายละเอียดเครื่องตรวจจับ หน้าให้เลือก กฎที่เกี่ยวข้อง.
8. เลือกกฎที่จะลบ
9. Choose สถานะ และ ลบเวอร์ชันกฎ.
10. ป้อนชื่อกฎเพื่อยืนยันและเลือก ลบเวอร์ชั่น.
11. ทำซ้ำขั้นตอนเหล่านี้เพื่อลบกฎที่เกี่ยวข้องทั้งหมด
12. หลังจากลบเวอร์ชันตัวตรวจจับและกฎที่เกี่ยวข้องทั้งหมดแล้ว ให้ไปที่ รายละเอียดเครื่องตรวจจับ หน้าให้เลือก สถานะและเลือก ลบตัวตรวจจับ.
13. ป้อนชื่อเครื่องตรวจจับและเลือก ลบตัวตรวจจับ.
14. ทำซ้ำขั้นตอนเหล่านี้เพื่อลบตัวตรวจจับถัดไป
หากโมเดลใดเชื่อมโยงกับประเภทเหตุการณ์ ให้ทำตามขั้นตอนต่อไปนี้เพื่อลบออก:
1. เลือกชื่อรุ่น
2. ตัว Vortex Indicator ได้ถูกนำเสนอลงในนิตยสาร รุ่นรุ่น บานหน้าต่าง เลือกเวอร์ชัน
3. หากสถานะของรุ่นคือ Activeเลือก สถานะ และ เลิกใช้งานรุ่นรุ่น.
4. เข้าสู่ undeploy เพื่อยืนยันและเลือก เลิกใช้งานรุ่นรุ่น.
  สถานะเปลี่ยนเป็น Undeploying. กระบวนการนี้ใช้เวลาสักครู่จึงจะเสร็จสมบูรณ์
5. หลังจากที่สถานะกลายเป็น Ready to deployเลือกการดำเนินการและลบ
6. ทำซ้ำขั้นตอนเหล่านี้เพื่อลบรุ่นทุกรุ่น
7. ในหน้ารายละเอียดแบบจำลอง ให้เลือกการดำเนินการและลบแบบจำลอง
8. ป้อนชื่อรุ่นและเลือกลบรุ่น
9. ทำซ้ำขั้นตอนเหล่านี้เพื่อลบโมเดลถัดไป
หลังจากลบตัวตรวจจับและรุ่นที่เกี่ยวข้องทั้งหมดแล้ว ให้เลือก สถานะ และ ลบประเภทเหตุการณ์ บน รายละเอียดกิจกรรม หน้า.
ใส่ชื่อประเภทกิจกรรมแล้วเลือก ลบประเภทเหตุการณ์.
ในบานหน้าต่างนำทาง เลือก ตัวแปรและเลือกตัวแปรที่คุณต้องการลบ
ทำซ้ำขั้นตอนก่อนหน้าเพื่อลบประเภทเหตุการณ์ทั้งหมดที่เกี่ยวข้องกับตัวแปร
เกี่ยวกับ รายละเอียดตัวแปร หน้าให้เลือก สถานะ และ ลบ
ป้อนชื่อตัวแปรแล้วเลือก ลบตัวแปร.

สร้างตัวแปรใหม่ด้วยประเภทตัวแปรที่ถูกต้อง

หลังจากที่คุณลบตัวแปรและประเภทเหตุการณ์ที่เกี่ยวข้อง เหตุการณ์ที่จัดเก็บ โมเดล และตัวตรวจจับจาก Amazon Fraud Detector แล้ว คุณสามารถสร้างตัวแปรใหม่ในชื่อเดียวกันและจับคู่ตัวแปรนั้นกับประเภทตัวแปรที่ถูกต้องได้

บนคอนโซล Amazon Fraud Detector ในบานหน้าต่างนำทาง ให้เลือก ตัวแปร.
Choose สร้างบัญชีตัวแทน.
ป้อนชื่อตัวแปรที่คุณต้องการแก้ไข (ชื่อที่คุณลบไปก่อนหน้านี้)
เลือกประเภทตัวแปรที่ถูกต้องที่คุณต้องการเปลี่ยน
Choose สร้างตัวแปร

อัปโหลดข้อมูลและฝึกโมเดลใหม่

หลังจากที่คุณอัปเดตประเภทตัวแปรแล้ว คุณสามารถอัปโหลดข้อมูลอีกครั้งและฝึกโมเดลใหม่ได้ สำหรับคำแนะนำ โปรดดูที่ ตรวจจับการฉ้อโกงธุรกรรมออนไลน์ด้วยคุณสมบัติใหม่ของ Amazon Fraud Detector.

วิธีเพิ่มตัวแปรใหม่ให้กับประเภทเหตุการณ์ที่มีอยู่

ในการเพิ่มตัวแปรใหม่ให้กับประเภทเหตุการณ์ที่มีอยู่ ให้ทำตามขั้นตอนต่อไปนี้:

เพิ่มตัวแปรใหม่ให้กับไฟล์ CVS การฝึกก่อนหน้านี้
อัปโหลดไฟล์ข้อมูลการฝึกใหม่ไปยังบัคเก็ต S3 สังเกตตำแหน่ง Amazon S3 ของไฟล์การฝึกของคุณ (เช่น s3://bucketname/path/to/some/object.csv) และชื่อบทบาทของคุณ
บนคอนโซล Amazon Fraud Detector ในบานหน้าต่างนำทาง ให้เลือก เหตุการณ์ที่เกิดขึ้น
เกี่ยวกับ ประเภทเหตุการณ์ หน้า เลือกชื่อของประเภทเหตุการณ์ที่คุณต้องการเพิ่มตัวแปร
เกี่ยวกับ ประเภทเหตุการณ์ หน้ารายละเอียดเลือก สถานะแล้ว เพิ่มตัวแปร.
ภายใต้ เลือกวิธีกำหนดตัวแปรของเหตุการณ์นี้เลือก เลือกตัวแปรจากชุดข้อมูลการฝึก.
สำหรับบทบาท IAM ให้เลือกบทบาท IAM ที่มีอยู่หรือสร้างบทบาทใหม่ในการเข้าถึงข้อมูลใน Amazon S3
สำหรับ ตำแหน่งข้อมูลป้อนตำแหน่ง S3 ของไฟล์การฝึกใหม่แล้วเลือก อัพโหลด
ตัวแปรใหม่ที่ไม่มีอยู่ในประเภทเหตุการณ์ที่มีอยู่ควรแสดงในรายการ
Choose เพิ่มตัวแปร

ตอนนี้ ตัวแปรใหม่ได้ถูกเพิ่มเข้าไปในประเภทเหตุการณ์ที่มีอยู่แล้ว หากคุณกำลังใช้เหตุการณ์ที่จัดเก็บไว้ใน Amazon Fraud Detector ตัวแปรใหม่ของเหตุการณ์ที่จัดเก็บไว้จะยังคงหายไป คุณต้องนำเข้าข้อมูลการฝึกด้วยตัวแปรใหม่ไปยัง Amazon Fraud Detector จากนั้นจึงฝึกเวอร์ชันใหม่ของโมเดลใหม่ เมื่ออัพโหลดข้อมูลการฝึกใหม่ด้วยตัวเดียวกัน EVENT_ID และ EVENT_TIMESTAMPตัวแปรเหตุการณ์ใหม่จะเขียนทับตัวแปรเหตุการณ์ก่อนหน้าที่จัดเก็บไว้ใน Amazon Fraud Detector

เกี่ยวกับผู้เขียน

จูเลียซู เป็นนักวิทยาศาสตร์วิจัยที่มี Amazon Fraud Detector เธอหลงใหลในการแก้ปัญหาท้าทายของลูกค้าโดยใช้เทคนิคแมชชีนเลิร์นนิง ในเวลาว่าง เธอชอบเดินป่า วาดภาพ และสำรวจร้านกาแฟใหม่ๆ

ห่าวโจว เป็นนักวิทยาศาสตร์วิจัยที่มี Amazon Fraud Detector เขาสำเร็จการศึกษาระดับปริญญาเอกด้านวิศวกรรมไฟฟ้าจาก Northwestern University ประเทศสหรัฐอเมริกา เขาหลงใหลในการใช้เทคนิคแมชชีนเลิร์นนิงเพื่อต่อต้านการฉ้อโกงและการละเมิด

อภิเษก ราวี เป็นผู้จัดการผลิตภัณฑ์อาวุโสของ Amazon Fraud Detector เขาหลงใหลในการใช้ประโยชน์จากความสามารถทางเทคนิคเพื่อสร้างผลิตภัณฑ์ที่สร้างความพึงพอใจให้กับลูกค้า

ประทับเวลา: มิถุนายน 29, 2022

ประทับเวลา: กุมภาพันธ์ 29, 2024

เผยแพร่ซ้ำโดยเพลโต

สร้างแพลตฟอร์มข้อมูลพืชไร่ด้วยความสามารถเชิงพื้นที่ของ Amazon SageMaker

ใช้ Amazon Lex เพื่อบันทึกที่อยู่

เร่งการฝึกอบรมโครงข่ายประสาทเทียมขนาดใหญ่บน CPU ด้วย ThirdAI และ AWS Graviton | อเมซอนเว็บเซอร์วิส

เกี่ยวกับเรา

การค้นหาแนวตั้ง & Ai

ระบบปฏิบัติการ

การติดต่อ

ลงชื่อเข้าใช้