Vượt qua thử thách bắt đầu từ máy học khi phát hiện gian lận bằng cách sử dụng Amazon Fraud Detector

Được xuất bản lại bởi Plato

Người theo dõi: 0

Khi nhiều doanh nghiệp tăng cường sự hiện diện trực tuyến của họ để phục vụ khách hàng tốt hơn, các kiểu lừa đảo mới liên tục xuất hiện. Trong bối cảnh kỹ thuật số không ngừng phát triển ngày nay, nơi những kẻ lừa đảo ngày càng tinh vi hơn trong các chiến thuật của chúng, việc phát hiện và ngăn chặn các hoạt động gian lận như vậy đã trở thành điều tối quan trọng đối với các công ty và tổ chức tài chính.

Các hệ thống phát hiện gian lận dựa trên quy tắc truyền thống bị giới hạn ở khả năng lặp lại nhanh chóng khi chúng dựa vào các quy tắc và ngưỡng được xác định trước để gắn cờ hoạt động gian lận tiềm ẩn. Các hệ thống này có thể tạo ra một số lượng lớn thông báo sai, làm tăng đáng kể khối lượng điều tra thủ công do nhóm gian lận thực hiện. Hơn nữa, con người cũng dễ mắc lỗi và có khả năng hạn chế trong việc xử lý lượng lớn dữ liệu, khiến nỗ lực thủ công để phát hiện gian lận tốn nhiều thời gian, điều này có thể dẫn đến bỏ lỡ các giao dịch gian lận, gia tăng tổn thất và thiệt hại về uy tín.

Máy học (ML) đóng một vai trò quan trọng trong việc phát hiện gian lận vì nó có thể phân tích nhanh chóng và chính xác khối lượng dữ liệu lớn để xác định các mẫu bất thường và xu hướng gian lận có thể xảy ra. Hiệu suất của mô hình gian lận ML chủ yếu phụ thuộc vào chất lượng dữ liệu được đào tạo trên đó và đặc biệt đối với các mô hình được giám sát, dữ liệu được gắn nhãn chính xác là rất quan trọng. Trong ML, việc thiếu dữ liệu lịch sử quan trọng để đào tạo một mô hình được gọi là vấn đề khởi động nguội.

Trong thế giới phát hiện gian lận, sau đây là một số kịch bản bắt đầu nguội truyền thống:

Xây dựng mô hình gian lận chính xác trong khi thiếu lịch sử giao dịch hoặc trường hợp gian lận
Có thể phân biệt chính xác hoạt động hợp pháp với gian lận đối với khách hàng và tài khoản mới
Các khoản thanh toán theo quyết định rủi ro đến một địa chỉ hoặc người thụ hưởng chưa từng thấy trước đây bởi hệ thống gian lận

Có nhiều cách để giải quyết cho những tình huống này. Ví dụ: bạn có thể sử dụng các mô hình chung, được gọi là mô hình một kích cỡ phù hợp với tất cả, thường được đào tạo trên nền tảng chia sẻ dữ liệu gian lận như các tập đoàn gian lận. Thách thức với cách tiếp cận này là không có doanh nghiệp nào giống nhau và các hướng tấn công gian lận thay đổi liên tục.

Một tùy chọn khác là sử dụng mô hình phát hiện bất thường không được giám sát để theo dõi và hiển thị hành vi bất thường giữa các sự kiện của khách hàng. Thách thức với phương pháp này là không phải tất cả các sự kiện gian lận đều là bất thường và không phải tất cả các bất thường đều thực sự là gian lận. Do đó, bạn có thể mong đợi tỷ lệ dương tính giả cao hơn.

Trong bài đăng này, chúng tôi trình bày cách bạn có thể nhanh chóng khởi động mô hình ML ngăn chặn gian lận theo thời gian thực chỉ với 100 sự kiện bằng cách sử dụng Phát hiện gian lận Amazon tính năng mới, Bắt đầu lạnh, do đó làm giảm đáng kể rào cản gia nhập các mô hình ML tùy chỉnh cho nhiều tổ chức đơn giản là không có thời gian hoặc khả năng thu thập và gắn nhãn chính xác các tập dữ liệu lớn. Hơn nữa, chúng ta thảo luận cách sử dụng các sự kiện được lưu trữ của Amazon Fraud Detector, bạn có thể xem lại kết quả và gắn nhãn chính xác cho các sự kiện để đào tạo lại các mô hình của mình, từ đó cải thiện hiệu quả của các biện pháp ngăn chặn gian lận theo thời gian.

Tổng quan về giải pháp

Amazon Fraud Detector là dịch vụ phát hiện gian lận được quản lý hoàn toàn, tự động phát hiện các hoạt động gian lận tiềm ẩn trực tuyến. Bạn có thể sử dụng Amazon Fraud Detector để xây dựng các mô hình phát hiện gian lận tùy chỉnh bằng cách sử dụng tập dữ liệu lịch sử của riêng bạn, thêm logic quyết định bằng công cụ quy tắc tích hợp và sắp xếp quy trình quyết định rủi ro chỉ bằng một lần bấm nút.

Trước đây, bạn phải cung cấp hơn 10,000 sự kiện được gắn nhãn với ít nhất 400 ví dụ về gian lận để đào tạo một mô hình. Với việc phát hành tính năng Cold Start, bạn có thể nhanh chóng đào tạo một mô hình với tối thiểu 100 sự kiện và ít nhất 50 sự kiện được phân loại là gian lận. So với yêu cầu dữ liệu ban đầu, đây là mức giảm 99% dữ liệu lịch sử và giảm 87% yêu cầu nhãn.

Tính năng Cold Start mới cung cấp các phương pháp thông minh để làm phong phú, mở rộng và lập mô hình rủi ro cho các tập dữ liệu nhỏ. Hơn nữa, Amazon Fraud Detector thực hiện gán nhãn và lấy mẫu cho các sự kiện chưa được gắn nhãn.

Các thử nghiệm được thực hiện với bộ dữ liệu công khai cho thấy rằng bằng cách giảm giới hạn xuống 50 gian lận và chỉ 100 sự kiện, bạn có thể xây dựng các mô hình ML gian lận luôn vượt trội so với các mô hình không được giám sát và bán giám sát.

Hiệu suất mô hình Cold Start

Khả năng khái quát hóa và đưa ra dự đoán chính xác của một mô hình ML đối với dữ liệu không nhìn thấy bị ảnh hưởng bởi chất lượng và tính đa dạng của tập dữ liệu huấn luyện. Đối với các mẫu Khởi động nguội, điều này cũng không khác. Bạn nên có sẵn các quy trình khi thu thập được nhiều dữ liệu hơn để gắn nhãn chính xác cho các sự kiện này và đào tạo lại các mô hình, cuối cùng dẫn đến hiệu suất mô hình tối ưu.

Với yêu cầu dữ liệu thấp hơn, tính không ổn định của hiệu suất được báo cáo sẽ tăng lên do phương sai của mô hình tăng lên và kích thước dữ liệu thử nghiệm hạn chế. Để giúp bạn xây dựng kỳ vọng phù hợp về hiệu suất của mô hình, bên cạnh AUC của mô hình, Amazon Fraud Detector còn báo cáo các số liệu về phạm vi không chắc chắn. Bảng sau đây xác định các số liệu này.

.	.	AUC
.	.	<0.6	0.6 - 0.8	> = 0.8
khoảng không chắc chắn AUC	> 0.3	Hiệu suất mô hình rất thấp và có thể thay đổi rất nhiều. Kỳ vọng hiệu suất phát hiện gian lận thấp.	Hiệu suất mô hình thấp và có thể thay đổi rất nhiều. Mong đợi hiệu suất phát hiện gian lận hạn chế.	Hiệu suất mô hình có thể thay đổi rất nhiều.
	0.1 - 0.3	Hiệu suất mô hình rất thấp và có thể thay đổi đáng kể. Kỳ vọng hiệu suất phát hiện gian lận thấp.	Hiệu suất mô hình thấp và có thể thay đổi đáng kể. Mong đợi hiệu suất phát hiện gian lận hạn chế.	Hiệu suất mô hình có thể thay đổi đáng kể.
	<0.1	Hiệu suất của mô hình rất thấp. Kỳ vọng hiệu suất phát hiện gian lận thấp.	Hiệu suất mô hình thấp. Mong đợi hiệu suất phát hiện gian lận hạn chế.	Không có cảnh báo

Huấn luyện một mô hình Khởi động Lạnh

Đào tạo mô hình gian lận Cold Start giống hệt với đào tạo bất kỳ mô hình Amazon Fraud Detector nào khác; điều khác biệt là kích thước tập dữ liệu. Bạn có thể tìm thấy bộ dữ liệu mẫu cho đào tạo Cold Start trong Kho lưu trữ GitHub. Để đào tạo một mô hình tùy chỉnh của Amazon Fraud Detector, bạn có thể làm theo hướng dẫn thực hành của chúng tôi hướng dẫn. Bạn có thể sử dụng Hướng dẫn bảng điều khiển Amazon Fraud Detector hoặc là Hướng dẫn SDK để xây dựng, đào tạo và triển khai mô hình phát hiện gian lận.

Sau khi mô hình của bạn được đào tạo, bạn có thể xem lại các chỉ số hiệu suất và sau đó triển khai nó bằng cách thay đổi trạng thái của nó thành hoạt động. Để tìm hiểu thêm về điểm số mô hình và chỉ số hiệu suất, hãy xem Điểm mô hình và Chỉ số hiệu suất mô hình. Tại thời điểm này, bây giờ bạn có thể thêm mô hình của mình vào máy dò, thêm quy tắc kinh doanh để giải thích điểm số rủi ro mà mô hình đưa ra và đưa ra dự đoán theo thời gian thực bằng cách sử dụng Nhận dự đoán sự kiện API.

Vòng phản hồi và cải tiến liên tục mô hình ML gian lận

Với tính năng Cold Start của Amazon Fraud Detector, bạn có thể nhanh chóng khởi động một điểm cuối phát hiện gian lận và bắt đầu bảo vệ doanh nghiệp của mình ngay lập tức. Tuy nhiên, các kiểu gian lận mới liên tục xuất hiện, do đó, điều quan trọng là phải đào tạo lại các mô hình Cold Start với dữ liệu mới hơn để cải thiện độ chính xác và hiệu quả của các dự đoán theo thời gian.

Để giúp bạn lặp lại các mô hình của mình, Amazon Fraud Detector tự động lưu trữ tất cả các sự kiện được gửi đến dịch vụ để suy luận. Bạn có thể thay đổi hoặc xác thực cờ nhập sự kiện được bật ở cấp loại sự kiện, như minh họa trong ảnh chụp màn hình sau.

Vượt qua thử thách khởi động nguội của máy học trong việc phát hiện gian lận bằng cách sử dụng Amazon Fraud Detector PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Với tính năng sự kiện được lưu trữ, bạn có thể sử dụng Amazon Fraud Detector SDK để truy cập vào một sự kiện theo chương trình, xem xét siêu dữ liệu sự kiện và giải thích dự đoán, đồng thời đưa ra quyết định rủi ro sáng suốt. Ngoài ra, bạn có thể gắn nhãn sự kiện để đào tạo lại mô hình trong tương lai và cải tiến mô hình liên tục. Sơ đồ sau đây cho thấy một ví dụ về quy trình làm việc này.

Trong đoạn mã sau, chúng tôi trình bày quy trình gắn nhãn sự kiện được lưu trữ:

Để thực hiện dự đoán gian lận theo thời gian thực cho một sự kiện, hãy gọi API GetEventPrediction:

import boto3 def get_event_prediction(): fraudDetector = boto3.client('frauddetector') prediction = fraudDetector.get_event_prediction( detectorId='your_detector_name', detectorVersionId='1', eventId='my-event-id-1234', eventTypeName='your_event_type', entities=[ { 'entityType': 'user', 'entityId': 'A12345' }, ], eventTimestamp= '2023-03-23T21:42:03.658Z', eventVariables={ 'email': 'test@anymockcompany.com', 'ip': '123.123.123.123', 'card_bin': '400022', 'billing_zip': '50401' } ) return(prediction)

Phản hồi API:

{ "modelScores": [ { "modelVersion": { "modelId": "your_model_name", "modelType": "TRANSACTION_FRAUD_INSIGHTS", "modelVersionNumber": "1.0" }, "scores": { "your_model_insightscore": 932 } } ], "ruleResults": [ { "ruleId": "high_risk_score", "outcomes": [ "high_risk_send_for_manual_review" ] } ]

Như đã thấy trong phản hồi, dựa trên quy tắc công cụ quyết định phù hợp, sự kiện sẽ được gửi để nhóm gian lận xem xét thủ công. Bằng cách thu thập siêu dữ liệu giải thích dự đoán, bạn có thể hiểu rõ hơn về cách mỗi biến sự kiện tác động đến điểm số dự đoán gian lận của mô hình.

Để thu thập những hiểu biết sâu sắc này, chúng tôi sử dụng get_event_prediction_metada API:

import boto3 def get_event_prediction_metadata(event, context): fraudDetector = boto3.client('frauddetector') prediction = fraudDetector.get_event_prediction_metadata( eventId = 'my-event-id-1234', eventTypeName = 'your_event_type', predictionTimestamp = '2023-03-23T21:44:39.318Z', detectorId = 'your_detector_name', detectorVersionId = '1' ) return(prediction)

Phản hồi API:

{ "modelScores": [ { "modelVersion": { "modelId": "your_model_name", "modelType": "TRANSACTION_FRAUD_INSIGHTS", "modelVersionNumber": "1.0" }, "scores": { "your_model_insightscore": 932 } } ], "ruleResults": [ { "ruleId": "high_risk_score", "outcomes": [ "high_risk_send_for_manual_review" ] } ] { "eventId": "my-event-id-1234", … <REDACTED> … "eventVariables": [ { "name": "ip", "value": "123.123.123.123" }, { "name": "billing_zip", "value": "50401" }, { "name": "email", "value": "test@anymockcompany.com" }, { "name": "card_bin", "value": "400022" } ],
… <REDACTED>
… "evaluations": [ { "evaluationScore": "932.0", "predictionExplanations": { "variableImpactExplanations": [ { "eventVariableName": "billing_zip", "relativeImpact": "1", "logOddsImpact": 1.018196990713477135 }, { "eventVariableName": "ip", "relativeImpact": "0", "logOddsImpact": -0.23122438788414001 }, { "eventVariableName": "email", "relativeImpact": "0", "logOddsImpact": 0.004304269328713417 }, { "eventVariableName": "card_bin", "relativeImpact": "0", "logOddsImpact": -0.011150157079100609 } ],
}

Với những thông tin chi tiết này, nhà phân tích gian lận có thể đưa ra quyết định rủi ro sáng suốt về sự kiện được đề cập và cập nhật nhãn sự kiện.

Để cập nhật nhãn sự kiện, hãy gọi update_event_label API:

import boto3 def update_event_label(event, context): fraudDetector = boto3.client('frauddetector') prediction = fraudDetector.update_event_label( eventId = "my-event-id-1234", eventTypeName = "your_event_type", assignedLabel='1', # Fraud labelTimestamp='2023-03-25T11:20:03.658Z' ) return(prediction)

Phản hồi API

{ "ResponseMetadata": { "RequestId": "3e28caa0-2a06-4b8d-9a10-9081811bf22d", "HTTPStatusCode": 200, … <REDACTED> … "RetryAttempts": 0 }
}

Ở bước cuối cùng, bạn có thể xác minh xem nhãn sự kiện đã được cập nhật chính xác hay chưa.

Để xác minh nhãn sự kiện, hãy gọi get_event API:

import boto3 def get_event(): fraudDetector = boto3.client('frauddetector') event = fraudDetector.get_event( eventId='my-event-id-1234', eventTypeName=’your_event_type' ) return(event)

Phản hồi API

{ "event": { "eventId": "my-event-id-1234", "eventTimestamp": "2023-03-23T21:42:03.658Z", "eventVariables": { "billing_zip": "50401", "card_bin": "400022", "email": "test@anymockcompany.com", "ip": "123.123.123.123" }, "currentLabel": "1", "labelTimestamp": "2023-03-25T11:20:03.658Z", "entities": [ { "entityType": "user", "entityId": "A12345" } ] }
}

Làm sạch

Để tránh bị tính phí trong tương lai, hãy xóa các tài nguyên đã tạo cho giải pháp.

Kết luận

Bài đăng này trình bày cách bạn có thể nhanh chóng khởi động hệ thống ngăn chặn gian lận theo thời gian thực với một vài sự kiện khoảng 100 sự kiện bằng cách sử dụng tính năng Cold Start mới của Amazon Fraud Detector. Chúng tôi đã thảo luận về cách bạn có thể sử dụng các sự kiện đã lưu trữ để xem xét kết quả và gắn nhãn chính xác cho các sự kiện cũng như đào tạo lại các mô hình của mình, nâng cao hiệu quả của các biện pháp ngăn chặn gian lận theo thời gian.

Các dịch vụ AWS được quản lý hoàn toàn như Amazon Fraud Detector giúp doanh nghiệp giảm thời gian phân tích hành vi của người dùng để xác định hành vi gian lận trong nền tảng của họ và tập trung hơn vào việc thúc đẩy giá trị kinh doanh. Để tìm hiểu thêm về cách Amazon Fraud Detector có thể hỗ trợ doanh nghiệp của bạn, hãy truy cập Công cụ phát hiện gian lận Amazon.

Về các tác giả

Marcel Pividal là Kiến trúc sư giải pháp dịch vụ AI cấp cao toàn cầu trong Tổ chức chuyên gia toàn cầu. Marcel có hơn 20 năm kinh nghiệm giải quyết các vấn đề kinh doanh thông qua công nghệ cho FinTech, nhà cung cấp dịch vụ thanh toán, dược phẩm và cơ quan chính phủ. Các lĩnh vực trọng tâm hiện tại của anh ấy là quản lý rủi ro, ngăn chặn gian lận và xác minh danh tính.

Julia Từ là một nhà khoa học nghiên cứu với Amazon Fraud Detector. Cô đam mê giải quyết các thách thức của khách hàng bằng kỹ thuật máy học. Khi rảnh rỗi, cô thích đi bộ đường dài, vẽ tranh và khám phá những quán cà phê mới.

Guilherme Ricci là Kiến trúc sư giải pháp cấp cao tại AWS, giúp các Công ty khởi nghiệp hiện đại hóa và tối ưu hóa chi phí ứng dụng của họ. Với hơn 10 năm kinh nghiệm làm việc với các công ty trong lĩnh vực tài chính, anh hiện đang làm việc cùng với đội ngũ chuyên gia AI/ML.

Phân phối nội dung và PR được hỗ trợ bởi SEO. Được khuếch đại ngay hôm nay.
Platoblockchain. Web3 Metaverse Intelligence. Khuếch đại kiến thức. Truy cập Tại đây.
Đúc kết tương lai với Adryenn Ashley. Truy cập Tại đây.
nguồn: https://aws.amazon.com/blogs/machine-learning/overcome-the-machine-learning-cold-start-challenge-in-fraud-detection-using-amazon-fraud-detector/

Dấu thời gian: 17 Tháng Tư, 2023

Dấu thời gian: Tháng 10, 2023

Được xuất bản lại bởi Plato

Sử dụng Amazon SageMaker Data Wrangler trong Amazon SageMaker Studio với cấu hình vòng đời mặc định

Giảm tới 90% mức tiêu thụ năng lượng cho khối lượng công việc học máy của bạn với các bộ tăng tốc được xây dựng có mục đích của AWS | Dịch vụ web của Amazon

Nâng cao trợ lý tự phục vụ của bạn bằng các tính năng AI tổng quát mới trong Amazon Lex | Dịch vụ web của Amazon

Về chúng tôi

Tìm kiếm dọc & Ai

Nền tảng

NHẬN THÔNG TIN

Tài khoản