Khi nhiều doanh nghiệp tăng cường sự hiện diện trực tuyến của họ để phục vụ khách hàng tốt hơn, các kiểu lừa đảo mới liên tục xuất hiện. Trong bối cảnh kỹ thuật số không ngừng phát triển ngày nay, nơi những kẻ lừa đảo ngày càng tinh vi hơn trong các chiến thuật của chúng, việc phát hiện và ngăn chặn các hoạt động gian lận như vậy đã trở thành điều tối quan trọng đối với các công ty và tổ chức tài chính.
Các hệ thống phát hiện gian lận dựa trên quy tắc truyền thống bị giới hạn ở khả năng lặp lại nhanh chóng khi chúng dựa vào các quy tắc và ngưỡng được xác định trước để gắn cờ hoạt động gian lận tiềm ẩn. Các hệ thống này có thể tạo ra một số lượng lớn thông báo sai, làm tăng đáng kể khối lượng điều tra thủ công do nhóm gian lận thực hiện. Hơn nữa, con người cũng dễ mắc lỗi và có khả năng hạn chế trong việc xử lý lượng lớn dữ liệu, khiến nỗ lực thủ công để phát hiện gian lận tốn nhiều thời gian, điều này có thể dẫn đến bỏ lỡ các giao dịch gian lận, gia tăng tổn thất và thiệt hại về uy tín.
Máy học (ML) đóng một vai trò quan trọng trong việc phát hiện gian lận vì nó có thể phân tích nhanh chóng và chính xác khối lượng dữ liệu lớn để xác định các mẫu bất thường và xu hướng gian lận có thể xảy ra. Hiệu suất của mô hình gian lận ML chủ yếu phụ thuộc vào chất lượng dữ liệu được đào tạo trên đó và đặc biệt đối với các mô hình được giám sát, dữ liệu được gắn nhãn chính xác là rất quan trọng. Trong ML, việc thiếu dữ liệu lịch sử quan trọng để đào tạo một mô hình được gọi là vấn đề khởi động nguội.
Trong thế giới phát hiện gian lận, sau đây là một số kịch bản bắt đầu nguội truyền thống:
- Xây dựng mô hình gian lận chính xác trong khi thiếu lịch sử giao dịch hoặc trường hợp gian lận
- Có thể phân biệt chính xác hoạt động hợp pháp với gian lận đối với khách hàng và tài khoản mới
- Các khoản thanh toán theo quyết định rủi ro đến một địa chỉ hoặc người thụ hưởng chưa từng thấy trước đây bởi hệ thống gian lận
Có nhiều cách để giải quyết cho những tình huống này. Ví dụ: bạn có thể sử dụng các mô hình chung, được gọi là mô hình một kích cỡ phù hợp với tất cả, thường được đào tạo trên nền tảng chia sẻ dữ liệu gian lận như các tập đoàn gian lận. Thách thức với cách tiếp cận này là không có doanh nghiệp nào giống nhau và các hướng tấn công gian lận thay đổi liên tục.
Một tùy chọn khác là sử dụng mô hình phát hiện bất thường không được giám sát để theo dõi và hiển thị hành vi bất thường giữa các sự kiện của khách hàng. Thách thức với phương pháp này là không phải tất cả các sự kiện gian lận đều là bất thường và không phải tất cả các bất thường đều thực sự là gian lận. Do đó, bạn có thể mong đợi tỷ lệ dương tính giả cao hơn.
Trong bài đăng này, chúng tôi trình bày cách bạn có thể nhanh chóng khởi động mô hình ML ngăn chặn gian lận theo thời gian thực chỉ với 100 sự kiện bằng cách sử dụng Phát hiện gian lận Amazon tính năng mới, Bắt đầu lạnh, do đó làm giảm đáng kể rào cản gia nhập các mô hình ML tùy chỉnh cho nhiều tổ chức đơn giản là không có thời gian hoặc khả năng thu thập và gắn nhãn chính xác các tập dữ liệu lớn. Hơn nữa, chúng ta thảo luận cách sử dụng các sự kiện được lưu trữ của Amazon Fraud Detector, bạn có thể xem lại kết quả và gắn nhãn chính xác cho các sự kiện để đào tạo lại các mô hình của mình, từ đó cải thiện hiệu quả của các biện pháp ngăn chặn gian lận theo thời gian.
Tổng quan về giải pháp
Amazon Fraud Detector là dịch vụ phát hiện gian lận được quản lý hoàn toàn, tự động phát hiện các hoạt động gian lận tiềm ẩn trực tuyến. Bạn có thể sử dụng Amazon Fraud Detector để xây dựng các mô hình phát hiện gian lận tùy chỉnh bằng cách sử dụng tập dữ liệu lịch sử của riêng bạn, thêm logic quyết định bằng công cụ quy tắc tích hợp và sắp xếp quy trình quyết định rủi ro chỉ bằng một lần bấm nút.
Trước đây, bạn phải cung cấp hơn 10,000 sự kiện được gắn nhãn với ít nhất 400 ví dụ về gian lận để đào tạo một mô hình. Với việc phát hành tính năng Cold Start, bạn có thể nhanh chóng đào tạo một mô hình với tối thiểu 100 sự kiện và ít nhất 50 sự kiện được phân loại là gian lận. So với yêu cầu dữ liệu ban đầu, đây là mức giảm 99% dữ liệu lịch sử và giảm 87% yêu cầu nhãn.
Tính năng Cold Start mới cung cấp các phương pháp thông minh để làm phong phú, mở rộng và lập mô hình rủi ro cho các tập dữ liệu nhỏ. Hơn nữa, Amazon Fraud Detector thực hiện gán nhãn và lấy mẫu cho các sự kiện chưa được gắn nhãn.
Các thử nghiệm được thực hiện với bộ dữ liệu công khai cho thấy rằng bằng cách giảm giới hạn xuống 50 gian lận và chỉ 100 sự kiện, bạn có thể xây dựng các mô hình ML gian lận luôn vượt trội so với các mô hình không được giám sát và bán giám sát.
Hiệu suất mô hình Cold Start
Khả năng khái quát hóa và đưa ra dự đoán chính xác của một mô hình ML đối với dữ liệu không nhìn thấy bị ảnh hưởng bởi chất lượng và tính đa dạng của tập dữ liệu huấn luyện. Đối với các mẫu Khởi động nguội, điều này cũng không khác. Bạn nên có sẵn các quy trình khi thu thập được nhiều dữ liệu hơn để gắn nhãn chính xác cho các sự kiện này và đào tạo lại các mô hình, cuối cùng dẫn đến hiệu suất mô hình tối ưu.
Với yêu cầu dữ liệu thấp hơn, tính không ổn định của hiệu suất được báo cáo sẽ tăng lên do phương sai của mô hình tăng lên và kích thước dữ liệu thử nghiệm hạn chế. Để giúp bạn xây dựng kỳ vọng phù hợp về hiệu suất của mô hình, bên cạnh AUC của mô hình, Amazon Fraud Detector còn báo cáo các số liệu về phạm vi không chắc chắn. Bảng sau đây xác định các số liệu này.
. | . | AUC | ||
. | . | <0.6 | 0.6 - 0.8 | > = 0.8 |
khoảng không chắc chắn AUC | > 0.3 | Hiệu suất mô hình rất thấp và có thể thay đổi rất nhiều. Kỳ vọng hiệu suất phát hiện gian lận thấp. | Hiệu suất mô hình thấp và có thể thay đổi rất nhiều. Mong đợi hiệu suất phát hiện gian lận hạn chế. | Hiệu suất mô hình có thể thay đổi rất nhiều. |
0.1 - 0.3 | Hiệu suất mô hình rất thấp và có thể thay đổi đáng kể. Kỳ vọng hiệu suất phát hiện gian lận thấp. | Hiệu suất mô hình thấp và có thể thay đổi đáng kể. Mong đợi hiệu suất phát hiện gian lận hạn chế. | Hiệu suất mô hình có thể thay đổi đáng kể. | |
<0.1 | Hiệu suất của mô hình rất thấp. Kỳ vọng hiệu suất phát hiện gian lận thấp. | Hiệu suất mô hình thấp. Mong đợi hiệu suất phát hiện gian lận hạn chế. | Không có cảnh báo |
Huấn luyện một mô hình Khởi động Lạnh
Đào tạo mô hình gian lận Cold Start giống hệt với đào tạo bất kỳ mô hình Amazon Fraud Detector nào khác; điều khác biệt là kích thước tập dữ liệu. Bạn có thể tìm thấy bộ dữ liệu mẫu cho đào tạo Cold Start trong Kho lưu trữ GitHub. Để đào tạo một mô hình tùy chỉnh của Amazon Fraud Detector, bạn có thể làm theo hướng dẫn thực hành của chúng tôi hướng dẫn. Bạn có thể sử dụng Hướng dẫn bảng điều khiển Amazon Fraud Detector hoặc là Hướng dẫn SDK để xây dựng, đào tạo và triển khai mô hình phát hiện gian lận.
Sau khi mô hình của bạn được đào tạo, bạn có thể xem lại các chỉ số hiệu suất và sau đó triển khai nó bằng cách thay đổi trạng thái của nó thành hoạt động. Để tìm hiểu thêm về điểm số mô hình và chỉ số hiệu suất, hãy xem Điểm mô hình và Chỉ số hiệu suất mô hình. Tại thời điểm này, bây giờ bạn có thể thêm mô hình của mình vào máy dò, thêm quy tắc kinh doanh để giải thích điểm số rủi ro mà mô hình đưa ra và đưa ra dự đoán theo thời gian thực bằng cách sử dụng Nhận dự đoán sự kiện API.
Vòng phản hồi và cải tiến liên tục mô hình ML gian lận
Với tính năng Cold Start của Amazon Fraud Detector, bạn có thể nhanh chóng khởi động một điểm cuối phát hiện gian lận và bắt đầu bảo vệ doanh nghiệp của mình ngay lập tức. Tuy nhiên, các kiểu gian lận mới liên tục xuất hiện, do đó, điều quan trọng là phải đào tạo lại các mô hình Cold Start với dữ liệu mới hơn để cải thiện độ chính xác và hiệu quả của các dự đoán theo thời gian.
Để giúp bạn lặp lại các mô hình của mình, Amazon Fraud Detector tự động lưu trữ tất cả các sự kiện được gửi đến dịch vụ để suy luận. Bạn có thể thay đổi hoặc xác thực cờ nhập sự kiện được bật ở cấp loại sự kiện, như minh họa trong ảnh chụp màn hình sau.
Với tính năng sự kiện được lưu trữ, bạn có thể sử dụng Amazon Fraud Detector SDK để truy cập vào một sự kiện theo chương trình, xem xét siêu dữ liệu sự kiện và giải thích dự đoán, đồng thời đưa ra quyết định rủi ro sáng suốt. Ngoài ra, bạn có thể gắn nhãn sự kiện để đào tạo lại mô hình trong tương lai và cải tiến mô hình liên tục. Sơ đồ sau đây cho thấy một ví dụ về quy trình làm việc này.
Trong đoạn mã sau, chúng tôi trình bày quy trình gắn nhãn sự kiện được lưu trữ:
- Để thực hiện dự đoán gian lận theo thời gian thực cho một sự kiện, hãy gọi API GetEventPrediction:
Như đã thấy trong phản hồi, dựa trên quy tắc công cụ quyết định phù hợp, sự kiện sẽ được gửi để nhóm gian lận xem xét thủ công. Bằng cách thu thập siêu dữ liệu giải thích dự đoán, bạn có thể hiểu rõ hơn về cách mỗi biến sự kiện tác động đến điểm số dự đoán gian lận của mô hình.
- Để thu thập những hiểu biết sâu sắc này, chúng tôi sử dụng
get_event_prediction_metada
API:
Phản hồi API:
Với những thông tin chi tiết này, nhà phân tích gian lận có thể đưa ra quyết định rủi ro sáng suốt về sự kiện được đề cập và cập nhật nhãn sự kiện.
- Để cập nhật nhãn sự kiện, hãy gọi
update_event_label
API:
Phản hồi API
Ở bước cuối cùng, bạn có thể xác minh xem nhãn sự kiện đã được cập nhật chính xác hay chưa.
- Để xác minh nhãn sự kiện, hãy gọi
get_event
API:
Phản hồi API
Làm sạch
Để tránh bị tính phí trong tương lai, hãy xóa các tài nguyên đã tạo cho giải pháp.
Kết luận
Bài đăng này trình bày cách bạn có thể nhanh chóng khởi động hệ thống ngăn chặn gian lận theo thời gian thực với một vài sự kiện khoảng 100 sự kiện bằng cách sử dụng tính năng Cold Start mới của Amazon Fraud Detector. Chúng tôi đã thảo luận về cách bạn có thể sử dụng các sự kiện đã lưu trữ để xem xét kết quả và gắn nhãn chính xác cho các sự kiện cũng như đào tạo lại các mô hình của mình, nâng cao hiệu quả của các biện pháp ngăn chặn gian lận theo thời gian.
Các dịch vụ AWS được quản lý hoàn toàn như Amazon Fraud Detector giúp doanh nghiệp giảm thời gian phân tích hành vi của người dùng để xác định hành vi gian lận trong nền tảng của họ và tập trung hơn vào việc thúc đẩy giá trị kinh doanh. Để tìm hiểu thêm về cách Amazon Fraud Detector có thể hỗ trợ doanh nghiệp của bạn, hãy truy cập Công cụ phát hiện gian lận Amazon.
Về các tác giả
Marcel Pividal là Kiến trúc sư giải pháp dịch vụ AI cấp cao toàn cầu trong Tổ chức chuyên gia toàn cầu. Marcel có hơn 20 năm kinh nghiệm giải quyết các vấn đề kinh doanh thông qua công nghệ cho FinTech, nhà cung cấp dịch vụ thanh toán, dược phẩm và cơ quan chính phủ. Các lĩnh vực trọng tâm hiện tại của anh ấy là quản lý rủi ro, ngăn chặn gian lận và xác minh danh tính.
Julia Từ là một nhà khoa học nghiên cứu với Amazon Fraud Detector. Cô đam mê giải quyết các thách thức của khách hàng bằng kỹ thuật máy học. Khi rảnh rỗi, cô thích đi bộ đường dài, vẽ tranh và khám phá những quán cà phê mới.
Guilherme Ricci là Kiến trúc sư giải pháp cấp cao tại AWS, giúp các Công ty khởi nghiệp hiện đại hóa và tối ưu hóa chi phí ứng dụng của họ. Với hơn 10 năm kinh nghiệm làm việc với các công ty trong lĩnh vực tài chính, anh hiện đang làm việc cùng với đội ngũ chuyên gia AI/ML.
- Phân phối nội dung và PR được hỗ trợ bởi SEO. Được khuếch đại ngay hôm nay.
- Platoblockchain. Web3 Metaverse Intelligence. Khuếch đại kiến thức. Truy cập Tại đây.
- Đúc kết tương lai với Adryenn Ashley. Truy cập Tại đây.
- nguồn: https://aws.amazon.com/blogs/machine-learning/overcome-the-machine-learning-cold-start-challenge-in-fraud-detection-using-amazon-fraud-detector/
- : có
- :là
- :không phải
- :Ở đâu
- 000
- 1
- 10
- 100
- 20
- 20 năm
- 200
- 39
- 50
- 7
- 8
- 9
- a
- có khả năng
- Có khả năng
- Giới thiệu
- truy cập
- chính xác
- chính xác
- chính xác
- hoạt động
- hoạt động
- địa chỉ
- cơ quan
- AI
- Dịch vụ AI
- AI / ML
- Tất cả
- Ngoài ra
- đàn bà gan dạ
- Phát hiện gian lận Amazon
- trong số
- số lượng
- an
- phân tích
- phân tích
- phân tích
- và
- phát hiện bất thường
- bất kì
- api
- các ứng dụng
- phương pháp tiếp cận
- LÀ
- khu vực
- AS
- At
- tấn công
- tự động hóa
- tự động
- AWS
- rào cản
- dựa
- BE
- bởi vì
- trở nên
- trở thành
- trước
- người thụ hưởng
- Hơn
- bootstrap
- xây dựng
- được xây dựng trong
- kinh doanh
- các doanh nghiệp
- nút
- by
- cuộc gọi
- gọi là
- CAN
- Sức chứa
- thách thức
- thách thức
- thay đổi
- thay đổi
- tải
- phân loại
- Nhấp chuột
- mã
- Cà Phê
- thu thập
- COM
- Các công ty
- so
- An ủi
- liên tục
- bối cảnh
- liên tục
- Chi phí
- tạo ra
- quan trọng
- quan trọng
- Current
- Hiện nay
- khách hàng
- khách hàng
- khách hàng
- tùy chỉnh
- dữ liệu
- chia sẻ dữ liệu
- bộ dữ liệu
- quyết định
- Xác định
- chứng minh
- chứng minh
- triển khai
- Phát hiện
- khác nhau
- kỹ thuật số
- thảo luận
- thảo luận
- phân biệt
- SỰ ĐA DẠNG
- do
- dont
- đột ngột
- lái xe
- mỗi
- hiệu quả
- những nỗ lực
- hay
- mới nổi
- Điểm cuối
- Động cơ
- làm giàu
- thực thể
- nhập
- đánh giá
- Sự kiện
- sự kiện
- ví dụ
- ví dụ
- mong đợi
- kỳ vọng
- kinh nghiệm
- giải thích
- Khám phá
- mở rộng
- sai
- Đặc tính
- thông tin phản hồi
- vài
- cuối cùng
- tài chính
- Học viện Tài chính
- Ngành tài chính
- Tìm kiếm
- fintechs
- Tập trung
- theo
- tiếp theo
- Trong
- gian lận
- phát hiện gian lận
- PHÒNG CHỐNG GIAN LẬN
- kẻ lừa đảo
- lừa đảo
- hoạt động gian lận
- Miễn phí
- từ
- đầy đủ
- Hơn nữa
- tương lai
- Thu được
- thu thập
- tạo ra
- Toàn cầu
- Chính phủ
- rất nhiều
- hands-on
- Có
- he
- nặng nề
- giúp đỡ
- giúp đỡ
- cao hơn
- lịch sử
- lịch sử
- Độ đáng tin của
- Tuy nhiên
- HTML
- HTTPS
- Con người
- giống hệt nhau
- xác định
- Bản sắc
- Xác minh danh tính
- ngay
- tác động
- nâng cao
- cải thiện
- cải thiện
- in
- Tăng lên
- tăng
- Tăng
- tăng
- thông báo
- ban đầu
- những hiểu biết
- bất ổn
- tổ chức
- Thông minh
- trong
- Điều tra
- IP
- IT
- ITS
- jpg
- nổi tiếng
- nhãn
- Thiếu sót
- cảnh quan
- lớn
- hàng đầu
- LEARN
- học tập
- Cấp
- Lượt thích
- Hạn chế
- giới hạn
- ít
- thiệt hại
- Thấp
- Hạ
- máy
- học máy
- làm cho
- Làm
- quản lý
- quản lý
- nhãn hiệu
- nhiều
- phù hợp
- các biện pháp
- Siêu dữ liệu
- phương pháp
- Metrics
- Might
- tối thiểu
- ML
- kiểu mẫu
- mô hình
- hiện đại hóa
- Màn Hình
- chi tiết
- Hơn thế nữa
- nhiều
- tên
- Mới
- tại
- con số
- of
- on
- Trực tuyến
- có thể
- tối ưu
- Tối ưu hóa
- Tùy chọn
- or
- cơ quan
- tổ chức
- Nền tảng khác
- vfoXNUMXfipXNUMXhfpiXNUMXufhpiXNUMXuf
- Vượt trội hơn
- kết thúc
- Vượt qua
- riêng
- Paramount
- đam mê
- mô hình
- thanh toán
- nhà cung cấp thanh toán
- thanh toán
- hiệu suất
- thực hiện
- Pharma
- Nơi
- Nền tảng
- plato
- Thông tin dữ liệu Plato
- PlatoDữ liệu
- Điểm
- tích cực
- có thể
- Bài đăng
- có khả năng
- dự đoán
- Dự đoán
- sự hiện diện
- ngăn chặn
- Phòng chống
- vấn đề
- quá trình
- Quy trình
- bảo vệ
- cho
- nhà cung cấp
- cung cấp
- công khai
- chất lượng
- câu hỏi
- Mau
- phạm vi
- Giá
- thời gian thực
- giảm
- phát hành
- Báo cáo
- Báo cáo
- yêu cầu
- Yêu cầu
- nghiên cứu
- Thông tin
- phản ứng
- kết quả
- Kết quả
- xem xét
- Nguy cơ
- quản lý rủi ro
- Vai trò
- Quy tắc
- quy tắc
- kịch bản
- Nhà khoa học
- Điểm số
- sdk
- ngành
- cao cấp
- phục vụ
- dịch vụ
- DỊCH VỤ
- bộ
- chia sẻ
- cửa hàng
- nên
- hiển thị
- thể hiện
- Chương trình
- có ý nghĩa
- đáng kể
- đơn giản
- Kích thước máy
- nhỏ
- So
- giải pháp
- Giải pháp
- động SOLVE
- Giải quyết
- một số
- tinh vi
- chuyên gia
- chuyên gia
- đặc biệt
- tiêu
- Bắt đầu
- Startups
- Trạng thái
- Bước
- lưu trữ
- cửa hàng
- như vậy
- Bề mặt
- hệ thống
- hệ thống
- bàn
- chiến thuật
- nhóm
- kỹ thuật
- Công nghệ
- thử nghiệm
- hơn
- việc này
- Sản phẩm
- thế giới
- cung cấp their dịch
- bằng cách ấy
- vì thế
- Kia là
- họ
- điều này
- Thông qua
- thời gian
- mất thời gian
- đến
- hôm nay
- bên nhau
- hàng đầu
- truyền thống
- Train
- đào tạo
- Hội thảo
- Giao dịch
- Xu hướng
- thường
- Cuối cùng
- Không chắc chắn
- Cập nhật
- cập nhật
- sử dụng
- người sử dang
- sử dụng
- HIỆU LỰC
- giá trị
- Xác minh
- xác minh
- Truy cập
- khối lượng
- khối lượng
- là
- cách
- we
- Điều gì
- cái nào
- trong khi
- với
- Luồng công việc
- đang làm việc
- thế giới
- năm
- Bạn
- trên màn hình
- zephyrnet