시각적으로 설명하는 딥 러닝

시각적 예시를 통한 딥러닝 이해

님이 촬영 한 사진 줄리앙 트로머 on Unsplash

딥러닝은 가장 강력한 AI 기술 중 하나이지만 이해하기 어려울 수 있습니다. 이번 블로그에서는 시각 자료와 예시를 사용하여 딥러닝을 설명하려고 합니다.

딥 러닝 아키텍처는 우리의 두뇌가 작동하는 방식에서 영감을 받았습니다. 뉴런의 연결입니다. 딥러닝 모델에는 많은 매개변수가 있을 수 있습니다. 매개변수의 수는 정교한 아키텍처에 대해 기하급수적으로 증가할 수 있는 레이어 및 뉴런의 수를 기반으로 합니다.

이번 블로그에서는 금융사기 탐지의 비즈니스 활용 사례를 다루겠습니다. 사기 탐지의 가장 큰 과제 중 하나는 클래스 불균형 문제입니다. 즉, 기계 학습 모델을 훈련하는 데 사용되는 데이터에는 사기 사례가 거의 없습니다.

딥 러닝 아키텍처(작성자 이미지)

이는 건초 더미에서 바늘을 찾기 위해 기계 학습 모델을 훈련하는 것과 같습니다. 사기 탐지는 딥 러닝 아키텍처와 같은 정교한 접근 방식을 정당화하는 특별한 문제입니다.

이 예에서는 은행 거래 시스템에서 데이터를 가져옵니다. 데이터는 여기에 표시된 것처럼 보입니다. 데이터에는 금융 거래 유형, 금액, 출발지 및 도착지의 기존 잔액, 새 잔액이 있습니다. 거래가 사기인지 아닌지를 나타내는 플래그도 있습니다.

데이터 세트에 대한 인용은 블로그 끝에서 확인할 수 있습니다.

사기 탐지 데이터(작성자 이미지)

데이터는 훈련 데이터와 테스트 데이터로 분할됩니다. 딥러닝 모델은 훈련 세트에서 개발된 후 테스트 데이터에서 검증됩니다. 그런 다음 이 모델을 사용하여 보이지 않는 데이터에 대한 사기를 예측할 수 있습니다.

학습/테스트 분할(작성자별 이미지)

사기 예측을 위한 딥러닝 모델은 다음과 같습니다. 입력 뉴런은 거래 데이터에 해당합니다. 각 뉴런은 출발지와 목적지의 거래 유형, 금액, 잔액 정보 등 입력 데이터의 열에 해당합니다.

하나의 중간 레이어가 있고 마지막 레이어에는 두 개의 뉴런이 있습니다. 하나는 사기 방지를 예측하고 다른 하나는 사기 방지를 예측합니다.

선은 서로 다른 레이어 사이에 전달되는 신호입니다. 녹색 선은 양의 신호를 나타내고 빨간색 선은 음의 신호를 나타냅니다.

사기 탐지를 위한 딥 러닝 모델(작성자 이미지)

우리는 뉴런 1_0이 뉴런 Fraud에 긍정적인 신호를 전달하고 있음을 알 수 있습니다.

이는 사기 거래가 어떻게 생겼는지 심층적으로 학습했다는 의미입니다! 신난다 !

뉴런 1_0은 뉴런 2_1에 긍정적인 신호를 전달합니다(사기)(작성자 이미지)

뉴런 1_0 내부를 살펴보겠습니다!

뉴런 내부 1_0 (저자 이미지)

레이더 차트는 뉴런이 데이터에 대해 학습한 내용을 나타냅니다. 파란색 선은 높은 값을 나타내고 빨간색 선은 낮은 값을 나타냅니다. 방사형 차트는 원점에서 높지만 거의 유사한 이전 균형과 새 균형을 나타냅니다. 그러나 목적지에서는 기존 잔액과 새 잔액의 차이가 매우 큽니다.

이러한 상황은 사기의 징후입니다. 이 상황은 아래에서 시각적으로 확인할 수 있습니다.

사기 거래가 어떻게 이루어지는지 시각적으로 보여줌(작성자 이미지)

여기에는 혼동 행렬을 사용한 딥러닝 모델의 정확도가 나와 있습니다.

혼동 행렬(저자별 이미지)

전체적으로 약 95000건의 거래가 있으며 그 중 사기 거래는 62건으로 전체 거래보다 극히 적습니다. 그러나 딥러닝 모델은 52를 사기로 정확하게 식별할 수 있어 좋은 결과를 보이고 있으며 이를 참양성(tp)이라고도 합니다.

1개의 거짓양성(fp)이 있습니다. 이는 사기가 아니지만 모델이 사기로 잘못 표시했음을 의미합니다. 따라서 정밀도(tp / (tp +fp))는 98%입니다.

또한 10개의 거짓음성(fn)이 있는데, 이는 사기 거래임을 의미하지만 우리 모델은 이를 예측할 수 없습니다. 따라서 측정 재현율은 83%인 tp / (tp +fn)입니다.

딥 러닝 아키텍처는 사기 탐지와 같은 복잡한 문제를 해결하는 데 도움이 되므로 매우 강력합니다. 딥러닝 아키텍처를 시각적으로 분석하는 방법은 아키텍처를 이해하고 문제를 해결하는 방법에 유용합니다.

사기 탐지를 위한 합성 금융 데이터 세트에 대한 데이터 소스 인용

사기 탐지를 위한 합성 금융 데이터 세트는 다음에서 확인할 수 있습니다. https://www.kaggle.com/competitions/spaceship-titanic/overview

라이선스 섹션에 명시된 대로 라이선스가 있습니다. CC BY-SA 4.0.

  • 공유 — 자료를 어떤 매체나 형식으로든 복사하고 재배포하세요.
  • 개조 하다 — 어떤 목적으로든, 심지어 상업적으로도 자료를 리믹스, 변형 및 제작할 수 있습니다.

XNUMX-XNUMX학년도 PTA 학교 위원회의 지명 후보를 확인하시려면 미디엄에 가입하세요 내 추천 링크로.

XNUMX-XNUMX학년도 PTA 학교 위원회의 지명 후보를 확인하시려면 가입 새로운 이야기를 발표할 때마다 최신 소식을 받아볼 수 있습니다.

내 웹사이트를 방문하면 코딩 없이 분석을 할 수 있습니다. https://experiencedatascience.com

웹사이트에서는 흥미롭고 혁신적인 데이터 과학 및 AI 경험을 위한 다가오는 AI 워크숍에도 참여할 수 있습니다.

내 YouTube 채널 링크는 다음과 같습니다.
https://www.youtube.com/c/DataScienceDemonstrated

시각적으로 설명된 딥 러닝은 https://towardsdatascience.com/feed를 통해 소스 https://towardsdatascience.com/deep-learning-visually-explained-a9fff874d280?source=rss—-7f60cf5620c9—4에서 다시 게시되었습니다.

<!–

–>

타임 스탬프 :

더보기 블록 체인 컨설턴트