Amazon SageMaker Canvas를 사용하여 코드 없는 기계 학습을 위해 40개 이상의 데이터 소스에서 데이터 가져오기

Amazon SageMaker Canvas를 사용하여 코드 없는 기계 학습을 위해 40개 이상의 데이터 소스에서 데이터 가져오기

데이터는 기계 학습(ML)의 핵심입니다. 비즈니스 문제를 포괄적으로 나타내는 관련 데이터를 포함하면 추세와 관계를 효과적으로 캡처하여 비즈니스 의사 결정을 내리는 데 필요한 통찰력을 얻을 수 있습니다. 와 함께 Amazon SageMaker 캔버스에서 데이터를 가져올 수 있습니다. 40개 이상의 데이터 소스 코드 없는 ML에 사용됩니다. Canvas는 비즈니스 분석가에게 ML 경험이 없거나 한 줄의 코드를 작성하지 않고도 자체적으로 정확한 ML 예측을 생성할 수 있는 시각적 인터페이스를 제공하여 ML에 대한 액세스를 확장합니다. 이제 다음과 같은 인기 있는 관계형 데이터 저장소에서 인앱 데이터를 가져올 수 있습니다. 아마존 아테나 에서 지원하는 타사 SaaS(Software as a Service) 플랫폼 아마존 AppFlow Salesforce, SAP OData 및 Google Analytics와 같은

ML을 위한 고품질 데이터를 수집하는 프로세스는 복잡하고 시간이 많이 소요될 수 있습니다. SaaS 애플리케이션 및 데이터 스토리지 서비스의 확산으로 인해 여러 시스템에 걸쳐 데이터가 분산되었기 때문입니다. 예를 들어 Salesforce의 고객 데이터, SAP의 재무 데이터, Snowflake의 물류 데이터를 사용하여 고객 이탈 분석을 수행해야 할 수 있습니다. 이러한 소스에서 데이터 세트를 생성하려면 각 애플리케이션에 개별적으로 로그인하고 원하는 데이터를 선택한 다음 로컬로 내보낸 다음 다른 도구를 사용하여 집계할 수 있어야 합니다. 그런 다음 이 데이터 세트를 별도의 ML용 애플리케이션으로 가져와야 합니다.

이번 출시로 Canvas는 40개 이상의 데이터 소스에서 인앱 데이터 가져오기 및 집계를 지원하여 서로 다른 소스에 저장된 데이터를 활용할 수 있도록 지원합니다. 이 기능은 다음을 통해 Athena 및 Amazon AppFlow에 대한 새로운 기본 커넥터를 통해 가능합니다. AWS 접착제 데이터 카탈로그. Amazon AppFlow는 타사 SaaS 애플리케이션에서 Amazon AppFlow로 데이터를 안전하게 전송할 수 있는 관리형 서비스입니다. 아마존 단순 스토리지 서비스 (Amazon S3) 몇 번의 클릭만으로 Data Catalog로 데이터를 카탈로그로 만들 수 있습니다. 데이터가 전송된 후 테이블 스키마를 보고, 데이터 소스 내부 또는 전체에서 테이블을 조인하고, Athena 쿼리를 작성하고, 데이터를 미리 보고 가져올 수 있는 Canvas 내의 데이터 소스에 간단히 액세스할 수 있습니다. 데이터를 가져온 후 ML 모델 구축, 열 영향 데이터 보기 또는 예측 생성과 같은 기존 Canvas 기능을 사용할 수 있습니다. Amazon AppFlow에서 데이터 전송 프로세스를 자동화하여 일정에 따라 활성화하여 항상 Canvas의 최신 데이터에 액세스할 수 있습니다.

솔루션 개요

이 게시물에 설명된 단계는 코드 없는 ML을 위해 데이터를 Canvas로 가져오는 방법에 대한 두 가지 예를 제공합니다. 첫 번째 예에서는 Athena를 통해 데이터를 가져오는 방법을 보여줍니다. 두 번째 예에서는 Amazon AppFlow를 통해 타사 SaaS 애플리케이션에서 데이터를 가져오는 방법을 보여줍니다.

Athena에서 데이터 가져오기

이 섹션에서는 고객 세분화 분석을 수행하기 위해 Athena에서 Canvas로 데이터를 가져오는 예를 보여줍니다. 우리는 ML 분류 모델을 생성하여 고객 기반을 XNUMX개의 서로 다른 클래스로 분류하고 모델을 사용하여 신규 고객이 어떤 클래스에 속할지 예측하는 최종 목표를 가지고 있습니다. 데이터 가져오기, 모델 훈련, 예측 생성의 세 가지 주요 단계를 따릅니다. 시작하자.

데이터 가져 오기

Athena에서 데이터를 가져오려면 다음 단계를 완료하십시오.

  1. Canvas 콘솔에서 다음을 선택합니다. 데이터 세트 탐색 창에서 다음을 선택합니다. 수입.
    Amazon SageMaker Canvas PlatoBlockchain 데이터 인텔리전스를 사용하여 코드 없는 기계 학습을 위해 40개 이상의 데이터 소스에서 데이터를 가져옵니다. 수직 검색. 일체 포함.
  2. 확장 데이터 소스 메뉴를 선택하고 아테나.
    Amazon SageMaker Canvas PlatoBlockchain 데이터 인텔리전스를 사용하여 코드 없는 기계 학습을 위해 40개 이상의 데이터 소스에서 데이터를 가져옵니다. 수직 검색. 일체 포함.
  3. 가져올 올바른 데이터베이스와 테이블을 선택하십시오. 선택적으로 미리 보기 아이콘을 선택하여 테이블을 미리 볼 수 있습니다.
    Amazon SageMaker Canvas PlatoBlockchain 데이터 인텔리전스를 사용하여 코드 없는 기계 학습을 위해 40개 이상의 데이터 소스에서 데이터를 가져옵니다. 수직 검색. 일체 포함.

다음 스크린샷은 미리보기 테이블의 예를 보여줍니다.

Amazon SageMaker Canvas PlatoBlockchain 데이터 인텔리전스를 사용하여 코드 없는 기계 학습을 위해 40개 이상의 데이터 소스에서 데이터를 가져옵니다. 수직 검색. 일체 포함.

이 예에서는 고객이 서비스에 참여한 마케팅 채널을 기준으로 고객을 분류합니다. 이것은 열에 의해 지정됩니다. segmentation, 여기서 A는 인쇄 매체, B는 모바일, C는 매장 내 프로모션, D는 텔레비전입니다.

  1. 올바른 테이블이 있다고 생각되면 원하는 테이블을 조인할 데이터 집합을 드래그 앤 드롭 안내
    Amazon SageMaker Canvas PlatoBlockchain 데이터 인텔리전스를 사용하여 코드 없는 기계 학습을 위해 40개 이상의 데이터 소스에서 데이터를 가져옵니다. 수직 검색. 일체 포함.
  2. 이제 선택적으로 열을 선택하거나 선택 취소하고 다른 테이블을 조인할 데이터 집합을 드래그 앤 드롭 섹션을 선택하거나 SQL 쿼리를 작성하여 데이터 조각을 지정합니다. 이 게시물에서는 테이블의 모든 데이터를 사용합니다.
  3. 데이터를 가져오려면 다음을 선택하십시오. 데이터를 가져옵니다.
    Amazon SageMaker Canvas PlatoBlockchain 데이터 인텔리전스를 사용하여 코드 없는 기계 학습을 위해 40개 이상의 데이터 소스에서 데이터를 가져옵니다. 수직 검색. 일체 포함.

데이터는 Athena의 특정 테이블에서 데이터 세트로 Canvas에 가져옵니다.

모델 훈련

데이터를 가져온 후에는 데이터 세트 페이지. 이 단계에서 모델을 만들 수 있습니다. 이렇게 하려면 다음 단계를 완료하십시오.

  1. 데이터 세트를 선택하고 모델 만들기.
    Amazon SageMaker Canvas PlatoBlockchain 데이터 인텔리전스를 사용하여 코드 없는 기계 학습을 위해 40개 이상의 데이터 소스에서 데이터를 가져옵니다. 수직 검색. 일체 포함.
  2. 럭셔리 모델 이름, 모델 이름을 입력하십시오(이 게시물의 경우, my_first_model).
  3. 캔버스를 사용하면 예측 분석, 이미지 분석 및 텍스트 분석을 위한 모델을 만들 수 있습니다. 고객을 분류하고 싶기 때문에 예측 분석 for 문제 유형.
  4. 계속하려면 다음을 선택하십시오. 만들기.
    Amazon SageMaker Canvas PlatoBlockchain 데이터 인텔리전스를 사용하여 코드 없는 기계 학습을 위해 40개 이상의 데이터 소스에서 데이터를 가져옵니다. 수직 검색. 일체 포함.

짓다 페이지에서 누락된 값의 백분율 및 데이터 평균과 같은 데이터 세트에 대한 통계를 볼 수 있습니다.

  1. 럭셔리 대상 열, 열을 선택합니다(이 게시물의 경우 segmentation).
    Amazon SageMaker Canvas PlatoBlockchain 데이터 인텔리전스를 사용하여 코드 없는 기계 학습을 위해 40개 이상의 데이터 소스에서 데이터를 가져옵니다. 수직 검색. 일체 포함.

Canvas는 예측을 생성할 수 있는 두 가지 유형의 모델을 제공합니다. 빠른 구축은 정확성보다 속도를 우선시하여 2~15분 안에 모델을 제공합니다. 표준 빌드는 속도보다 정확성을 우선시하여 2-4시간 내에 모델을 제공합니다.

  1. 이 게시물의 경우 선택 빠른 빌드.
    Amazon SageMaker Canvas PlatoBlockchain 데이터 인텔리전스를 사용하여 코드 없는 기계 학습을 위해 40개 이상의 데이터 소스에서 데이터를 가져옵니다. 수직 검색. 일체 포함.
  2. 모델이 학습된 후 모델 정확도를 분석할 수 있습니다.

다음 모델은 고객을 94.67%의 시간 동안 정확하게 분류합니다.

Amazon SageMaker Canvas PlatoBlockchain 데이터 인텔리전스를 사용하여 코드 없는 기계 학습을 위해 40개 이상의 데이터 소스에서 데이터를 가져옵니다. 수직 검색. 일체 포함.

  1. 선택적으로 각 열이 분류에 미치는 영향을 볼 수도 있습니다. 이 예에서 고객의 나이가 들면 열이 분류에 미치는 영향이 줄어듭니다. 새 모델로 예측을 생성하려면 다음을 선택하십시오. 예측.
    Amazon SageMaker Canvas PlatoBlockchain 데이터 인텔리전스를 사용하여 코드 없는 기계 학습을 위해 40개 이상의 데이터 소스에서 데이터를 가져옵니다. 수직 검색. 일체 포함.

예측 생성

예측 탭에서 일괄 예측과 단일 예측을 모두 생성할 수 있습니다. 다음 단계를 완료하십시오.

  1. 이 게시물의 경우 선택 단일 예측 새로운 고객에게 어떤 고객 세분화가 발생할지 이해합니다.
    Amazon SageMaker Canvas PlatoBlockchain 데이터 인텔리전스를 사용하여 코드 없는 기계 학습을 위해 40개 이상의 데이터 소스에서 데이터를 가져옵니다. 수직 검색. 일체 포함.

우리의 예측을 위해 고객이 32세이고 전문직 변호사인 경우 고객이 어떻게 세분화되는지 이해하고자 합니다.

  1. 해당 값을 이러한 입력으로 바꿉니다.
  2. 왼쪽 메뉴에서 업데이트.
    Amazon SageMaker Canvas PlatoBlockchain 데이터 인텔리전스를 사용하여 코드 없는 기계 학습을 위해 40개 이상의 데이터 소스에서 데이터를 가져옵니다. 수직 검색. 일체 포함.

업데이트된 예측이 예측 창에 표시됩니다. 이 예에서 32세 변호사는 세그먼트 D로 분류됩니다.

Amazon SageMaker Canvas PlatoBlockchain 데이터 인텔리전스를 사용하여 코드 없는 기계 학습을 위해 40개 이상의 데이터 소스에서 데이터를 가져옵니다. 수직 검색. 일체 포함.

타사 SaaS 애플리케이션에서 AWS로 데이터 가져오기

코드 없는 ML을 위해 타사 SaaS 애플리케이션에서 Canvas로 데이터를 가져오려면 먼저 Amazon AppFlow를 통해 애플리케이션에서 Amazon S3로 데이터를 전송해야 합니다. 이 예에서는 SAP OData에서 제조 데이터를 전송합니다.

데이터를 전송하려면 다음 단계를 완료하십시오.

  1. Amazon AppFlow 콘솔에서 흐름 만들기.
    Amazon SageMaker Canvas PlatoBlockchain 데이터 인텔리전스를 사용하여 코드 없는 기계 학습을 위해 40개 이상의 데이터 소스에서 데이터를 가져옵니다. 수직 검색. 일체 포함.
  2. 럭셔리 흐름 이름이름을 입력하십시오.
  3. 왼쪽 메뉴에서 다음 보기.
    Amazon SageMaker Canvas PlatoBlockchain 데이터 인텔리전스를 사용하여 코드 없는 기계 학습을 위해 40개 이상의 데이터 소스에서 데이터를 가져옵니다. 수직 검색. 일체 포함.
  4. 럭셔리 소스 이름, 원하는 타사 SaaS 애플리케이션(이 게시물의 경우 SAP OData)을 선택합니다.
  5. 왼쪽 메뉴에서 새 연결 만들기.
    Amazon SageMaker Canvas PlatoBlockchain 데이터 인텔리전스를 사용하여 코드 없는 기계 학습을 위해 40개 이상의 데이터 소스에서 데이터를 가져옵니다. 수직 검색. 일체 포함.
  6. . SAP OData에 연결 팝업 창에서 인증 정보를 입력하고 선택하십시오. 연결하기.
    Amazon SageMaker Canvas PlatoBlockchain 데이터 인텔리전스를 사용하여 코드 없는 기계 학습을 위해 40개 이상의 데이터 소스에서 데이터를 가져옵니다. 수직 검색. 일체 포함.
  7. 럭셔리 SAP OData 객체, SAP OData 내에서 데이터가 포함된 개체를 선택합니다.
  8. 럭셔리 목적지 이름선택한다. 아마존 S3.
  9. 럭셔리 버킷 세부정보, S3 버킷 세부 정보를 지정합니다.
  10. 선택 AWS Glue 데이터 카탈로그에서 데이터 카탈로그화.
  11. 럭셔리 사용자 역할을 선택하십시오 AWS 자격 증명 및 액세스 관리 (IAM) Canvas 사용자가 데이터에 액세스하는 데 사용할 역할.
  12. 럭셔리 흐름 트리거, 고르다 주문형 실행.

또는 다음을 선택하여 흐름 전송을 자동화할 수 있습니다. 일정에 따라 흐름 실행.

  1. 왼쪽 메뉴에서 다음 보기.
    Amazon SageMaker Canvas PlatoBlockchain 데이터 인텔리전스를 사용하여 코드 없는 기계 학습을 위해 40개 이상의 데이터 소스에서 데이터를 가져옵니다. 수직 검색. 일체 포함.
  2. 필드 매핑 방법을 선택하고 필드 매핑을 완료합니다. 이 게시물의 경우 매핑할 해당 대상 데이터베이스가 없으므로 매핑을 지정할 필요가 없습니다.
  3. 왼쪽 메뉴에서 다음.
    Amazon SageMaker Canvas PlatoBlockchain 데이터 인텔리전스를 사용하여 코드 없는 기계 학습을 위해 40개 이상의 데이터 소스에서 데이터를 가져옵니다. 수직 검색. 일체 포함.
  4. 선택적으로 필요한 경우 필터를 추가하여 전송되는 데이터를 제한하십시오.
  5. 왼쪽 메뉴에서 다음 보기.
    Amazon SageMaker Canvas PlatoBlockchain 데이터 인텔리전스를 사용하여 코드 없는 기계 학습을 위해 40개 이상의 데이터 소스에서 데이터를 가져옵니다. 수직 검색. 일체 포함.
  6. 세부정보를 검토하고 선택하세요. 흐름 만들기.
    Amazon SageMaker Canvas PlatoBlockchain 데이터 인텔리전스를 사용하여 코드 없는 기계 학습을 위해 40개 이상의 데이터 소스에서 데이터를 가져옵니다. 수직 검색. 일체 포함.

흐름이 생성되면 성공적으로 업데이트되었음을 ​​나타내는 녹색 리본이 페이지 상단에 채워집니다.

  1. 왼쪽 메뉴에서 흐름 실행.
    Amazon SageMaker Canvas PlatoBlockchain 데이터 인텔리전스를 사용하여 코드 없는 기계 학습을 위해 40개 이상의 데이터 소스에서 데이터를 가져옵니다. 수직 검색. 일체 포함.

이 단계에서 SAP OData에서 Amazon S3로 데이터를 성공적으로 전송했습니다.

이제 Canvas 앱 내에서 데이터를 가져올 수 있습니다. Canvas에서 데이터를 가져오려면 데이터 가져 오기 이 게시물 앞부분의 섹션. 이 예에서는 데이터 소스 드롭 다운 메뉴 데이터 가져 오기 페이지, 당신은 볼 수 있습니다 SAP 오데이터 나열되어 있습니다.

Amazon SageMaker Canvas PlatoBlockchain 데이터 인텔리전스를 사용하여 코드 없는 기계 학습을 위해 40개 이상의 데이터 소스에서 데이터를 가져옵니다. 수직 검색. 일체 포함.

이제 데이터 정리, ML 모델 구축, 열 영향 데이터 보기 및 예측 생성과 같은 모든 기존 Canvas 기능을 사용할 수 있습니다.

정리

프로비저닝된 리소스를 정리하려면 다음을 선택하여 Canvas 애플리케이션에서 로그아웃합니다. 로그아웃 탐색 창에서

Amazon SageMaker Canvas PlatoBlockchain 데이터 인텔리전스를 사용하여 코드 없는 기계 학습을 위해 40개 이상의 데이터 소스에서 데이터를 가져옵니다. 수직 검색. 일체 포함.

결론

Canvas를 사용하면 이제 AWS Glue 데이터 카탈로그를 통해 Athena 및 Amazon AppFlow의 기본 커넥터를 통해 47개의 데이터 소스에서 코드 없는 ML용 데이터를 가져올 수 있습니다. 이 프로세스를 통해 데이터가 Amazon AppFlow를 통해 전송된 후 Canvas 내의 데이터 소스 전체에서 데이터에 직접 액세스하고 집계할 수 있습니다. 데이터 전송을 자동화하여 일정에 따라 활성화할 수 있습니다. 즉, 데이터를 새로 고치기 위해 프로세스를 다시 거칠 필요가 없습니다. 이 프로세스를 통해 Canvas 앱을 종료하지 않고도 최신 데이터로 새 데이터 세트를 만들 수 있습니다. 이 기능은 이제 Canvas를 사용할 수 있는 모든 AWS 리전에서 사용할 수 있습니다. 데이터 가져오기를 시작하려면 Canvas 콘솔로 이동하여 이 게시물에 설명된 단계를 따르세요. 자세한 내용은 다음을 참조하십시오. 데이터 소스에 연결.


저자 소개

Amazon SageMaker Canvas PlatoBlockchain 데이터 인텔리전스를 사용하여 코드 없는 기계 학습을 위해 40개 이상의 데이터 소스에서 데이터를 가져옵니다. 수직 검색. 일체 포함.브랜든 나이어 Amazon SageMaker Canvas의 선임 제품 관리자입니다. 그의 전문적인 관심은 확장 가능한 기계 학습 서비스 및 애플리케이션을 만드는 데 있습니다. 직장 밖에서는 국립공원을 탐험하거나 골프 스윙을 완벽하게 하거나 모험 여행을 계획하는 모습을 볼 수 있습니다.

Amazon SageMaker Canvas PlatoBlockchain 데이터 인텔리전스를 사용하여 코드 없는 기계 학습을 위해 40개 이상의 데이터 소스에서 데이터를 가져옵니다. 수직 검색. 일체 포함.산자나 캄발라팔리 코드 없는 ML 애플리케이션을 구축하여 기계 학습의 민주화를 목표로 하는 AWS Sagemaker Canvas의 소프트웨어 개발 관리자입니다.

Amazon SageMaker Canvas PlatoBlockchain 데이터 인텔리전스를 사용하여 코드 없는 기계 학습을 위해 40개 이상의 데이터 소스에서 데이터를 가져옵니다. 수직 검색. 일체 포함.쉬신 Canvas 팀의 소프트웨어 개발 엔지니어로서 코드 없는 기계 학습 제품의 다른 측면 중에서 데이터 준비 작업을 수행합니다. 여가 시간에는 조깅, 독서, 영화 감상을 즐깁니다.

Amazon SageMaker Canvas PlatoBlockchain 데이터 인텔리전스를 사용하여 코드 없는 기계 학습을 위해 40개 이상의 데이터 소스에서 데이터를 가져옵니다. 수직 검색. 일체 포함.볼칸 운살 그는 Canvas 팀의 수석 프런트엔드 엔지니어로 인간이 인공 지능에 액세스할 수 있도록 코드 없는 제품을 구축합니다. 여가 시간에는 달리기, 독서, e스포츠 관람, 무술을 즐깁니다.

타임 스탬프 :

더보기 AWS 기계 학습