Amazon SageMaker Canvas 감정 분석 및 텍스트 분석 모델을 사용하여 코드 없는 기계 학습을 사용하여 제품 리뷰에서 통찰력을 도출 | 아마존 웹 서비스

Amazon SageMaker Canvas 감정 분석 및 텍스트 분석 모델을 사용하여 코드 없는 기계 학습을 사용하여 제품 리뷰에서 통찰력을 도출 | 아마존 웹 서비스

에 따르면 가트너, 소프트웨어 구매자의 85%는 개인적인 추천만큼 온라인 리뷰를 신뢰합니다. 고객은 리뷰 웹사이트, 공급업체 웹사이트, 영업 전화, 소셜 미디어 등 다양한 채널을 통해 구매한 제품에 대한 피드백과 리뷰를 제공합니다. 여러 채널에 걸쳐 고객 리뷰의 양이 증가함에 따라 발생하는 문제는 기업이 기존 방법을 사용하여 데이터에서 의미 있는 통찰력을 처리하고 도출하는 것이 어려울 수 있다는 것입니다. 기계 학습(ML)은 대량의 제품 리뷰를 분석하고 논의된 패턴, 감정, 주제를 식별할 수 있습니다. 이 정보를 통해 기업은 고객 선호도, 불만 사항 및 만족도 수준을 더 잘 이해할 수 있습니다. 또한 이 정보를 사용하여 제품과 서비스를 개선하고 추세를 파악하며 비즈니스 성장을 촉진하는 전략적 조치를 취할 수 있습니다. 그러나 ML 구현은 ML 실무자, 데이터 과학자, 인공지능(AI) 개발자 등 리소스가 부족한 기업에게는 어려울 수 있습니다. 새로운 Amazon SageMaker 캔버스 기능을 통해 이제 비즈니스 분석가는 ML을 사용하여 제품 리뷰에서 통찰력을 얻을 수 있습니다.

SageMaker Canvas는 비즈니스 분석가가 사용하는 기능적 요구 사항에 맞춰 설계되었습니다. AWS 코드 없음 ML 표 형식 데이터의 임시 분석을 위해. SageMaker Canvas는 비즈니스 분석가가 코드 한 줄을 작성하거나 ML 전문 지식이 필요 없이 정확한 ML 예측을 생성할 수 있는 시각적인 포인트 앤 클릭 서비스입니다. 모델을 사용하여 대화형으로 예측하고 대량 데이터 세트에 대한 일괄 채점을 수행할 수 있습니다. SageMaker Canvas는 즉시 사용 가능한 완전 관리형 AI 모델 및 사용자 지정 모델 솔루션을 제공합니다. 일반적인 ML 사용 사례의 경우 즉시 사용 가능한 AI 모델을 사용하여 모델 교육 없이 데이터로 예측을 생성할 수 있습니다. 비즈니스 도메인과 관련된 ML 사용 사례의 경우 사용자 지정 예측을 위해 자체 데이터로 ML 모델을 교육할 수 있습니다.

이 게시물에서는 즉시 사용 가능한 감정 분석 모델과 사용자 정의 텍스트 분석 모델을 사용하여 제품 리뷰에서 통찰력을 얻는 방법을 보여줍니다. 이 사용 사례에는 감정을 분석하고 리뷰를 제품 유형별로 분류하여 비즈니스 이해관계자가 더 나은 정보에 입각한 결정을 내리는 데 도움이 될 수 있는 패턴과 추세를 쉽게 도출할 수 있는 합성된 제품 리뷰 세트가 있습니다. 먼저, 즉시 사용 가능한 감정 분석 모델을 사용하여 리뷰의 감정을 결정하는 단계를 설명합니다. 그런 다음 제품 유형별로 리뷰를 분류하기 위해 텍스트 분석 모델을 교육하는 프로세스를 안내합니다. 다음으로 학습된 모델의 성능을 검토하는 방법을 설명합니다. 마지막으로 학습된 모델을 사용하여 예측을 수행하는 방법을 설명합니다.

감정 분석은 텍스트의 감정을 분석하는 즉시 사용 가능한 자연어 처리(NLP) 모델입니다. 단일 라인 또는 일괄 예측을 위해 감정 분석을 실행할 수 있습니다. 각 텍스트 줄에 대한 예측 감정은 긍정적, 부정적, 혼합 또는 중립입니다.

텍스트 분석을 사용하면 사용자 정의 모델을 사용하여 텍스트를 두 개 이상의 범주로 분류할 수 있습니다. 이번 포스팅에서는 상품 종류에 따라 상품평을 분류해 보도록 하겠습니다. 텍스트 분석 사용자 정의 모델을 교육하려면 텍스트와 관련 카테고리로 구성된 데이터 세트를 CSV 파일로 제공하기만 하면 됩니다. 데이터세트에는 최소 125개의 카테고리와 카테고리당 XNUMX행의 텍스트가 필요합니다. 모델이 훈련된 후에는 예측에 사용하기 전에 모델의 성능을 검토하고 필요한 경우 모델을 다시 훈련할 수 있습니다.

사전 조건

다음 전제 조건을 완료하십시오.

  1. AWS 계정.
  2. 설정 SageMaker 캔버스.
  3. 를 다운로드 샘플 제품 리뷰 데이터 세트:
    • sample_product_reviews.csv – 2,000개의 합성된 제품 리뷰가 포함되어 있으며 감정 분석 및 텍스트 분석 예측에 사용됩니다.
    • sample_product_reviews_training.csv – 600개의 합성된 제품 리뷰와 XNUMX개의 제품 카테고리가 포함되어 있으며 텍스트 분석 모델 교육용입니다.

감정 분석

먼저 다음 단계를 완료하여 감정 분석을 사용하여 제품 리뷰의 감정을 결정합니다.

  1. SageMaker 콘솔클릭 캔버스 탐색 창에서 다음을 클릭하세요. 오픈 캔버스 SageMaker Canvas 애플리케이션을 엽니다.
  2. 즉시 사용 가능한 모델 탐색 창에서 다음을 클릭하세요. 감정 분석.
  3. 일괄 예측다음을 클릭합니다 데이터 세트를 만듭니다.
  4. 을 제공 데이터 세트 이름 클릭 만듭니다.
  5. 컴퓨터에서 파일 선택 가져 오기 sample_product_reviews.csv 데이터 세트.
  6. 데이터 세트 만들기 그리고 데이터를 검토해 보세요. 첫 번째 열에는 리뷰가 포함되어 있으며 감정 분석에 사용됩니다. 두 번째 열에는 리뷰 ID가 포함되어 있으며 참조용으로만 사용됩니다.
  7. 데이터 세트 만들기 데이터 업로드 프로세스를 완료합니다.
  8. . 예측을 위한 데이터 세트 선택 보기, 선택 sample_product_reviews.csv 다음을 클릭합니다 예측을 생성합니다. 
  9. 일괄 예측이 완료되면 관측 예측을 보려면

감정 분석 단계

감정 및 신뢰도 열은 각각 감정 및 신뢰도 점수를 제공합니다. 신뢰도 점수는 0~100% 사이의 통계 값으로, 감정이 올바르게 예측될 확률을 보여줍니다.

  1. CSV 다운로드 결과를 컴퓨터에 다운로드합니다.

텍스트 분석

이 섹션에서는 사용자 지정 모델을 사용하여 텍스트 분석을 수행하는 단계(데이터 가져오기, 모델 교육, 예측 수행)를 수행합니다.

데이터 가져 오기

먼저 훈련 데이터 세트를 가져옵니다. 다음 단계를 완료하세요.

  1. On 즉시 사용 가능한 모델 페이지 클릭 사용자 지정 모델 만들기
  2. 럭셔리 모델 이름, 이름을 입력하십시오 (예 : Product Reviews Analysis). 딸깍 하는 소리 텍스트 분석, 다음을 클릭하십시오. 만듭니다.
  3. 선택 탭에서 데이터 세트 만들기 가져 오기 sample_product_reviews_training.csv 데이터 세트.
  4. 을 제공 데이터 세트 이름 클릭 만듭니다.
  5. 데이터 세트 만들기 그리고 데이터를 검토해 보세요. 학습 데이터세트에는 제품 카테고리를 설명하는 세 번째 열이 포함되어 있으며, 대상 열은 책, 비디오, 음악이라는 세 가지 제품으로 구성되어 있습니다.
  6. 데이터 세트 만들기 데이터 업로드 프로세스를 완료합니다.
  7. 데이터 세트 선택 페이지, 선택 sample_product_reviews_training.csv 클릭 데이터 세트 선택.

분류 단계

모델 훈련

다음으로 훈련 프로세스를 시작하도록 모델을 구성합니다.

  1. 에 짓다 탭에서 대상 열 드롭다운 메뉴, 클릭 product_category 훈련 목표로 삼았습니다.
  2. product_review 소스로.
  3. 빠른 빌드 모델 교육을 시작합니다.

빠른 빌드와 표준 빌드의 차이점에 대한 자세한 내용은 다음을 참조하세요. 사용자 정의 모델 구축.

모델 훈련이 완료되면 예측에 사용하기 전에 모델 성능을 검토할 수 있습니다.

  1. 분석 탭을 클릭하면 모델의 신뢰도 점수가 표시됩니다. 신뢰도 점수는 모델의 예측이 정확하다고 얼마나 확신하는지를 나타냅니다. 에 살펴보기 탭에서 각 카테고리의 실적을 검토하세요.
  2. 점수 모델 정확도 통찰력을 검토합니다.
  3. 고급 측정항목 그 (것)들을 검토하기 위하여 혼동 행렬과 F1 점수.

예상하다

커스텀 모델을 사용하여 예측하려면 다음 단계를 완료하세요.

  1. 예측 탭에서 일괄 예측다음을 클릭합니다 Manual.
  2. 동일한 데이터 세트를 클릭하고, sample_product_reviews.csv, 이전에 감정 분석에 사용한 다음 예측을 생성합니다.
  3. 일괄 예측이 완료되면 관측 예측을 보려면

사용자 지정 모델 예측의 경우 SageMaker Canvas가 초기 사용을 위해 모델을 배포하는 데 다소 시간이 걸립니다. SageMaker Canvas는 비용 절감을 위해 15분 동안 유휴 상태인 경우 자동으로 모델 프로비저닝을 해제합니다.

XNUMXD덴탈의 Prediction (카테고리) 및 Confidence 열은 각각 예측된 제품 카테고리와 신뢰도 점수를 제공합니다.

  1. 완료된 작업을 강조 표시하고 세 개의 점을 선택한 다음 다운로드 결과를 컴퓨터에 다운로드합니다.

정리

로그아웃 탐색 창에서 SageMaker Canvas 애플리케이션에서 로그아웃하여 소비를 중지합니다. 캔버스 세션 시간 모든 리소스를 해제합니다.

결론

이 게시물에서는 다음을 사용하는 방법을 시연했습니다. Amazon SageMaker 캔버스 ML 전문 지식 없이 제품 리뷰에서 통찰력을 도출합니다. 먼저, 즉시 사용 가능한 감정 분석 모델을 사용하여 제품 리뷰의 감정을 결정했습니다. 다음으로 텍스트 분석을 사용하여 빠른 빌드 프로세스로 사용자 정의 모델을 교육했습니다. 마지막으로 훈련된 모델을 사용하여 제품 리뷰를 제품 카테고리로 분류했습니다. 단 한 줄의 코드도 작성하지 않고 모든 작업을 수행할 수 있습니다. 모델 결과와 예측 신뢰도를 비교하려면 표준 빌드 프로세스로 텍스트 분석 프로세스를 반복하는 것이 좋습니다.


저자에 관하여

Amazon SageMaker Canvas 감정 분석 및 텍스트 분석 모델을 사용하여 코드 없는 기계 학습을 사용하여 제품 리뷰에서 통찰력을 도출 | Amazon Web Services PlatoBlockchain 데이터 인텔리전스. 수직 검색. 일체 포함. 개빈 새터 Amazon Web Services의 수석 솔루션 아키텍트입니다. 그는 기업 고객과 협력하여 전략적이고 잘 구성된 솔루션을 구축하고 자동화에 열정을 갖고 있습니다. 업무 외 시간에는 가족과 함께하는 시간, 테니스, 요리, 여행을 즐깁니다.

Amazon SageMaker Canvas 감정 분석 및 텍스트 분석 모델을 사용하여 코드 없는 기계 학습을 사용하여 제품 리뷰에서 통찰력을 도출 | Amazon Web Services PlatoBlockchain 데이터 인텔리전스. 수직 검색. 일체 포함.레 찬 캘리포니아주 어바인에 본사를 둔 Amazon Web Services의 수석 솔루션 설계자입니다. Les는 고객 비즈니스 성과 창출에만 초점을 맞춰 기술 솔루션을 채택하고 구현하는 데 있어 기업 고객과 협력하는 데 열정을 갖고 있습니다. 그의 전문 지식은 애플리케이션 아키텍처, DevOps, 서버리스 및 기계 학습에 걸쳐 있습니다.

Amazon SageMaker Canvas 감정 분석 및 텍스트 분석 모델을 사용하여 코드 없는 기계 학습을 사용하여 제품 리뷰에서 통찰력을 도출 | Amazon Web Services PlatoBlockchain 데이터 인텔리전스. 수직 검색. 일체 포함.아킵 비키야 남부 캘리포니아에 본사를 둔 Amazon Web Services의 솔루션 설계자입니다. 그는 소매 분야의 기업 고객이 프로젝트를 가속화하고 새로운 기술을 구현하도록 돕습니다. Aaqib의 중점 분야에는 기계 학습, 서버리스, 분석 및 통신 서비스가 포함됩니다.

타임 스탬프 :

더보기 AWS 기계 학습