Brug kodefri maskinlæring til at udlede indsigt fra produktanmeldelser ved hjælp af Amazon SageMaker Canvas sentimentanalyse og tekstanalysemodeller | Amazon Web Services

Brug kodefri maskinlæring til at udlede indsigt fra produktanmeldelser ved hjælp af Amazon SageMaker Canvas sentimentanalyse og tekstanalysemodeller | Amazon Web Services

Ifølge Gartner, 85 % af softwarekøbere stoler lige så meget på onlineanmeldelser som personlige anbefalinger. Kunder giver feedback og anmeldelser om produkter, de har købt gennem mange kanaler, herunder anmeldelseswebsteder, leverandørwebsteder, salgsopkald, sociale medier og mange andre. Problemet med den stigende mængde af kundeanmeldelser på tværs af flere kanaler er, at det kan være udfordrende for virksomheder at behandle og udlede meningsfuld indsigt fra dataene ved hjælp af traditionelle metoder. Machine learning (ML) kan analysere store mængder produktanmeldelser og identificere mønstre, følelser og emner, der diskuteres. Med disse oplysninger kan virksomheder få en bedre forståelse af kundepræferencer, smertepunkter og tilfredshedsniveauer. De kan også bruge disse oplysninger til at forbedre produkter og tjenester, identificere tendenser og tage strategiske handlinger, der driver virksomhedens vækst. Implementering af ML kan dog være en udfordring for virksomheder, der mangler ressourcer, såsom ML-praktikere, dataforskere eller udviklere af kunstig intelligens (AI). Med det nye Amazon SageMaker lærred funktioner, kan forretningsanalytikere nu bruge ML til at udlede indsigt fra produktanmeldelser.

SageMaker Canvas er designet til at bruge forretningsanalytikeres funktionelle behov AWS ingen kode ML til ad hoc analyse af tabeldata. SageMaker Canvas er en visuel peg-og-klik-tjeneste, der giver forretningsanalytikere mulighed for at generere nøjagtige ML-forudsigelser uden at skrive en enkelt kodelinje eller kræve ML-ekspertise. Du kan bruge modeller til at lave forudsigelser interaktivt og til batch-scoring på massedatasæt. SageMaker Canvas tilbyder fuldt administrerede klar-til-brug AI-modeller og tilpassede modelløsninger. Til almindelige ML-brugstilfælde kan du bruge en klar-til-brug AI-model til at generere forudsigelser med dine data uden modeltræning. For ML-brugstilfælde, der er specifikke for dit forretningsdomæne, kan du træne en ML-model med dine egne data til tilpasset forudsigelse.

I dette indlæg demonstrerer vi, hvordan man bruger den brugsklare sentimentanalysemodel og den tilpassede tekstanalysemodel til at udlede indsigt fra produktanmeldelser. I dette tilfælde har vi et sæt syntetiserede produktanmeldelser, som vi ønsker at analysere for følelser og kategorisere anmeldelserne efter produkttype, for at gøre det nemt at tegne mønstre og tendenser, der kan hjælpe forretningsinteressenter med at træffe bedre informerede beslutninger. Først beskriver vi trinene til at bestemme stemningen i anmeldelserne ved hjælp af den brugsklare stemningsanalysemodel. Derefter leder vi dig gennem processen for at træne en tekstanalysemodel til at kategorisere anmeldelserne efter produkttype. Dernæst forklarer vi, hvordan man gennemgår den trænede model for ydeevne. Til sidst forklarer vi, hvordan man bruger den trænede model til at udføre forudsigelser.

Følelsesanalyse er en naturlig sprogbehandling (NLP) klar-til-brug-model, der analyserer tekst for følelser. Sentimentanalyse kan køres for enkeltlinje- eller batchforudsigelser. De forudsagte følelser for hver tekstlinje er enten positive, negative, blandede eller neutrale.

Tekstanalyse giver dig mulighed for at klassificere tekst i to eller flere kategorier ved hjælp af brugerdefinerede modeller. I dette indlæg ønsker vi at klassificere produktanmeldelser baseret på produkttype. For at træne en tilpasset tekstanalysemodel leverer du blot et datasæt bestående af teksten og de tilhørende kategorier i en CSV-fil. Datasættet kræver minimum to kategorier og 125 rækker tekst pr. kategori. Efter at modellen er trænet, kan du gennemgå modellens ydeevne og genoptræne modellen, hvis det er nødvendigt, før du bruger den til forudsigelser.

Forudsætninger

Fuldfør følgende forudsætninger:

  1. har du en AWS-konto.
  2. Opsætning SageMaker lærred.
  3. Download eksempler på produktanmeldelser datasæt:
    • sample_product_reviews.csv – Indeholder 2,000 syntetiserede produktanmeldelser og bruges til sentimentanalyse og tekstanalyse forudsigelser.
    • sample_product_reviews_training.csv – Indeholder 600 syntetiserede produktanmeldelser og tre produktkategorier og er til tekstanalysemodeltræning.

Følelsesanalyse

Først bruger du følelsesanalyse til at bestemme følelserne i produktanmeldelserne ved at udføre følgende trin.

  1. SageMaker konsolklik Lærred i navigationsruden, og klik derefter Åbn lærred for at åbne SageMaker Canvas-applikationen.
  2. Klik Klar til brug modeller i navigationsruden, og klik derefter Følelsesanalyse.
  3. Klik Batch forudsigelse, og klik derefter på Opret datasæt.
  4. Giv en Datasætnavn og klik Opret.
  5. Klik Vælg filer fra din computer for at importere sample_product_reviews.csv datasæt.
  6. Klik Opret datasæt og gennemgå dataene. Den første kolonne indeholder anmeldelserne og bruges til sentimentanalyse. Den anden kolonne indeholder anmeldelses-id'et og bruges kun til reference.
  7. Klik Opret datasæt for at fuldføre dataoverførselsprocessen.
  8. I Vælg datasæt til forudsigelser vis, vælg sample_product_reviews.csv og klik derefter på Generer forudsigelser. 
  9. Når batch-forudsigelsen er færdig, skal du klikke Specifikation for at se forudsigelserne.

Stemningsanalysetrin

Kolonnerne Følelse og Tillid angiver henholdsvis stemnings- og tillidsscore. En konfidensscore er en statistisk værdi mellem 0 og 100 %, der viser sandsynligheden for, at stemningen er korrekt forudsagt.

  1. Klik Download CSV for at downloade resultaterne til din computer.

Tekstanalyse

I dette afsnit gennemgår vi trinene til at udføre tekstanalyse med en brugerdefineret model: importere data, træne modellen og derefter lave forudsigelser.

Importer dataene

Importer først træningsdatasættet. Udfør følgende trin:

  1. On Klar til brug modeller side, skal du klikke på Opret en brugerdefineret model
  2. Til Modelnavn, indtast et navn (f.eks. Product Reviews Analysis). Klik på Tekstanalyse, Klik derefter på Opret.
  3. Type fanebladet, klik på Opret datasæt for at importere sample_product_reviews_training.csv datasæt.
  4. Giv en Datasætnavn og klik Opret.
  5. Klik Opret datasæt og gennemgå dataene. Træningsdatasættet indeholder en tredje kolonne, der beskriver produktkategori, og målkolonnen består af tre produkter: bøger, video og musik.
  6. Klik Opret datasæt for at fuldføre dataoverførselsprocessen.
  7. Vælg datasæt side, vælg sample_product_reviews_training.csv og klik Vælg datasæt.

Klassificeringstrin

Træn modellen

Dernæst konfigurerer du modellen til at begynde træningsprocessen.

  1. På Byg fanen på Målkolonne rullemenu, klik product_category som træningsmål.
  2. Klik product_review som kilde.
  3. Klik Hurtig opbygning at starte modeluddannelsen.

For mere information om forskellene mellem Quick build og Standard build, se Byg en tilpasset model.

Når modeltræningen er færdig, kan du gennemgå modellens ydeevne, før du bruger den til forudsigelse.

  1. Analyser fanen, vil modellens konfidensscore blive vist. En konfidensscore angiver, hvor sikker en model er på, at dens forudsigelser er korrekte. På den Oversigt fanen, gennemgå ydeevnen for hver kategori.
  2. Klik Scoring at gennemgå modellens nøjagtighedsindsigt.
  3. Klik Avancerede målinger at gennemgå forvirringsmatrix og F1-score.

Lav forudsigelser

For at lave en forudsigelse med din brugerdefinerede model skal du udføre følgende trin:

  1. Forudsige fanebladet, klik på Batch forudsigelse, og klik derefter på Manuel.
  2. Klik på det samme datasæt, sample_product_reviews.csv, som du tidligere brugte til sentimentanalysen, og klik derefter Generer forudsigelser.
  3. Når batch-forudsigelsen er færdig, skal du klikke Specifikation for at se forudsigelserne.

Til forudsigelse af tilpasset model tager det noget tid for SageMaker Canvas at implementere modellen til den første brug. SageMaker Canvas fjerner automatisk modellen, hvis den er inaktiv i 15 minutter for at spare omkostninger.

Prediction (Kategori) og Confidence kolonner viser henholdsvis de forudsagte produktkategorier og konfidensscore.

  1. Fremhæv det udførte job, vælg de tre prikker og klik Hent for at downloade resultaterne til din computer.

Ryd op

Klik Log ud i navigationsruden for at logge ud af SageMaker Canvas-applikationen for at stoppe forbruget af Lærred session timer og frigive alle ressourcer.

Konklusion

I dette indlæg demonstrerede vi, hvordan du kan bruge Amazon SageMaker lærred at udlede indsigt fra produktanmeldelser uden ML-ekspertise. Først brugte du en brugsklar model for sentimentanalyse til at bestemme følelserne i produktanmeldelserne. Dernæst brugte du tekstanalyse til at træne en tilpasset model med den hurtige byggeproces. Til sidst brugte du den trænede model til at kategorisere produktanmeldelserne i produktkategorier. Alt sammen uden at skrive en eneste linje kode. Vi anbefaler, at du gentager tekstanalyseprocessen med standardopbygningsprocessen for at sammenligne modelresultaterne og forudsigelsessikkerheden.


Om forfatterne

Brug kodefri maskinlæring til at udlede indsigt fra produktanmeldelser ved hjælp af Amazon SageMaker Canvas sentimentanalyse og tekstanalysemodeller | Amazon Web Services PlatoBlockchain Data Intelligence. Lodret søgning. Ai. Gavin Satur er Principal Solutions Architect hos Amazon Web Services. Han arbejder med virksomhedskunder for at bygge strategiske, veldesignede løsninger og brænder for automatisering. Uden for arbejdet nyder han familietid, tennis, madlavning og rejser.

Brug kodefri maskinlæring til at udlede indsigt fra produktanmeldelser ved hjælp af Amazon SageMaker Canvas sentimentanalyse og tekstanalysemodeller | Amazon Web Services PlatoBlockchain Data Intelligence. Lodret søgning. Ai.Les Chan er Sr. Solutions Architect hos Amazon Web Services, baseret i Irvine, Californien. Les brænder for at arbejde med virksomhedskunder om at adoptere og implementere teknologiske løsninger med det ene fokus på at fremme kundernes forretningsresultater. Hans ekspertise spænder over applikationsarkitektur, DevOps, serverløs og maskinlæring.

Brug kodefri maskinlæring til at udlede indsigt fra produktanmeldelser ved hjælp af Amazon SageMaker Canvas sentimentanalyse og tekstanalysemodeller | Amazon Web Services PlatoBlockchain Data Intelligence. Lodret søgning. Ai.Aaqib Bickiya er Solutions Architect hos Amazon Web Services baseret i det sydlige Californien. Han hjælper virksomhedskunder i detailhandelen med at accelerere projekter og implementere nye teknologier. Aaqibs fokusområder omfatter maskinlæring, serverløs, analytics og kommunikationstjenester

Tidsstempel:

Mere fra AWS maskinindlæring