Akselerer Time To Business Insights med Amazon SageMaker Data Wrangler Direkte tilkobling til Snowflake

Publisert av Platon

Følgere: 0

Amazon SageMaker Data Wrangler er et enkelt visuelt grensesnitt som reduserer tiden som kreves for å forberede data og utføre funksjonsutvikling fra uker til minutter med muligheten til å velge og rense data, lage funksjoner og automatisere dataforberedelse i maskinlæring (ML) arbeidsflyter uten å skrive noen kode.

SageMaker Data Wrangler støtter Snowflake, en populær datakilde for brukere som ønsker å utføre ML. Vi lanserer Snowflake-direkteforbindelsen fra SageMaker Data Wrangler for å forbedre kundeopplevelsen. Før lanseringen av denne funksjonen ble administratorer pålagt å sette opp den første lagringsintegrasjonen for å koble til Snowflake for å lage funksjoner for ML i Data Wrangler. Dette inkluderer klargjøring Amazon enkel lagringstjeneste (Amazon S3) bøtter, AWS identitets- og tilgangsadministrasjon (IAM) tilgangstillatelser, Snowflake-lagringsintegrasjon for individuelle brukere, og en pågående mekanisme for å administrere eller rydde opp i datakopier i Amazon S3. Denne prosessen er ikke skalerbar for kunder med streng datatilgangskontroll og et stort antall brukere.

I dette innlegget viser vi hvordan Snowflakes direkte kobling i SageMaker Data Wrangler forenkler administratorens erfaring og dataforskerens ML-reise fra data til forretningsinnsikt.

Løsningsoversikt

I denne løsningen bruker vi SageMaker Data Wrangler for å fremskynde dataforberedelse for ML og Amazon SageMaker Autopilot for å automatisk bygge, trene og finjustere ML-modellene basert på dataene dine. Begge tjenestene er utviklet spesielt for å øke produktiviteten og forkorte tiden til verdi for ML-utøvere. Vi demonstrerer også den forenklede datatilgangen fra SageMaker Data Wrangler til Snowflake med direkte tilkobling til spørring og opprette funksjoner for ML.

Se diagrammet nedenfor for en oversikt over lavkode ML-prosessen med Snowflake, SageMaker Data Wrangler og SageMaker Autopilot.

Akselerer tiden til forretningsinnsikt med Amazon SageMaker Data Wrangler direkte tilkobling til Snowflake | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Arbeidsflyten inkluderer følgende trinn:

Naviger til SageMaker Data Wrangler for dataforberedelse og funksjonsingeniøroppgaver.
- Sett opp Snowflake-tilkoblingen med SageMaker Data Wrangler.
- Utforsk Snowflake-tabellene dine i SageMaker Data Wrangler, lag et ML-datasett og utfør funksjonsutvikling.
Tren og test modellene ved å bruke SageMaker Data Wrangler og SageMaker Autopilot.
Last den beste modellen til et endepunkt for slutninger i sanntid for spådommer.
Bruk en Python-notisbok for å påkalle det lanserte sanntidsslutningsendepunktet.

Forutsetninger

For dette innlegget trenger administratoren følgende forutsetninger:

Dataforskere bør ha følgende forutsetninger

Til slutt bør du forberede dataene dine for Snowflake

Vi bruker kredittkorttransaksjonsdata fra kaggle å bygge ML-modeller for å oppdage falske kredittkorttransaksjoner, slik at kundene ikke belastes for varer de ikke har kjøpt. Datasettet inkluderer kredittkorttransaksjoner i september 2013 utført av europeiske kortholdere.
Du bør bruke SnowSQL-klient og installer det på din lokale maskin, slik at du kan bruke det til å laste opp datasettet til en Snowflake-tabell.

De følgende trinnene viser hvordan du klargjør og laster datasettet inn i Snowflake-databasen. Dette er et engangsoppsett.

Snøfnuggtabell og dataforberedelse

Fullfør følgende trinn for dette engangsoppsettet:

Først, som administrator, opprette et Snowflake virtuelt lager, bruker og rolle, og gi tilgang til andre brukere, for eksempel dataforskerne, til å opprette en database og scenedata for deres ML-brukssaker:

-- Use the role SECURITYADMIN to create Role and User
USE ROLE SECURITYADMIN; -- Create a new role 'ML Role'
CREATE OR REPLACE ROLE ML_ROLE COMMENT='ML Role';
GRANT ROLE ML_ROLE TO ROLE SYSADMIN; -- Create a new user and password and grant the role to the user
CREATE OR REPLACE USER ML_USER PASSWORD='<REPLACE_PASSWORD>'
DEFAULT_ROLE=ML_ROLE
DEFAULT_WAREHOUSE=ML_WH
DEFAULT_NAMESPACE=ML_WORKSHOP.PUBLIC
COMMENT='ML User';
GRANT ROLE ML_ROLE TO USER ML_USER; -- Grant privliges to role
USE ROLE ACCOUNTADMIN;
GRANT CREATE DATABASE ON ACCOUNT TO ROLE ML_ROLE; --Create Warehouse for AI/ML work
USE ROLE SYSADMIN; CREATE OR REPLACE WAREHOUSE ML_WH
WITH WAREHOUSE_SIZE = 'XSMALL' AUTO_SUSPEND = 120 AUTO_RESUME = true INITIALLY_SUSPENDED = TRUE; GRANT ALL ON WAREHOUSE ML_WH TO ROLE ML_ROLE;

Som dataforsker, la oss nå lage en database og importere kredittkorttransaksjonene til Snowflake-databasen for å få tilgang til dataene fra SageMaker Data Wrangler. For illustrasjonsformål oppretter vi en Snowflake-database med navnet SF_FIN_TRANSACTION:

-- Select the role and the warehouse
USE ROLE ML_ROLE;
USE WAREHOUSE ML_WH; -- Create the DB to import the financial transactions
CREATE DATABASE IF NOT EXISTS sf_fin_transaction; -- Create CSV File Format
create or replace file format my_csv_format
type = csv
field_delimiter = ','
skip_header = 1
null_if = ('NULL', 'null')
empty_field_as_null = true
compression = gzip;

Last ned datasettet CSV-filen til din lokale maskin og lag et trinn for å laste dataene inn i databasetabellen. Oppdater filbanen for å peke til den nedlastede datasettplasseringen før du kjører PUT-kommandoen for å importere dataene til det opprettede stadiet:

-- Create a Snowflake named internal stage to store the transactions csv file
CREATE OR REPLACE STAGE my_stage
FILE_FORMAT = my_csv_format; -- Import the file in to the stage
-- This command needs be run from SnowSQL client and not on WebUI
PUT file:///Users/*******/Downloads/creditcard.csv @my_stage; -- Check whether the import was successful
LIST @my_stage;

Lag en tabell med navnet credit_card_transactions:

-- Create table and define the columns mapped to the csv transactions file
create or replace table credit_card_transaction (
Time integer,
V1 float, V2 float, V3 float,
V4 float, V5 float, V6 float,
V7 float, V8 float, V9 float,
V10 float,V11 float,V12 float,
V13 float,V14 float,V15 float,
V16 float,V17 float,V18 float,
V19 float,V20 float,V21 float,
V22 float,V23 float,V24 float,
V25 float,V26 float,V27 float,
V28 float,Amount float,
Class varchar(5)
);

Importer dataene til den opprettede tabellen fra scenen:

-- Import the transactions in to a new table named 'credit_card_transaction'
copy into credit_card_transaction from @my_stage ON_ERROR = CONTINUE; -- Check whether the table was successfully created
select * from credit_card_transaction limit 100;

Akselerer tiden til forretningsinnsikt med Amazon SageMaker Data Wrangler direkte tilkobling til Snowflake | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Sett opp SageMaker Data Wrangler og Snowflake-tilkoblingen

Etter at vi har klargjort datasettet for bruk med SageMaker Data Wrangler, la oss opprette en ny Snowflake-tilkobling i SageMaker Data Wrangler for å koble til sf_fin_transaction database i Snowflake og spør etter credit_card_transaction tabell:

Velg Snowflake på SageMaker Data Wrangler Tilkobling side.
Oppgi et navn for å identifisere forbindelsen din.
Velg autentiseringsmetoden din for å koble til Snowflake-databasen:
- Hvis du bruker grunnleggende autentisering, oppgi brukernavnet og passordet som deles av Snowflake-administratoren. For dette innlegget bruker vi grunnleggende autentisering for å koble til Snowflake ved å bruke brukerlegitimasjonen vi opprettet i forrige trinn.
- Hvis du bruker OAuth, oppgi legitimasjonen din for identitetsleverandøren.

SageMaker Data Wrangler spør som standard om dataene dine direkte fra Snowflake uten å lage noen datakopier i S3-bøtter. SageMaker Data Wranglers nye brukervennlighetsforbedring bruker Apache Spark til å integrere med Snowflake for å forberede og sømløst lage et datasett for ML-reisen din.

Så langt har vi laget databasen på Snowflake, importert CSV-filen til Snowflake-tabellen, opprettet Snowflake-legitimasjon og opprettet en kobling på SageMaker Data Wrangler for å koble til Snowflake. For å validere den konfigurerte Snowflake-tilkoblingen, kjør følgende spørring på den opprettede Snowflake-tabellen:

select * from credit_card_transaction;

Akselerer tiden til forretningsinnsikt med Amazon SageMaker Data Wrangler direkte tilkobling til Snowflake | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Merk at alternativet for lagringsintegrasjon som var nødvendig før, nå er valgfritt i de avanserte innstillingene.

Utforsk Snowflake-data

Når du har validert søkeresultatene, velger du Import for å lagre søkeresultatene som datasettet. Vi bruker dette utpakkede datasettet for utforskende dataanalyse og funksjonsutvikling.

Akselerer tiden til forretningsinnsikt med Amazon SageMaker Data Wrangler direkte tilkobling til Snowflake | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Du kan velge å prøve dataene fra Snowflake i SageMaker Data Wrangler UI. Et annet alternativ er å laste ned fullstendige data for ML-modellens treningstilfeller ved å bruke SageMaker Data Wrangler-behandlingsjobber.

Akselerer tiden til forretningsinnsikt med Amazon SageMaker Data Wrangler direkte tilkobling til Snowflake | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Utfør utforskende dataanalyse i SageMaker Data Wrangler

Dataene i Data Wrangler må konstrueres før de kan trenes. I denne delen viser vi hvordan du utfører funksjonsutvikling på dataene fra Snowflake ved å bruke SageMaker Data Wranglers innebygde muligheter.

Først, la oss bruke Data Quality and Insights Report funksjon i SageMaker Data Wrangler for å generere rapporter for å automatisk verifisere datakvaliteten og oppdage unormalt i dataene fra Snowflake.

Du kan bruke rapporten til å hjelpe deg med å rense og behandle dataene dine. Den gir deg informasjon som antall manglende verdier og antall uteliggere. Hvis du har problemer med dataene dine, for eksempel mållekkasje eller ubalanse, kan innsiktsrapporten gjøre deg oppmerksom på disse problemene. For å forstå rapportdetaljene, se Akselerer dataforberedelsen med datakvalitet og innsikt i Amazon SageMaker Data Wrangler.

Etter at du har sjekket datatypetilpasningen brukt av SageMaker Data Wrangler, fullfør følgende trinn:

Velg plusstegnet ved siden av Datatyper Og velg Legg til analyse.
Til Analysetype, velg Rapport om datakvalitet og innsikt.
Velg Opprett.
Se detaljer i rapporten om datakvalitet og innsikt for å sjekke ut advarsler med høy prioritet.

Du kan velge å løse advarslene som er rapportert før du fortsetter med ML-reisen.

Akselerer tiden til forretningsinnsikt med Amazon SageMaker Data Wrangler direkte tilkobling til Snowflake | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Målkolonnen Class å bli forutsagt er klassifisert som en streng. Først, la oss bruke en transformasjon for å fjerne de foreldede tomme tegnene.

Velg Legg til trinn Og velg Formater streng.
Velg i listen over transformasjoner Strip venstre og høyre.
Skriv inn tegnene du vil fjerne og velg Legg til.

Akselerer tiden til forretningsinnsikt med Amazon SageMaker Data Wrangler direkte tilkobling til Snowflake | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Deretter konverterer vi målkolonnen Class fra strengdatatypen til boolsk fordi transaksjonen enten er legitim eller uredelig.

Velg Legg til trinn.
Velg Parse kolonne som type.
Velg for kolonne Class.
Til Fra, velg String.
Til Til, velg boolean.
Velg Legg til.

Akselerer tiden til forretningsinnsikt med Amazon SageMaker Data Wrangler direkte tilkobling til Snowflake | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Etter målkolonnetransformasjonen reduserer vi antall funksjonskolonner, fordi det er over 30 funksjoner i det opprinnelige datasettet. Vi bruker Principal Component Analysis (PCA) for å redusere dimensjonene basert på funksjonens betydning. For å forstå mer om PCA og dimensjonalitetsreduksjon, se Principal Component Analysis (PCA) Algoritme.

Velg Legg til trinn.
Velg Dimensjonsreduksjon.
Til Transform, velg Hovedkomponentanalyse.
Til Inndatakolonner, velg alle kolonnene unntatt målkolonnen Class.
Velg plusstegnet ved siden av Dataflyt Og velg Legg til analyse.
Til Analysetype, velg Rask modell.
Til Analysenavn, skriv inn et navn.
Til Etiketten, velg Class.
Velg Kjør.

Basert på PCA-resultatene kan du bestemme hvilke funksjoner du skal bruke for å bygge modellen. I det følgende skjermbildet viser grafen funksjonene (eller dimensjonene) sortert basert på høyeste til laveste betydning for å forutsi målklassen, som i dette datasettet er om transaksjonen er uredelig eller gyldig.

Akselerer tiden til forretningsinnsikt med Amazon SageMaker Data Wrangler direkte tilkobling til Snowflake | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Du kan velge å redusere antall funksjoner basert på denne analysen, men for dette innlegget lar vi standardinnstillingene være som de er.

Dette avslutter funksjonsutviklingsprosessen vår, selv om du kan velge å kjøre hurtigmodellen og lage en datakvalitets- og innsiktsrapport på nytt for å forstå dataene før du utfører ytterligere optimaliseringer.

Eksporter data og tren modellen

I neste trinn bruker vi SageMaker Autopilot til å automatisk bygge, trene og justere de beste ML-modellene basert på dataene dine. Med SageMaker Autopilot beholder du fortsatt full kontroll og synlighet over data og modell.

Nå som vi har fullført utforskningen og funksjonsutviklingen, la oss trene en modell på datasettet og eksportere dataene for å trene ML-modellen ved hjelp av SageMaker Autopilot.

På Kurs kategorien, velg Eksporter og trener.

Vi kan overvåke eksportfremdriften mens vi venter på at den skal fullføres.

Akselerer tiden til forretningsinnsikt med Amazon SageMaker Data Wrangler direkte tilkobling til Snowflake | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

La oss konfigurere SageMaker Autopilot til å kjøre en automatisert treningsjobb ved å spesifisere målet vi ønsker å forutsi og typen problem. I dette tilfellet, fordi vi trener datasettet til å forutsi om transaksjonen er uredelig eller gyldig, bruker vi binær klassifisering.

Skriv inn et navn for eksperimentet ditt, oppgi S3-posisjonsdataene og velg Neste: Mål og funksjoner.
Til Target, velg Class som kolonnen å forutsi.
Velg Neste: Treningsmetode.

La oss la SageMaker Autopilot bestemme treningsmetoden basert på datasettet.

Til Treningsmetode og algoritmer, plukke ut Auto.

For å forstå mer om treningsmodusene som støttes av SageMaker Autopilot, se Treningsmoduser og algoritme Støtte.

Velg Neste: Implementering og avanserte innstillinger.
Til Implementeringsalternativ, velg Implementer den beste modellen automatisk med transformasjoner fra Data Wrangler, som laster den beste modellen for slutning etter at eksperimenteringen er fullført.
Skriv inn et navn for endepunktet ditt.
Til Velg maskinlæringsproblemtypen, velg Binær klassifisering.
Til Innvendingsberegning, velg F1.
Velg Neste: Se gjennom og opprett.
Velg Lag eksperiment.

Dette starter en SageMaker Autopilot-jobb som lager et sett med treningsjobber som bruker kombinasjoner av hyperparametere for å optimalisere den objektive metrikken.

Akselerer tiden til forretningsinnsikt med Amazon SageMaker Data Wrangler direkte tilkobling til Snowflake | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Vent til SageMaker Autopilot er ferdig med å bygge modellene og evaluere den beste ML-modellen.

Start et endepunkt i sanntid for å teste den beste modellen

SageMaker Autopilot kjører eksperimenter for å finne den beste modellen som kan klassifisere kredittkorttransaksjoner som legitime eller uredelige.

Når SageMaker Autopilot fullfører eksperimentet, kan vi se treningsresultatene med evalueringsberegningene og utforske den beste modellen fra SageMaker Autopilot-jobbbeskrivelsessiden.

Velg den beste modellen og velg Implementer modell.

Vi bruker et endepunkt for sanntidsslutning for å teste den beste modellen laget gjennom SageMaker Autopilot.

Plukke ut Lag spådommer i sanntid.

Når endepunktet er tilgjengelig, kan vi passere nyttelasten og få slutningsresultater.

Akselerer tiden til forretningsinnsikt med Amazon SageMaker Data Wrangler direkte tilkobling til Snowflake | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

La oss starte en Python-notisbok for å bruke sluttpunktet.

På SageMaker Studio-konsollen velger du mappeikonet i navigasjonsruten og velger Lag notatbok.

Bruk følgende Python-kode for å påkalle det utplasserte sanntidsslutningsendepunktet:

# Library imports
import os
import io
import boto3
import json
import csv #: Define the endpoint's name.
ENDPOINT_NAME = 'SnowFlake-FraudDetection' # replace the endpoint name as per your config
runtime = boto3.client('runtime.sagemaker') #: Define a test payload to send to your endpoint.
payload = { "body": { "TIME": 152895, "V1": 2.021155535, "V2": 0.05372872624, "V3": -1.620399104, "V4": 0.3530165253, "V5": 0.3048483853, "V6": -0.6850955461, "V7": 0.02483335885, "V8": -0.05101346021, "V9": 0.3550896835, "V10": -0.1830053153, "V11": 1.148091498, "V12": 0.4283365505, "V13": -0.9347237892, "V14": -0.4615291327, "V15": -0.4124343184, "V16": 0.4993445934, "V17": 0.3411548305, "V18": 0.2343833846, "V19": 0.278223588, "V20": -0.2104513475, "V21": -0.3116427235, "V22": -0.8690778214, "V23": 0.3624146958, "V24": 0.6455923598, "V25": -0.3424913329, "V26": 0.1456884618, "V27": -0.07174890419, "V28": -0.040882382, "AMOUNT": 0.27 }
} #: Submit an API request and capture the response object.
response = runtime.invoke_endpoint( EndpointName=ENDPOINT_NAME, ContentType='text/csv', Body=str(payload)
) #: Print the model endpoint's output.
print(response['Body'].read().decode())

Utgangen viser resultatet som false, som antyder at prøvefunksjonsdataene ikke er uredelige.

Akselerer tiden til forretningsinnsikt med Amazon SageMaker Data Wrangler direkte tilkobling til Snowflake | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Rydd opp

For å være sikker på at du ikke påløper kostnader etter å ha fullført denne opplæringen, slå av SageMaker Data Wrangler-applikasjonen og slå av den bærbare forekomsten brukes til å utføre slutninger. Det burde du også slett inferensendepunktet du opprettet ved å bruke SageMaker Autopilot for å forhindre ekstra kostnader.

konklusjonen

I dette innlegget demonstrerte vi hvordan du kan bringe dataene dine fra Snowflake direkte uten å lage noen mellomliggende kopier i prosessen. Du kan enten prøve eller laste inn hele datasettet til SageMaker Data Wrangler direkte fra Snowflake. Du kan deretter utforske dataene, rense dataene og utføre funksjonsteknikk ved å bruke SageMaker Data Wranglers visuelle grensesnitt.

Vi fremhevet også hvordan du enkelt kan trene og tune en modell med SageMaker Autopilot direkte fra SageMaker Data Wrangler-brukergrensesnittet. Med SageMaker Data Wrangler og SageMaker Autopilot-integrasjon kan vi raskt bygge en modell etter fullført funksjonsutvikling, uten å skrive noen kode. Deretter refererte vi SageMaker Autopilots beste modell for å kjøre slutninger ved å bruke et sanntidsendepunkt.

Prøv den nye Snowflake direkte integrasjonen med SageMaker Data Wrangler i dag for enkelt å bygge ML-modeller med dataene dine ved hjelp av SageMaker.

Om forfatterne

Akselerer tiden til forretningsinnsikt med Amazon SageMaker Data Wrangler direkte tilkobling til Snowflake | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikalt søk. Ai. Hariharan Suresh er Senior Solutions Architect hos AWS. Han brenner for databaser, maskinlæring og design av innovative løsninger. Før han begynte i AWS, var Hariharan produktarkitekt, kjernebankimplementeringsspesialist og utvikler, og jobbet med BFSI-organisasjoner i over 11 år. Utenom teknologien liker han paragliding og sykling.

Akselerer tiden til forretningsinnsikt med Amazon SageMaker Data Wrangler direkte tilkobling til Snowflake | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikalt søk. Ai. Aparajithan Vaidyanathan er hovedarkitekt for bedriftsløsninger hos AWS. Han støtter bedriftskunder med å migrere og modernisere arbeidsmengdene deres på AWS-skyen. Han er en skyarkitekt med 23+ års erfaring med å designe og utvikle store, store og distribuerte programvaresystemer. Han spesialiserer seg på maskinlæring og dataanalyse med fokus på data- og funksjonsteknikk-domene. Han er en aspirerende maratonløper og hobbyene hans inkluderer fotturer, sykling og tilbringe tid med kona og to gutter.

Akselerer tiden til forretningsinnsikt med Amazon SageMaker Data Wrangler direkte tilkobling til Snowflake | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikalt søk. Ai. Tim Song er en programvareutviklingsingeniør hos AWS SageMaker, med 10+ års erfaring som programvareutvikler, konsulent og teknisk leder har han demonstrert evne til å levere skalerbare og pålitelige produkter og løse komplekse problemer. På fritiden liker han naturen, løping utendørs, fotturer og så videre.

Bosco Albuquerque er en Sr. Partner Solutions Architect hos AWS og har over 20 års erfaring i å jobbe med database- og analyseprodukter fra bedriftsdatabaseleverandører og skyleverandører. Han har hjulpet store teknologiselskaper med å designe dataanalyseløsninger og har ledet ingeniørteam med å designe og implementere dataanalyseplattformer og dataprodukter.

SEO-drevet innhold og PR-distribusjon. Bli forsterket i dag.
PlatoData.Network Vertical Generative Ai. Styrk deg selv. Tilgang her.
PlatoAiStream. Web3 Intelligence. Kunnskap forsterket. Tilgang her.
PlatoESG. Bil / elbiler, Karbon, CleanTech, Energi, Miljø, Solenergi, Avfallshåndtering. Tilgang her.
BlockOffsets. Modernisering av eierskap for miljøkompensasjon. Tilgang her.
kilde: https://aws.amazon.com/blogs/machine-learning/accelerate-time-to-business-insights-with-the-amazon-sagemaker-data-wrangler-direct-connection-to-snowflake/

Tidstempel: Juni 23, 2023

Tidstempel: September 29, 2023

Akselerer tiden til forretningsinnsikt med Amazon SageMaker Data Wrangler direkte tilkobling til Snowflake | Amazon Web Services

Publisert av Platon

Løsningsoversikt

Forutsetninger

For dette innlegget trenger administratoren følgende forutsetninger:

Dataforskere bør ha følgende forutsetninger

Til slutt bør du forberede dataene dine for Snowflake

Snøfnuggtabell og dataforberedelse

Sett opp SageMaker Data Wrangler og Snowflake-tilkoblingen

Utforsk Snowflake-data

Utfør utforskende dataanalyse i SageMaker Data Wrangler

Eksporter data og tren modellen

Start et endepunkt i sanntid for å teste den beste modellen

Rydd opp

konklusjonen

Om forfatterne

Mer fra AWS maskinlæring

Tren og distribuer ML-modeller i et multicloud-miljø ved å bruke Amazon SageMaker | Amazon Web Services

Sanntidsanalyse av kundesentiment ved hjelp av AWS

Hvordan LotteON bygde dynamisk A/B-testing for deres personlige anbefalingssystem | Amazon Web Services

Organiser din maskinlæringsreise med Amazon SageMaker Experiments og Amazon SageMaker Pipelines

Automatiser salgssalg av Amazon SageMaker-notatbøker med Amazon EventBridge og AWS Lambda

Om Oss

Vertikal søk og Ai

Plattform

Hold kontakten

Logg inn