Utilizza Amazon DocumentDB per creare soluzioni di machine learning senza codice in Amazon SageMaker Canvas | Servizi Web di Amazon

Utilizza Amazon DocumentDB per creare soluzioni di machine learning senza codice in Amazon SageMaker Canvas | Servizi Web di Amazon

Siamo entusiasti di annunciare il lancio di Amazon DocumentDB (con compatibilità MongoDB) integrazione con Tela di Amazon SageMaker, consentendo ai clienti di Amazon DocumentDB di creare e utilizzare soluzioni di intelligenza artificiale generativa e machine learning (ML) senza scrivere codice. Amazon DocumentDB è un database di documenti JSON nativo completamente gestito che rende semplice ed economico gestire carichi di lavoro di documenti critici praticamente su qualsiasi scala senza gestire l'infrastruttura. Amazon SageMaker Canvas è uno spazio di lavoro ML senza codice che offre modelli pronti all'uso, inclusi modelli di base, e la possibilità di preparare dati e creare e distribuire modelli personalizzati.

In questo post, discuteremo di come portare i dati archiviati in Amazon DocumentDB in SageMaker Canvas e utilizzarli per creare modelli ML per l'analisi predittiva. Senza creare e gestire pipeline di dati, sarai in grado di potenziare i modelli ML con i tuoi dati non strutturati archiviati in Amazon DocumentDB.

Panoramica della soluzione

Assumiamo il ruolo di analista aziendale per un'azienda di consegna di cibo. La tua app mobile memorizza informazioni sui ristoranti in Amazon DocumentDB grazie alla sua scalabilità e alle funzionalità di schema flessibile. Desideri raccogliere approfondimenti su questi dati e creare un modello ML per prevedere come verranno valutati i nuovi ristoranti, ma trovi difficile eseguire analisi su dati non strutturati. Si incontrano colli di bottiglia perché è necessario fare affidamento sui team di ingegneria e scienza dei dati per raggiungere questi obiettivi.

Questa nuova integrazione risolve questi problemi semplificando il trasferimento dei dati di Amazon DocumentDB in SageMaker Canvas e iniziando immediatamente a preparare e analizzare i dati per il ML. Inoltre, SageMaker Canvas elimina la dipendenza dalle competenze di machine learning per creare modelli di alta qualità e generare previsioni.

Dimostreremo come utilizzare i dati di Amazon DocumentDB per creare modelli ML in SageMaker Canvas nei passaggi seguenti:

  1. Crea un connettore Amazon DocumentDB in SageMaker Canvas.
  2. Analizza i dati utilizzando l'intelligenza artificiale generativa.
  3. Preparare i dati per l'apprendimento automatico.
  4. Costruisci un modello e genera previsioni.

Prerequisiti

Per implementare questa soluzione, completare i seguenti prerequisiti:

  1. Disponi dell'accesso amministrativo ad AWS Cloud con un file Gestione dell'identità e dell'accesso di AWS (SONO) Utente con le autorizzazioni necessarie per completare l'integrazione.
  2. Completa la configurazione dell'ambiente utilizzando AWS CloudFormazione attraverso una delle seguenti opzioni:
    1. Distribuisci un modello CloudFormation in un nuovo VPC – Questa opzione crea un nuovo ambiente AWS composto da VPC, sottoreti private, gruppi di sicurezza, ruoli di esecuzione IAM, Amazon Cloud9, endpoint VPC richiestie dominio SageMaker. Quindi distribuisce Amazon DocumentDB in questo nuovo VPC. Scarica il modello oppure avvia rapidamente lo stack CloudFormation scegliendo Avvia Stack:
      Avvia lo stack CloudFormation
    2. Distribuisci un modello CloudFormation in un VPC esistente – Questa opzione crea gli endpoint VPC richiesti, i ruoli di esecuzione IAM e il dominio SageMaker in un VPC esistente con sottoreti private. Scarica il modello oppure avvia rapidamente lo stack CloudFormation scegliendo Avvia Stack:
      Avvia lo stack CloudFormation

Tieni presente che se stai creando un nuovo dominio SageMaker, devi configurare il dominio in modo che si trovi in ​​un VPC privato senza accesso a Internet per poter aggiungere il connettore ad Amazon DocumentDB. Per saperne di più, fare riferimento a Configura Amazon SageMaker Canvas in un VPC senza accesso a Internet.

  1. Seguire le lezione per caricare i dati di esempio del ristorante in Amazon DocumentDB.
  2. Aggiungi l'accesso ad Amazon Bedrock e al modello Anthropic Claude al suo interno. Per ulteriori informazioni, vedere Aggiungi l'accesso al modello.

Crea un connettore Amazon DocumentDB in SageMaker Canvas

Dopo aver creato il tuo dominio SageMaker, completa i seguenti passaggi:

  1. Nella console Amazon DocumentDB, scegli Apprendimento automatico senza codice nel pannello di navigazione.
  2. Sotto Scegli un dominio e un profilo¸ scegli il tuo dominio SageMaker e il tuo profilo utente.
  3. Scegli Avvia tela per avviare SageMaker Canvas in una nuova scheda.
    Utilizza Amazon DocumentDB per creare soluzioni di machine learning senza codice in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

Una volta terminato il caricamento di SageMaker Canvas, verrai visualizzato su flussi di dati scheda.

  1. Scegli Creare per creare un nuovo flusso di dati.
    Utilizza Amazon DocumentDB per creare soluzioni di machine learning senza codice in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.
  2. Inserisci un nome per il flusso di dati e scegli Creare.
  3. Aggiungi una nuova connessione Amazon DocumentDB scegliendo Importa le date, Quindi scegliere di tabella per Tipo di set di dati.
  4. Sulla Importa le date pagina, per Fonte di datiscegli Document DB ed Aggiungi connessione.
    Utilizza Amazon DocumentDB per creare soluzioni di machine learning senza codice in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.
  5. Inserisci un nome di connessione, ad esempio demo, e scegli il cluster Amazon DocumentDB desiderato.

Tieni presente che SageMaker Canvas precompilerà il menu a discesa con i cluster nello stesso VPC del tuo dominio SageMaker.

  1. Immettere un nome utente, una password e un nome del database.
  2. Infine, seleziona la tua preferenza di lettura.

Per proteggere le prestazioni delle istanze primarie, SageMaker Canvas utilizza per impostazione predefinita Secondario, il che significa che leggerà solo da istanze secondarie. Quando la preferenza di lettura è Preferibile secondaria, SageMaker Canvas legge dalle istanze secondarie disponibili, ma leggerà dall'istanza primaria se un'istanza secondaria non è disponibile. Per ulteriori informazioni su come configurare una connessione Amazon DocumentDB, consulta il file Connettiti a un database archiviato in AWS.

  1. Scegli Aggiungi connessione.
    Utilizza Amazon DocumentDB per creare soluzioni di machine learning senza codice in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

Se la connessione ha esito positivo, vedrai le raccolte nel database Amazon DocumentDB mostrate come tabelle.

  1. Trascina la tabella che preferisci sulla tela vuota. Per questo post aggiungiamo i dati del nostro ristorante.

Le prime 100 righe vengono visualizzate come anteprima.

  1. Per iniziare ad analizzare e preparare i tuoi dati, scegli Importa le date.
    Utilizza Amazon DocumentDB per creare soluzioni di machine learning senza codice in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.
  2. Immettere un nome per il set di dati e scegliere Importa le date.

Analizza i dati utilizzando l'intelligenza artificiale generativa

Successivamente, vogliamo ottenere alcune informazioni sui nostri dati e cercare modelli. SageMaker Canvas fornisce un'interfaccia in linguaggio naturale per analizzare e preparare i dati. Quando il Dati vengono caricate le schede, puoi iniziare a chattare con i tuoi dati procedendo nel seguente modo:

  1. Scegli Chatta per la preparazione dei dati.
    Utilizza Amazon DocumentDB per creare soluzioni di machine learning senza codice in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.
  2. Raccogli informazioni dettagliate sui tuoi dati ponendo domande come gli esempi mostrati negli screenshot seguenti.
    Utilizza Amazon DocumentDB per creare soluzioni di machine learning senza codice in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

Per ulteriori informazioni su come utilizzare il linguaggio naturale per esplorare e preparare i dati, fare riferimento a Utilizza il linguaggio naturale per esplorare e preparare i dati con una nuova funzionalità di Amazon SageMaker Canvas.

Acquisiamo un'idea più approfondita della qualità dei nostri dati utilizzando il rapporto sulla qualità dei dati e sugli approfondimenti di SageMaker Canvas, che valuta automaticamente la qualità dei dati e rileva le anomalie.

  1. Sulla Analisi scheda, scegliere Rapporto sulla qualità dei dati e sugli approfondimenti.
  2. Scegli rating come colonna di destinazione e Regressione come tipo di problema, quindi scegli Creare.

Ciò simulerà l'addestramento del modello e fornirà approfondimenti su come possiamo migliorare i nostri dati per l'apprendimento automatico. Il report completo viene generato in pochi minuti.

Il nostro report mostra che il 2.47% delle righe nel nostro target presenta valori mancanti: affronteremo questo problema nel passaggio successivo. Inoltre, l'analisi mostra che il address line 2, namee type_of_food le funzionalità hanno il maggior potere di previsione nei nostri dati. Ciò indica che le informazioni di base sui ristoranti, come la posizione e la cucina, potrebbero avere un impatto enorme sulle valutazioni.

Utilizza Amazon DocumentDB per creare soluzioni di machine learning senza codice in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

Preparare i dati per l'apprendimento automatico

SageMaker Canvas offre oltre 300 trasformazioni integrate per preparare i dati importati. Per ulteriori informazioni sulle funzionalità di trasformazione di SageMaker Canvas, fare riferimento a Prepara i dati con trasformazioni avanzate. Aggiungiamo alcune trasformazioni per preparare i nostri dati per l'addestramento di un modello ML.

  1. Torna al file Flusso di dati pagina scegliendo il nome del flusso di dati nella parte superiore della pagina.
  2. Scegli il segno più accanto a Tipi di dati e scegli Aggiungi trasformazione.
    Utilizza Amazon DocumentDB per creare soluzioni di machine learning senza codice in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.
  3. Scegli Aggiungi passaggio.
  4. Rinominiamo il address line 2 colonna a cities.
    1. Scegli Gestisci colonne.
    2. Scegli Rinomina colonna per Trasformare.
    3. Scegli address line 2 per Colonna di input, accedere cities per Nuovo nomee scegli Aggiungi.
      Utilizza Amazon DocumentDB per creare soluzioni di machine learning senza codice in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.
  5. Inoltre, eliminiamo alcune colonne non necessarie.
    1. Aggiungi una nuova trasformazione.
    2. Nel Trasformarescegli Colonna di rilascio.
    3. Nel Colonne da eliminarescegli URL ed restaurant_id.
    4. Scegli Aggiungi.
      Utilizza Amazon DocumentDB per creare soluzioni di machine learning senza codice in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.[
  6. Il nostro rating la colonna caratteristica ha alcuni valori mancanti, quindi riempiamo quelle righe con il valore medio di questa colonna.
    1. Aggiungi una nuova trasformazione.
    2. Nel Trasformarescegli Imputare.
    3. Nel Tipo di colonnascegli Numerico.
    4. Nel Colonne di input, scegli il rating colonna.
    5. Nel Strategia di imputazionescegli Significare.
    6. Nel Colonna di output, accedere rating_avg_filled.
    7. Scegli Aggiungi.
      Utilizza Amazon DocumentDB per creare soluzioni di machine learning senza codice in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.
  7. Possiamo eliminare il rating colonna perché abbiamo una nuova colonna con valori riempiti.
  8. Perché type_of_food è di natura categoriale, sarà necessario codificarlo numericamente. Codifichiamo questa funzionalità utilizzando la tecnica di codifica one-hot.
    1. Aggiungi una nuova trasformazione.
    2. Nel Trasformarescegli Codifica a caldo.
    3. Per Colonne di input, scegli type_of_food.
    4. Nel Strategia di gestione non valida¸ scegli mantenere.
    5. Nel Stile di output¸ scegli colonne.
    6. Nel Colonna di output, accedere encoded.
    7. Scegli Aggiungi.
      Utilizza Amazon DocumentDB per creare soluzioni di machine learning senza codice in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

Costruisci un modello e genera previsioni

Ora che abbiamo trasformato i nostri dati, addestriamo un modello numerico di machine learning per prevedere le valutazioni dei ristoranti.

  1. Scegli Crea modello.
  2. Nel Nome del set di dati, inserisci un nome per l'esportazione del set di dati.
  3. Scegli Esportare e attendere che i dati trasformati vengano esportati.
    Utilizza Amazon DocumentDB per creare soluzioni di machine learning senza codice in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.
  4. Scegliere il Crea modello collegamento nell'angolo in basso a sinistra della pagina.

Puoi anche selezionare il set di dati dalla funzione Data Wrangler sulla sinistra della pagina.

Utilizza Amazon DocumentDB per creare soluzioni di machine learning senza codice in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

  1. Inserisci il nome del modello.
  2. Scegli Analisi predittiva, Quindi scegliere Creare.
  3. Scegli rating_avg_filled come colonna di destinazione.

SageMaker Canvas seleziona automaticamente un tipo di modello adatto.

  1. Scegli Anteprima del modello per garantire che non vi siano problemi di qualità dei dati.
  2. Scegli Costruzione rapida per costruire il modello.
    Utilizza Amazon DocumentDB per creare soluzioni di machine learning senza codice in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

Il completamento della creazione del modello richiederà circa 2-15 minuti.

È possibile visualizzare lo stato del modello una volta terminato l'addestramento. Il nostro modello ha un RSME di 0.422, il che significa che spesso prevede la valutazione di un ristorante entro +/- 0.422 rispetto al valore effettivo, una solida approssimazione per la scala di valutazione da 1 a 6.

Utilizza Amazon DocumentDB per creare soluzioni di machine learning senza codice in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

  1. Infine, puoi generare previsioni di esempio accedendo a Prevedere scheda.
    Utilizza Amazon DocumentDB per creare soluzioni di machine learning senza codice in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

ripulire

Per evitare di incorrere in addebiti futuri, elimina le risorse che hai creato mentre segui questo post. SageMaker Canvas ti addebita la durata della sessione e ti consigliamo di disconnetterti da SageMaker Canvas quando non lo utilizzi. Fare riferimento a Disconnessione da Amazon SageMaker Canvas per ulteriori dettagli.

Conclusione

In questo post abbiamo discusso di come utilizzare SageMaker Canvas per l'intelligenza artificiale e il machine learning generativi con i dati archiviati in Amazon DocumentDB. Nel nostro esempio, abbiamo mostrato come un analista può creare rapidamente un modello ML di alta qualità utilizzando un set di dati di esempio di un ristorante.

Abbiamo mostrato i passaggi per implementare la soluzione, dall'importazione di dati da Amazon DocumentDB alla creazione di un modello ML in SageMaker Canvas. L'intero processo è stato completato tramite un'interfaccia visiva senza scrivere una sola riga di codice.

Per iniziare il tuo viaggio ML low-code/no-code, fai riferimento a Tela di Amazon SageMaker.


Circa gli autori

Utilizza Amazon DocumentDB per creare soluzioni di machine learning senza codice in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.Adeleke Coker è un Global Solutions Architect con AWS. Lavora con clienti a livello globale per fornire guida e assistenza tecnica nella distribuzione di carichi di lavoro di produzione su larga scala su AWS. Nel tempo libero ama imparare, leggere, giocare e guardare eventi sportivi.

Utilizza Amazon DocumentDB per creare soluzioni di machine learning senza codice in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Ricerca verticale. Ai. Gururaj S Bayari è un Senior DocumentDB Specialist Solutions Architect presso AWS. Gli piace aiutare i clienti ad adottare i database appositamente creati da Amazon. Aiuta i clienti a progettare, valutare e ottimizzare la scalabilità Internet e i carichi di lavoro ad alte prestazioni basati su NoSQL e/o database relazionali.

Utilizza Amazon DocumentDB per creare soluzioni di machine learning senza codice in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.Tim Pusateri è Senior Product Manager presso AWS dove lavora su Amazon SageMaker Canvas. Il suo obiettivo è aiutare i clienti a trarre rapidamente valore dall'intelligenza artificiale/ML. Al di fuori del lavoro, ama stare all'aria aperta, suonare la chitarra, vedere musica dal vivo e trascorrere del tempo con la famiglia e gli amici.

Utilizza Amazon DocumentDB per creare soluzioni di machine learning senza codice in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.Pratik Das è un Product Manager presso AWS. Gli piace lavorare con i clienti che desiderano creare carichi di lavoro resilienti e basi dati solide nel cloud. Porta la sua esperienza lavorando con le aziende su iniziative di modernizzazione, analisi e trasformazione dei dati.

Utilizza Amazon DocumentDB per creare soluzioni di machine learning senza codice in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.Varma Gottumukkala è un Senior Database Specialist Solutions Architect presso AWS con sede a Dallas Fort Worth. Varma collabora con i clienti sulla loro strategia di database e progetta i loro carichi di lavoro utilizzando database AWS appositamente creati. Prima di unirsi ad AWS, ha lavorato a lungo con database relazionali, database NOSQL e diversi linguaggi di programmazione negli ultimi 22 anni.

Timestamp:

Di più da Apprendimento automatico di AWS