Utilizza l'apprendimento automatico senza scrivere una sola riga di codice con Amazon SageMaker Canvas

Ripubblicato da Platone

Seguaci: 0

Nel recente passato, l’utilizzo dell’apprendimento automatico (ML) per fare previsioni, in particolare per dati sotto forma di testo e immagini, richiedeva una vasta conoscenza di ML per la creazione e la messa a punto di modelli di deep learning. Oggi, il machine learning è diventato più accessibile a qualsiasi utente che desideri utilizzare modelli di machine learning per generare valore aziendale. Con Tela di Amazon SageMaker, puoi creare previsioni per una serie di tipi di dati diversi oltre ai semplici dati tabulari o di serie temporali senza scrivere una singola riga di codice. Queste funzionalità includono modelli preaddestrati per tipi di dati di immagini, testo e documenti.

In questo post viene illustrato come utilizzare modelli preaddestrati per recuperare previsioni per i tipi di dati supportati oltre ai dati tabulari.

Dati di testo

SageMaker Canvas fornisce un ambiente visivo e senza codice per la creazione, l'addestramento e la distribuzione di modelli ML. Per le attività di elaborazione del linguaggio naturale (NLP), SageMaker Canvas si integra perfettamente con Amazon Comprehend per consentirti di eseguire funzionalità chiave della PNL come il rilevamento del linguaggio, il riconoscimento delle entità, l'analisi del sentiment, la modellazione degli argomenti e altro ancora. L'integrazione elimina la necessità di codifica o ingegneria dei dati per utilizzare i robusti modelli NLP di Amazon Comprehend. Fornisci semplicemente i tuoi dati di testo e scegli tra quattro funzionalità comunemente utilizzate: analisi del sentiment, rilevamento della lingua, estrazione di entità e rilevamento delle informazioni personali. Per ogni scenario, puoi utilizzare l'interfaccia utente per testare e utilizzare la previsione batch per selezionare i dati archiviati Servizio di archiviazione semplice Amazon (Amazon S3).

Analisi dei dati di testo su SageMaker Canvas

Analisi del sentimento

Con l'analisi del sentiment, SageMaker Canvas ti consente di analizzare il sentiment del testo inserito. Può determinare se il sentimento generale è positivo, negativo, misto o neutro, come mostrato nello screenshot seguente. Ciò è utile in situazioni come l'analisi delle recensioni dei prodotti. Ad esempio, il testo "Adoro questo prodotto, è fantastico!" verrebbe classificato da SageMaker Canvas come avente un sentimento positivo, mentre "Questo prodotto è orribile, mi pento di averlo acquistato" verrebbe etichettato come sentimento negativo.

Analisi del sentiment su SageMaker Canvas

Estrazione di entità

SageMaker Canvas può analizzare il testo e rilevare automaticamente le entità menzionate al suo interno. Quando un documento viene inviato a SageMaker Canvas per l'analisi, identificherà persone, organizzazioni, luoghi, date, quantità e altre entità nel testo. Questa funzionalità di estrazione delle entità ti consente di ottenere rapidamente informazioni dettagliate sulle persone, i luoghi e i dettagli chiave discussi nei documenti. Per un elenco delle entità supportate, fare riferimento a Entità.

Estrazione di entità su SageMaker Canvas

Rilevamento della lingua

SageMaker Canvas può anche determinare la lingua dominante del testo utilizzando Amazon Comprehend. Analizza il testo per identificare la lingua principale e fornisce punteggi di confidenza per la lingua dominante rilevata, ma non indica ripartizioni percentuali per i documenti multilingue. Per ottenere i migliori risultati con documenti lunghi in più lingue, dividi il testo in parti più piccole e aggrega i risultati per stimare le percentuali linguistiche. Funziona meglio con almeno 20 caratteri di testo.

Rilevamento della lingua su SageMaker Canvas

Rilevamento di informazioni personali

Puoi anche proteggere i dati sensibili utilizzando il rilevamento delle informazioni personali con SageMaker Canvas. Può analizzare documenti di testo per rilevare automaticamente entità di informazioni di identificazione personale (PII), consentendo di individuare dati sensibili come nomi, indirizzi, date di nascita, numeri di telefono, indirizzi e-mail e altro ancora. Analizza documenti fino a 100 KB e fornisce un punteggio di confidenza per ciascuna entità rilevata in modo da poter rivedere e oscurare selettivamente le informazioni più sensibili. Per un elenco delle entità rilevate, fare riferimento a Rilevamento di entità PII.

Rilevamento PII su SageMaker Canvas

Dati immagine

SageMaker Canvas fornisce un'interfaccia visiva senza codice che semplifica l'utilizzo delle funzionalità di visione artificiale integrandosi con Rekognition di Amazon per l'analisi delle immagini. Ad esempio, puoi caricare un set di dati di immagini, utilizzare Amazon Rekognition per rilevare oggetti e scene ed eseguire il rilevamento del testo per affrontare un'ampia gamma di casi d'uso. L'interfaccia visiva e l'integrazione di Amazon Rekognition consentono ai non sviluppatori di sfruttare tecniche avanzate di visione artificiale.

Analisi dei dati dell'immagine su SageMaker Canvas

Rilevamento di oggetti nelle immagini

SageMaker Canvas utilizza Amazon Rekognition per rilevare etichette (oggetti) in un'immagine. Puoi caricare l'immagine dall'interfaccia utente di SageMaker Canvas o utilizzare il file Previsione batch scheda per selezionare le immagini archiviate in un bucket S3. Come mostrato nell'esempio seguente, può estrarre oggetti nell'immagine come torre dell'orologio, autobus, edifici e altro. È possibile utilizzare l'interfaccia per cercare tra i risultati della previsione e ordinarli.

Rilevamento di oggetti nelle immagini su SageMaker Canvas

Rilevamento del testo nelle immagini

L'estrazione del testo dalle immagini è un caso d'uso molto comune. Ora puoi eseguire questa attività con facilità su SageMaker Canvas senza codice. Il testo viene estratto come elementi pubblicitari, come mostrato nello screenshot seguente. Le brevi frasi all'interno dell'immagine vengono classificate insieme e identificate come frase.

Rilevamento del testo nelle immagini su SageMaker Canvas

Puoi eseguire previsioni batch caricando una serie di immagini, estrarre tutte le immagini in un unico processo batch e scaricare i risultati come file CSV. Questa soluzione è utile quando desideri estrarre e rilevare il testo nelle immagini.

Dati del documento

SageMaker Canvas offre una varietà di soluzioni pronte all'uso che risolvono le tue esigenze quotidiane di comprensione dei documenti. Queste soluzioni sono alimentate da Testo Amazon. Per visualizzare tutte le opzioni disponibili per i documenti, scegliere di Modelli pronti all'uso nel riquadro di navigazione e filtrare per Documenti, come mostrato nella seguente schermata.

Analisi dei dati del documento su SageMaker Canvas

Analisi del documento

L'analisi dei documenti analizza documenti e moduli per le relazioni tra il testo rilevato. Le operazioni restituiscono quattro categorie di estrazione dei documenti: testo non elaborato, moduli, tabelle e firme. La capacità della soluzione di comprendere la struttura del documento offre maggiore flessibilità nel tipo di dati che desideri estrarre dai documenti. Lo screenshot seguente è un esempio di come appare il rilevamento della tabella.

Analisi dei documenti su SageMaker Canvas

Questa soluzione è in grado di comprendere layout di documenti complessi, il che è utile quando è necessario estrarre informazioni specifiche dai documenti.

Analisi dei documenti d'identità

Questa soluzione è progettata per analizzare documenti come carte d'identità personali, patenti di guida o altre forme di identificazione simili. Informazioni quali secondo nome, contea e luogo di nascita, insieme al relativo punteggio di confidenza individuale sulla precisione, verranno restituite per ciascun documento di identità, come mostrato nello screenshot seguente.

Analisi dei documenti di identità su SageMaker Canvas

È disponibile un'opzione per eseguire previsioni batch, mediante la quale è possibile caricare in blocco set di documenti di identificazione ed elaborarli come un lavoro batch. Ciò fornisce un modo rapido e semplice per trasformare i dettagli del documento di identificazione in coppie chiave-valore che possono essere utilizzate per processi a valle come l'analisi dei dati.

Analisi delle spese

L'analisi delle spese è progettata per analizzare documenti di spesa come fatture e ricevute. Lo screenshot seguente è un esempio di come appaiono le informazioni estratte.

Analisi delle spese su SageMaker Canvas

I risultati vengono restituiti come campi di riepilogo e campi di elementi pubblicitari. I campi di riepilogo sono coppie chiave-valore estratte dal documento e contengono chiavi come Somma globale, Scadenzae Tributario. I campi delle voci fanno riferimento ai dati strutturati come tabella nel documento. Ciò è utile per estrarre informazioni dal documento mantenendone il layout.

Interrogazioni sui documenti

Le query sui documenti sono progettate per consentirti di porre domande sui tuoi documenti. Questa è un'ottima soluzione da utilizzare quando hai documenti multipagina e desideri estrarre risposte molto specifiche dai tuoi documenti. Di seguito è riportato un esempio dei tipi di domande che è possibile porre e dell'aspetto delle risposte estratte.

Query sui documenti su SageMaker Canvas

La soluzione fornisce un'interfaccia semplice per interagire con i tuoi documenti. Ciò è utile quando desideri ottenere dettagli specifici all'interno di documenti di grandi dimensioni.

Conclusione

SageMaker Canvas fornisce un ambiente senza codice per utilizzare facilmente il machine learning su vari tipi di dati come testo, immagini e documenti. L'interfaccia visiva e l'integrazione con servizi AWS come Amazon Comprehend, Amazon Rekognition e Amazon Textract eliminano la necessità di codifica e ingegneria dei dati. Puoi analizzare il testo per valutazioni, entità, lingue e PII. Per le immagini, il rilevamento di oggetti e testo consente casi d'uso di visione artificiale. Infine, l'analisi dei documenti può estrarre il testo preservandone il layout per i processi successivi. Le soluzioni pronte all'uso in SageMaker Canvas ti consentono di sfruttare tecniche ML avanzate per generare approfondimenti da dati strutturati e non strutturati. Se sei interessato a utilizzare strumenti senza codice con modelli ML pronti all'uso, prova SageMaker Canvas oggi stesso. Per ulteriori informazioni, fare riferimento a Iniziare con l'utilizzo di Amazon SageMaker Canvas.

Circa gli autori

Utilizza l'apprendimento automatico senza scrivere una sola riga di codice con Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Ricerca verticale. Ai. Giulia Ang è un Solutions Architect con sede a Singapore. Ha lavorato con clienti in diversi settori, dal settore sanitario e pubblico alle aziende native digitali, per adottare soluzioni in base alle loro esigenze aziendali. Ha inoltre supportato i clienti nel sud-est asiatico e oltre nell'utilizzo dell'intelligenza artificiale e del machine learning nelle loro attività. Al di fuori del lavoro, le piace conoscere il mondo viaggiando e impegnandosi in attività creative.

Utilizza l'apprendimento automatico senza scrivere una sola riga di codice con Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Ricerca verticale. Ai. Loke Jun Kai è uno Specialist Solutions Architect per AI/ML con sede a Singapore. Lavora con clienti in tutta l'ASEAN per progettare soluzioni di machine learning su larga scala in AWS. Jun Kai è un sostenitore degli strumenti di machine learning Low-Code No-Code. Nel tempo libero gli piace stare a contatto con la natura.