Utilisez l'apprentissage automatique sans écrire une seule ligne de code avec Amazon SageMaker Canvas | Services Web Amazon

Utilisez l'apprentissage automatique sans écrire une seule ligne de code avec Amazon SageMaker Canvas | Services Web Amazon

Dans un passé récent, l'utilisation de l'apprentissage automatique (ML) pour effectuer des prédictions, en particulier pour les données sous forme de texte et d'images, nécessitait des connaissances approfondies en ML pour créer et régler des modèles d'apprentissage profond. Aujourd'hui, le ML est devenu plus accessible à tout utilisateur souhaitant utiliser des modèles de ML pour générer de la valeur commerciale. Avec Toile Amazon SageMaker, vous pouvez créer des prédictions pour un certain nombre de types de données différents, au-delà des données tabulaires ou de séries chronologiques, sans écrire une seule ligne de code. Ces fonctionnalités incluent des modèles pré-entraînés pour les types de données image, texte et document.

Dans cet article, nous expliquons comment utiliser des modèles pré-entraînés pour récupérer des prédictions pour les types de données pris en charge au-delà des données tabulaires.

Données texte

SageMaker Canvas fournit un environnement visuel sans code pour la création, la formation et le déploiement de modèles ML. Pour les tâches de traitement du langage naturel (NLP), SageMaker Canvas s'intègre parfaitement à Amazon comprendre pour vous permettre d'exécuter des fonctionnalités NLP clés telles que la détection de langage, la reconnaissance d'entités, l'analyse des sentiments, la modélisation de sujets, etc. L'intégration élimine le besoin de codage ou d'ingénierie de données pour utiliser les modèles NLP robustes d'Amazon Comprehend. Vous fournissez simplement vos données textuelles et choisissez parmi quatre fonctionnalités couramment utilisées : analyse des sentiments, détection de la langue, extraction des entités et détection des informations personnelles. Pour chaque scénario, vous pouvez utiliser l'interface utilisateur pour tester et utiliser la prédiction par lots afin de sélectionner les données stockées dans Service de stockage simple Amazon (Amazon S3).

Analyser des données texte sur SageMaker Canvas

Analyse des sentiments

Avec l'analyse des sentiments, SageMaker Canvas vous permet d'analyser le sentiment de votre texte saisi. Il peut déterminer si le sentiment général est positif, négatif, mitigé ou neutre, comme le montre la capture d'écran suivante. Ceci est utile dans des situations telles que l’analyse des avis sur les produits. Par exemple, le texte « J'adore ce produit, c'est incroyable ! » serait classé par SageMaker Canvas comme ayant un sentiment positif, alors que « Ce produit est horrible, je regrette de l'avoir acheté » serait qualifié de sentiment négatif.

Analyse des sentiments sur SageMaker Canvas

Extraction d'entités

SageMaker Canvas peut analyser le texte et détecter automatiquement les entités qui y sont mentionnées. Lorsqu'un document est envoyé à SageMaker Canvas pour analyse, il identifie les personnes, les organisations, les lieux, les dates, les quantités et d'autres entités dans le texte. Cette fonctionnalité d'extraction d'entités vous permet d'obtenir rapidement des informations sur les personnes, les lieux et les détails clés abordés dans les documents. Pour une liste des entités prises en charge, reportez-vous à Entités.

Extraction d'entités sur SageMaker Canvas

Détection de la langue

SageMaker Canvas peut également déterminer la langue dominante du texte à l'aide d'Amazon Comprehend. Il analyse le texte pour identifier la langue principale et fournit des scores de confiance pour la langue dominante détectée, mais n'indique pas de répartition en pourcentage pour les documents multilingues. Pour de meilleurs résultats avec des documents longs dans plusieurs langues, divisez le texte en morceaux plus petits et regroupez les résultats pour estimer les pourcentages de langue. Cela fonctionne mieux avec au moins 20 caractères de texte.

Détection de langue sur SageMaker Canvas

Détection des informations personnelles

Vous pouvez également protéger les données sensibles grâce à la détection des informations personnelles avec SageMaker Canvas. Il peut analyser des documents texte pour détecter automatiquement les entités d'informations personnellement identifiables (PII), vous permettant de localiser des données sensibles telles que les noms, adresses, dates de naissance, numéros de téléphone, adresses e-mail, etc. Il analyse des documents jusqu'à 100 Ko et fournit un score de confiance pour chaque entité détectée afin que vous puissiez examiner et rédiger de manière sélective les informations les plus sensibles. Pour une liste des entités détectées, reportez-vous à Détection des entités PII.

Détection de PII sur SageMaker Canvas

Données d'image

SageMaker Canvas fournit une interface visuelle sans code qui vous permet d'utiliser facilement les capacités de vision par ordinateur en s'intégrant à Amazon Reconnaissance pour l'analyse d'images. Par exemple, vous pouvez télécharger un ensemble de données d'images, utiliser Amazon Rekognition pour détecter des objets et des scènes et effectuer une détection de texte pour répondre à un large éventail de cas d'utilisation. L'interface visuelle et l'intégration d'Amazon Rekognition permettent aux non-développeurs d'exploiter des techniques avancées de vision par ordinateur.

Analyser les données d'image sur SageMaker Canvas

Détection d'objets dans les images

SageMaker Canvas utilise Amazon Rekognition pour détecter les étiquettes (objets) dans une image. Vous pouvez télécharger l'image depuis l'interface utilisateur de SageMaker Canvas ou utiliser le Prédiction par lots pour sélectionner les images stockées dans un compartiment S3. Comme le montre l'exemple suivant, il peut extraire des objets dans l'image tels qu'une tour de l'horloge, un bus, des bâtiments, etc. Vous pouvez utiliser l'interface pour rechercher dans les résultats de prédiction et les trier.

Détection d'objets dans les images sur SageMaker Canvas

Détection de texte dans les images

L'extraction de texte à partir d'images est un cas d'utilisation très courant. Désormais, vous pouvez effectuer cette tâche facilement sur SageMaker Canvas sans code. Le texte est extrait sous forme d'éléments de campagne, comme indiqué dans la capture d'écran suivante. Les phrases courtes dans l'image sont classées ensemble et identifiées comme une phrase.

Détection de texte dans les images sur SageMaker Canvas

Vous pouvez effectuer des prédictions par lots en téléchargeant un ensemble d'images, en extrayant toutes les images en une seule tâche par lots et en téléchargeant les résultats sous forme de fichier CSV. Cette solution est utile lorsque vous souhaitez extraire et détecter du texte dans des images.

Données du document

SageMaker Canvas propose une variété de solutions prêtes à l'emploi qui répondent à vos besoins quotidiens en matière de compréhension de documents. Ces solutions sont alimentées par Extrait d'Amazon. Pour afficher toutes les options disponibles pour les documents, choisissez de Modèles prêts à l'emploi dans le volet de navigation et filtrer par DOCUMENTS, comme illustré dans la capture d'écran suivante.

Analyse des données d'un document sur SageMaker Canvas

Analyse de documents

L'analyse de documents analyse les documents et les formulaires pour déterminer les relations entre les textes détectés. Les opérations renvoient quatre catégories d'extraction de documents : texte brut, formulaires, tableaux et signatures. La capacité de la solution à comprendre la structure du document vous offre une flexibilité supplémentaire quant au type de données que vous souhaitez extraire des documents. La capture d'écran suivante est un exemple de ce à quoi ressemble la détection de table.

Analyse de documents sur SageMaker Canvas

Cette solution est capable de comprendre la mise en page de documents complexes, ce qui est utile lorsque vous devez extraire des informations spécifiques dans vos documents.

Analyse des documents d'identité

Cette solution est conçue pour analyser des documents tels que des cartes d'identité personnelles, des permis de conduire ou d'autres formes d'identification similaires. Des informations telles que le deuxième prénom, le comté et le lieu de naissance, ainsi que son score de confiance individuel quant à l'exactitude, seront renvoyées pour chaque pièce d'identité, comme indiqué dans la capture d'écran suivante.

Analyse des documents d'identité sur SageMaker Canvas

Il existe une option permettant d'effectuer une prédiction par lots, grâce à laquelle vous pouvez télécharger en masse des ensembles de documents d'identification et les traiter par lots. Cela fournit un moyen rapide et transparent de transformer les détails des documents d’identification en paires clé-valeur pouvant être utilisées pour des processus en aval tels que l’analyse des données.

Analyse des dépenses

L'analyse des dépenses est conçue pour analyser les documents de dépenses tels que les factures et les reçus. La capture d'écran suivante est un exemple de ce à quoi ressemblent les informations extraites.

Analyse des dépenses sur SageMaker Canvas

Les résultats sont renvoyés sous forme de champs récapitulatifs et de champs d'éléments de campagne. Les champs récapitulatifs sont des paires clé-valeur extraites du document et contiennent des clés telles que Grand Total, Date d'échéanceet une Taxe estimée. Les champs d'éléments de ligne font référence à des données structurées sous forme de tableau dans le document. Ceci est utile pour extraire des informations du document tout en conservant sa mise en page.

Requêtes de documents

Les requêtes de documents sont conçues pour vous permettre de poser des questions sur vos documents. C'est une excellente solution à utiliser lorsque vous disposez de documents de plusieurs pages et que vous souhaitez extraire des réponses très spécifiques de vos documents. Ce qui suit est un exemple des types de questions que vous pouvez poser et de ce à quoi ressemblent les réponses extraites.

Requêtes de documents sur SageMaker Canvas

La solution fournit une interface simple pour vous permettre d'interagir avec vos documents. Ceci est utile lorsque vous souhaitez obtenir des détails spécifiques dans des documents volumineux.

Conclusion

SageMaker Canvas fournit un environnement sans code pour utiliser facilement le ML sur différents types de données tels que le texte, les images et les documents. L'interface visuelle et l'intégration avec les services AWS tels qu'Amazon Comprehend, Amazon Rekognition et Amazon Textract éliminent le besoin de codage et d'ingénierie des données. Vous pouvez analyser le texte pour détecter les sentiments, les entités, les langues et les informations personnelles. Pour les images, la détection d’objets et de texte permet des cas d’utilisation de vision par ordinateur. Enfin, l'analyse de documents peut extraire du texte tout en préservant sa mise en page pour les processus en aval. Les solutions prêtes à l'emploi de SageMaker Canvas vous permettent d'exploiter des techniques avancées de ML pour générer des informations à partir de données structurées et non structurées. Si vous souhaitez utiliser des outils sans code avec des modèles ML prêts à l'emploi, essayez SageMaker Canvas dès aujourd'hui. Pour plus d'informations, reportez-vous à Premiers pas avec Amazon SageMaker Canvas.


À propos des auteurs

Use machine learning without writing a single line of code with Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.Julia Ang est un architecte de solutions basé à Singapour. Elle a travaillé avec des clients dans divers domaines, de la santé et du secteur public aux entreprises natives du numérique, pour adopter des solutions en fonction de leurs besoins commerciaux. Elle a également aidé des clients d'Asie du Sud-Est et au-delà à utiliser l'IA et le ML dans leurs entreprises. En dehors du travail, elle aime découvrir le monde en voyageant et en se lançant dans des activités créatives.

Use machine learning without writing a single line of code with Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.Loke Jun Kai est un architecte de solutions spécialisé pour l'IA/ML basé à Singapour. Il travaille avec des clients de l'ASEAN pour concevoir des solutions d'apprentissage automatique à grande échelle dans AWS. Jun Kai est un défenseur des outils d'apprentissage automatique Low-Code No-Code. Dans ses temps libres, il aime être en contact avec la nature.

Horodatage:

Plus de Apprentissage automatique AWS