Dans un passé récent, l'utilisation de l'apprentissage automatique (ML) pour effectuer des prédictions, en particulier pour les données sous forme de texte et d'images, nécessitait des connaissances approfondies en ML pour créer et régler des modèles d'apprentissage profond. Aujourd'hui, le ML est devenu plus accessible à tout utilisateur souhaitant utiliser des modèles de ML pour générer de la valeur commerciale. Avec Toile Amazon SageMaker, vous pouvez créer des prédictions pour un certain nombre de types de données différents, au-delà des données tabulaires ou de séries chronologiques, sans écrire une seule ligne de code. Ces fonctionnalités incluent des modèles pré-entraînés pour les types de données image, texte et document.
Dans cet article, nous expliquons comment utiliser des modèles pré-entraînés pour récupérer des prédictions pour les types de données pris en charge au-delà des données tabulaires.
Données texte
SageMaker Canvas fournit un environnement visuel sans code pour la création, la formation et le déploiement de modèles ML. Pour les tâches de traitement du langage naturel (NLP), SageMaker Canvas s'intègre parfaitement à Amazon comprendre pour vous permettre d'exécuter des fonctionnalités NLP clés telles que la détection de langage, la reconnaissance d'entités, l'analyse des sentiments, la modélisation de sujets, etc. L'intégration élimine le besoin de codage ou d'ingénierie de données pour utiliser les modèles NLP robustes d'Amazon Comprehend. Vous fournissez simplement vos données textuelles et choisissez parmi quatre fonctionnalités couramment utilisées : analyse des sentiments, détection de la langue, extraction des entités et détection des informations personnelles. Pour chaque scénario, vous pouvez utiliser l'interface utilisateur pour tester et utiliser la prédiction par lots afin de sélectionner les données stockées dans Service de stockage simple Amazon (Amazon S3).
Analyse des sentiments
Avec l'analyse des sentiments, SageMaker Canvas vous permet d'analyser le sentiment de votre texte saisi. Il peut déterminer si le sentiment général est positif, négatif, mitigé ou neutre, comme le montre la capture d'écran suivante. Ceci est utile dans des situations telles que l’analyse des avis sur les produits. Par exemple, le texte « J'adore ce produit, c'est incroyable ! » serait classé par SageMaker Canvas comme ayant un sentiment positif, alors que « Ce produit est horrible, je regrette de l'avoir acheté » serait qualifié de sentiment négatif.
Extraction d'entités
SageMaker Canvas peut analyser le texte et détecter automatiquement les entités qui y sont mentionnées. Lorsqu'un document est envoyé à SageMaker Canvas pour analyse, il identifie les personnes, les organisations, les lieux, les dates, les quantités et d'autres entités dans le texte. Cette fonctionnalité d'extraction d'entités vous permet d'obtenir rapidement des informations sur les personnes, les lieux et les détails clés abordés dans les documents. Pour une liste des entités prises en charge, reportez-vous à Entités.
Détection de la langue
SageMaker Canvas peut également déterminer la langue dominante du texte à l'aide d'Amazon Comprehend. Il analyse le texte pour identifier la langue principale et fournit des scores de confiance pour la langue dominante détectée, mais n'indique pas de répartition en pourcentage pour les documents multilingues. Pour de meilleurs résultats avec des documents longs dans plusieurs langues, divisez le texte en morceaux plus petits et regroupez les résultats pour estimer les pourcentages de langue. Cela fonctionne mieux avec au moins 20 caractères de texte.
Détection des informations personnelles
Vous pouvez également protéger les données sensibles grâce à la détection des informations personnelles avec SageMaker Canvas. Il peut analyser des documents texte pour détecter automatiquement les entités d'informations personnellement identifiables (PII), vous permettant de localiser des données sensibles telles que les noms, adresses, dates de naissance, numéros de téléphone, adresses e-mail, etc. Il analyse des documents jusqu'à 100 Ko et fournit un score de confiance pour chaque entité détectée afin que vous puissiez examiner et rédiger de manière sélective les informations les plus sensibles. Pour une liste des entités détectées, reportez-vous à Détection des entités PII.
Données d'image
SageMaker Canvas fournit une interface visuelle sans code qui vous permet d'utiliser facilement les capacités de vision par ordinateur en s'intégrant à Amazon Reconnaissance pour l'analyse d'images. Par exemple, vous pouvez télécharger un ensemble de données d'images, utiliser Amazon Rekognition pour détecter des objets et des scènes et effectuer une détection de texte pour répondre à un large éventail de cas d'utilisation. L'interface visuelle et l'intégration d'Amazon Rekognition permettent aux non-développeurs d'exploiter des techniques avancées de vision par ordinateur.
Détection d'objets dans les images
SageMaker Canvas utilise Amazon Rekognition pour détecter les étiquettes (objets) dans une image. Vous pouvez télécharger l'image depuis l'interface utilisateur de SageMaker Canvas ou utiliser le Prédiction par lots pour sélectionner les images stockées dans un compartiment S3. Comme le montre l'exemple suivant, il peut extraire des objets dans l'image tels qu'une tour de l'horloge, un bus, des bâtiments, etc. Vous pouvez utiliser l'interface pour rechercher dans les résultats de prédiction et les trier.
Détection de texte dans les images
L'extraction de texte à partir d'images est un cas d'utilisation très courant. Désormais, vous pouvez effectuer cette tâche facilement sur SageMaker Canvas sans code. Le texte est extrait sous forme d'éléments de campagne, comme indiqué dans la capture d'écran suivante. Les phrases courtes dans l'image sont classées ensemble et identifiées comme une phrase.
Vous pouvez effectuer des prédictions par lots en téléchargeant un ensemble d'images, en extrayant toutes les images en une seule tâche par lots et en téléchargeant les résultats sous forme de fichier CSV. Cette solution est utile lorsque vous souhaitez extraire et détecter du texte dans des images.
Données du document
SageMaker Canvas propose une variété de solutions prêtes à l'emploi qui répondent à vos besoins quotidiens en matière de compréhension de documents. Ces solutions sont alimentées par Extrait d'Amazon. Pour afficher toutes les options disponibles pour les documents, choisissez de Modèles prêts à l'emploi dans le volet de navigation et filtrer par DOCUMENTS, comme illustré dans la capture d'écran suivante.
Analyse de documents
L'analyse de documents analyse les documents et les formulaires pour déterminer les relations entre les textes détectés. Les opérations renvoient quatre catégories d'extraction de documents : texte brut, formulaires, tableaux et signatures. La capacité de la solution à comprendre la structure du document vous offre une flexibilité supplémentaire quant au type de données que vous souhaitez extraire des documents. La capture d'écran suivante est un exemple de ce à quoi ressemble la détection de table.
Cette solution est capable de comprendre la mise en page de documents complexes, ce qui est utile lorsque vous devez extraire des informations spécifiques dans vos documents.
Analyse des documents d'identité
Cette solution est conçue pour analyser des documents tels que des cartes d'identité personnelles, des permis de conduire ou d'autres formes d'identification similaires. Des informations telles que le deuxième prénom, le comté et le lieu de naissance, ainsi que son score de confiance individuel quant à l'exactitude, seront renvoyées pour chaque pièce d'identité, comme indiqué dans la capture d'écran suivante.
Il existe une option permettant d'effectuer une prédiction par lots, grâce à laquelle vous pouvez télécharger en masse des ensembles de documents d'identification et les traiter par lots. Cela fournit un moyen rapide et transparent de transformer les détails des documents d’identification en paires clé-valeur pouvant être utilisées pour des processus en aval tels que l’analyse des données.
Analyse des dépenses
L'analyse des dépenses est conçue pour analyser les documents de dépenses tels que les factures et les reçus. La capture d'écran suivante est un exemple de ce à quoi ressemblent les informations extraites.
Les résultats sont renvoyés sous forme de champs récapitulatifs et de champs d'éléments de campagne. Les champs récapitulatifs sont des paires clé-valeur extraites du document et contiennent des clés telles que Grand Total, Date d'échéanceet une Taxe estimée. Les champs d'éléments de ligne font référence à des données structurées sous forme de tableau dans le document. Ceci est utile pour extraire des informations du document tout en conservant sa mise en page.
Requêtes de documents
Les requêtes de documents sont conçues pour vous permettre de poser des questions sur vos documents. C'est une excellente solution à utiliser lorsque vous disposez de documents de plusieurs pages et que vous souhaitez extraire des réponses très spécifiques de vos documents. Ce qui suit est un exemple des types de questions que vous pouvez poser et de ce à quoi ressemblent les réponses extraites.
La solution fournit une interface simple pour vous permettre d'interagir avec vos documents. Ceci est utile lorsque vous souhaitez obtenir des détails spécifiques dans des documents volumineux.
Conclusion
SageMaker Canvas fournit un environnement sans code pour utiliser facilement le ML sur différents types de données tels que le texte, les images et les documents. L'interface visuelle et l'intégration avec les services AWS tels qu'Amazon Comprehend, Amazon Rekognition et Amazon Textract éliminent le besoin de codage et d'ingénierie des données. Vous pouvez analyser le texte pour détecter les sentiments, les entités, les langues et les informations personnelles. Pour les images, la détection d’objets et de texte permet des cas d’utilisation de vision par ordinateur. Enfin, l'analyse de documents peut extraire du texte tout en préservant sa mise en page pour les processus en aval. Les solutions prêtes à l'emploi de SageMaker Canvas vous permettent d'exploiter des techniques avancées de ML pour générer des informations à partir de données structurées et non structurées. Si vous souhaitez utiliser des outils sans code avec des modèles ML prêts à l'emploi, essayez SageMaker Canvas dès aujourd'hui. Pour plus d'informations, reportez-vous à Premiers pas avec Amazon SageMaker Canvas.
À propos des auteurs
Julia Ang est un architecte de solutions basé à Singapour. Elle a travaillé avec des clients dans divers domaines, de la santé et du secteur public aux entreprises natives du numérique, pour adopter des solutions en fonction de leurs besoins commerciaux. Elle a également aidé des clients d'Asie du Sud-Est et au-delà à utiliser l'IA et le ML dans leurs entreprises. En dehors du travail, elle aime découvrir le monde en voyageant et en se lançant dans des activités créatives.
Loke Jun Kai est un architecte de solutions spécialisé pour l'IA/ML basé à Singapour. Il travaille avec des clients de l'ASEAN pour concevoir des solutions d'apprentissage automatique à grande échelle dans AWS. Jun Kai est un défenseur des outils d'apprentissage automatique Low-Code No-Code. Dans ses temps libres, il aime être en contact avec la nature.
- Contenu propulsé par le référencement et distribution de relations publiques. Soyez amplifié aujourd'hui.
- PlatoData.Network Ai générative verticale. Autonomisez-vous. Accéder ici.
- PlatoAiStream. Intelligence Web3. Connaissance Amplifiée. Accéder ici.
- PlatonESG. Carbone, Technologie propre, Énergie, Environnement, Solaire, La gestion des déchets. Accéder ici.
- PlatoHealth. Veille biotechnologique et essais cliniques. Accéder ici.
- La source: https://aws.amazon.com/blogs/machine-learning/use-machine-learning-without-writing-a-single-line-of-code-with-amazon-sagemaker-canvas/
- :possède
- :est
- $UP
- 100
- 20
- 360
- 385
- 400
- 7
- a
- Capable
- A Propos
- accessible
- Selon
- précision
- à travers
- propos
- adresses
- adopter
- Avancée
- avocat
- agrégat
- AI
- AI / ML
- Tous
- permettre
- Permettre
- permet
- aussi
- Amazon
- Amazon comprendre
- Amazon Reconnaissance
- Amazon Sage Maker
- Toile Amazon SageMaker
- Extrait d'Amazon
- Amazon Web Services
- parmi
- an
- selon une analyse de l’Université de Princeton
- il analyse
- des analyses
- l'analyse
- ainsi que le
- réponses
- tous
- SONT
- AS
- Asean
- Asie
- demander
- At
- automatiquement
- disponibles
- AWS
- basé
- BE
- devenez
- était
- va
- LES MEILLEURS
- Au-delà
- naissance
- tous les deux
- Développement
- bâtiments
- bus
- la performance des entreprises
- entreprises
- mais
- Achat
- by
- CAN
- la toile
- capacités
- aptitude
- Cartes
- maisons
- cas
- catégories
- caractères
- Selectionnez
- classifié
- horloge
- code
- Codage
- Commun
- communément
- complexe
- comprendre
- ordinateur
- Vision par ordinateur
- confiance
- contiennent
- comté
- engendrent
- La création
- Conception
- des clients
- Clients
- données
- l'analyse des données
- Dates
- jour après jour
- profond
- l'apprentissage en profondeur
- déployer
- un
- détails
- détecter
- détecté
- Détection
- Déterminer
- différent
- numérique
- discuter
- discuté
- do
- document
- INSTITUTIONNELS
- Ne fait pas
- dominant
- download
- chacun
- facilité
- élimine
- permet
- engageant
- ENGINEERING
- entités
- entité
- Environment
- notamment
- estimation
- exemple
- les
- supplémentaire
- extrait
- extraction
- Des champs
- Déposez votre dernière attestation
- une fonction filtre
- finalement
- Flexibilité
- Abonnement
- Pour
- formulaire
- document
- quatre
- De
- Gain
- générer
- obtenez
- donne
- l'
- harnais
- Vous avez
- ayant
- he
- Santé
- utile
- sa
- Comment
- HTML
- HTTPS
- i
- Identification
- identifié
- identifier
- Identite
- if
- image
- satellite
- in
- comprendre
- indiquer
- individuel
- d'information
- contribution
- idées.
- Intègre
- Intégration
- l'intégration
- interagir
- intéressé
- Interfaces
- développement
- factures
- IT
- articles
- SES
- Emploi
- juste
- ACTIVITES
- clés
- spécialisées
- Etiquettes
- langue
- Langues
- gros
- Disposition
- apprentissage
- au
- licences
- comme
- Gamme
- Liste
- emplacements
- Location
- Style
- ressembler
- LOOKS
- love
- click
- machine learning
- Entrée
- a prendre une
- FAIT DU
- mentionné
- Milieu
- mixte
- ML
- modélisation statistique
- numériques jumeaux (digital twin models)
- PLUS
- (en fait, presque toutes)
- plusieurs
- prénom
- noms
- indigène
- Nature
- Traitement du langage naturel
- Nature
- Navigation
- Besoin
- Besoins
- négatif
- Neutri
- nlp
- aucune
- maintenant
- nombre
- numéros
- objet
- Détection d'objet
- objets
- of
- Offres Speciales
- on
- Opérations
- Option
- Options
- or
- organisations
- Autre
- ande
- au contrôle
- global
- paires
- pain
- passé
- Personnes
- pourcentage
- Effectuer
- personnel
- Personnellement
- Téléphone
- les expressions clés
- pièces
- Place
- Des endroits
- Platon
- Intelligence des données Platon
- PlatonDonnées
- positif
- possible
- Post
- alimenté
- prédiction
- Prédictions
- conservation
- processus
- les process
- traitement
- Produit
- Comparatifs
- protéger
- fournir
- fournit
- public
- requêtes
- fréquemment posées
- Rapide
- vite.
- gamme
- raw
- recettes
- récent
- reconnaissance
- reportez-vous
- regretter
- Les relations
- conditions
- Résultats
- retenue
- retourner
- Avis
- Avis
- robuste
- sagemaker
- Escaliers intérieurs
- scénario
- Scènes
- But
- fluide
- de façon transparente
- Rechercher
- secteur
- sensible
- envoyé
- sentiment
- Série
- Services
- set
- Sets
- elle
- Shorts
- montré
- Signatures
- similaires
- étapes
- simplement
- Singapour
- unique
- situations
- faibles
- So
- sur mesure
- Solutions
- RÉSOUDRE
- Sud est
- Asie du Sud-Est
- spécialiste
- groupe de neurones
- scission
- j'ai commencé
- storage
- stockée
- simple
- structure
- structuré
- tel
- RÉSUMÉ
- Appareils
- Appuyer
- table
- Tâche
- tâches
- techniques
- tester
- texte
- qui
- La
- le monde
- leur
- Les
- Ces
- this
- Avec
- fiable
- Des séries chronologiques
- à
- aujourd'hui
- ensemble
- les outils
- sujet
- La tour
- Formation
- Transformer
- Voyages
- Essai
- réglage
- type
- types
- ui
- comprendre
- compréhension
- Téléchargement
- utilisé
- cas d'utilisation
- d'utiliser
- Utilisateur
- Usages
- en utilisant
- Plus-value
- variété
- divers
- très
- Voir
- vision
- souhaitez
- veut
- Façon..
- we
- web
- services Web
- Quoi
- quand
- Les
- qui
- tout en
- WHO
- large
- Large gamme
- sera
- comprenant
- dans les
- sans
- activités principales
- travaillé
- vos contrats
- world
- pourra
- écriture
- Vous n'avez
- Votre
- zéphyrnet