Les données constituent la base permettant de tirer le meilleur parti de la technologie de l’IA et de résoudre rapidement les problèmes de l’entreprise. Toutefois, pour libérer le potentiel des technologies d’IA générative, il existe une condition préalable essentielle : vos données doivent être correctement préparées. Dans cet article, nous décrivons comment utiliser l'IA générative pour mettre à jour et faire évoluer votre pipeline de données à l'aide de Toile Amazon SageMaker pour la préparation des données.
En règle générale, le travail de pipeline de données nécessite une compétence spécialisée pour préparer et organiser les données que les analystes de sécurité pourront utiliser pour extraire de la valeur, ce qui peut prendre du temps, augmenter les risques et augmenter le délai de rentabilisation. Avec SageMaker Canvas, les analystes de sécurité peuvent accéder facilement et en toute sécurité aux principaux modèles de base pour préparer leurs données plus rapidement et remédier aux risques de cybersécurité.
La préparation des données implique un formatage minutieux et une contextualisation réfléchie, en partant du problème du client. Désormais, grâce à la fonctionnalité de chat SageMaker Canvas pour la préparation des données, les analystes possédant une connaissance du domaine peuvent rapidement préparer, organiser et extraire de la valeur des données à l'aide d'une expérience basée sur le chat.
Vue d'ensemble de la solution
L'IA générative révolutionne le domaine de la sécurité en offrant des expériences personnalisées et en langage naturel, améliorant l'identification des risques et les mesures correctives, tout en augmentant la productivité des entreprises. Pour ce cas d'utilisation, nous utilisons SageMaker Canvas, Gestionnaire de données Amazon SageMaker, Lac de sécurité Amazonet une Service de stockage simple Amazon (Amazon S3). Amazon Security Lake vous permet de regrouper et de normaliser les données de sécurité à des fins d'analyse afin de mieux comprendre la sécurité au sein de votre organisation. Amazon S3 vous permet de stocker et de récupérer n'importe quelle quantité de données à tout moment et en tout lieu. Il offre une évolutivité, une disponibilité des données, une sécurité et des performances de pointe.
SageMaker Canvas prend désormais en charge des fonctionnalités complètes de préparation de données optimisées par SageMaker Data Wrangler. Avec cette intégration, SageMaker Canvas fournit un espace de travail sans code de bout en bout pour préparer les données, créer et utiliser l'apprentissage automatique (ML) et Socle amazonien modèles de base pour accélérer le passage des données aux informations commerciales. Vous pouvez désormais découvrir et regrouper des données provenant de plus de 50 sources de données, ainsi qu'explorer et préparer des données à l'aide de plus de 300 analyses et transformations intégrées dans l'interface visuelle de SageMaker Canvas. Vous bénéficierez également de performances plus rapides pour les transformations et les analyses, et bénéficierez d'une interface en langage naturel pour explorer et transformer les données pour le ML.
Dans cet article, nous démontrons trois transformations clés ; filtrage, renommage des colonnes et extraction de texte à partir d'une colonne de l'ensemble de données des résultats de sécurité. Nous démontrons également l'utilisation de la fonctionnalité de chat pour la préparation des données dans SageMaker Canvas pour analyser les données et visualiser vos résultats.
Pré-requis
Avant de commencer, vous avez besoin d'un compte AWS. Vous devez également mettre en place un Amazon SageMakerStudio domaine. Pour obtenir des instructions sur la configuration de SageMaker Canvas, reportez-vous à Générez des prédictions de machine learning sans code.
Accédez à l'interface de discussion de SageMaker Canvas
Suivez les étapes suivantes pour commencer à utiliser la fonctionnalité de discussion de SageMaker Canvas :
- Sur la console SageMaker Canvas, choisissez Traqueur de données.
- Sous Jeux de données, choisissez Amazon S3 comme source et spécifiez le Ensemble de données sur les résultats de sécurité d'Amazon Security Lake.
- Choisissez votre flux de données et choisissez Chat pour la préparation des données, qui affichera une expérience d'interface de chat avec des invites guidées.
Filtrer les données
Pour cet article, nous souhaitons d'abord filtrer les avertissements critiques et de haute gravité, nous entrons donc dans la boîte de discussion les instructions pour supprimer les résultats qui ne sont pas critiques ou de gravité élevée. Canvas supprime les lignes, affiche un aperçu des données transformées et offre la possibilité d'utiliser le code. Nous pouvons l'ajouter à la liste des étapes du Étapes vitre.
Renommer les colonnes
Ensuite, nous voulons renommer deux colonnes, nous entrons donc dans la boîte de discussion l'invite suivante, pour renommer la desc et les titre colonnes à Trouver et les Remédiation. SageMaker Canvas génère un aperçu et si vous êtes satisfait des résultats, vous pouvez ajouter les données transformées aux étapes du flux de données.
Extraire le texte
Pour déterminer les régions sources des résultats, vous pouvez saisir des instructions dans le chat pour Extrayez le texte de la région de la colonne UID en fonction du modèle arn:aws:security:securityhub:region:*
et créez une nouvelle colonne appelée Région) pour extraire le texte de la région de la colonne UID en fonction d'un modèle. SageMaker Canvas génère ensuite du code pour créer une nouvelle colonne de région. L'aperçu des données montre que les résultats proviennent d'une région : us-west-2
. Vous pouvez ajouter cette transformation au flux de données pour une analyse en aval.
Analysez les données
Enfin, nous souhaitons analyser les données pour déterminer s'il existe une corrélation entre l'heure de la journée et le nombre de découvertes critiques. Vous pouvez saisir une demande pour résumer les résultats critiques par heure de la journée dans le chat, et SageMaker Canvas renvoie des informations utiles pour votre enquête et votre analyse.
Visualisez les résultats
Ensuite, nous visualisons les résultats par gravité au fil du temps pour les inclure dans un rapport sur le leadership. Vous pouvez demander à SageMaker Canvas de générer un graphique à barres de gravité par rapport à l'heure de la journée. En quelques secondes, SageMaker Canvas a créé le graphique regroupé par gravité. Vous pouvez ajouter cette visualisation à l'analyse dans le flux de données et la télécharger pour votre rapport. Les données montrent que les découvertes proviennent d’une région et se produisent à des moments précis. Cela nous donne la certitude de savoir où concentrer nos enquêtes sur les résultats de sécurité afin de déterminer les causes profondes et les actions correctives.
Nettoyer
Pour éviter d'encourir des frais involontaires, procédez comme suit pour nettoyer vos ressources :
- Videz le compartiment S3 que vous avez utilisé comme source.
- Déconnectez-vous de SageMaker Canvas.
Conclusion
Dans cet article, nous vous avons montré comment utiliser SageMaker Canvas comme espace de travail sans code de bout en bout pour la préparation des données afin de créer et d'utiliser des modèles de base Amazon Bedrock afin d'accélérer la collecte d'informations commerciales à partir des données.
Notez que cette approche ne se limite pas aux résultats de sécurité ; vous pouvez appliquer cela à n’importe quel cas d’utilisation de l’IA générative qui utilise la préparation des données à sa base.
L’avenir appartient aux entreprises capables d’exploiter efficacement la puissance de l’IA générative et des grands modèles linguistiques. Mais pour ce faire, nous devons d’abord développer une stratégie de données solide et comprendre l’art de la préparation des données. En utilisant l’IA générative pour structurer intelligemment nos données et en travaillant à rebours du client, nous pouvons résoudre les problèmes commerciaux plus rapidement. Avec le chat SageMaker Canvas pour la préparation des données, les analystes peuvent facilement démarrer et capturer la valeur immédiate de l'IA.
À propos des auteurs
Sudeesh Sasidharan est architecte de solutions senior chez AWS, au sein de l'équipe Energy. Sudeesh aime expérimenter de nouvelles technologies et créer des solutions innovantes qui résolvent des défis commerciaux complexes. Lorsqu'il n'est pas en train de concevoir des solutions ou de bricoler les dernières technologies, vous pouvez le trouver sur le court de tennis en train de travailler son revers.
John Klacynski est l'un des principaux responsables de solutions clients au sein de l'équipe AWS Independent Software Vendor (ISV). Dans ce rôle, il aide, par programmation, les clients ISV à adopter les technologies et services AWS pour atteindre plus rapidement leurs objectifs commerciaux. Avant de rejoindre AWS, John a dirigé des équipes de produits de données pour de grandes entreprises de biens de consommation, les aidant à exploiter les informations sur les données pour améliorer leurs opérations et leur prise de décision.
- Contenu propulsé par le référencement et distribution de relations publiques. Soyez amplifié aujourd'hui.
- PlatoData.Network Ai générative verticale. Autonomisez-vous. Accéder ici.
- PlatoAiStream. Intelligence Web3. Connaissance Amplifiée. Accéder ici.
- PlatonESG. Carbone, Technologie propre, Énergie, Environnement, Solaire, La gestion des déchets. Accéder ici.
- PlatoHealth. Veille biotechnologique et essais cliniques. Accéder ici.
- La source: https://aws.amazon.com/blogs/machine-learning/analyze-security-findings-faster-with-no-code-data-preparation-using-generative-ai-and-amazon-sagemaker-canvas/
- :possède
- :est
- :ne pas
- :où
- $UP
- 100
- 125
- 300
- 50
- 7
- a
- accélérer
- accès
- Compte
- à travers
- actes
- ajouter
- adopter
- agrégat
- AI
- permet
- aussi
- Amazon
- Amazon Sage Maker
- Toile Amazon SageMaker
- Amazon Web Services
- montant
- an
- Analyses
- selon une analyse de l’Université de Princeton
- Analystes
- il analyse
- et les
- tous
- Appliquer
- une approche
- de manière appropriée
- SONT
- Art
- AS
- demander
- At
- disponibilité
- éviter
- AWS
- barre
- basé
- BE
- appartient
- profiter
- Améliorée
- jusqu'à XNUMX fois
- stimuler
- Box
- construire
- Développement
- intégré
- la performance des entreprises
- entreprises
- mais
- by
- appelé
- CAN
- la toile
- capacités
- aptitude
- capturer
- Capturer
- prudent
- maisons
- les causes
- globaux
- des charges
- Graphique
- le chat
- Selectionnez
- espace extérieur plus propre,
- code
- Colonne
- Colonnes
- Sociétés
- par rapport
- complet
- complexe
- complet
- confiance
- Console
- consommateur
- Core
- Corrélation
- Court Intérieur
- engendrent
- créée
- critique
- des clients
- Clients
- cyber
- la cyber-sécurité
- données
- Préparation des données
- stratégie de données
- journée
- décision
- La prise de décision
- démontrer
- décrire
- conception
- Déterminer
- développer
- découvrez
- Commande
- affiche
- do
- domaine
- download
- de manière efficace
- sans effort
- d'effort
- permet
- end-to-end
- énergie
- améliorer
- Entrer
- d'experience
- Expériences
- l'expérimentation
- explorez
- extrait
- extraction
- plus rapide
- Fonctionnalité
- une fonction filtre
- filtration
- Trouvez
- résultats
- Prénom
- flux
- Focus
- Abonnement
- Pour
- Fondation
- De
- avenir
- Gain
- recueillir
- générer
- génère
- génératif
- IA générative
- obtenez
- donne
- Objectifs
- pour les
- guidé
- arriver
- heureux vous
- harnais
- he
- aider
- aide
- Haute
- lui
- sa
- Comment
- How To
- Cependant
- http
- HTTPS
- Identification
- if
- Immédiat
- améliorer
- in
- comprendre
- Améliore
- indépendant
- leader de l'industrie
- technologie innovante
- idées.
- Des instructions
- l'intégration
- Interfaces
- développement
- enquête
- implique
- Isv
- IT
- SES
- John
- joindre
- jpg
- ACTIVITES
- spécialisées
- lac
- langue
- gros
- Nouveautés
- Leadership
- conduisant
- apprentissage
- LED
- Données menées
- Levier
- limité
- Liste
- aime
- click
- machine learning
- Fabrication
- manager
- maximales
- ML
- numériques jumeaux (digital twin models)
- PLUS
- must
- Nature
- Besoin
- Besoins
- Nouveauté
- Les nouvelles technologies
- maintenant
- nombre
- of
- Offres Speciales
- on
- ONE
- Opérations
- Option
- or
- organisation
- nos
- ande
- plus de
- paquet
- pain
- Patron de Couture
- performant
- Personnalisé
- pipeline
- Place
- Platon
- Intelligence des données Platon
- PlatonDonnées
- Post
- défaillances
- power
- alimenté
- Prédictions
- préparation
- Préparer
- préparé
- Aperçu
- Directeur
- Avant
- Problème
- d'ouvrabilité
- Produit
- productivité
- instructions
- fournit
- aportando
- vite.
- nous joindre
- reportez-vous
- région
- régions
- supprime
- rapport
- nécessaire
- a besoin
- Resources
- Résultats
- Retours
- Révolutionnement
- Analyse
- risques
- Rôle
- racine
- sagemaker
- Évolutivité
- Escaliers intérieurs
- secondes
- en toute sécurité
- sécurité
- risques de sécurité
- sur le lien
- supérieur
- Services
- set
- mise
- montré
- Spectacles
- étapes
- compétence
- So
- Logiciels
- solide
- sur mesure
- Solutions
- RÉSOUDRE
- Résoudre
- Identifier
- Sources
- spécialisé
- groupe de neurones
- Commencer
- j'ai commencé
- Commencez
- Étapes
- storage
- Boutique
- de Marketing
- structure
- résumé
- Les soutiens
- Prenez
- équipe
- équipes
- Les technologies
- Technologie
- tennis
- texte
- qui
- Le
- La Source
- leur
- Les
- puis
- Là.
- this
- trois
- fiable
- fois
- à
- Transformer
- De La Carrosserie
- transformations
- transformé
- se transforme
- deux
- comprendre
- compréhension
- ouvrir
- Mises à jour
- us
- utilisé
- cas d'utilisation
- d'utiliser
- incontournable
- Usages
- en utilisant
- Plus-value
- vendeur
- visuel
- visualisation
- visualiser
- souhaitez
- we
- web
- services Web
- quand
- qui
- tout en
- sera
- comprenant
- dans les
- sans
- activités principales
- de travail
- Vous n'avez
- Votre
- zéphyrnet