Data är grunden för att fånga maximalt värde från AI-teknik och lösa affärsproblem snabbt. För att frigöra potentialen hos generativ AI-teknik finns det dock en nyckelförutsättning: din data måste förberedas på lämpligt sätt. I det här inlägget beskriver vi hur du använder generativ AI för att uppdatera och skala din datapipeline med hjälp av Amazon SageMaker Canvas för dataförberedelser.
Vanligtvis kräver datapipelinearbete en specialiserad färdighet att förbereda och organisera data för säkerhetsanalytiker att använda för att extrahera värde, vilket kan ta tid, öka riskerna och öka tiden till värde. Med SageMaker Canvas kan säkerhetsanalytiker enkelt och säkert komma åt ledande grundmodeller för att förbereda sina data snabbare och åtgärda cybersäkerhetsrisker.
Dataförberedelser innebär noggrann formatering och genomtänkt kontextualisering, att arbeta bakåt från kundproblemet. Nu med SageMaker Canvas-chatt för dataförberedande förmåga kan analytiker med domänkunskap snabbt förbereda, organisera och extrahera värde från data med hjälp av en chattbaserad upplevelse.
Lösningsöversikt
Generativ AI revolutionerar säkerhetsdomänen genom att tillhandahålla personliga och naturliga språkupplevelser, förbättra riskidentifiering och åtgärdande, samtidigt som företagets produktivitet ökar. För detta användningsfall använder vi SageMaker Canvas, Amazon SageMaker Data Wrangler, Amazon Security Lakeoch Amazon enkel lagringstjänst (Amazon S3). Amazon Security Lake låter dig aggregera och normalisera säkerhetsdata för analys för att få en bättre förståelse av säkerheten i hela din organisation. Amazon S3 gör att du kan lagra och hämta vilken mängd data som helst när som helst och när som helst. Den erbjuder branschledande skalbarhet, datatillgänglighet, säkerhet och prestanda.
SageMaker Canvas stöder nu omfattande databeredningsfunktioner som drivs av SageMaker Data Wrangler. Med denna integrering tillhandahåller SageMaker Canvas en end-to-end-arbetsyta utan kod för att förbereda data, bygga och använda maskininlärning (ML) och Amazonas berggrund grundmodeller för att påskynda tiden från data till affärsinsikter. Du kan nu upptäcka och samla data från över 50 datakällor och utforska och förbereda data med hjälp av över 300 inbyggda analyser och transformationer i SageMaker Canvas visuella gränssnitt. Du kommer också att se snabbare prestanda för transformationer och analyser, och dra nytta av ett naturligt språkgränssnitt för att utforska och transformera data för ML.
I det här inlägget visar vi tre viktiga transformationer; filtrering, byte av kolumn och textextraktion från en kolumn i datauppsättningen för säkerhetsresultat. Vi demonstrerar också hur du använder funktionen för att förbereda chatt för data i SageMaker Canvas för att analysera data och visualisera dina resultat.
Förutsättningar
Innan du börjar behöver du ett AWS-konto. Du måste också ställa in en Amazon SageMaker Studio domän. För instruktioner om hur du ställer in SageMaker Canvas, se Generera maskininlärningsförutsägelser utan kod.
Få åtkomst till SageMaker Canvas chattgränssnitt
Slutför följande steg för att börja använda SageMaker Canvas chattfunktion:
- Välj på SageMaker Canvas-konsolen Data Wrangler.
- Enligt dataset, välj Amazon S3 som din källa och ange datauppsättning av säkerhetsfynd från Amazon Security Lake.
- Välj ditt dataflöde och välj Chatta för dataförberedelser, som visar en chattgränssnittsupplevelse med guidade uppmaningar.
Filtrera data
För det här inlägget vill vi först filtrera efter kritiska och allvarliga varningar, så vi skriver in instruktionerna i chattrutan för att ta bort fynd som inte är kritiska eller av hög svårighetsgrad. Canvas tar bort raderna, visar en förhandsvisning av transformerade data och ger möjlighet att använda koden. Vi kan lägga till det i listan med steg i Steg rutan.
Byt namn på kolumner
Därefter vill vi byta namn på två kolumner, så vi anger följande prompt i chattrutan för att byta namn på desc och rubricerade kolumner till Finna och sanering. SageMaker Canvas genererar en förhandsgranskning, och om du är nöjd med resultatet kan du lägga till den transformerade datan i dataflödesstegen.
Extrahera text
För att bestämma källan Regioner för fynden, kan du ange i chatt instruktioner till Extrahera regiontexten från UID-kolumnen baserat på mönstret arn:aws:security:securityhub:region:*
och skapa en ny kolumn som heter Region) för att extrahera regiontexten från UID-kolumnen baserat på ett mönster. SageMaker Canvas genererar sedan kod för att skapa en ny regionkolumn. Dataförhandsgranskningen visar att resultaten kommer från en region: us-west-2
. Du kan lägga till denna omvandling till dataflödet för nedströmsanalys.
Analysera data
Slutligen vill vi analysera data för att avgöra om det finns en korrelation mellan tid på dygnet och antal kritiska fynd. Du kan ange en förfrågan om att sammanfatta viktiga fynd efter tid på dagen i chatten, och SageMaker Canvas returnerar insikter som är användbara för din undersökning och analys.
Visualisera fynden
Därefter visualiserar vi resultaten efter svårighetsgrad över tid för att inkludera i en ledarskapsrapport. Du kan be SageMaker Canvas att generera ett stapeldiagram av svårighetsgrad jämfört med tid på dygnet. På några sekunder har SageMaker Canvas skapat diagrammet grupperat efter svårighetsgrad. Du kan lägga till denna visualisering i analysen i dataflödet och ladda ner den för din rapport. Data visar att fynden kommer från en region och inträffar vid specifika tidpunkter. Detta ger oss förtroende för var vi ska fokusera vår säkerhetsundersökning för att fastställa grundorsaker och korrigerande åtgärder.
Städa upp
För att undvika oavsiktliga avgifter, slutför du följande steg för att rensa dina resurser:
- Töm S3-hinken du använde som källa.
- Logga ut från SageMaker Canvas.
Slutsats
I det här inlägget visade vi dig hur du använder SageMaker Canvas som en end-to-end no-code-arbetsyta för dataförberedelse för att bygga och använda Amazon Bedrock-grundmodeller för att påskynda tiden för att samla in affärsinsikter från data.
Observera att detta tillvägagångssätt inte är begränsat till säkerhetsresultat; du kan tillämpa detta på alla generativa AI-användningsfall som använder dataförberedelse i sin kärna.
Framtiden tillhör företag som effektivt kan utnyttja kraften i generativ AI och stora språkmodeller. Men för att göra det måste vi först utveckla en solid datastrategi och förstå konsten att förbereda data. Genom att använda generativ AI för att strukturera vår data intelligent och arbeta bakåt från kunden kan vi lösa affärsproblem snabbare. Med SageMaker Canvas-chatt för dataförberedelse är det enkelt för analytiker att komma igång och fånga omedelbart värde från AI.
Om författarna
Sudeesh Sasidharan är Senior Solutions Architect på AWS, inom energiteamet. Sudeesh älskar att experimentera med ny teknik och bygga innovativa lösningar som löser komplexa affärsutmaningar. När han inte designar lösningar eller pysslar med den senaste tekniken kan du hitta honom på tennisbanan som arbetar med sin backhand.
John Klacynski är en Principal Customer Solution Manager inom AWS Independent Software Vendor (ISV)-teamet. I den här rollen hjälper han programmatiskt ISV-kunder att anta AWS-teknologier och tjänster för att nå sina affärsmål snabbare. Innan han började på AWS ledde John Data Product Teams för stora konsumentpaketvaruföretag, och hjälpte dem att utnyttja datainsikter för att förbättra sin verksamhet och beslutsfattande.
- SEO-drivet innehåll och PR-distribution. Bli förstärkt idag.
- PlatoData.Network Vertical Generative Ai. Styrka dig själv. Tillgång här.
- PlatoAiStream. Web3 Intelligence. Kunskap förstärkt. Tillgång här.
- Platoesg. Kol, CleanTech, Energi, Miljö, Sol, Avfallshantering. Tillgång här.
- PlatoHealth. Biotech och kliniska prövningar Intelligence. Tillgång här.
- Källa: https://aws.amazon.com/blogs/machine-learning/analyze-security-findings-faster-with-no-code-data-preparation-using-generative-ai-and-amazon-sagemaker-canvas/
- : har
- :är
- :inte
- :var
- $UPP
- 100
- 125
- 300
- 50
- 7
- a
- accelerera
- tillgång
- Konto
- tvärs
- åtgärder
- lägga till
- anta
- aggregat
- AI
- tillåter
- också
- amason
- Amazon SageMaker
- Amazon SageMaker Canvas
- Amazon Web Services
- mängd
- an
- analyser
- analys
- analytiker
- analysera
- och
- vilken som helst
- Ansök
- tillvägagångssätt
- lämpligt
- ÄR
- Konst
- AS
- be
- At
- tillgänglighet
- undvika
- AWS
- bar
- baserat
- BE
- tillhör
- fördel
- Bättre
- mellan
- öka
- Box
- SLUTRESULTAT
- Byggnad
- inbyggd
- företag
- företag
- men
- by
- kallas
- KAN
- canvas
- kapacitet
- kapacitet
- fånga
- Fångande
- noggrann
- Vid
- Orsakerna
- utmaningar
- avgifter
- Diagram
- chatt
- Välja
- rena
- koda
- Kolumn
- Kolonner
- Företag
- jämfört
- fullborda
- komplex
- omfattande
- förtroende
- Konsol
- Konsumenten
- Kärna
- Korrelation
- Domstol
- skapa
- skapas
- kritisk
- kund
- Kunder
- cyber
- Cybersäkerhet
- datum
- Förberedelse av data
- datstrategi
- dag
- Beslutet
- Beslutsfattande
- demonstrera
- beskriva
- design
- Bestämma
- utveckla
- Upptäck
- Visa
- displayer
- do
- domän
- ladda ner
- effektivt
- enkel
- enkelt
- möjliggör
- början till slut
- energi
- förbättra
- ange
- erfarenhet
- Erfarenheter
- experimentera
- utforska
- extrahera
- extraktion
- snabbare
- Leverans
- filtrera
- filtrering
- hitta
- resultat
- Förnamn
- flöda
- Fokus
- efter
- För
- fundament
- från
- framtida
- Få
- samla
- generera
- genererar
- generativ
- Generativ AI
- skaffa sig
- ger
- Mål
- varor
- guidad
- hända
- lyckligt
- sele
- he
- hjälpa
- hjälper
- Hög
- honom
- hans
- Hur ser din drömresa ut
- How To
- Men
- http
- HTTPS
- Identifiering
- if
- omedelbar
- förbättra
- in
- innefattar
- Öka
- oberoende
- branschledande
- innovativa
- insikter
- instruktioner
- integrering
- Gränssnitt
- in
- Undersökningen
- innebär
- ISV
- IT
- DESS
- John
- sammanfogning
- jpg
- Nyckel
- kunskap
- sjö
- språk
- Large
- senaste
- Ledarskap
- ledande
- inlärning
- Led
- Led data
- Hävstång
- Begränsad
- Lista
- älskar
- Maskinen
- maskininlärning
- Framställning
- chef
- maximal
- ML
- modeller
- mer
- måste
- Natural
- Behöver
- behov
- Nya
- Ny teknik
- nu
- antal
- of
- Erbjudanden
- on
- ONE
- Verksamhet
- Alternativet
- or
- organisation
- vår
- ut
- över
- paket
- panelen
- Mönster
- prestanda
- personlig
- rörledning
- Plats
- plato
- Platon Data Intelligence
- PlatonData
- Inlägg
- potentiell
- kraft
- drivs
- Förutsägelser
- beredning
- Förbered
- beredd
- Förhandsvisning
- Principal
- Innan
- Problem
- problem
- Produkt
- produktivitet
- prompter
- ger
- tillhandahålla
- snabbt
- nå
- hänvisa
- region
- regioner
- avlägsnar
- rapport
- begära
- Kräver
- Resurser
- Resultat
- återgår
- revolutionera
- Risk
- risker
- Roll
- rot
- sagemaker
- skalbarhet
- Skala
- sekunder
- säkert
- säkerhet
- säkerhetsrisker
- se
- senior
- Tjänster
- in
- inställning
- visade
- Visar
- Enkelt
- skicklighet
- So
- Mjukvara
- fast
- lösning
- Lösningar
- LÖSA
- Lösa
- Källa
- Källor
- specialiserad
- specifik
- starta
- igång
- Starta
- Steg
- förvaring
- lagra
- Strategi
- struktur
- sammanfatta
- Stöder
- Ta
- grupp
- lag
- Tekniken
- Teknologi
- tennis
- text
- den där
- Smakämnen
- källan
- deras
- Dem
- sedan
- Där.
- detta
- tre
- tid
- gånger
- till
- Förvandla
- Transformation
- transformationer
- transformerad
- transformer
- två
- förstå
- förståelse
- låsa
- Uppdatering
- us
- användning
- användningsfall
- Begagnade
- användbara
- användningar
- med hjälp av
- värde
- leverantör
- visuell
- visualisering
- visualisera
- vill
- we
- webb
- webbservice
- när
- som
- medan
- kommer
- med
- inom
- utan
- Arbete
- arbetssätt
- Om er
- Din
- zephyrnet