Data er grunnlaget for å fange maksimal verdi fra AI-teknologi og raskt løse forretningsproblemer. For å frigjøre potensialet til generative AI-teknologier er det imidlertid en nøkkelforutsetning: dataene dine må være riktig forberedt. I dette innlegget beskriver vi hvordan du bruker generativ AI for å oppdatere og skalere datapipeline ved hjelp av Amazon SageMaker Canvas for dataforberedelse.
Vanligvis krever datapipelinearbeid en spesialisert ferdighet for å forberede og organisere data som sikkerhetsanalytikere kan bruke for å hente ut verdi, noe som kan ta tid, øke risikoen og øke tiden til verdi. Med SageMaker Canvas kan sikkerhetsanalytikere enkelt og sikkert få tilgang til ledende grunnmodeller for å klargjøre dataene sine raskere og utbedre cybersikkerhetsrisikoer.
Dataforberedelse innebærer nøye formatering og gjennomtenkt kontekstualisering, og jobber bakover fra kundeproblemet. Nå med SageMaker Canvas-chatten for dataforberedelse, kan analytikere med domenekunnskap raskt forberede, organisere og trekke ut verdi fra data ved hjelp av en chat-basert opplevelse.
Løsningsoversikt
Generativ AI revolusjonerer sikkerhetsdomenet ved å tilby personlige og naturlige språkopplevelser, forbedre risikoidentifikasjon og utbedring, samtidig som den øker bedriftens produktivitet. For denne brukssaken bruker vi SageMaker Canvas, Amazon SageMaker Data Wrangler, Amazon Security Lakeog Amazon enkel lagringstjeneste (Amazon S3). Amazon Security Lake lar deg samle og normalisere sikkerhetsdata for analyse for å få en bedre forståelse av sikkerhet på tvers av organisasjonen din. Amazon S3 lar deg lagre og hente en hvilken som helst mengde data når som helst og når som helst. Den tilbyr bransjeledende skalerbarhet, datatilgjengelighet, sikkerhet og ytelse.
SageMaker Canvas støtter nå omfattende dataforberedelsesfunksjoner drevet av SageMaker Data Wrangler. Med denne integrasjonen gir SageMaker Canvas et ende-til-ende arbeidsområde uten kode for å forberede data, bygge og bruke maskinlæring (ML) og Amazonas grunnfjell grunnleggende modeller for å akselerere tiden fra data til forretningsinnsikt. Du kan nå oppdage og samle data fra over 50 datakilder og utforske og forberede data ved å bruke over 300 innebygde analyser og transformasjoner i SageMaker Canvas visuelle grensesnitt. Du vil også se raskere ytelse for transformasjoner og analyser, og dra nytte av et naturlig språkgrensesnitt for å utforske og transformere data for ML.
I dette innlegget demonstrerer vi tre sentrale transformasjoner; filtrering, navn på kolonner og tekstutvinning fra en kolonne i datasettet for sikkerhetsfunn. Vi demonstrerer også bruk av chat for data prep-funksjonen i SageMaker Canvas for å analysere dataene og visualisere funnene dine.
Forutsetninger
Før du starter, trenger du en AWS-konto. Du må også sette opp en Amazon SageMaker Studio domene. For instruksjoner om oppsett av SageMaker Canvas, se Generer maskinlæringsspådommer uten kode.
Få tilgang til SageMaker Canvas chat-grensesnitt
Fullfør følgende trinn for å begynne å bruke SageMaker Canvas chat-funksjonen:
- Velg på SageMaker Canvas-konsollen Data Wrangler.
- Under datasett, velg Amazon S3 som kilde og spesifiser datasett for sikkerhetsfunn fra Amazon Security Lake.
- Velg din dataflyt og velg Chat for dataforberedelse, som vil vise en chat-grensesnittopplevelse med veilede meldinger.
Filtrer data
For dette innlegget ønsker vi først å filtrere etter kritiske advarsler og advarsler med høy alvorlighetsgrad, så vi skriver inn instruksjonene i chatteboksen for å fjerne funn som ikke er kritiske eller høy alvorlighetsgrad. Canvas fjerner radene, viser en forhåndsvisning av transformerte data og gir muligheten til å bruke koden. Vi kan legge det til listen over trinn i Steps ruten.
Gi nytt navn til kolonner
Deretter ønsker vi å gi nytt navn til to kolonner, så vi skriver inn følgende melding i chat-boksen for å gi nytt navn til synkende og tittel kolonner til Finne og Utbedring. SageMaker Canvas genererer en forhåndsvisning, og hvis du er fornøyd med resultatene, kan du legge til de transformerte dataene i dataflyttrinnene.
Pakk ut tekst
For å finne kilden Regioner for funnene, kan du skrive inn chatteinstruksjoner til Trekk ut regionteksten fra UID-kolonnen basert på mønsteret arn:aws:security:securityhub:region:*
og lag en ny kolonne kalt Region) for å trekke ut regionteksten fra UID-kolonnen basert på et mønster. SageMaker Canvas genererer deretter kode for å lage en ny regionkolonne. Dataforhåndsvisningen viser at funnene kommer fra én region: us-west-2
. Du kan legge til denne transformasjonen til dataflyten for nedstrømsanalyse.
Analyser dataene
Til slutt ønsker vi å analysere dataene for å finne ut om det er en sammenheng mellom tid på døgnet og antall kritiske funn. Du kan legge inn en forespørsel om å oppsummere kritiske funn etter tid på dagen i chatten, og SageMaker Canvas returnerer innsikt som er nyttig for din undersøkelse og analyse.
Visualiser funn
Deretter visualiserer vi funnene etter alvorlighetsgrad over tid for å inkludere i en lederrapport. Du kan be SageMaker Canvas om å generere et søylediagram av alvorlighetsgrad sammenlignet med tid på dagen. På sekunder har SageMaker Canvas laget diagrammet gruppert etter alvorlighetsgrad. Du kan legge til denne visualiseringen i analysen i dataflyten og laste den ned for rapporten din. Dataene viser at funnene stammer fra én region og skjer på bestemte tidspunkter. Dette gir oss tillit til hvor vi skal fokusere etterforskningen av sikkerhetsfunnene våre for å finne de grunnleggende årsakene og korrigerende handlinger.
Rydd opp
For å unngå å pådra seg utilsiktede belastninger, fullfør følgende trinn for å rydde opp i ressursene dine:
- Tøm S3-bøtta du brukte som kilde.
- Logg ut av SageMaker Canvas.
konklusjonen
I dette innlegget viste vi deg hvordan du bruker SageMaker Canvas som et ende-til-ende arbeidsområde uten kode for dataforberedelse for å bygge og bruke Amazon Bedrock-fundamentmodeller for å akselerere tiden for å samle forretningsinnsikt fra data.
Merk at denne tilnærmingen ikke er begrenset til sikkerhetsfunn; du kan bruke dette på alle generative AI-brukssaker som bruker dataforberedelse i kjernen.
Fremtiden tilhører bedrifter som effektivt kan utnytte kraften til generativ AI og store språkmodeller. Men for å gjøre det, må vi først utvikle en solid datastrategi og forstå kunsten å forberede data. Ved å bruke generativ AI for å strukturere dataene våre intelligent, og jobbe bakover fra kunden, kan vi løse forretningsproblemer raskere. Med SageMaker Canvas-chat for dataforberedelse er det enkelt for analytikere å komme i gang og fange umiddelbar verdi fra AI.
Om forfatterne
Sudeesh Sasidharan er Senior Solutions Architect hos AWS, innenfor energiteamet. Sudeesh elsker å eksperimentere med nye teknologier og bygge innovative løsninger som løser komplekse forretningsutfordringer. Når han ikke designer løsninger eller pirker med den nyeste teknologien, kan du finne ham på tennisbanen mens han jobber med backhanden.
John Klacynski er en hovedkundeløsningssjef i AWS Independent Software Vendor (ISV)-teamet. I denne rollen hjelper han programmatisk ISV-kunder med å ta i bruk AWS-teknologier og -tjenester for å nå sine forretningsmål raskere. Før han begynte i AWS, ledet John Data Product Teams for store Consumer Package Goods-selskaper, og hjalp dem med å utnytte datainnsikt for å forbedre driften og beslutningstakingen.
- SEO-drevet innhold og PR-distribusjon. Bli forsterket i dag.
- PlatoData.Network Vertical Generative Ai. Styrk deg selv. Tilgang her.
- PlatoAiStream. Web3 Intelligence. Kunnskap forsterket. Tilgang her.
- PlatoESG. Karbon, CleanTech, Energi, Miljø, Solenergi, Avfallshåndtering. Tilgang her.
- PlatoHelse. Bioteknologisk og klinisk etterretning. Tilgang her.
- kilde: https://aws.amazon.com/blogs/machine-learning/analyze-security-findings-faster-with-no-code-data-preparation-using-generative-ai-and-amazon-sagemaker-canvas/
- : har
- :er
- :ikke
- :hvor
- $OPP
- 100
- 125
- 300
- 50
- 7
- a
- akselerere
- adgang
- Logg inn
- tvers
- handlinger
- legge til
- adoptere
- aggregat
- AI
- tillater
- også
- Amazon
- Amazon SageMaker
- Amazon SageMaker Canvas
- Amazon Web Services
- beløp
- an
- analyser
- analyse
- analytikere
- analysere
- og
- noen
- Påfør
- tilnærming
- hensiktsmessig
- ER
- Kunst
- AS
- spør
- At
- tilgjengelighet
- unngå
- AWS
- Bar
- basert
- BE
- tilhører
- nytte
- Bedre
- mellom
- øke
- Eske
- bygge
- Bygning
- innebygd
- virksomhet
- bedrifter
- men
- by
- som heter
- CAN
- lerret
- evner
- evne
- fangst
- fange
- forsiktig
- saken
- årsaker
- utfordringer
- avgifter
- Figur
- chatte
- Velg
- ren
- kode
- Kolonne
- kolonner
- Selskaper
- sammenlignet
- fullføre
- komplekse
- omfattende
- selvtillit
- Konsoll
- forbruker
- Kjerne
- Korrelasjon
- Court
- skape
- opprettet
- kritisk
- kunde
- Kunder
- cyber
- cybersikkerhet
- dato
- Dataklargjøring
- datastrategi
- dag
- avgjørelse
- Beslutningstaking
- demonstrere
- beskrive
- utforme
- Bestem
- utvikle
- oppdage
- Vise
- skjermer
- do
- domene
- nedlasting
- effektivt
- uanstrengt
- uanstrengt
- muliggjør
- ende til ende
- energi
- styrke
- Enter
- erfaring
- Erfaringer
- eksperimentere
- utforske
- trekke ut
- utdrag
- raskere
- Trekk
- filtrere
- filtrering
- Finn
- funn
- Først
- flyten
- Fokus
- etter
- Til
- Fundament
- fra
- framtid
- Gevinst
- samle
- generere
- genererer
- generative
- Generativ AI
- få
- gir
- Mål
- varer
- guidet
- skje
- lykkelig
- seletøy
- he
- hjelpe
- hjelper
- Høy
- ham
- hans
- Hvordan
- Hvordan
- Men
- http
- HTTPS
- Identifikasjon
- if
- umiddelbar
- forbedre
- in
- inkludere
- Øke
- uavhengig
- bransjeledende
- innovative
- innsikt
- instruksjoner
- integrering
- Interface
- inn
- etterforskning
- innebærer
- isv
- IT
- DET ER
- John
- sammenføyning
- jpg
- nøkkel
- kunnskap
- innsjø
- Språk
- stor
- siste
- Ledelse
- ledende
- læring
- Led
- Led data
- Leverage
- Begrenset
- Liste
- elsker
- maskin
- maskinlæring
- Making
- leder
- maksimal
- ML
- modeller
- mer
- må
- Naturlig
- Trenger
- behov
- Ny
- Ny teknologi
- nå
- Antall
- of
- Tilbud
- on
- ONE
- Drift
- Alternativ
- or
- organisasjon
- vår
- ut
- enn
- pakke
- brød
- Mønster
- ytelse
- Personlig
- rørledning
- Sted
- plato
- Platon Data Intelligence
- PlatonData
- Post
- potensiell
- makt
- powered
- Spådommer
- forberedelse
- Forbered
- forberedt
- Forhåndsvisning
- Principal
- Før
- Problem
- problemer
- Produkt
- produktivitet
- ledetekster
- gir
- gi
- raskt
- å nå
- referere
- region
- regioner
- Fjerner
- rapporterer
- anmode
- Krever
- Ressurser
- Resultater
- avkastning
- revolusjonerer
- Risiko
- risikoer
- Rolle
- root
- sagemaker
- skalerbarhet
- Skala
- sekunder
- sikkert
- sikkerhet
- sikkerhetsrisiko
- se
- senior
- Tjenester
- sett
- innstilling
- viste
- Viser
- Enkelt
- ferdighet
- So
- Software
- solid
- løsning
- Solutions
- LØSE
- løse
- kilde
- Kilder
- spesialisert
- spesifikk
- Begynn
- startet
- Start
- Steps
- lagring
- oppbevare
- Strategi
- struktur
- oppsummere
- Støtter
- Ta
- lag
- lag
- Technologies
- Teknologi
- tennis
- tekst
- Det
- De
- Kilden
- deres
- Dem
- deretter
- Der.
- denne
- tre
- tid
- ganger
- til
- Transform
- Transformation
- transformasjoner
- forvandlet
- transforme
- to
- forstå
- forståelse
- låse opp
- Oppdater
- us
- bruke
- bruk sak
- brukt
- nyttig
- bruker
- ved hjelp av
- verdi
- leverandør
- visuell
- visualisering
- visualisere
- ønsker
- we
- web
- webtjenester
- når
- hvilken
- mens
- vil
- med
- innenfor
- uten
- Arbeid
- arbeid
- Du
- Din
- zephyrnet