Innen kapitalforvaltning må porteføljeforvaltere overvåke selskaper i deres investeringsunivers nøye for å identifisere risikoer og muligheter, og veilede investeringsbeslutninger. Det er enkelt å spore direkte hendelser som inntektsrapporter eller kredittnedgraderinger – du kan sette opp varsler for å varsle ledere om nyheter som inneholder firmanavn. Det er imidlertid utfordrende å oppdage andre og tredje ordens påvirkninger som oppstår fra hendelser hos leverandører, kunder, partnere eller andre enheter i en bedrifts økosystem.
For eksempel vil en forsyningskjedeavbrudd hos en nøkkelleverandør sannsynligvis påvirke nedstrømsprodusenter negativt. Eller tapet av en toppkunde for en stor kunde utgjør en etterspørselsrisiko for leverandøren. Svært ofte klarer ikke slike hendelser å skape overskrifter som viser det berørte selskapet direkte, men det er likevel viktig å ta hensyn til. I dette innlegget demonstrerer vi en automatisert løsning som kombinerer kunnskapsgrafer og generativ kunstig intelligens (AI) å synliggjøre slike risikoer ved å kryssreferanser forholdskart med sanntidsnyheter.
Grovt sett innebærer dette to trinn: For det første å bygge de intrikate relasjonene mellom selskaper (kunder, leverandører, direktører) til en kunnskapsgraf. For det andre, bruk av denne grafdatabasen sammen med generativ AI for å oppdage andre og tredje-ordens påvirkninger fra nyhetshendelser. For eksempel kan denne løsningen fremheve at forsinkelser hos en deleleverandør kan forstyrre produksjonen for nedstrøms bilprodusenter i en portefølje, selv om ingen er direkte referert.
Med AWS kan du distribuere denne løsningen i en serverløs, skalerbar og fullstendig hendelsesdrevet arkitektur. Dette innlegget demonstrerer et proof of concept bygget på to viktige AWS-tjenester som er godt egnet for grafisk kunnskapsrepresentasjon og naturlig språkbehandling: Amazon Neptun og Amazonas grunnfjell. Neptune er en rask, pålitelig, fullstendig administrert grafdatabasetjeneste som gjør det enkelt å bygge og kjøre applikasjoner som fungerer med svært tilkoblede datasett. Amazon Bedrock er en fullt administrert tjeneste som tilbyr et utvalg av høyytende fundamentmodeller (FM-er) fra ledende AI-selskaper som AI21 Labs, Anthropic, Cohere, Meta, Stability AI og Amazon gjennom et enkelt API, sammen med et bredt sett av evner til å bygge generative AI-applikasjoner med sikkerhet, personvern og ansvarlig AI.
Totalt sett demonstrerer denne prototypen kunsten å være mulig med kunnskapsgrafer og generativ AI – å utlede signaler ved å koble sammen forskjellige prikker. Takeaway for investeringseksperter er muligheten til å holde seg på toppen av utviklingen nærmere signalet samtidig som man unngår støy.
Bygg kunnskapsgrafen
Det første trinnet i denne løsningen er å bygge en kunnskapsgraf, og en verdifull, men ofte oversett datakilde for kunnskapsgrafer, er selskapets årsrapporter. Fordi offisielle bedriftspublikasjoner gjennomgår gransking før utgivelse, vil informasjonen de inneholder sannsynligvis være nøyaktig og pålitelig. Årsrapporter er imidlertid skrevet i et ustrukturert format ment for menneskelig lesing i stedet for maskinforbruk. For å frigjøre potensialet deres, trenger du en måte å systematisk trekke ut og strukturere rikdommen av fakta og relasjoner de inneholder.
Med generative AI-tjenester som Amazon Bedrock, har du nå muligheten til å automatisere denne prosessen. Du kan ta en årsrapport og utløse en behandlingspipeline for å innta rapporten, dele den opp i mindre biter og bruke naturlig språkforståelse for å trekke ut fremtredende enheter og relasjoner.
For eksempel, en setning som sier at "[Bedrift A] utvidet sin europeiske elektriske leveringsflåte med en ordre på 1,800 elektriske varebiler fra [Bedrift B]" ville tillate Amazon Bedrock å identifisere følgende:
- [Bedrift A] som kunde
- [Bedrift B] som leverandør
- Et leverandørforhold mellom [Bedrift A] og [Bedrift B]
- Forholdsdetaljer for "leverandør av elektriske varebiler"
Å trekke ut slike strukturerte data fra ustrukturerte dokumenter krever å gi nøye utformede forespørsler til store språkmodeller (LLM) slik at de kan analysere tekst for å trekke ut enheter som selskaper og mennesker, samt relasjoner som kunder, leverandører og mer. Forespørslene inneholder klare instruksjoner om hva du skal se etter og strukturen for å returnere dataene i. Ved å gjenta denne prosessen på tvers av hele årsrapporten, kan du trekke ut de relevante enhetene og relasjonene for å konstruere en rik kunnskapsgraf.
Men før du overfører den utpakkede informasjonen til kunnskapsgrafen, må du først disambiguere enhetene. For eksempel kan det allerede være en annen «[Bedrift A]»-enhet i kunnskapsgrafen, men den kan representere en annen organisasjon med samme navn. Amazon Bedrock kan resonnere og sammenligne attributter som forretningsfokusområde, industri og inntektsgenererende bransjer og relasjoner til andre enheter for å finne ut om de to enhetene faktisk er forskjellige. Dette forhindrer unøyaktig sammenslåing av ikke-relaterte selskaper til en enkelt enhet.
Etter at disambigueringen er fullført, kan du på en pålitelig måte legge til nye enheter og relasjoner i Neptun-kunnskapsgrafen din, og berike den med fakta hentet fra årsrapporter. Over tid vil inntak av pålitelige data og integrering av mer pålitelige datakilder bidra til å bygge en omfattende kunnskapsgraf som kan støtte avslørende innsikt gjennom grafforespørsler og analyser.
Denne automatiseringen aktivert av generativ AI gjør det mulig å behandle tusenvis av årsrapporter og låser opp en uvurderlig ressurs for kunnskapsgrafkurering som ellers ville forbli uutnyttet på grunn av den uoverkommelige manuelle innsatsen som trengs.
Følgende skjermbilde viser et eksempel på den visuelle utforskningen som er mulig i en Neptun-grafdatabase ved å bruke Graph Explorer verktøyet.
Behandle nyhetsartikler
Det neste trinnet i løsningen er å automatisk berike porteføljeforvalteres nyhetsfeed og fremheve artikler som er relevante for deres interesser og investeringer. For nyhetsfeeden kan porteføljeforvaltere abonnere på hvilken som helst tredjeparts nyhetsleverandør gjennom AWS datautveksling eller et annet nyhets-API etter eget valg.
Når en nyhetsartikkel kommer inn i systemet, påkalles en inntakspipeline for å behandle innholdet. Ved å bruke teknikker som ligner på behandling av årsrapporter, brukes Amazon Bedrock til å trekke ut enheter, attributter og relasjoner fra nyhetsartikkelen, som deretter brukes til å disambiguere mot kunnskapsgrafen for å identifisere den tilsvarende enheten i kunnskapsgrafen.
Kunnskapsgrafen inneholder koblinger mellom selskaper og personer, og ved å koble artikkelenheter til eksisterende noder kan du identifisere om noen emner er innenfor to hopp fra selskapene som porteføljeforvalteren har investert i eller er interessert i. Å finne en slik kobling indikerer artikkelen kan være relevant for porteføljeforvalteren, og fordi de underliggende dataene er representert i en kunnskapsgraf, kan den visualiseres for å hjelpe porteføljeforvalteren til å forstå hvorfor og hvordan denne konteksten er relevant. I tillegg til å identifisere forbindelser til porteføljen, kan du også bruke Amazon Bedrock til å utføre sentimentanalyse på enhetene det refereres til.
Det endelige resultatet er en beriket nyhetsfeed som viser artikler som sannsynligvis vil påvirke porteføljeforvalterens interesseområder og investeringer.
Løsningsoversikt
Den generelle arkitekturen til løsningen ser ut som følgende diagram.
Arbeidsflyten består av følgende trinn:
- En bruker laster opp offisielle rapporter (i PDF-format) til en Amazon enkel lagringstjeneste (Amazon S3) bøtte. Rapportene bør være offisielt publiserte rapporter for å minimere inkluderingen av unøyaktige data i kunnskapsgrafen din (i motsetning til nyheter og tabloider).
- S3-hendelsesvarselet påkaller en AWS Lambda funksjon, som sender S3-bøtten og filnavnet til en Amazon enkel køtjeneste (Amazon SQS) kø. First-In-First-Out (FIFO)-køen sørger for at rapportinntaksprosessen utføres sekvensielt for å redusere sannsynligheten for å introdusere dupliserte data i kunnskapsgrafen din.
- An Amazon EventBridge tidsbasert hendelse kjøres hvert minutt for å starte kjøringen av en AWS trinnfunksjoner tilstandsmaskin asynkront.
- Step Functions-tilstandsmaskinen kjører gjennom en rekke oppgaver for å behandle det opplastede dokumentet ved å trekke ut nøkkelinformasjon og sette den inn i kunnskapsgrafen din:
- Motta kømeldingen fra Amazon SQS.
- Last ned PDF-rapportfilen fra Amazon S3, del den opp i flere mindre tekstbiter (ca. 1,000 ord) for behandling, og lagre tekstbitene i Amazon DynamoDB.
- Bruk Anthropics Claude v3 Sonnet på Amazon Bedrock til å behandle de første få tekstbitene for å bestemme hovedenheten som rapporten refererer til, sammen med relevante attributter (som industri).
- Hent tekstbitene fra DynamoDB og for hver tekstdel, påkall en Lambda-funksjon for å trekke ut enheter (som selskap eller person), og dets forhold (kunde, leverandør, partner, konkurrent eller direktør) til hovedenheten ved å bruke Amazon Bedrock .
- Konsolider all utvunnet informasjon.
- Filtrer ut støy og irrelevante enheter (for eksempel generiske termer som "forbrukere") ved å bruke Amazon Bedrock.
- Bruk Amazon Bedrock til å gjøre disambiguering ved å resonnere ved å bruke den utvunnede informasjonen mot listen over lignende enheter fra kunnskapsgrafen. Hvis enheten ikke eksisterer, sett den inn. Ellers bruker du enheten som allerede finnes i kunnskapsgrafen. Sett inn alle relasjoner som er hentet ut.
- Rydd opp ved å slette SQS-kømeldingen og S3-filen.
- En bruker får tilgang til en React-basert nettapplikasjon for å se nyhetsartiklene som er supplert med informasjon om enhet, sentiment og tilkoblingssti.
- Ved å bruke webapplikasjonen spesifiserer brukeren antall hopp (standard N=2) på tilkoblingsbanen som skal overvåkes.
- Ved å bruke nettapplikasjonen spesifiserer brukeren listen over enheter som skal spores.
- For å generere fiktive nyheter velger brukeren Generer eksempelnyheter å generere 10 eksempler på finansielle nyhetsartikler med tilfeldig innhold som skal mates inn i nyhetsinntaksprosessen. Innhold er generert ved hjelp av Amazon Bedrock og er rent fiktivt.
- For å laste ned faktiske nyheter, velger brukeren Last ned siste nytt for å laste ned toppnyhetene som skjer i dag (drevet av NewsAPI.org).
- Nyhetsfilen (TXT-format) lastes opp til en S3-bøtte. Trinn 8 og 9 laster opp nyheter til S3-bøtten automatisk, men du kan også bygge integrasjoner til din foretrukne nyhetsleverandør som AWS Data Exchange eller en hvilken som helst tredjeparts nyhetsleverandør for å slippe nyhetsartikler som filer i S3-bøtten. Innholdet i nyhetsdatafilen skal formateres som
<date>{dd mmm yyyy}</date><title>{title}</title><text>{news content}</text>
. - S3-hendelsesvarselet sender S3-bøtten eller filnavnet til Amazon SQS (standard), som påkaller flere Lambda-funksjoner for å behandle nyhetsdataene parallelt:
- Bruk Amazon Bedrock til å trekke ut enheter nevnt i nyhetene sammen med all relatert informasjon, relasjoner og følelser til den nevnte enheten.
- Sjekk mot kunnskapsgrafen og bruk Amazon Bedrock til å gjøre disambiguering ved å resonnere ved å bruke tilgjengelig informasjon fra nyhetene og fra kunnskapsgrafen for å identifisere den tilsvarende enheten.
- Etter at enheten er funnet, søk etter og returner eventuelle tilkoblingsstier som kobles til enheter merket med
INTERESTED=YES
i kunnskapsgrafen som er innenfor N=2 hopp unna.
- Nettapplikasjonen oppdateres automatisk hvert 1. sekund for å trekke ut det siste settet med behandlede nyheter som skal vises på nettapplikasjonen.
Distribuer prototypen
Du kan distribuere prototypeløsningen og begynne å eksperimentere selv. Prototypen er tilgjengelig fra GitHub og inkluderer detaljer om følgende:
- Forutsetninger for distribusjon
- Implementeringstrinn
- Oppryddingstrinn
Oppsummering
Dette innlegget demonstrerte en proof of concept-løsning for å hjelpe porteføljeforvaltere med å oppdage andre- og tredjeordens risikoer fra nyhetshendelser, uten direkte referanser til selskaper de sporer. Ved å kombinere en kunnskapsgraf over intrikate selskapsforhold med sanntidsnyhetsanalyse ved bruk av generativ AI, kan nedstrømseffekter fremheves, for eksempel produksjonsforsinkelser fra leverandørhikke.
Selv om det bare er en prototype, viser denne løsningen løftet om kunnskapsgrafer og språkmodeller for å koble sammen prikker og utlede signaler fra støy. Disse teknologiene kan hjelpe investeringseksperter ved å avsløre risikoer raskere gjennom relasjonskartlegging og resonnement. Totalt sett er dette en lovende anvendelse av grafdatabaser og AI som garanterer utforskning for å øke investeringsanalyse og beslutningstaking.
Hvis dette eksemplet på generativ AI i finansielle tjenester er av interesse for virksomheten din, eller du har en lignende idé, ta kontakt med AWS-kontoadministratoren din, så vil vi gjerne utforske videre med deg.
om forfatteren
Xan Huang er Senior Solutions Architect med AWS og er basert i Singapore. Han jobber med store finansinstitusjoner for å designe og bygge sikre, skalerbare og svært tilgjengelige løsninger i skyen. Utenom jobben tilbringer Xan mesteparten av fritiden med familien sin og blir styrt av sin 3 år gamle datter. Du kan finne Xan på Linkedin.
- SEO-drevet innhold og PR-distribusjon. Bli forsterket i dag.
- PlatoData.Network Vertical Generative Ai. Styrk deg selv. Tilgang her.
- PlatoAiStream. Web3 Intelligence. Kunnskap forsterket. Tilgang her.
- PlatoESG. Karbon, CleanTech, Energi, Miljø, Solenergi, Avfallshåndtering. Tilgang her.
- PlatoHelse. Bioteknologisk og klinisk etterretning. Tilgang her.
- kilde: https://aws.amazon.com/blogs/machine-learning/uncover-hidden-connections-in-unstructured-financial-data-with-amazon-bedrock-and-amazon-neptune/
- : har
- :er
- :ikke
- $OPP
- 000
- 1
- 10
- 100
- 7
- 8
- 800
- 9
- a
- evne
- Logg inn
- nøyaktig
- tvers
- faktiske
- faktisk
- legge til
- tillegg
- mot
- AI
- AI-tjenester
- Aid
- Varsler
- Alle
- tillate
- langs
- allerede
- også
- Amazon
- Amazon Neptun
- Amazon Web Services
- an
- analyse
- analytics
- analysere
- og
- årlig
- En annen
- Antropisk
- noen
- api
- Søknad
- søknader
- Påfør
- ca
- arkitektur
- ER
- AREA
- områder
- oppstår
- rundt
- Kunst
- Artikkel
- artikler
- kunstig
- kunstig intelligens
- AS
- eiendel
- Kapitalforvaltning
- At
- oppmerksomhet
- attributter
- øke
- auto
- automatisere
- Automatisert
- automatisk
- Automatisering
- tilgjengelig
- unngå
- borte
- AWS
- AWS datautveksling
- basert
- BE
- fordi
- vært
- før du
- mellom
- Break
- bred
- bygge
- Bygning
- bygget
- virksomhet
- men
- by
- CAN
- evner
- evne
- nøye
- kjede
- utfordrende
- valg
- Velger
- fjerne
- kunde
- tett
- nærmere
- Cloud
- kombinere
- begå
- Selskaper
- Selskapet
- Selskapets
- sammenligne
- konkurrent
- fullføre
- omfattende
- konsept
- Koble
- tilkoblet
- Tilkobling
- tilkobling
- Tilkoblinger
- består
- konstruere
- forbruk
- inneholde
- inneholder
- innhold
- kontekst
- Bedriftens
- Tilsvarende
- kunne
- utformet
- kreditt
- kryssreferanser
- konservering
- kunde
- Kunder
- dato
- Datautveksling
- Database
- databaser
- datasett
- datter
- Beslutningstaking
- avgjørelser
- Misligholde
- forsinkelser
- glad
- levering
- Etterspørsel
- demonstrere
- demonstrert
- demonstrerer
- utplassere
- Derive
- utforming
- detaljer
- oppdage
- Bestem
- utviklingen
- diagram
- forskjellig
- direkte
- direkte
- Regissør
- Styremedlemmer
- uensartede
- Vise
- Avbryte
- Avbrudd
- distinkt
- dokument
- dokumenter
- gjør
- ned
- nedlasting
- Drop
- to
- hver enkelt
- Inntjening
- økosystem
- innsats
- Elektrisk
- aktivert
- anriket
- berikende
- Går inn
- Hele
- enheter
- enhet
- europeisk
- Event
- hendelser
- Hver
- eksempel
- utveksling
- eksisterer
- eksisterende
- finnes
- utvidet
- eksperimentere
- leting
- utforske
- trekke ut
- fakta
- FAIL
- familie
- FAST
- raskere
- gjennomførbart
- Featuring
- Fed
- Noen få
- fiktiv
- filet
- Filer
- slutt~~POS=TRUNC
- finansiell
- Økonomiske data
- Finansinstitusjoner
- finansielle nyheter
- finansielle tjenester
- Finn
- finne
- Først
- FLÅTE
- Fokus
- etter
- Til
- format
- Fundament
- Gratis
- fra
- fullt
- funksjon
- funksjoner
- videre
- generere
- generert
- generative
- Generativ AI
- få
- Go
- graf
- grafer
- veilede
- Skjer
- Ha
- he
- Overskrifter
- hjelpe
- skjult
- Høy
- høytytende
- Uthev
- Fremhevet
- utheving
- svært
- hans
- Hvordan
- Men
- HTTPS
- menneskelig
- Tanken
- identifisere
- identifisering
- if
- Påvirkning
- påvirket
- Konsekvenser
- viktig
- in
- unøyaktig
- inkluderer
- inkludering
- indikerer
- bransjer
- industri
- informasjon
- innsikt
- f.eks
- institusjoner
- instruksjoner
- integrering
- integrasjoner
- Intelligens
- interesse
- interessert
- interesser
- inn
- innviklet
- innføre
- uvurderlig
- investert
- investering
- investeringsanalyse
- Investeringer
- påkalt
- påkaller
- IT
- DET ER
- jpg
- nøkkel
- kunnskap
- Kunnskap Graph
- Labs
- Språk
- stor
- siste
- ledende
- i likhet med
- sannsynligheten
- Sannsynlig
- linking
- Liste
- ligger
- Se
- UTSEENDE
- tap
- maskin
- Hoved
- større
- gjøre
- GJØR AT
- fikk til
- ledelse
- leder
- Ledere
- håndbok
- Produsenter
- Kart
- merket
- Kan..
- ment
- nevnt
- sammenslåing
- melding
- Meta
- minimere
- minutt
- modeller
- Overvåke
- mer
- mest
- flere
- navn
- navn
- Naturlig
- Natural Language Processing
- Trenger
- nødvendig
- negativt
- Neptune
- Ny
- nyheter
- Nyheter og hendelser
- neste
- noder
- Bråk
- none
- varsling
- nå
- Antall
- of
- Tilbud
- offisiell
- offisielt
- ofte
- on
- bare
- Muligheter
- motsetning
- or
- rekkefølge
- organisasjon
- Annen
- ellers
- ut
- produksjon
- utenfor
- enn
- samlet
- Parallel
- partner
- partnere
- deler
- banen
- baner
- Betale
- Ansatte
- Utfør
- utført
- person
- rørledning
- plato
- Platon Data Intelligence
- PlatonData
- portefølje
- porteføljeforvalter
- porteføljeforvaltere
- positurer
- mulig
- Post
- potensiell
- powered
- trekkes
- forhindrer
- privatliv
- prosess
- Bearbeidet
- prosessering
- Produksjon
- fagfolk
- løfte
- lovende
- ledetekster
- bevis
- proof of concept
- prototype
- leverandør
- gi
- publikasjoner
- publisert
- rent
- spørsmål
- tilfeldig
- heller
- å nå
- Lesning
- sanntids
- grunnen til
- redusere
- refererte
- referanser
- i slekt
- forholdet
- Relasjoner
- slipp
- relevant
- pålitelig
- rapporterer
- Rapporter
- representere
- representasjon
- representert
- Krever
- ansvarlig
- retur
- avslørende
- Rich
- Risiko
- risikoer
- Kjør
- går
- samme
- sample
- skalerbar
- granskning
- Søk
- Sekund
- sikre
- sikkerhet
- sender
- senior
- dømme
- sentiment
- Serien
- server~~POS=TRUNC
- tjeneste
- Tjenester
- sett
- bør
- Viser
- Signal
- signaler
- lignende
- Enkelt
- Singapore
- enkelt
- mindre
- So
- løsning
- Solutions
- kilde
- Kilder
- tilbringer
- splittet
- Stabilitet
- Standard
- Begynn
- Tilstand
- sier
- opphold
- Trinn
- Steps
- Still
- lagring
- oppbevare
- rett fram
- struktur
- strukturert
- abonnere
- slik
- velegnet
- leverandør
- leverandører
- levere
- forsyningskjeden
- støtte
- sikker
- overflaten
- system
- systematisk
- Ta
- oppgaver
- teknikker
- Technologies
- vilkår
- tekst
- enn
- Det
- De
- informasjonen
- deres
- deretter
- Der.
- Disse
- de
- tredjeparts
- denne
- selv om?
- tusener
- Gjennom
- tid
- til
- i dag
- sammen
- verktøy
- topp
- spor
- Sporing
- utløse
- to
- avdekke
- gjennomgå
- underliggende
- forstå
- forståelse
- Universe
- låse opp
- låser opp
- ustrukturert
- uutnyttet
- lastet opp
- bruke
- brukt
- Bruker
- ved hjelp av
- Verdifull
- leverandør
- veldig
- Se
- visuell
- warrants
- Vei..
- we
- Rikdom
- web
- Webapplikasjon
- webtjenester
- VI VIL
- Hva
- hvilken
- mens
- hvorfor
- vil
- med
- innenfor
- uten
- ord
- Arbeid
- arbeidsflyt
- virker
- ville
- skrevet
- ennå
- Du
- Din
- deg selv
- zephyrnet