At AWS re: Oppfinne 2023, kunngjorde vi generell tilgjengelighet av Kunnskapsbaser for Amazon Bedrock. Med en kunnskapsbase kan du trygt koble fundamentmodeller (FM-er) inn Amazonas grunnfjell til bedriftens data for fullstendig administrert Retrieval Augmented Generation (RAG).
I en Forrige innlegg, vi beskrev hvordan Knowledge Bases for Amazon Bedrock administrerer ende-til-ende RAG-arbeidsflyten for deg og delte detaljer om noen av de nylige funksjonslanseringene.
For RAG-baserte applikasjoner er nøyaktigheten til den genererte responsen fra store språkmodeller (LLMs) avhengig av konteksten gitt til modellen. Kontekst hentes fra vektordatabasen basert på brukerspørringen. Semantisk søk er mye brukt fordi det er i stand til å forstå mer menneskelignende spørsmål – en brukers søk er ikke alltid direkte relatert til de eksakte søkeordene i innholdet som besvarer det. Semantisk søk bidrar til å gi svar basert på betydningen av teksten. Det har imidlertid begrensninger når det gjelder å fange opp alle relevante søkeord. Ytelsen er avhengig av kvaliteten på ordet innebygging som brukes til å representere betydningen av teksten. For å overkomme slike begrensninger vil det å kombinere semantisk søk med søkeordsøk (hybrid) gi bedre resultater.
I dette innlegget diskuterer vi den nye funksjonen til hybridsøk, som du kan velge som et spørringsalternativ sammen med semantisk søk.
Hybrid søk oversikt
Hybridsøk drar fordel av styrken til flere søkealgoritmer, og integrerer deres unike evner for å forbedre relevansen til returnerte søkeresultater. For RAG-baserte applikasjoner kombineres semantiske søkefunksjoner vanligvis med tradisjonelle søkeordbaserte søk for å forbedre søkeresultatenes relevans. Den gjør det mulig å søke i både innholdet i dokumenter og deres underliggende betydning. Tenk for eksempel på følgende spørring:
I denne spørringen etter et boknavn og nettstedsnavn vil et søkeordsøk gi bedre resultater, fordi vi vil ha kostnaden for den spesifikke boken. Imidlertid kan begrepet "kostnad" ha synonymer som "pris", så det vil være bedre å bruke semantisk søk, som forstår betydningen av teksten. Hybridsøk gir det beste fra begge tilnærminger: presisjon av semantisk søk og dekning av søkeord. Det fungerer utmerket for RAG-baserte applikasjoner der retrieveren må håndtere et bredt utvalg av naturlig språkspørringer. Nøkkelordene hjelper til med å dekke spesifikke enheter i søket, for eksempel produktnavn, farge og pris, mens semantikk bedre forstår betydningen og intensjonen i søket. Hvis du for eksempel ønsker å bygge en chatbot for et e-handelsnettsted for å håndtere kundeforespørsler som returpolicy eller detaljer om produktet, vil bruk av hybridsøk være best egnet.
Bruk tilfeller for hybrid søk
Følgende er noen vanlige brukstilfeller for hybridsøk:
- Svar på spørsmål om åpent domene – Dette innebærer å svare på spørsmål om et bredt spekter av temaer. Dette krever søk i store samlinger av dokumenter med mangfoldig innhold, for eksempel nettsteddata, som kan omfatte ulike emner som bærekraft, lederskap, økonomiske resultater og mer. Semantisk søk alene kan ikke generalisere godt for denne oppgaven, fordi den mangler kapasitet for leksikalsk matching av usynlige enheter, noe som er viktig for å håndtere eksempler utenfor domene. Derfor kan det å kombinere søkeordbasert søk med semantisk søk bidra til å begrense omfanget og gi bedre resultater for svar på åpne domenespørsmål.
- Kontekstbaserte chatbots – Samtaler kan raskt endre retning og dekke uforutsigbare emner. Hybridsøk kan bedre håndtere slike åpne dialoger.
- Personlig søk – Søk i nettskala over heterogent innhold drar nytte av en hybrid tilnærming. Semantisk søk håndterer populære hodespørringer, mens søkeord dekker sjeldne longtail-spørringer.
Selv om hybridsøk gir bredere dekning ved å kombinere to tilnærminger, har semantisk søk presisjonsfordeler når domenet er smalt og semantikken er veldefinert, eller når det er lite rom for feiltolkning, som faktuelle spørsmålssvarsystemer.
Fordeler med hybrid søk
Både søkeord og semantisk søk vil returnere et eget sett med resultater sammen med deres relevanspoeng, som deretter kombineres for å returnere de mest relevante resultatene. Kunnskapsbaser for Amazon Bedrock støtter for tiden fire vektorbutikker: Amazon OpenSearch Serverless, Amazon Aurora PostgreSQL-kompatibel utgave, konglenog Redis Enterprise Cloud. Når dette skrives er hybridsøkefunksjonen tilgjengelig for OpenSearch Serverless, med støtte for andre vektorbutikker som kommer snart.
Følgende er noen av fordelene ved å bruke hybridsøk:
- Forbedret nøyaktighet – Nøyaktigheten til den genererte responsen fra FM er direkte avhengig av relevansen til de hentede resultatene. Basert på dataene dine kan det være utfordrende å forbedre nøyaktigheten til applikasjonen din bare ved å bruke semantisk søk. Den viktigste fordelen med å bruke hybridsøk er å få forbedret kvalitet på de hentede resultatene, som igjen hjelper FM å generere mer nøyaktige svar.
- Utvidede søkemuligheter – Nøkkelordsøk kaster et bredere nett og finner dokumenter som kan være relevante, men som kanskje ikke inneholder semantisk struktur gjennom hele dokumentet. Den lar deg søke på nøkkelord så vel som den semantiske betydningen av teksten, og utvider dermed søkemulighetene.
I de følgende delene viser vi hvordan du bruker hybridsøk med kunnskapsbaser for Amazons grunnfjell.
Bruk alternativer for hybridsøk og semantiske søk via SDK
Når du ringer Retrieve API, velger Knowledge Bases for Amazon Bedrock den riktige søkestrategien for deg for å gi deg de mest relevante resultatene. Du har muligheten til å overstyre den for å bruke enten hybrid eller semantisk søk i API.
Hent API
Retrieve API er utformet for å hente relevante søkeresultater ved å oppgi brukerspørringen, kunnskapsbase-IDen og antall resultater du vil at APIen skal returnere. Denne API-en konverterer brukerspørringer til innebygginger, søker i kunnskapsbasen ved å bruke enten hybridsøk eller semantisk (vektor) søk, og returnerer de relevante resultatene, noe som gir deg mer kontroll over å bygge egendefinerte arbeidsflyter på toppen av søkeresultatene. For eksempel kan du legge til etterbehandlingslogikk til de hentede resultatene eller legge til din egen forespørsel og koble til en hvilken som helst FM levert av Amazon Bedrock for å generere svar.
For å vise deg et eksempel på veksling mellom hybrid og semantisk (vektor) søkealternativer, har vi laget en kunnskapsbase ved å bruke Amazon 10K-dokument for 2023. For mer informasjon om hvordan du oppretter en kunnskapsbase, se Bygg en kontekstuell chatbot-applikasjon ved å bruke Knowledge Bases for Amazon Bedrock.
For å demonstrere verdien av hybridsøk bruker vi følgende søk:
Svaret for det foregående søket involverer noen få nøkkelord, for eksempel date
, physical stores
og North America
. Riktig svar er 22,871 thousand square feet
. La oss observere forskjellen i søkeresultatene for både hybrid og semantisk søk.
Følgende kode viser hvordan du bruker hybrid eller semantisk (vektor) søk ved å bruke Retrieve API med Boto3:
De overrideSearchType
alternativet i retrievalConfiguration
tilbyr valget mellom å bruke enten HYBRID
or SEMANTIC
. Som standard vil den velge riktig strategi for deg for å gi deg mest relevante resultater, og hvis du vil overstyre standardalternativet for å bruke enten hybrid eller semantisk søk, kan du sette verdien til HYBRID/SEMANTIC
. Utgangen til Retrieve
API inkluderer de hentede tekstbitene, stedstypen og URI for kildedataene og relevanspoengsummene til hentingene. Poengsummene hjelper til med å bestemme hvilke deler som best samsvarer med svaret på spørringen.
Følgende er resultatene for det foregående søket ved bruk av hybridsøk (med noe av utdataene redigert for korthets skyld):
Følgende er resultatene for semantisk søk (med noe av utdataene redigert for korthets skyld):
Som du kan se i resultatene, var hybrid søk i stand til å hente søkeresultatet med de leide kvadratmeterne for fysiske butikker i Nord-Amerika som nevnt i brukerforespørselen. Hovedårsaken var at hybridsøk klarte å kombinere resultatene fra søkeord som f.eks date
, physical stores
og North America
i spørringen, mens semantisk søk ikke gjorde det. Derfor, når søkeresultatene er utvidet med brukerspørringen og ledeteksten, vil ikke FM-en kunne gi riktig svar i tilfelle semantisk søk.
La oss se på RetrieveAndGenerate
API med hybridsøk for å forstå den endelige responsen generert av FM.
RetrieveAndGenerate API
De RetrieveAndGenerate
API spør etter en kunnskapsbase og genererer et svar basert på de hentede resultatene. Du spesifiserer kunnskapsbase-IDen samt FM-en for å generere et svar fra resultatene. Amazon Bedrock konverterer spørringene til innebygginger, spør kunnskapsbasen basert på søketypen, og forsterker deretter FM-forespørselen med søkeresultatene som kontekstinformasjon og returnerer det FM-genererte svaret.
La oss bruke søket "Fra og med 31. desember 2023, hva er den utleide kvadratmeteren for fysiske butikker i Nord-Amerika?" og spør RetrieveAndGenerate
API for å generere svaret ved å bruke spørringen vår:
Følgende er resultatene ved bruk av hybridsøk:
Følgende er resultatene ved bruk av semantisk søk:
Det faktiske svaret på spørringen er 22,871 thousand leased square feet
, som genereres av hybridsøket. De hentede søkeresultatene for hybrid søk inkluderte informasjonen om de leide kvadratmeterne for fysiske butikker i Nord-Amerika, mens semantisk søk ikke var i stand til å hente riktig informasjon fra vektorbutikken på grunn av oversettelse av embeddings. Derfor kunne ikke FM gi riktig svar fordi den ikke hadde de riktige og mest relevante søkeresultatene.
Men for mer generiske spørsmål som ikke involverer enheter som f.eks physical stores
or North America
, gir både hybrid og semantisk søk lignende resultater.
Følgende er eksempler på svar fra noen få søk som viser tilfeller der både hybrid og semantisk søk gir lignende resultater.
Spørsmål | Semantisk søk: RAG API | Hybridsøk: RAG API |
Hvordan betjener Amazon utviklerne og bedriftene? | Vi betjener utviklere og bedrifter av alle størrelser, inkludert oppstartsbedrifter, offentlige etater og akademiske institusjoner, gjennom AWS, som tilbyr et bredt sett av on-demand teknologitjenester, inkludert databehandling, lagring, database, analyse og maskinlæring, og andre tjenester | Vi betjener utviklere og bedrifter av alle størrelser, inkludert oppstartsbedrifter, offentlige etater og akademiske institusjoner, gjennom AWS, som tilbyr et bredt sett av on-demand teknologitjenester, inkludert databehandling, lagring, database, analyse og maskinlæring, og andre tjenester. |
Hvem er administrerende direktører og direktører for Amazon fra 24. januar 2024? | De administrerende direktørene i Amazon fra og med 2024 inkluderer Andrew R. Jassy som president og administrerende direktør, Douglas J. Herrington som CEO Worldwide Amazon Stores, Brian T. Olsavsky som senior visepresident og finansdirektør, Shelley L. Reynolds som visepresident , verdensomspennende kontrollør og hovedregnskapsansvarlig, Adam N. Selipsky som administrerende direktør for Amazon Web Services, og David A. Zapolsky som senior visepresident, global offentlig politikk og generaladvokat. | Fra og med 2024 fungerer Jeffrey P. Bezos som administrerende styreleder for Amazon.com. Andrew R. Jassy fungerer som president og administrerende direktør. Andre administrerende direktører inkluderer Douglas J. Herrington som CEO Worldwide Amazon Stores, Brian T. Olsavsky som Senior Vice President og Chief Financial Officer, Shelley L. Reynolds som visepresident, Worldwide Controller og Principal Accounting Officer, og Adam N. Selipsky som CEO. Amazon Web Services. David A. Zapolsky fungerer som Senior Vice President, Global Public Policy og General Counsel |
Bruk hybridsøk og semantiske søkealternativer via Amazon Bedrock-konsollen
For å bruke hybride og semantiske søkealternativer på Amazon Bedrock-konsollen, fullfør følgende trinn:
- På Amazon Bedrock-konsollen velger du Kunnskapsbase i navigasjonsruten.
- Velg kunnskapsbasen du opprettet.
- Velg Test kunnskapsbase.
- Velg konfigurasjonsikonet.
- Til Søketypeå velge Hybridsøk (semantisk og tekst).
Som standard kan du velge en FM for å få et generert svar for søket ditt. Hvis du bare vil se de hentede resultatene, kan du veksle Generer respons av for å få kun hentede resultater.
konklusjonen
I dette innlegget dekket vi den nye søkefunksjonen i Knowledge Bases for Amazon Bedrock, som muliggjør hybridsøk. Vi lærte hvordan du konfigurerer hybridsøkealternativet i SDK og Amazon Bedrock-konsollen. Dette bidrar til å overvinne noen av begrensningene ved å stole utelukkende på semantisk søk, spesielt for søk i store samlinger av dokumenter med mangfoldig innhold. Bruken av hybridsøk avhenger av dokumenttypen og brukssaken du prøver å implementere.
For ytterligere ressurser, se følgende:
Referanser
Forbedring av gjenvinningsytelse i RAG-rørledninger med Hybrid Search
Om forfatterne
Mani Khanuja er en Tech Lead – Generative AI Specialists, forfatter av boken Applied Machine Learning and High Performance Computing on AWS, og medlem av styret for Women in Manufacturing Education Foundation Board. Hun leder maskinlæringsprosjekter innen forskjellige domener som datasyn, naturlig språkbehandling og generativ AI. Hun snakker på interne og eksterne konferanser som AWS re:Invent, Women in Manufacturing West, YouTube-webinarer og GHC 23. På fritiden liker hun å gå lange løpeturer langs stranden.
Pallavi Nargund er en hovedløsningsarkitekt ved AWS. I sin rolle som skyteknologi-enabler jobber hun med kunder for å forstå deres mål og utfordringer, og gi foreskrivende veiledning for å nå deres mål med AWS-tilbud. Hun brenner for kvinner innen teknologi og er et kjernemedlem i Women in AI/ML hos Amazon. Hun snakker på interne og eksterne konferanser som AWS re:Invent, AWS Summits og webinarer. Utenom jobben liker hun frivillig arbeid, hagearbeid, sykling og fotturer.
- SEO-drevet innhold og PR-distribusjon. Bli forsterket i dag.
- PlatoData.Network Vertical Generative Ai. Styrk deg selv. Tilgang her.
- PlatoAiStream. Web3 Intelligence. Kunnskap forsterket. Tilgang her.
- PlatoESG. Karbon, CleanTech, Energi, Miljø, Solenergi, Avfallshåndtering. Tilgang her.
- PlatoHelse. Bioteknologisk og klinisk etterretning. Tilgang her.
- kilde: https://aws.amazon.com/blogs/machine-learning/knowledge-bases-for-amazon-bedrock-now-supports-hybrid-search/
- : har
- :er
- :ikke
- :hvor
- ][s
- 1
- 100
- 10K
- 125
- 17
- 2021
- 2022
- 2023
- 2024
- 22
- 23
- 24
- 28
- 30
- 31
- 31.
- 32
- 43
- 54
- 60
- 7
- 72
- 8
- 9
- a
- I stand
- Om oss
- akademisk
- Regnskap og administrasjon
- nøyaktighet
- nøyaktig
- Oppnå
- ervervet
- faktiske
- Adam
- legge til
- Ytterligere
- Fordel
- fordeler
- byråer
- AI
- AI / ML
- luftfartøy
- algoritmer
- Alle
- tillater
- alene
- langs
- sammen
- alltid
- Amazon
- Amazon Web Services
- Amazon.com
- america
- amortisering
- an
- analytics
- og
- Andrew
- annonsert
- besvare
- besvare
- svar
- noen
- api
- Søknad
- søknader
- anvendt
- tilnærming
- tilnærminger
- ER
- AS
- spør
- Eiendeler
- At
- augmented
- forstørrelser
- Aurora
- forfatter
- tilgjengelighet
- tilgjengelig
- AWS
- AWS re: Oppfinne
- basen
- basert
- BE
- Strand
- fordi
- nytte
- Fordeler
- BEST
- Bedre
- mellom
- Bezos
- Milliarder
- borde
- styret
- bok
- både
- Brian
- Bringer
- bred
- bygge
- Bygning
- bygninger
- men
- by
- ring
- CAN
- evner
- Kapasitet
- fange
- saken
- saker
- sentrum
- konsernsjef
- Chair
- utfordringer
- utfordrende
- endring
- chatbot
- sjef
- Administrerende direktør
- konsernsjef
- valg
- Velg
- Cloud
- SKYETEKNOLOGI
- kode
- samlinger
- farge
- COM
- kombinere
- kombinert
- kombinere
- kommer
- Kommer snart
- Felles
- vanligvis
- Selskapet
- fullføre
- Beregn
- datamaskin
- Datamaskin syn
- databehandling
- konferanser
- Koble
- Vurder
- Konsoll
- konstruksjon
- inneholde
- innhold
- innhold
- kontekst
- kontekstuelle
- kontroll
- controller
- samtaler
- Kjerne
- Bedriftens
- korrigere
- Kostnad
- Kostnader
- råd
- dekke
- dekning
- dekket
- opprettet
- Opprette
- I dag
- skikk
- kunde
- Kunder
- dato
- Datasenter
- Database
- David
- Desember
- Misligholde
- demonstrere
- demonstrere
- avhengig
- avhenger
- avskrivninger
- beskrevet
- beskrivelse
- designet
- detaljer
- Bestem
- utviklere
- gJORDE
- forskjell
- retning
- direkte
- Styremedlemmer
- diskutere
- diverse
- do
- dokument
- dokumenter
- gjør
- domene
- domener
- ikke
- douglas
- ned
- to
- under
- e-handel
- Kunnskap
- enten
- enabler
- muliggjør
- ende til ende
- forbedre
- kom inn
- Enterprise
- bedrifter
- enheter
- utstyr
- spesielt
- eksempel
- eksempler
- utøvende
- Konsulent
- ekspanderende
- utvendig
- fasiliteter
- Trekk
- Noen få
- slutt~~POS=TRUNC
- finansiere
- finansiell
- funn
- etter
- følger
- Til
- Fundament
- fire
- Gratis
- fra
- fullt
- general
- generere
- generert
- genererer
- genererer
- generasjonen
- generative
- Generativ AI
- få
- Gi
- Giving
- Global
- Go
- Mål
- Regjeringen
- offentlige etater
- flott
- brutto
- veiledning
- håndtere
- Håndterer
- Håndtering
- Ha
- hode
- hjelpe
- hjelper
- her
- Høy
- Hvordan
- Hvordan
- Men
- HTTPS
- Hybrid
- ICON
- ID
- if
- iverksette
- viktig
- forbedre
- forbedret
- in
- Incentiver
- inkludere
- inkludert
- inkluderer
- Inkludert
- informasjon
- inngang
- institusjoner
- Integrering
- hensikt
- intern
- internasjonalt
- inn
- involvere
- innebærer
- IT
- DET ER
- Januar
- januar 24
- jeffrey
- jpg
- nøkkel
- nøkkelord
- kunnskap
- Tomt
- Språk
- stor
- lanseringer
- føre
- Ledelse
- Fører
- lært
- læring
- leie
- i likhet med
- liker
- begrensninger
- lite
- plassering
- logikk
- Lang
- Se
- maskin
- maskinlæring
- Hoved
- fikk til
- forvalter
- produksjon
- Match
- matchende
- Kan..
- betyr
- medlem
- nevnt
- kunne
- millioner
- modell
- modeller
- mer
- mest
- flere
- navn
- smal
- Naturlig
- Natural Language Processing
- Navigasjon
- nett
- nettverk
- nettverk
- Ny
- nord
- nord amerika
- note
- nå
- Antall
- Målet
- observere
- of
- off
- tilbud
- Tilbud
- Office
- Offiser
- offiserer
- on
- På etterspørsel
- bare
- åpen
- drift
- Alternativ
- alternativer
- or
- Annen
- vår
- produksjon
- utenfor
- enn
- Overcome
- overstyring
- egen
- brød
- lidenskapelig
- ytelse
- perioden
- fysisk
- plato
- Platon Data Intelligence
- PlatonData
- politikk
- Populær
- Post
- forut
- Precision
- president
- pris
- Principal
- prosessering
- Produkt
- prosjekter
- eiendom
- gi
- forutsatt
- gi
- offentlig
- kvalitet
- spørsmål
- spørring
- spørsmål
- spørsmål
- R
- fille
- raskt
- SJELDEN
- RE
- grunnen til
- motta
- nylig
- registrert
- reduksjon
- referere
- i slekt
- relevans
- relevant
- avhengig
- representere
- Krever
- Ressurser
- svar
- svar
- resultere
- Resultater
- gjenfinning
- retur
- avkastning
- ikke sant
- Rolle
- rom
- går
- sample
- omfang
- Resultat
- SDK
- Søk
- søk
- søker
- seksjoner
- sikkert
- se
- segmentet
- velg
- semantisk
- semantikk
- senior
- separat
- betjene
- server
- server~~POS=TRUNC
- serverer
- Tjenester
- sett
- delt
- hun
- Vis
- Viser
- lignende
- størrelser
- So
- utelukkende
- Solutions
- noen
- snart
- kilde
- Snakker
- spesialister
- spesifikk
- kvadrat
- start-ups
- Steps
- lagring
- oppbevare
- butikker
- Strategi
- styrker
- struktur
- slik
- egnet
- Summits
- støtte
- Støtter
- Bærekraft
- Systemer
- bord
- tar
- Oppgave
- tech
- Teknologi
- begrep
- tekst
- Det
- De
- informasjonen
- Kilden
- deres
- deretter
- Der.
- derved
- derfor
- denne
- tusen
- Gjennom
- hele
- tid
- til
- topp
- temaer
- tradisjonelle
- Oversettelse
- prøver
- SVING
- to
- typen
- etter
- underliggende
- forstå
- forstår
- unik
- uforutsigbare
- bruke
- bruk sak
- brukt
- Bruker
- ved hjelp av
- verdi
- variasjon
- ulike
- Kjøretøy
- leverandører
- av
- vice
- Vice President
- syn
- ønsker
- var
- we
- web
- webtjenester
- Webinarer
- Nettsted
- VI VIL
- veldefinerte
- Vest
- Hva
- Hva er
- når
- mens
- hvilken
- mens
- bred
- allment
- bredere
- vil
- med
- innenfor
- Dame
- kvinner i teknologi
- ord
- Arbeid
- arbeidsflyt
- arbeidsflyt
- virker
- verdensomspennende
- skriving
- Utbytte
- Du
- Din
- youtube
- zephyrnet