koos Amazon Bedrocki teadmistebaasid, saate vundamendimudeleid (FM-id) turvaliselt ühendada Amazonase aluspõhi teie ettevõtte andmetele Retrieval Augmented Generation (RAG) jaoks. Juurdepääs lisaandmetele aitab mudelil luua asjakohasemaid, kontekstipõhiseid ja täpsemaid vastuseid ilma FM-e ümber õpetamata.
Selles postituses käsitleme Amazon Bedrocki teadmistebaaside kahte uut funktsiooni, mis on spetsiifilised RetrieveAndGenerate
API: tulemuste maksimaalse arvu konfigureerimine ja kohandatud viipade loomine teadmistebaasi viipamalliga. Nüüd saate valida need päringuvalikutena koos otsingutüübiga.
Uute funktsioonide ülevaade ja eelised
Maksimaalne tulemuste arv annab teile kontrolli otsingutulemuste arvu üle, mis tuuakse vektorihoidlast ja edastatakse vastuse genereerimiseks FM-ile. See võimaldab teil kohandada genereerimiseks pakutava taustteabe hulka, andes seeläbi keerukatele küsimustele rohkem konteksti või lihtsamate küsimuste jaoks vähem konteksti. See võimaldab teil tuua kuni 100 tulemust. See valik aitab parandada asjakohase konteksti tõenäosust, parandades seeläbi genereeritud vastuse täpsust ja vähendades hallutsinatsioone.
Kohandatud teadmistebaasi viipade mall võimaldab asendada vaikeviiba malli enda omaga, et kohandada mudelile vastuse genereerimiseks saadetavat viipa. See võimaldab teil kohandada FM-i tooni, väljundvormingut ja käitumist, kui see vastab kasutaja küsimusele. Selle valiku abil saate täpsustada terminoloogiat, et see vastaks paremini teie tööstusharule või domeenile (nt tervishoid või juriidiline). Lisaks saate lisada kohandatud juhiseid ja näiteid, mis on kohandatud teie konkreetsete töövoogude jaoks.
Järgmistes jaotistes selgitame, kuidas saate neid funktsioone kasutada kas AWS-i juhtimiskonsool või SDK.
Eeldused
Nende näidete järgimiseks peab teil olema olemasolev teadmistebaas. Juhiseid selle loomiseks vt Loo teadmistebaas.
Konsooli abil konfigureerige maksimaalne tulemuste arv
Maksimaalse tulemuste arvu kasutamiseks konsooli abil tehke järgmist.
- Amazon Bedrocki konsoolil valige Teadmiste alused vasakpoolses navigeerimispaanis.
- Valige loodud teadmistebaas.
- Vali Testi teadmistebaasi.
- Valige konfiguratsiooniikoon.
- Vali Sünkrooni andmeallikas enne kui hakkate oma teadmistebaasi testima.
- alla KonfiguratsioonidJaoks Otsingu tüüp, valige oma kasutusjuhtumi põhjal otsingutüüp.
Selle postituse jaoks kasutame hübriidotsingut, kuna see ühendab semantilise ja tekstiotsingu, et tagada pakkuja suurem täpsus. Hübriidotsingu kohta lisateabe saamiseks vaadake Amazon Bedrocki teadmistebaasid toetavad nüüd hübriidotsingut.
- Laiendama Maksimaalne allikate tükkide arv ja määrake maksimaalne tulemuste arv.
Uue funktsiooni väärtuse demonstreerimiseks näitame näiteid selle kohta, kuidas saate genereeritud vastuse täpsust suurendada. Me kasutasime Amazoni 10K dokument 2023. aastaks teadmistebaasi loomise lähteandmetena. Kasutame katsetamiseks järgmist päringut: "Mis aastal kasvas Amazoni aastane tulu 245 miljardilt dollarilt 434 miljardile?"
Õige vastus sellele päringule on teadmistebaasi dokumentide põhjal: „Amazoni aastane tulu kasvas 245 miljardilt dollarilt 2019. aastal 434 miljardile dollarile 2022. aastal. Kasutasime FM-ina Claude v2, et genereerida teadmistebaasist hangitud kontekstuaalse teabe põhjal lõplik vastus. Põlvkonna FM-idena toetatakse ka Claude 3 Sonnet ja Claude 3 Haiku.
Käitasime veel ühe päringu, et demonstreerida otsingu võrdlust erinevate konfiguratsioonidega. Kasutasime sama sisestuspäringut (“Mis aastal kasvas Amazoni aastane tulu 245 miljardilt dollarilt 434 miljardile?”) ja määrasime tulemuste maksimaalseks arvuks 5.
Nagu on näidatud järgmisel ekraanipildil, genereeriti vastus "Vabandust, ma ei saa teid selle taotlusega aidata."
Järgmiseks määrame maksimaalseks tulemuseks 12 ja esitame sama küsimuse. Loodud vastus on "Amazoni aastane tulude kasv 245 miljardilt dollarilt 2019. aastal 434 miljardile dollarile 2022. aastal."
Nagu selles näites näidatud, saame õige vastuse hankida saadud tulemuste arvu põhjal. Kui soovite lisateavet lõpliku väljundi moodustava allika omistamise kohta, valige Kuva allika üksikasjad genereeritud vastuse valideerimiseks teadmistebaasi põhjal.
Kohandage konsooli abil teadmistebaasi viipa malli
Samuti saate vaikeviipa kohandada oma viipaga, mis põhineb kasutusjuhtumil. Selleks tehke seda konsoolis järgmiselt.
- Oma teadmistebaasi testimise alustamiseks korrake eelmises jaotises toodud samme.
- Võimaldama Loo vastuseid.
- Valige vastuse genereerimiseks oma valitud mudel.
Selles postituses kasutame näitena Claude v2 mudelit. Põlvkonna jaoks on saadaval ka Claude 3 Sonneti ja Haiku mudel.
- Vali kehtima jätkama.
Pärast mudeli valimist avaneb uus jaotis nimega Teadmistebaasi viipade mall all kuvatakse Konfiguratsioonid.
- Vali Edit viipa kohandamise alustamiseks.
- Kohandage viipa malli, et kohandada, kuidas soovite allavõetud tulemusi kasutada ja sisu luua.
Selle postituse jaoks andsime mõned näited "Financial Advisor AI süsteemi" loomiseks, kasutades kohandatud viipadega Amazoni finantsaruandeid. Kiire projekteerimise parimate tavade saamiseks vaadake Kiired insenerijuhised.
Nüüd kohandame vaikimisi viipamalli mitmel erineval viisil ja jälgime vastuseid.
Proovime esmalt vaikeviipaga päringut. Küsime: "Milline oli Amazoni tulu aastatel 2019 ja 2021?" Järgmine näitab meie tulemusi.
Väljundist leiame, et see genereerib saadud teadmiste põhjal vabas vormis vastuse. Viideteks on loetletud ka tsitaadid.
Oletame, et tahame anda lisajuhiseid loodud vastuse vormindamiseks, näiteks standardiseerida see JSON-iks. Saame need juhised lisada eraldi sammuna pärast teabe hankimist viipamalli osana:
Lõplikul vastusel on nõutav struktuur.
Viipa kohandades saate muuta ka genereeritud vastuse keelt. Järgmises näites anname mudelile korralduse anda vastus hispaania keeles.
Pärast eemaldamist $output_format_instructions$
vaikeviibast eemaldatakse loodud vastuse tsitaat.
Järgmistes jaotistes selgitame, kuidas saate neid funktsioone SDK-ga kasutada.
Konfigureerige SDK abil maksimaalne tulemuste arv
Maksimaalse tulemuste arvu muutmiseks SDK-ga kasutage järgmist süntaksit. Selle näite puhul on päring "Mis aastal kasvas Amazoni aastane tulu 245 miljardilt dollarilt 434 miljardile dollarile?" Õige vastus on "Amazoni aastane tulude kasv 245 miljardilt dollarilt 2019. aastal 434 miljardile dollarile 2022. aastal."
"numberOfResults
' valik ' allretrievalConfiguration
' võimaldab teil valida tulemuste arvu, mida soovite tuua. väljund RetrieveAndGenerate
API sisaldab loodud vastust, allika omistamist ja allalaaditud tekstitükke.
Järgmised on tulemused erinevate väärtuste jaoksnumberOfResults
' parameetrid. Esiteks seadsime numberOfResults = 5
.
Siis seadsime numberOfResults = 12
.
Kohandage teadmistebaasi viipa malli SDK abil
SDK abil viipa kohandamiseks kasutame järgmist päringut erinevate viipade mallidega. Selle näite puhul on päring „Milline oli Amazoni tulu aastatel 2019 ja 2021?”
Vaikimisi viipamall on järgmine:
Järgmine on kohandatud viipamall:
Vaikimisi viipamalliga saame järgmise vastuse:
Kui soovite anda vastuse genereerimise väljundvormingu kohta täiendavaid juhiseid, nt vastuse standardimine kindlas vormingus (nt JSON), saate olemasolevat viipa kohandada, pakkudes rohkem juhiseid. Meie kohandatud viipamalliga saame järgmise vastuse.
"promptTemplate
' valik 'generationConfiguration
' võimaldab teil viipa kohandada, et vastuste genereerimist paremini kontrollida.
Järeldus
Selles postituses tutvustasime Amazon Bedrocki teadmistebaasides kahte uut funktsiooni: otsingutulemuste maksimaalse arvu reguleerimine ja rakenduse vaikeviibamalli kohandamine. RetrieveAndGenerate
API. Näitasime, kuidas neid funktsioone konsoolis ja SDK kaudu konfigureerida, et parandada loodud vastuse jõudlust ja täpsust. Maksimaalsete tulemuste suurendamine annab põhjalikumat teavet, samas kui viipamalli kohandamine võimaldab teil täpsustada sihtasutuse mudeli juhiseid, et need vastaksid paremini konkreetsetele kasutusjuhtudele. Need täiustused pakuvad suuremat paindlikkust ja kontrolli, võimaldades teil pakkuda RAG-põhiste rakenduste jaoks kohandatud kogemusi.
AWS-i keskkonnas juurutamise alustamiseks lisaressursside saamiseks vaadake järgmist.
Autoritest
Sandeep Singh on Amazon Web Servicesi vanem generatiivse tehisintellekti andmeteadlane, kes aitab ettevõtetel generatiivse AI abil uuendusi teha. Ta on spetsialiseerunud generatiivsele AI-le, tehisintellektile, masinõppele ja süsteemikujundusele. Ta on kirglik arendada tipptasemel AI/ML-põhiseid lahendusi, et lahendada keerulisi äriprobleeme erinevate tööstusharude jaoks, optimeerides tõhusust ja mastaapsust.
Suyin Wang on AWS-i AI/ML-i spetsialistilahenduste arhitekt. Tal on interdistsiplinaarne haridus masinõppe, finantsteabe teenuse ja majanduse alal ning aastatepikkune kogemus andmeteaduse ja masinõppe rakenduste loomisel, mis lahendasid reaalseid äriprobleeme. Ta naudib klientide abistamist õigete äriküsimuste tuvastamisel ja õigete AI/ML-lahenduste loomisel. Vabal ajal armastab ta laulda ja süüa teha.
Sherry Ding on Amazon Web Servicesi (AWS) tehisintellekti (AI) ja masinõppe (ML) spetsialistide lahenduste vanemarhitekt. Tal on laialdased kogemused masinõppe alal arvutiteaduse doktorikraadiga. Ta töötab peamiselt avaliku sektori klientidega erinevate tehisintellekti/ML-iga seotud äriprobleemide kallal, aidates neil kiirendada masinõppe teekonda AWS-i pilves. Kui kliente ei aita, naudib ta tegevusi väljas.
- SEO-põhise sisu ja PR-levi. Võimenduge juba täna.
- PlatoData.Network Vertikaalne generatiivne Ai. Jõustage ennast. Juurdepääs siia.
- PlatoAiStream. Web3 luure. Täiustatud teadmised. Juurdepääs siia.
- PlatoESG. Süsinik, CleanTech, Energia, Keskkond päikeseenergia, Jäätmekäitluse. Juurdepääs siia.
- PlatoTervis. Biotehnoloogia ja kliiniliste uuringute luureandmed. Juurdepääs siia.
- Allikas: https://aws.amazon.com/blogs/machine-learning/knowledge-bases-for-amazon-bedrock-now-supports-custom-prompts-for-the-retrieveandgenerate-api-and-configuration-of-the-maximum-number-of-retrieved-results/
- :on
- :on
- :mitte
- : kus
- $ UP
- 10
- 100
- 10K
- 12
- 13
- 15%
- 2019
- 2021
- 2022
- 25
- 28
- 32
- 7
- 900
- a
- Võimalik
- MEIST
- kiirendama
- juurdepääs
- täpsus
- täpne
- tegevus
- lisama
- Täiendavad lisad
- Lisaks
- kohandamine
- nõuandja
- pärast
- Agent
- AI
- AI andmed
- AI / ML
- viia
- võimaldab
- mööda
- kõrval
- Ka
- am
- Amazon
- Amazon Web Services
- Amazon Web Services (AWS)
- summa
- an
- ja
- aastane
- AASTATULU
- Teine
- vastus
- vastamine
- vastuseid
- API
- ilmub
- rakendused
- OLEME
- ümber
- kunstlik
- tehisintellekti
- Tehisintellekt (AI)
- AS
- küsima
- abistama
- assistent
- At
- suurendatud
- saadaval
- AWS
- tagapõhi
- baas
- põhineb
- BE
- sest
- enne
- käitumine
- on
- Kasu
- BEST
- parimaid tavasid
- Parem
- Ehitus
- äri
- ettevõtted
- by
- kutsutud
- CAN
- juhul
- juhtudel
- väljakutseid
- muutma
- kontrollima
- valik
- Vali
- Cloud
- ühendab
- ettevõte
- võrdlus
- täitma
- keeruline
- terviklik
- arvuti
- Arvutiteadus
- lühike
- konfiguratsioon
- seadistamine
- Võta meiega ühendust
- konsool
- sisaldama
- sisu
- kontekst
- kontekstuaalne
- kontrollida
- parandada
- võiks
- kattes
- looma
- loodud
- loomine
- tava
- Kliendid
- kohandada
- kohandatud
- andmed
- andmeteadus
- andmeteadlane
- vaikimisi
- Kraad
- tarnima
- näitama
- Näidatud
- Disain
- arenev
- DID
- erinev
- arutama
- mitu
- do
- dokument
- dokumendid
- ei
- domeen
- kahekordistada
- Ökonoomika
- Käsitöö
- efektiivsus
- kumbki
- võimaldades
- Inseneriteadus
- lisaseadmed
- keskkond
- täpne
- näide
- näited
- olemasolevate
- kogemus
- Kogemused
- Selgitama
- ulatuslik
- Laialdased kogemused
- lisatasu
- asjaolu
- tunnusjoon
- FUNKTSIOONID
- vähe
- lõplik
- finants-
- finantsinfo
- leidma
- esimene
- Paindlikkus
- järgima
- Järel
- eest
- formaat
- Sihtasutus
- Alates
- andis
- tekitama
- loodud
- teeniva
- põlvkond
- generatiivne
- Generatiivne AI
- saama
- Andma
- annab
- andmine
- suurem
- juhised
- Olema
- he
- tervishoid
- aidates
- aitab
- siin
- siin
- Kuidas
- Kuidas
- HTML
- http
- HTTPS
- inim-
- hübriid
- i
- ICON
- identifitseerima
- if
- rakendamisel
- parandama
- Paranemist
- in
- hõlmab
- Suurendama
- kasvanud
- kasvav
- tööstusharudes
- tööstus
- info
- uuendama
- sisend
- juhised
- Intelligentsus
- sisse
- IT
- töö
- teekond
- jpeg
- Json
- lihtsalt
- Võti
- teadmised
- keel
- Õppida
- õppimine
- lahkus
- Õigus
- vähem
- nagu
- tõenäosus
- nimekiri
- Loetletud
- armastab
- masin
- masinõpe
- peamiselt
- tegema
- juhtimine
- Vastama
- maksimaalne
- keskmine
- ML
- mudel
- mudelid
- rohkem
- mitmekordne
- NAVIGATSIOON
- Vajadus
- Uus
- Uued funktsioonid
- nüüd
- number
- nummerdatud
- jälgima
- of
- pakkuma
- on
- ONE
- ainult
- optimeerimine
- valik
- Valikud
- or
- et
- meie
- väljund
- üle
- enda
- pane
- parameetrid
- osa
- Vastu võetud
- kirglik
- jõudlus
- phd
- Platon
- Platoni andmete intelligentsus
- PlatoData
- palun
- post
- tavad
- vajadus
- eelmine
- probleeme
- jätkama
- küsib
- anda
- tingimusel
- tarnija
- annab
- pakkudes
- avalik
- päringu
- küsimus
- Küsimused
- rag
- RE
- päris maailm
- vähendamine
- viitama
- viide
- seotud
- asjakohane
- Eemaldatud
- eemaldades
- asendama
- Aruanded
- taotleda
- nõutav
- Vahendid
- vastus
- vastuste
- Tulemused
- otsing
- tagasipöördumine
- tulu
- õige
- s
- sama
- ütlema
- Skaalautuvus
- teadus
- teadlane
- SDK
- Otsing
- Osa
- lõigud
- sektor
- kindlalt
- vaata
- valima
- semantiline
- vanem
- Saadetud
- eri
- teenus
- Teenused
- komplekt
- mitu
- ta
- näitama
- näidatud
- Näitused
- lihtsam
- So
- Lahendused
- LAHENDAGE
- allikas
- hispaania
- spetsialist
- spetsialiseerunud
- konkreetse
- standardimine
- algus
- riik
- modernne
- Samm
- Sammud
- salvestada
- struktuur
- selline
- Toetatud
- Toetab
- kindel
- süntaks
- süsteem
- kohandatud
- šabloon
- malle
- terminoloogia
- Testimine
- tekst
- et
- .
- teave
- Allikas
- oma
- Neile
- sellega
- Need
- see
- aeg
- et
- TONE
- tõsi
- püüdma
- kaks
- tüüp
- ei suuda
- all
- kasutama
- kasutage juhtumit
- Kasutatud
- Kasutaja
- kasutamine
- KINNITAGE
- väärtus
- Väärtused
- eri
- väga
- kaudu
- tahan
- oli
- kuidas
- we
- web
- veebiteenused
- M
- millal
- samas kui
- will
- koos
- ilma
- Töövoogud
- töötab
- aasta
- aastat
- sa
- Sinu
- sephyrnet