Generatiivne AI mudelitel on potentsiaal muuta ettevõtte tegevust revolutsiooniliseks, kuid ettevõtted peavad hoolikalt kaaluma, kuidas oma jõudu rakendada, ületades samal ajal väljakutseid, nagu andmete kaitsmine ja tehisintellektiga loodud sisu kvaliteedi tagamine.
Retrieval-Augmented Generation (RAG) raamistik täiendab viipasid mitmest allikast (nt dokumendihoidlatest, andmebaasidest või API-dest) pärit väliste andmetega, et muuta sihtmudelid domeenispetsiifiliste ülesannete jaoks tõhusaks. See postitus tutvustab RAG-mudeli võimalusi ja tõstab esile MongoDB Atlase transformatiivse potentsiaali selle vektorotsingu funktsiooniga.
MongoDB atlas on integreeritud andmeteenuste komplekt, mis kiirendab ja lihtsustab andmepõhiste rakenduste arendamist. Selle vektorandmete salvestusruum integreerub sujuvalt operatiivsete andmete salvestamisega, välistades vajaduse eraldi andmebaasi järele. See integratsioon võimaldab võimsaid semantilisi otsinguvõimalusi Vektorotsing, kiire viis semantilise otsingu ja tehisintellektil põhinevate rakenduste loomiseks.
Amazon SageMaker võimaldab ettevõtetel ehitada, koolitada ja juurutada masinõppe (ML) mudeleid. Amazon SageMaker JumpStart pakub eelkoolitatud mudeleid ja andmeid, mis aitavad teil ML-iga alustada. Eelkoolitatud mudelitele ja andmetele pääsete juurde, neid kohandada ja juurutada saate SageMaker JumpStarti sihtlehe kaudu Amazon SageMaker Studio vaid mõne hiireklõpsuga.
Amazon Lex on vestlusliides, mis aitab ettevõtetel luua vestlusroboteid ja häälroboteid, mis osalevad loomulikus ja elutruus suhtluses. Integreerides Amazon Lexi generatiivse tehisintellektiga, saavad ettevõtted luua tervikliku ökosüsteemi, kus kasutajate sisestus läheb sujuvalt üle sidusateks ja kontekstuaalselt asjakohasteks vastusteks.
Lahenduse ülevaade
Järgnev diagramm illustreerib lahenduse arhitektuuri.
Järgmistes jaotistes käsitleme selle lahenduse ja selle komponentide rakendamise etappe.
Seadistage MongoDB klaster
Tasuta MongoDB Atlase klastri loomiseks järgige juhiseid Looge klaster. Seadistage andmebaas juurdepääs ja võrku juurdepääs.
Juurutage SageMakeri manustamismudel
Saate valida manustamismudeli (ALL MiniLM L6 v2) lehel SageMaker JumpStart Mudelid, sülearvutid, lahendused lehel.
Vali juurutada mudeli juurutamiseks.
Kontrollige, kas mudel on edukalt juurutatud, ja veenduge, et lõpp-punkt on loodud.
Vektori manustamine
Vektori manustamine on teksti või pildi teisendamine vektoresitluseks. Järgmise koodi abil saame SageMaker JumpStartiga genereerida vektormanustusi ja värskendada kollektsiooni iga dokumendi jaoks loodud vektoriga:
payload = {"text_inputs": [document[field_name_to_be_vectorized]]}
query_response = query_endpoint_with_json_payload(json.dumps(payload).encode('utf-8'))
embeddings = parse_response_multiple_texts(query_response) # update the document
update = {'$set': {vector_field_name : embeddings[0]}}
collection.update_one(query, update)
Ülaltoodud kood näitab, kuidas värskendada kogus üksikut objekti. Kõigi objektide värskendamiseks järgige juhised.
MongoDB vektorandmete salvestusruum
MongoDB atlase vektorotsing on uus funktsioon, mis võimaldab salvestada ja otsida MongoDB-s vektorandmeid. Vektorandmed on teatud tüüpi andmed, mis esindavad punkti suuremõõtmelises ruumis. Seda tüüpi andmeid kasutatakse sageli ML ja tehisintellekti rakendustes. MongoDB Atlas Vector Search kasutab tehnikat nimega k-lähimad naabrid (k-NN), et otsida sarnaseid vektoreid. k-NN töötab, leides antud vektoriga k kõige sarnasemat vektorit. Kõige sarnasemad vektorid on need, mis on antud vektorile eukleidilise kauguse poolest kõige lähemal.
Vektorandmete salvestamine tööandmete kõrval võib parandada jõudlust, vähendades vajadust andmete teisaldamiseks erinevate salvestussüsteemide vahel. See on eriti kasulik rakenduste jaoks, mis nõuavad reaalajas juurdepääsu vektorandmetele.
Looge vektorotsingu register
Järgmine samm on luua a MongoDB vektorotsingu register eelmises etapis loodud vektorväljal. MongoDB kasutab knnVector
tüüp vektormanustuste indekseerimiseks. Vektorväli tuleks esitada arvude massiivina (ainult BSON int32, int64 või topeltandmetüübid).
Viitama Vaadake üle knnVektori tüübi piirangud piirangute kohta lisateabe saamiseks knnVector
tüüp
Järgmine kood on näidisindeksi määratlus:
{ "mappings": { "dynamic": true, "fields": { "egVector": { "dimensions": 384, "similarity": "euclidean", "type": "knnVector" } } }
}
Pange tähele, et mõõde peab vastama teie manustamismudeli mõõtmetele.
Esitage päring vektorandmete salvest
Saate päringuid vektorandmesalvest teha kasutades Vektorotsingu koondamise konveier. See kasutab vektorotsingu indeksit ja täidab a semantiline otsing vektori andmesalves.
Järgmine kood on näidisotsingu määratlus:
{ $search: { "index": "<index name>", // optional, defaults to "default" "knnBeta": { "vector": [<array-of-numbers>], "path": "<field-to-search>", "filter": {<filter-specification>}, "k": <number>, "score": {<options>} } }
}
Juurutage SageMakeri suurkeelemudel
SageMaker JumpStart jumestuskreemi mudelid on eelkoolitatud suured keelemudelid (LLM), mida kasutatakse mitmesuguste loomuliku keele töötlemise (NLP) ülesannete lahendamiseks, nagu teksti kokkuvõte, küsimustele vastamine ja loomuliku keele järeldamine. Need on saadaval erinevates suurustes ja konfiguratsioonides. Selles lahenduses kasutame Kallistav nägu FLAN-T5-XL mudel.
Otsige SageMaker JumpStartis mudelit FLAN-T5-XL.
Vali juurutada mudeli FLAN-T5-XL seadistamiseks.
Veenduge, et mudel on edukalt juurutatud ja lõpp-punkt aktiivne.
Looge Amazon Lex bot
Amazon Lexi roboti loomiseks toimige järgmiselt.
- Amazon Lex konsoolil valige Loo bot.
- eest Boti nimi, sisestage nimi.
- eest Kestuslik rollvalige Looge roll Amazon Lexi põhiõigustega.
- Määrake oma keeleseaded ja seejärel valige Tehtud.
- Lisage väljaütlemise näidis
NewIntent
UI ja valige Salvesta kavatsus. - Liikuge
FallbackIntent
mis on teie jaoks loodud vaikimisi ja lülitage sisse aktiivne aasta Täitmine sektsiooni. - Vali Ehitama ja kui ehitamine on edukas, valige test.
- Enne testimist valige hammasrattaikoon.
- Märkida AWS Lambda funktsioon, mis suhtleb MongoDB Atlase ja LLM-iga, et pakkuda vastuseid. Lambda funktsiooni loomiseks toimige järgmiselt need sammud.
- Nüüd saate LLM-iga suhelda.
Koristage
Ressursside puhastamiseks toimige järgmiselt.
- Kustutage Amazon Lex bot.
- Kustutage lambda funktsioon.
- Kustutage LLM SageMakeri lõpp-punkt.
- Kustutage manustamismudeli SageMaker lõpp-punkt.
- Kustutage MongoDB Atlase klaster.
Järeldus
Postituses näitasime, kuidas luua lihtsat robotit, mis kasutab MongoDB Atlase semantilist otsingut ja integreerub SageMaker JumpStarti mudeliga. See robot võimaldab teil kiiresti prototüüpida kasutaja interaktsiooni erinevate LLM-idega SageMaker Kiirstardis, sidudes need samal ajal MongoDB Atlase kontekstiga.
Nagu alati, ootab AWS tagasisidet. Palun jätke oma tagasiside ja küsimused kommentaaride jaotisesse.
Autoritest
Igor Aleksejev on AWS-i vanempartnerlahenduste arhitekt Andmete ja Analyticsi domeenis. Oma rollis teeb Igor koostööd strateegiliste partneritega, aidates neil ehitada keerulisi AWS-i jaoks optimeeritud arhitektuure. Enne AWS-iga liitumist viis ta andmete/lahenduste arhitektina ellu palju projekte suurandmete domeenis, sealhulgas mitut Hadoopi ökosüsteemi andmejärve. Andmeinsenerina oli ta seotud AI/ML rakendamisega pettuste tuvastamisel ja kontori automatiseerimisel.
Babu Srinivasan on MongoDB vanempartnerilahenduste arhitekt. Oma praeguses rollis töötab ta koos AWS-iga, et luua AWS-i ja MongoDB lahenduste tehnilisi integratsioone ja võrdlusarhitektuure. Tal on enam kui kahe aastakümne pikkune kogemus andmebaasi- ja pilvetehnoloogiate vallas. Ta on kirglik tehniliste lahenduste pakkumise vastu klientidele, kes töötavad mitme globaalse süsteemiintegraatoriga (GSI) mitmes geograafilises piirkonnas.
- SEO-põhise sisu ja PR-levi. Võimenduge juba täna.
- PlatoData.Network Vertikaalne generatiivne Ai. Jõustage ennast. Juurdepääs siia.
- PlatoAiStream. Web3 luure. Täiustatud teadmised. Juurdepääs siia.
- PlatoESG. Süsinik, CleanTech, Energia, Keskkond päikeseenergia, Jäätmekäitluse. Juurdepääs siia.
- PlatoTervis. Biotehnoloogia ja kliiniliste uuringute luureandmed. Juurdepääs siia.
- Allikas: https://aws.amazon.com/blogs/machine-learning/retrieval-augmented-generation-with-langchain-amazon-sagemaker-jumpstart-and-mongodb-atlas-semantic-search/
- :on
- :on
- : kus
- $ UP
- 100
- 200
- 321
- 361
- 7
- 9
- a
- MEIST
- üle
- kiirendama
- juurdepääs
- üle
- aktiivne
- pärast
- koondamine
- AI
- Tehisintellekti toega
- AI / ML
- Materjal: BPA ja flataatide vaba plastik
- võimaldab
- alati
- Amazon
- Amazon Lex
- Amazon SageMaker
- Amazon SageMaker JumpStart
- Amazon Web Services
- an
- analytics
- ja
- API-liidesed
- rakendused
- Rakendades
- arhitektuur
- OLEME
- Array
- kunstlik
- tehisintellekti
- AS
- At
- suurendab
- Automaatika
- saadaval
- AWS
- AWS Lambda
- põhiline
- BE
- kasulik
- vahel
- Suur
- Big andmed
- Bot
- eest
- ehitama
- ettevõtted
- kuid
- by
- kutsutud
- CAN
- võimeid
- hoolikalt
- väljakutseid
- jututoad
- Vali
- puhastama
- Cloud
- Cluster
- kood
- SIDUS
- kogumine
- kommentaarid
- täitma
- keeruline
- komponendid
- Arvestama
- konsool
- sisu
- kontekst
- jutukas
- konverteeriva
- looma
- loodud
- Praegune
- Kliendid
- kohandada
- andmed
- andmete salvestamine
- andmepõhistele
- andmebaas
- andmebaasid
- aastakümnete
- vaikimisi
- vaikimisi
- määratlus
- juurutada
- lähetatud
- Detection
- & Tarkvaraarendus
- erinev
- mõõde
- mõõdud
- kaugus
- dokument
- domeen
- kahekordistada
- dünaamiline
- ökosüsteemi
- Tõhus
- kõrvaldades
- kinnistamine
- võimaldab
- Lõpp-punkt
- tegelema
- insener
- tagades
- sisene
- ettevõte
- ettevõtete
- eriti
- Iga
- kogemus
- väline
- KIIRE
- tunnusjoon
- tagasiside
- vähe
- väli
- Valdkonnad
- filtreerida
- leidmine
- järgima
- Järel
- eest
- Sihtasutus
- Raamistik
- pettus
- pettuste avastamine
- tasuta
- Alates
- funktsioon
- Käik
- tekitama
- põlvkond
- generatiivne
- Generatiivne AI
- geograafiad
- saama
- antud
- Globaalne
- rakmed
- Olema
- he
- aitama
- aidates
- aitab
- rõhutab
- tema
- terviklikku
- Kuidas
- Kuidas
- HTML
- http
- HTTPS
- ICON
- illustreerib
- pilt
- rakendada
- rakendatud
- parandama
- in
- Kaasa arvatud
- indeks
- info
- sisend
- juhised
- integreeritud
- Integreerib
- Integreerimine
- integratsioon
- integratsioon
- Intelligentsus
- suhelda
- suhtlemist
- interaktsioonid
- Interface
- sisse
- seotud
- IT
- ITS
- liitumine
- Json
- lihtsalt
- järved
- maandumine
- keel
- suur
- õppimine
- Lahkuma
- elutruu
- piirangud
- LLM
- masin
- masinõpe
- tegema
- palju
- Vastama
- ML
- mudel
- mudelid
- MongoDB
- rohkem
- kõige
- liikuma
- mitmekordne
- peab
- nimi
- Natural
- Natural Language Processing
- Vajadus
- võrk
- Uus
- järgmine
- nlp
- nüüd
- numbrid
- objekt
- esemeid
- of
- Office
- sageli
- on
- ones
- ainult
- töökorras
- Operations
- or
- päritolu
- ülesaamine
- ülevaade
- lehekülg
- sidumine
- partner
- partnerid
- kirglik
- tee
- jõudlus
- täidab
- Platon
- Platoni andmete intelligentsus
- PlatoData
- palun
- Punkt
- post
- potentsiaal
- võim
- võimas
- kingitusi
- eelmine
- Eelnev
- protsess
- töötlemine
- projektid
- prototüüp
- anda
- annab
- pakkudes
- kvaliteet
- küsimus
- Küsimused
- kiiresti
- reaalajas
- vähendamine
- viide
- asjakohane
- esindamine
- esindatud
- esindab
- nõudma
- Vahendid
- vastuste
- murranguliseks muuta
- Roll
- kaitsmine
- salveitegija
- skoor
- sujuvalt
- Otsing
- Osa
- lõigud
- vanem
- eri
- Teenused
- komplekt
- seaded
- mitu
- peaks
- näitas
- Näitused
- sarnane
- lihtne
- lihtsustama
- ühekordne
- suurused
- lahendus
- Lahendused
- LAHENDAGE
- Allikad
- Ruum
- alustatud
- Samm
- Sammud
- ladustamine
- salvestada
- Strateegiline
- strateegilised partnerid
- edukas
- Edukalt
- selline
- komplekt
- süsteem
- süsteemid
- ülesanded
- Tehniline
- tehnika
- Tehnoloogiad
- tingimused
- test
- Testimine
- tekst
- kui
- et
- .
- oma
- Neile
- SIIS
- nad
- see
- Läbi
- rida
- et
- Rong
- muundav
- üleminekuid
- tõsi
- kaks
- tüüp
- liigid
- ui
- Värskendused
- kasutama
- Kasutatud
- Kasutaja
- kasutusalad
- kasutamine
- sort
- kontrollima
- Hääl
- kõndima
- oli
- Tee..
- we
- web
- veebiteenused
- Tervitab
- kuigi
- will
- koos
- töö
- töötab
- sa
- Sinu
- sephyrnet