Generiranje z obogatenim iskanjem z LangChain, Amazon SageMaker JumpStart in semantičnim iskanjem MongoDB Atlas

Ponovno objavil Platon

Spremljevalci: 0

Generativna AI modeli imajo potencial za revolucijo v delovanju podjetij, vendar morajo podjetja skrbno razmisliti o tem, kako izkoristiti njihovo moč, medtem ko premagujejo izzive, kot sta varovanje podatkov in zagotavljanje kakovosti vsebine, ustvarjene z umetno inteligenco.

Ogrodje Retrieval-Augmented Generation (RAG) dopolnjuje pozive z zunanjimi podatki iz več virov, kot so repozitoriji dokumentov, baze podatkov ali API-ji, da naredi temeljne modele učinkovite za naloge, specifične za domeno. Ta objava predstavlja zmožnosti modela RAG in poudarja transformativni potencial Atlasa MongoDB s funkcijo vektorskega iskanja.

Atlas MongoDB je integrirana zbirka podatkovnih storitev, ki pospešujejo in poenostavljajo razvoj podatkovno vodenih aplikacij. Njegova shramba vektorskih podatkov se brezhibno integrira s shrambo operativnih podatkov, kar odpravlja potrebo po ločeni bazi podatkov. Ta integracija omogoča zmogljive semantične zmožnosti iskanja prek Vektorsko iskanje, hiter način za izdelavo semantičnega iskanja in aplikacij, ki jih poganja AI.

Amazon SageMaker podjetjem omogoča izdelavo, usposabljanje in uvajanje modelov strojnega učenja (ML). Amazon SageMaker JumpStart ponuja vnaprej usposobljene modele in podatke, ki vam bodo pomagali začeti z ML. Prek ciljne strani SageMaker JumpStart lahko dostopate do vnaprej pripravljenih modelov in podatkov, jih prilagajate in uvajate v Amazon SageMaker Studio z le nekaj kliki.

Amazon Lex je pogovorni vmesnik, ki podjetjem pomaga ustvariti klepetalnice in glasovne robote, ki sodelujejo v naravnih in realističnih interakcijah. Z integracijo Amazon Lex z generativno umetno inteligenco lahko podjetja ustvarijo celosten ekosistem, v katerem uporabniški vnos brezhibno prehaja v skladne in kontekstualno ustrezne odzive.

Pregled rešitev

Naslednji diagram prikazuje arhitekturo rešitev.

V naslednjih razdelkih se sprehodimo skozi korake za implementacijo te rešitve in njenih komponent.

Nastavite gručo MongoDB

Če želite ustvariti brezplačno gručo MongoDB Atlas, sledite navodilom v Ustvarite gručo. Nastavite bazo podatkov dostop in omrežja dostop.

Razmestite model vdelave SageMaker

Izberete lahko model vdelave (VSI MiniLM L6 v2) na SageMaker JumpStart modeli, prenosniki, rešitve stran.

Izberite uvajanje za uvedbo modela.

Preverite, ali je model uspešno uveden, in preverite, ali je končna točka ustvarjena.

Vdelava vektorjev

Vdelava vektorjev je postopek pretvorbe besedila ali slike v vektorsko predstavitev. Z naslednjo kodo lahko ustvarimo vdelave vektorjev s SageMaker JumpStart in posodobimo zbirko z ustvarjenim vektorjem za vsak dokument:

payload = {"text_inputs": [document[field_name_to_be_vectorized]]}
query_response = query_endpoint_with_json_payload(json.dumps(payload).encode('utf-8'))
embeddings = parse_response_multiple_texts(query_response) # update the document
update = {'$set': {vector_field_name :  embeddings[0]}}
collection.update_one(query, update)

Zgornja koda prikazuje, kako posodobiti en predmet v zbirki. Če želite posodobiti vse predmete, sledite Navodila.

Shramba vektorskih podatkov MongoDB

MongoDB Atlas Vector Search je nova funkcija, ki omogoča shranjevanje in iskanje vektorskih podatkov v MongoDB. Vektorski podatki so vrsta podatkov, ki predstavljajo točko v visokodimenzionalnem prostoru. Ta vrsta podatkov se pogosto uporablja v aplikacijah ML in umetne inteligence. MongoDB Atlas Vector Search uporablja tehniko, imenovano k-najbližji sosedje (k-NN) za iskanje podobnih vektorjev. k-NN deluje tako, da poišče k danemu vektorju najbolj podobnih vektorjev. Najbolj podobni vektorji so tisti, ki so glede na evklidsko razdaljo najbližje danemu vektorju.

Shranjevanje vektorskih podatkov poleg operativnih podatkov lahko izboljša zmogljivost z zmanjšanjem potrebe po premikanju podatkov med različnimi sistemi za shranjevanje. To je še posebej koristno za aplikacije, ki zahtevajo dostop do vektorskih podatkov v realnem času.

Ustvari indeks vektorskega iskanja

Naslednji korak je ustvariti a Indeks vektorskega iskanja MongoDB na vektorskem polju, ki ste ga ustvarili v prejšnjem koraku. MongoDB uporablja knnVector tip za indeksiranje vektorskih vdelav. Vektorsko polje mora biti predstavljeno kot niz števil (samo tipi podatkov BSON int32, int64 ali double).

Nanašati se na Preglejte omejitve vrste knnVector za več informacij o omejitvah knnVector tip.

Naslednja koda je vzorčna definicija indeksa:

{ "mappings": { "dynamic": true, "fields": { "egVector": { "dimensions": 384, "similarity": "euclidean", "type": "knnVector" } } }
}

Upoštevajte, da se mora dimenzija ujemati z vašo dimenzijo modela vdelave.

Izvedite poizvedbo v shrambi vektorskih podatkov

V vektorski podatkovni shrambi lahko poizvedujete z uporabo Cev združevanja vektorskega iskanja. Uporablja indeks vektorskega iskanja in izvaja a pomensko iskanje v shrambi vektorskih podatkov.

Naslednja koda je vzorčna definicija iskanja:

{ $search: { "index": "<index name>", // optional, defaults to "default" "knnBeta": { "vector": [<array-of-numbers>], "path": "<field-to-search>", "filter": {<filter-specification>}, "k": <number>, "score": {<options>} } }
}

Namestite velik jezikovni model SageMaker

Modeli temeljev SageMaker JumpStart so vnaprej usposobljeni veliki jezikovni modeli (LLM), ki se uporabljajo za reševanje različnih nalog obdelave naravnega jezika (NLP), kot so povzemanje besedila, odgovarjanje na vprašanja in sklepanje o naravnem jeziku. Na voljo so v različnih velikostih in konfiguracijah. V tej rešitvi uporabljamo Objemni obraz Model FLAN-T5-XL.

Poiščite model FLAN-T5-XL v SageMaker JumpStart.

Izberite uvajanje za nastavitev modela FLAN-T5-XL.

Preverite, ali je model uspešno nameščen in je končna točka aktivna.

Ustvarite bota Amazon Lex

Če želite ustvariti bota Amazon Lex, izvedite naslednje korake:

Na konzoli Amazon Lex izberite Ustvari bot.

za Ime bota, vnesite ime.
za Vloga med izvajanjemtako, da izberete Ustvarite vlogo z osnovnimi dovoljenji Amazon Lex.
Določite jezikovne nastavitve in nato izberite Done.
Dodajte vzorčno izjavo v NewIntent UI in izberite Shrani namero.
Pomaknite se na FallbackIntent ki je bil privzeto ustvarjen za vas in preklopite Aktivno v Izpolnitev oddelek.
Izberite Zgradite in po uspešni gradnji izberite Test.
Pred testiranjem izberite ikono zobnika.
določite AWS Lambda funkcijo, ki bo sodelovala z MongoDB Atlas in LLM za zagotavljanje odgovorov. Za ustvarjanje funkcije lambda sledite te korake.
Zdaj lahko sodelujete z LLM.

Čiščenje

Za čiščenje virov izvedite naslednje korake:

Izbrišite bota Amazon Lex.
Izbrišite funkcijo Lambda.
Izbrišite končno točko LLM SageMaker.
Izbrišite končno točko SageMaker modela vdelav.
Izbrišite gručo MongoDB Atlas.

zaključek

V objavi smo pokazali, kako ustvariti preprostega bota, ki uporablja semantično iskanje MongoDB Atlas in se integrira z modelom iz SageMaker JumpStart. Ta bot vam omogoča, da hitro ustvarite prototip uporabniške interakcije z različnimi LLM-ji v SageMaker Jumpstart, medtem ko jih združite s kontekstom, ki izvira iz Atlasa MongoDB.

Kot vedno AWS pozdravlja povratne informacije. Pustite povratne informacije in vprašanja v razdelku za komentarje.

O avtorjih

Retrieval-Augmented Generation with LangChain, Amazon SageMaker JumpStart, and MongoDB Atlas semantic search | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Igor Aleksejev je višji arhitekt partnerskih rešitev pri AWS na področju podatkov in analitike. V svoji vlogi Igor sodeluje s strateškimi partnerji in jim pomaga zgraditi kompleksne arhitekture, optimizirane za AWS. Preden se je pridružil AWS, je kot Data/Solution Architect izvajal številne projekte na področju Big Data, vključno z več podatkovnimi jezeri v ekosistemu Hadoop. Kot podatkovni inženir je sodeloval pri uporabi AI/ML za odkrivanje goljufij in pisarniško avtomatizacijo.

Babu Srinivasan je višji arhitekt partnerskih rešitev pri MongoDB. V svoji trenutni vlogi sodeluje z AWS pri izgradnji tehničnih integracij in referenčnih arhitektur za rešitve AWS in MongoDB. Ima več kot dve desetletji izkušenj na področju podatkovnih baz in tehnologij v oblaku. Strastno se ukvarja z zagotavljanjem tehničnih rešitev strankam, ki delajo z več globalnimi sistemskimi integratorji (GSI) na različnih območjih.

Distribucija vsebine in PR s pomočjo SEO. Okrepite se še danes.
PlatoData.Network Vertical Generative Ai. Opolnomočite se. Dostopite tukaj.
PlatoAiStream. Web3 Intelligence. Razširjeno znanje. Dostopite tukaj.
PlatoESG. Ogljik, CleanTech, Energija, Okolje, sončna energija, Ravnanje z odpadki. Dostopite tukaj.
PlatoHealth. Obveščanje o biotehnologiji in kliničnih preskušanjih. Dostopite tukaj.
vir: https://aws.amazon.com/blogs/machine-learning/retrieval-augmented-generation-with-langchain-amazon-sagemaker-jumpstart-and-mongodb-atlas-semantic-search/

Časovni žig: November 17, 2023

Časovni žig: April 30, 2024

Generiranje z obogatenim iskanjem s semantičnim iskanjem LangChain, Amazon SageMaker JumpStart in MongoDB Atlas | Spletne storitve Amazon

Ponovno objavil Platon

Pregled rešitev

Nastavite gručo MongoDB

Razmestite model vdelave SageMaker

Vdelava vektorjev

Shramba vektorskih podatkov MongoDB

Ustvari indeks vektorskega iskanja

Izvedite poizvedbo v shrambi vektorskih podatkov

Namestite velik jezikovni model SageMaker

Ustvarite bota Amazon Lex

Čiščenje

zaključek

O avtorjih

Več od Strojno učenje AWS

Odkrivanje goljufij v mobilno usmerjenih podjetjih z uporabo GrabDefence device intelligence in Amazon Fraud Detector

AWS Inferentia in AWS Trainium zagotavljata najnižje stroške za uvajanje modelov Llama 3 v Amazon SageMaker JumpStart | Spletne storitve Amazon

Stroškovno učinkovita priprava podatkov za strojno učenje z uporabo SageMaker Data Wrangler

Poenotena priprava podatkov, usposabljanje modela in uvedba z Amazon SageMaker Data Wrangler in Amazon SageMaker Autopilot – 2. del

Zgradite nabor podatkov vprašanj in odgovorov po meri z uporabo Amazon SageMaker Ground Truth za usposabljanje modela NLU vprašanj in odgovorov Hugging Face

O nas

Navpično iskanje in Ai

Platforma

Ostanite povezani

Račun