Retrieval-Augmented Generation LangChainilla, Amazon SageMaker JumpStartilla ja MongoDB Atlas Semantic Searchilla

Julkaissut Platon

seuraajia: 0

Generatiivinen AI mallit voivat mullistaa yritysten toiminnan, mutta yritysten on harkittava tarkasti, kuinka valjastaa voimansa ja voitettava haasteet, kuten tietojen suojaaminen ja tekoälyn tuottaman sisällön laadun varmistaminen.

Retrieval-Augmented Generation (RAG) -kehys täydentää kehotteita ulkoisilla tiedoilla useista lähteistä, kuten asiakirjavarastoista, tietokannoista tai API:sta, jotta perustamalleista tulee tehokkaita toimialuekohtaisissa tehtävissä. Tämä viesti esittelee RAG-mallin ominaisuudet ja korostaa MongoDB Atlasin muutospotentiaalia sen Vector Search -ominaisuuden avulla.

MongoDB Atlas on integroitu tietopalvelupaketti, joka nopeuttaa ja yksinkertaistaa tietopohjaisten sovellusten kehitystä. Sen vektoritietovarasto integroituu saumattomasti operatiivisen tiedon varastointiin, mikä eliminoi erillisen tietokannan tarpeen. Tämä integraatio mahdollistaa tehokkaat semanttiset hakuominaisuudet Vektorihaku, nopea tapa rakentaa semanttista hakua ja tekoälypohjaisia sovelluksia.

Amazon Sage Maker antaa yrityksille mahdollisuuden rakentaa, kouluttaa ja ottaa käyttöön koneoppimismalleja (ML). Amazon SageMaker JumpStart tarjoaa valmiiksi koulutettuja malleja ja tietoja, jotka auttavat sinua pääsemään alkuun ML:n kanssa. Voit käyttää, muokata ja ottaa käyttöön esikoulutettuja malleja ja tietoja SageMaker JumpStart -aloitussivun kautta Amazon SageMaker Studio vain muutamalla napsautuksella.

Amazon-Lex on keskustelukäyttöliittymä, joka auttaa yrityksiä luomaan chatbotteja ja äänibotteja, jotka osallistuvat luonnolliseen, todenmukaiseen vuorovaikutukseen. Integroimalla Amazon Lexin generatiiviseen tekoälyyn yritykset voivat luoda kokonaisvaltaisen ekosysteemin, jossa käyttäjien syötteet muuttuvat saumattomasti johdonmukaisiksi ja kontekstuaalisesti relevanteiksi vastauksiksi.

Ratkaisun yleiskatsaus

Seuraava kaavio kuvaa ratkaisuarkkitehtuuria.

Seuraavissa osioissa käymme läpi vaiheet tämän ratkaisun ja sen komponenttien toteuttamiseksi.

Luo MongoDB-klusteri

Luo ilmainen tason MongoDB Atlas -klusteri noudattamalla ohjeita Luo klusteri. Määritä tietokanta pääsy ja verkko pääsy.

Ota SageMaker-upotusmalli käyttöön

Voit valita upotusmallin (ALL MiniLM L6 v2) SageMaker JumpStart Mallit, muistikirjat, ratkaisut sivu.

Valita Sijoittaa ottaa mallin käyttöön.

Varmista, että malli on otettu käyttöön onnistuneesti ja varmista, että päätepiste on luotu.

Vector upotus

Vector upotus on prosessi, jossa teksti tai kuva muunnetaan vektoriesitykseen. Seuraavalla koodilla voimme luoda vektori upotuksia SageMaker JumpStartilla ja päivittää kokoelman luodulla vektorilla jokaiselle asiakirjalle:

payload = {"text_inputs": [document[field_name_to_be_vectorized]]}
query_response = query_endpoint_with_json_payload(json.dumps(payload).encode('utf-8'))
embeddings = parse_response_multiple_texts(query_response) # update the document
update = {'$set': {vector_field_name :  embeddings[0]}}
collection.update_one(query, update)

Yllä oleva koodi näyttää, kuinka kokoelman yksittäinen objekti päivitetään. Päivitä kaikki objektit noudattamalla ohjeet.

MongoDB-vektoritietovarasto

MongoDB Atlas Vector Search on uusi ominaisuus, jonka avulla voit tallentaa ja etsiä vektoritietoja MongoDB:ssä. Vektoridata on datatyyppi, joka edustaa pistettä korkeaulotteisessa avaruudessa. Tämän tyyppistä dataa käytetään usein ML- ja tekoälysovelluksissa. MongoDB Atlas Vector Search käyttää tekniikkaa nimeltä k-lähimmät naapurit (k-NN) etsiäksesi samanlaisia vektoreita. k-NN toimii etsimällä k eniten samankaltaista vektoria tiettyyn vektoriin. Samankaltaisimmat vektorit ovat ne, jotka ovat lähimpänä annettua vektoria euklidisen etäisyyden suhteen.

Vektoritietojen tallentaminen operatiivisten tietojen viereen voi parantaa suorituskykyä vähentämällä tarvetta siirtää tietoja eri tallennusjärjestelmien välillä. Tämä on erityisen hyödyllistä sovelluksille, jotka vaativat reaaliaikaista pääsyä vektoritietoihin.

Luo vektorihakuindeksi

Seuraava vaihe on luoda MongoDB Vector Search -hakemisto edellisessä vaiheessa luomassasi vektorikentässä. MongoDB käyttää knnVector kirjoita hakemistovektorin upotukset. Vektorikenttä tulee esittää lukujonona (vain BSON int32, int64 tai kaksoistietotyypit).

Mainita Tarkista knnVector-tyyppirajoitukset lisätietoja rajoituksista knnVector tyyppi.

Seuraava koodi on esimerkkiindeksin määritelmä:

{ "mappings": { "dynamic": true, "fields": { "egVector": { "dimensions": 384, "similarity": "euclidean", "type": "knnVector" } } }
}

Huomaa, että mittasuhteen on vastattava upotusmallin mittaa.

Tee kysely vektoritietovarastoon

Voit tehdä kyselyn vektoritietovarastoon käyttämällä Vector Search aggregation pipeline. Se käyttää Vector Search -indeksiä ja suorittaa a semanttinen haku vektoritietovarastossa.

Seuraava koodi on esimerkkihaun määritelmä:

{ $search: { "index": "<index name>", // optional, defaults to "default" "knnBeta": { "vector": [<array-of-numbers>], "path": "<field-to-search>", "filter": {<filter-specification>}, "k": <number>, "score": {<options>} } }
}

Ota käyttöön suuri SageMaker-kielimalli

SageMaker JumpStart -pohjamallit ovat valmiiksi koulutettuja suuria kielimalleja (LLM), joita käytetään ratkaisemaan erilaisia luonnollisen kielen käsittelyn (NLP) tehtäviä, kuten tekstin yhteenveto, kysymyksiin vastaaminen ja luonnollisen kielen päättely. Niitä on saatavana eri kokoisina ja kokoonpanoina. Tässä ratkaisussa käytämme Halaaminen kasvot FLAN-T5-XL malli.

Etsi mallia FLAN-T5-XL SageMaker JumpStartista.

Valita Sijoittaa määrittääksesi mallin FLAN-T5-XL.

Varmista, että mallin käyttöönotto onnistui ja päätepiste on aktiivinen.

Luo Amazon Lex -botti

Voit luoda Amazon Lex -botin suorittamalla seuraavat vaiheet:

Valitse Amazon Lex -konsolissa Luo botti.

varten Botin nimi, kirjoita nimi.
varten Suorituksen roolivalitse Luo rooli Amazon Lexin perusoikeuksilla.
Määritä kieliasetukset ja valitse sitten valmis.
Lisää esimerkkilauseke kohtaan NewIntent UI ja valitse Tallenna tarkoitus.
Siirry FallbackIntent joka on luotu sinulle oletuksena ja vaihda Aktiiviset vuonna täyttymys osiossa.
Valita Rakentaa ja kun rakentaminen on onnistunut, valitse Testi.
Valitse rataskuvake ennen testaamista.
Määritä AWS Lambda toiminto, joka on vuorovaikutuksessa MongoDB Atlasin ja LLM:n kanssa antaakseen vastauksia. Luo lambda-funktio seuraavasti nämä vaiheet.
Voit nyt olla vuorovaikutuksessa LLM:n kanssa.

Puhdistaa

Voit puhdistaa resurssit suorittamalla seuraavat vaiheet:

Poista Amazon Lex -botti.
Poista lambda-toiminto.
Poista LLM SageMaker -päätepiste.
Poista upotusmallin SageMaker-päätepiste.
Poista MongoDB Atlas -klusteri.

Yhteenveto

Viestissä näytimme, kuinka luodaan yksinkertainen botti, joka käyttää MongoDB Atlas -semanttista hakua ja integroituu SageMaker JumpStart -malliin. Tämän botin avulla voit luoda nopeasti prototyyppejä käyttäjien vuorovaikutuksesta SageMaker Jumpstartin eri LLM:ien kanssa samalla kun yhdistät ne MongoDB Atlasista peräisin olevaan kontekstiin.

Kuten aina, AWS ottaa palautetta vastaan. Jätä palautteesi ja kysymyksesi kommenttiosioon.

Tietoja kirjoittajista

Retrieval-Augmented Generation kanssa LangChain, Amazon SageMaker JumpStart ja MongoDB Atlas semanttinen haku | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.

Igor Alekseev on vanhempi kumppaniratkaisuarkkitehti AWS:ssä Data and Analytics -verkkotunnuksessa. Roolissaan Igor työskentelee strategisten kumppaneiden kanssa auttaen heitä rakentamaan monimutkaisia, AWS-optimoituja arkkitehtuureja. Ennen AWS:ään liittymistään hän toteutti Data/Solution Architectina monia Big Data -alueen projekteja, mukaan lukien useita datajärviä Hadoop-ekosysteemissä. Tietosuunnittelijana hän oli mukana AI/ML:n soveltamisessa petosten havaitsemiseen ja toimistoautomaatioon.

Babu Srinivasan on Senior Partner Solutions -arkkitehti MongoDB:ssä. Nykyisessä tehtävässään hän työskentelee AWS:n kanssa teknisten integraatioiden ja referenssiarkkitehtuurien rakentamiseksi AWS- ja MongoDB-ratkaisuille. Hänellä on yli kahden vuosikymmenen kokemus tietokanta- ja pilviteknologioista. Hän on intohimoinen teknisten ratkaisujen tarjoamisesta asiakkaille, jotka työskentelevät useiden maailmanlaajuisten järjestelmäintegraattoreiden (GSI) kanssa useilla maantieteellisillä alueilla.

SEO-pohjainen sisällön ja PR-jakelu. Vahvista jo tänään.
PlatoData.Network Vertical Generatiivinen Ai. Vahvista itseäsi. Pääsy tästä.
PlatoAiStream. Web3 Intelligence. Tietoa laajennettu. Pääsy tästä.
PlatoESG. hiili, CleanTech, energia, ympäristö, Aurinko, Jätehuolto. Pääsy tästä.
PlatonHealth. Biotekniikan ja kliinisten kokeiden älykkyys. Pääsy tästä.
Lähde: https://aws.amazon.com/blogs/machine-learning/retrieval-augmented-generation-with-langchain-amazon-sagemaker-jumpstart-and-mongodb-atlas-semantic-search/

Aikaleima: Marraskuussa 17, 2023

Aikaleima: Huhtikuu 30, 2024

Retrieval-Augmented Generation kanssa LangChain, Amazon SageMaker JumpStart ja MongoDB Atlas semanttinen haku | Amazon Web Services

Julkaissut Platon

Ratkaisun yleiskatsaus

Luo MongoDB-klusteri

Ota SageMaker-upotusmalli käyttöön

Vector upotus

MongoDB-vektoritietovarasto

Luo vektorihakuindeksi

Tee kysely vektoritietovarastoon

Ota käyttöön suuri SageMaker-kielimalli

Luo Amazon Lex -botti

Puhdistaa

Yhteenveto

Tietoja kirjoittajista

Lisää aiheesta AWS-koneoppiminen

Tunnista petokset mobiilialan yrityksissä GrabDefence-laitetiedon ja Amazon Fraud Detectorin avulla

AWS Inferentia ja AWS Trainium tarjoavat alhaisimmat kustannukset Llama 3 -mallien käyttöönotosta Amazon SageMaker JumpStartissa | Amazon Web Services

Kustannustehokas tietojen valmistelu koneoppimista varten SageMaker Data Wranglerin avulla

Yhtenäinen tietojen valmistelu, mallikoulutus ja käyttöönotto Amazon SageMaker Data Wranglerin ja Amazon SageMaker Autopilotin kanssa – Osa 2

Luo mukautettu Q&A-tietojoukko Amazon SageMaker Ground Truthin avulla kouluttaaksesi Hugging Face Q&A NLU-mallin

Tietoa meistä

Pystysuuntainen haku ja Ai

foorumi

Pysy yhteydessä

Tili