Käytä RAG:ta lääkkeiden löytämiseen Amazon Bedrockin tietokannan avulla | Amazon Web Services

Käytä RAG:ta lääkkeiden löytämiseen Amazon Bedrockin tietokannan avulla | Amazon Web Services

Amazonin kallioperä tarjoaa laajan valikoiman malleja Amazonilta ja kolmansien osapuolien palveluntarjoajilta, mukaan lukien Anthropic, AI21, Meta, Cohere ja Stability AI, ja kattaa laajan valikoiman käyttötapauksia, mukaan lukien tekstin ja kuvan luominen, upottaminen, chat ja korkean tason agentit perusteluilla ja orkestroinnilla ja paljon muuta. Amazon Bedrockin tietokannat voit rakentaa tehokkaita ja räätälöityjä Retrieval Augmented Generation (RAG) -sovelluksia AWS:n ja kolmannen osapuolen vektorisäilöjen päälle käyttämällä sekä AWS- että kolmannen osapuolen malleja. Knowledge Bases for Amazon Bedrock automatisoi tietojesi synkronoinnin vektorivarastosi kanssa, mukaan lukien tietojen erottamisen, kun ne päivitetään, asiakirjan lataamisen ja lohkomisen sekä semanttisen upottamisen. Sen avulla voit räätälöidä saumattomasti RAG-kehotteitasi ja hakustrategioitasi – tarjoamme lähdemäärityksen ja hoidamme muistinhallinnan automaattisesti. Knowledge Bases on täysin palvelimeton, joten sinun ei tarvitse hallita mitään infrastruktuuria, ja Knowledge Base -tietokantoja käytettäessä sinua veloitetaan vain käyttämistäsi malleista, vektoritietokannoista ja tallennustilasta.

RAG on suosittu tekniikka, joka yhdistää yksityisen tiedon käytön suuriin kielimalleihin (LLM). RAG aloittaa ensimmäisellä vaiheella asiaankuuluvien asiakirjojen hakemiseksi tietovarastosta (yleisimmin vektoriindeksistä) käyttäjän kyselyn perusteella. Sitten se käyttää kielimallia vastauksen luomiseen ottamalla huomioon sekä haetut asiakirjat että alkuperäisen kyselyn.

Tässä viestissä osoitamme, kuinka luodaan RAG-työnkulku käyttämällä Knowledge Bases for Amazon Bedrock -sovellusta lääkekeksintöjen käyttötapauksessa.

Yleiskatsaus Amazon Bedrockin tietokantoihin

Knowledge Bases for Amazon Bedrock tukee laajaa valikoimaa yleisiä tiedostotyyppejä, mukaan lukien .txt, .docx, .pdf, .csv ja paljon muuta. Tehokkaan haun mahdollistamiseksi yksityisistä tiedoista yleinen käytäntö on jakaa nämä asiakirjat ensin hallittaviin osiin. Knowledge Bases on ottanut käyttöön oletusarvoisen lohkomisstrategian, joka toimii hyvin useimmissa tapauksissa, jotta pääset alkuun nopeammin. Jos haluat enemmän hallintaa, Knowledge Basesin avulla voit hallita lohkomisstrategiaa ennalta määritettyjen asetusten avulla. Voit hallita tunnisteen enimmäiskokoa ja osien päälle luotavien päällekkäisyyksien määrää, jotta upotukselle saadaan yhtenäinen konteksti. Knowledge Bases for Amazon Bedrock hallitsee tietojen synkronointiprosessia Amazonin yksinkertainen tallennuspalvelu (Amazon S3) -ämpäri, jakaa sen pienemmiksi paloiksi, luo vektori upotuksia ja tallentaa upotukset vektoriindeksiin. Tämä prosessi sisältää älykkään erotuksen, suorituskyvyn ja vikojen hallinnan.

Suorituksen aikana upotusmallia käytetään muuntamaan käyttäjän kysely vektoriksi. Tämän jälkeen vektoriindeksiä kysytään, jotta löydettäisiin käyttäjän kyselyn kaltaisia ​​asiakirjoja vertaamalla dokumenttivektoreita käyttäjän kyselyvektoriin. Viimeisessä vaiheessa vektoriindeksistä haetut semanttisesti samanlaiset asiakirjat lisätään kontekstiksi alkuperäiselle käyttäjäkyselylle. Kun käyttäjälle luodaan vastaus, semanttisesti samankaltaiset asiakirjat kysytään tekstimallissa sekä lähdemerkintä jäljitettävyyttä varten.

Knowledge Bases for Amazon Bedrock tukee useita vektoritietokantoja, mukaan lukien Amazon OpenSearch palvelimeton, Amazon Aurora, Pinecone ja Redis Enterprise Cloud. Retrieve- ja RetrieveAndGenerate-sovellusliittymien avulla sovelluksesi voivat tehdä kyselyitä indeksistä suoraan käyttämällä yhtenäistä ja standardisyntaksia ilman, että sinun tarvitsee opetella erillisiä API-liittymiä jokaiselle eri vektoritietokannalle, mikä vähentää tarvetta kirjoittaa mukautettuja indeksikyselyitä vektorivarastoasi vastaan. Retrieve API ottaa saapuvan kyselyn, muuntaa sen upotusvektoriksi ja tekee kyselyjä taustasäilöstä käyttämällä vektoritietokantatasolla määritettyjä algoritmeja. RetrieveAndGenerate API käyttää Amazon Bedrockin tarjoamaa käyttäjän määrittämää LLM:ää ja luo lopullisen vastauksen luonnollisella kielellä. Alkuperäinen jäljitettävyystuki ilmoittaa pyynnön esittäneelle sovellukselle lähteistä, joita on käytetty kysymykseen vastaamiseen. Yritystoteutuksissa Knowledge Bases tukee AWS-avainhallintapalvelu (AWS KMS) -salaus, AWS CloudTrail integraatio ja paljon muuta.

Seuraavissa osissa osoitamme, kuinka luodaan RAG-työnkulku käyttämällä Knowledge Bases for Amazon Bedrockia, jota tukee OpenSearch Serverless -vektorimoottori, analysoimaan strukturoimatonta kliinisen kokeen tietojoukkoa lääkekeksintöä varten. Nämä tiedot ovat runsaasti tietoa, mutta voivat olla hyvin heterogeenisia. Erikoisterminologian ja eri muodoissa olevien käsitteiden asianmukainen käsittely on välttämätöntä oivallusten havaitsemiseksi ja analyyttisen eheyden varmistamiseksi. Amazon Bedrockin Knowledge Bases -tietokannan avulla voit saada yksityiskohtaisia ​​tietoja yksinkertaisten, luonnollisten kyselyjen avulla.

Rakenna tietokanta Amazon Bedrockille

Tässä osiossa esittelemme Amazon Bedrockin tietokannan luomisprosessia konsolin kautta. Suorita seuraavat vaiheet:

  1. Amazon Bedrock -konsolissa, alla orkestrointi valitse siirtymisruudussa Tietoa.
  2. Valita Luo tietopohja.

Käytä RAG:ta lääkkeiden löytämiseen Amazon Bedrockin tietokannan avulla | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.

  1. In Tietokannan tiedot -osiossa, anna nimi ja valinnainen kuvaus.
  2. In IAM-oikeudet , valitse Luo uusi palvelurooli ja käytä sitä.
  3. varten Palvelun nimen rooli, anna roolillesi nimi, jonka täytyy alkaa AmazonBedrockExecutionRoleForKnowledgeBase_.
  4. Valita seuraava.

Käytä RAG:ta lääkkeiden löytämiseen Amazon Bedrockin tietokannan avulla | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.

  1. In Tietolähde kirjoita tietolähteesi nimi ja S3-URI, jossa tietojoukko sijaitsee. Knowledge Bases tukee seuraavia tiedostomuotoja:
    • Pelkkä teksti (.txt)
    • Markdown (.md)
    • Hypertext Markup Language (.html)
    • Microsoft Word -asiakirja (.doc/.docx)
    • Pilkuilla erotetut arvot (.csv)
    • Microsoft Excel -laskentataulukko (.xls/.xlsx)
    • Portable Document Format (.pdf)
  1. Alle Lisäasetukset¸ valitse haluamasi paloittelustrategia (valitsemme tätä viestiä varten Kiinteän kokoinen paloittelu) ja määritä palan koko ja peittokuva prosentteina. Vaihtoehtoisesti voit käyttää oletusasetuksia.
  2. Valita seuraava.

Käytä RAG:ta lääkkeiden löytämiseen Amazon Bedrockin tietokannan avulla | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.

  1. In Upotusmalli -osiossa valitse Titan Embeddings -malli Amazon Bedrockista.
  2. In Vektoritietokanta , valitse Luo nopeasti uusi vektorikauppa, joka hallitsee vektorivaraston perustamisprosessia.
  3. Valita seuraava.

Käytä RAG:ta lääkkeiden löytämiseen Amazon Bedrockin tietokannan avulla | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.

  1. Tarkista asetukset ja valitse Luo tietopohja.

Käytä RAG:ta lääkkeiden löytämiseen Amazon Bedrockin tietokannan avulla | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.

  1. Odota, että tietokannan luominen on valmis ja vahvista sen tila Valmis.
  2. In Tietolähde -osiosta tai sivun yläreunassa olevasta bannerista tai testiikkunan ponnahdusikkunasta, valitse Synkronoi käynnistää tietojen lataamisen S3-säilöstä, jakamalla sen määrittämäsi kokoisiksi paloiksi, luomalla vektoriupotuksia valitulla tekstin upotusmallilla ja tallentamalla ne vektorisäilöön, jota hallitsee Knowledge Bases for Amazon Bedrock.

Käytä RAG:ta lääkkeiden löytämiseen Amazon Bedrockin tietokannan avulla | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.

Synkronointitoiminto tukee asiakirjojen käsittelyä, päivittämistä ja poistamista vektorihakemistosta Amazon S3:n asiakirjoihin tehtyjen muutosten perusteella. Voit myös käyttää StartIngestionJob API käynnistää synkronoinnin AWS SDK:n kautta.

Kun synkronointi on valmis, synkronointihistoria näyttää tilan Päätökseen.

Käytä RAG:ta lääkkeiden löytämiseen Amazon Bedrockin tietokannan avulla | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.

Kysele tietokannasta

Tässä osiossa osoitamme, kuinka pääset käsiksi tietokannan yksityiskohtaisiin tietoihin yksinkertaisten ja luonnollisten kyselyjen avulla. Käytämme strukturoimatonta synteettistä aineistoa, joka koostuu PDF-tiedostoista, joiden sivunumerot ovat 10–100 sivua ja jotka simuloivat ehdotetun uuden lääkkeen kliinistä tutkimussuunnitelmaa, joka sisältää tilastolliset analyysimenetelmät ja osallistujan suostumuslomakkeet. Käytämme Amazon Bedrockin tietokantoja retrieve_and_generate ja retrieve Sovellusliittymät Amazon Bedrock LangChain -integraatio.

Ennen kuin voit kirjoittaa skriptejä, jotka käyttävät Amazon Bedrock API:ta, sinun on asennettava AWS SDK:n asianmukainen versio ympäristöösi. Python-skripteille tämä on AWS SDK Pythonille (Boto3):

pip install langchain
pip install boto3

Lisäksi ota käyttöön Amazon Titan Embeddings -malli ja Anthropic Claude v2 tai v1. Lisätietoja on kohdassa Mallin käyttöoikeus.

Luo kysymyksiä Amazon Bedrockin avulla

Voimme käyttää Anthropic Claude 2.1 for Amazon Bedrockia ehdottaaksemme luettelon kysymyksistä kliinisen tutkimuksen tietojoukossa:

import boto3
from langchain.llms.bedrock import Bedrock

bedrock_client = boto3.client("bedrock-runtime")

# Start with the query
prompt = "For medical research trial consent forms to sign, what are the top 5 questions can be asked?"

claude_llm = Bedrock(
    model_id="anthropic.claude-v2:1",
    model_kwargs={"temperature": 0, "top_k": 10, "max_tokens_to_sample": 3000},
    client=bedrock_client,
)

# Provide the prompt to the LLM to generate an answer to the query without any additional context provided
response = claude_llm(prompt)
questions = [
    item.split(".")[1].strip() for item in response.strip().split("nn")[1:-1]
]
questions
>>> answer:
'What is the purpose of the study? Make sure you understand the goals of the research and what the study procedures will entail',
'What are the risks and potential benefits? The form should explain all foreseeable risks, side effects, or discomforts you might experience from participating',
'What will participation involve? Get details on what tests, medications, lifestyle changes, or procedures you will go through, how much time it will take, and how long the study will last',
'Are there any costs or payments? Ask if you will be responsible for any costs related to the study or get paid for participating',
'How will my privacy be protected? The form should explain how your personal health information will be kept confidential before, during, and after the trial'

Käytä Amazon Bedrock RetrieveAndGenerate -sovellusliittymää

Täysin hallitun RAG-kokemuksen saamiseksi voit käyttää Amazon Bedrockin alkuperäisiä Knowledge Bases -tietokantoja RetrieveAndGenerate API saadaksesi vastaukset suoraan:

bedrock_agent_client = boto3.client("bedrock-agent-runtime")

kb_id = "<YOUR_KNOWLEDGE_BASE_ID>"

def retrieveAndGenerate(
    input: str,
    kbId: str,
    region: str = "us-east-1",
    sessionId: str = None,
    model_id: str = "anthropic.claude-v2:1",
):
    model_arn = f"arn:aws:bedrock:{region}::foundation-model/{model_id}"

    if sessionId:
        return bedrock_agent_client.retrieve_and_generate(
            input={"text": input},
            retrieveAndGenerateConfiguration={
                "type": "KNOWLEDGE_BASE",
                "knowledgeBaseConfiguration": {
                    "knowledgeBaseId": kbId,
                    "modelArn": model_arn,
                },
            },
            sessionId=sessionId,
        )

    else:
        return bedrock_agent_client.retrieve_and_generate(
            input={"text": input},
            retrieveAndGenerateConfiguration={
                "type": "KNOWLEDGE_BASE",
                "knowledgeBaseConfiguration": {
                    "knowledgeBaseId": kbId,
                    "modelArn": model_arn,
                },
            },
        )

response = retrieveAndGenerate(
    "What are the potential risks and benefits of participating?", kb_id
)

generated_text = response["output"]["text"]
>>> "The potential risks include side effects from the study medication lithium such as nausea, loose stools, thirst, urination changes, shakiness, headaches, sweating, fatigue, decreased concentration, and skin rash. There is also a risk of lithium interaction with other medications. For women, there is a risk of birth defects if lithium is taken during pregnancy. There are no guaranteed benefits, but possible benefits include new information that could help the participant from the interviews and tests conducted during the study."

Mainittu tietolähde voidaan saada seuraavan koodin avulla (jotakin tulosteesta on muokattu lyhyyden vuoksi):

response["citations"]

>>> [
    {
        "generatedResponsePart": {
            "textResponsePart": {
                "text": " The potential risks include side effects from the study...",
                "span": {"start": 0, "end": 361},
            }
        },
        "retrievedReferences": [
            {
                "content": {
                    "text": "590 ICF#2 Page 7 of 19 The primary risks and discomforts of participation…"
                },
                "location": {"type": "S3", "s3Location": {"uri": "s3://XXXX/XXXX.pdf"}},
            },
            {
                "content": {
                    "text": "N/A CSP 590 ICF#2 Page 10 of 19 Risks associated with suddenly stopping study medications..."
                },
                "location": {"type": "S3", "s3Location": {"uri": "s3://XXXX/XXXX.pdf"}},
            },
        ],
    },
    {
        "generatedResponsePart": {
            "textResponsePart": {
                "text": " There are no guaranteed benefits, but possible benefits include...",
                "span": {"start": 363, "end": 531},
            }
        },
        "retrievedReferences": [
            {
                "content": {
                    "text": "research, not usual clinical care. After these are done we ask..."
                },
                "location": {"type": "S3", "s3Location": {"uri": "s3://XXXX/XXXX.pdf"}},
            }
        ],
    },
]

Välittämällä istuntotunnuksen RetrieveAndGenerate API, voit säilyttää keskustelukontekstin ja esittää jatkokysymyksiä. Jos esimerkiksi kysyt lisätietoja edellisestä vastauksesta ilman kontekstia, se ei ehkä pysty vastaamaan oikein:

retrieveAndGenerate("elaborate more on the first side effect", kb_id, sessionId=None)["output"]["text"]
>>> "The search results do not provide additional details about the mild nausea side effect that would allow me to elaborate further on it."

Mutta välittämällä istuntotunnuksen, RAG-liukuhihna pystyy tunnistamaan vastaavan kontekstin ja palauttamaan asiaankuuluvat vastaukset:

retrieveAndGenerate("elaborate more on the first side effect", kb_id, sessionId=response["sessionId"])["output"]["text"]
>>> "The search results provide details that nausea from taking lithium is usually mild and goes away after days or weeks for most people. Specifically, up to 75% of people may experience mild nausea when first starting lithium, but this goes away in 90-99% of people who continue taking it."

Seuraava taulukko näyttää haetut vastaukset kaikkiin vastaaviin kysymyksiin.

Kysymys Vastaus
Mikä on tutkimuksen tarkoitus? Varmista, että ymmärrät tutkimuksen tavoitteet ja mitä tutkimusmenettelyt sisältävät. Tutkimuksen tarkoituksena on testata, onko litium tehokas estämään toistuvaa itsemurhaväkivaltaa potilailla, joilla on masennus tai kaksisuuntainen mielialahäiriö.
Mitkä ovat riskit ja mahdolliset hyödyt? Lomakkeessa tulee selittää kaikki ennakoitavat riskit, sivuvaikutukset tai epämukavuudet, joita saatat kokea osallistumisesta. Mahdollisia riskejä tai epämukavuutta ovat: epämukavuutta aiheuttavat haastattelukysymykset, litiumlääkityksen sivuvaikutukset, kuten pahoinvointi, löysät ulosteet, jano, virtsaamisen muutokset, vapina, päänsärky, hikoilu, väsymys, keskittymiskyvyn heikkeneminen, ihottuma, kilpirauhasen muutokset, aknen paheneminen /psoriaasi, litiumtoksisuus ja riskit, jos lääkitys lopetetaan äkillisesti. Mahdollisia hyötyjä ovat, että testit voivat johtaa uuteen tietoon osallistujan avuksi, ja litium voi auttaa estämään toistuvan itsetuhoisen itseohjautuvan väkivallan masennuksesta tai kaksisuuntaisesta mielialahäiriöstä kärsiville.
Mitä osallistuminen sisältää? Saat lisätietoja siitä, mitä testejä, lääkkeitä, elämäntapamuutoksia tai toimenpiteitä käyt läpi, kuinka paljon aikaa se kestää ja kuinka kauan tutkimus kestää. Osallistuminen edellyttää haastattelun ja kyselylomakkeiden täyttämistä, jotka kattavat ajattelun, käyttäytymisen, mielenterveyshoidon, lääkkeiden, alkoholin ja huumeiden käytön, kodin ja sosiaalisen tuen sekä tutkimuksen ymmärtämisen. Tämä kestää noin kaksi tuntia ja voidaan tehdä useissa istunnoissa, henkilökohtaisesti ja puhelimitse. Mikäli koko tutkimukseen kelpaa, opintovierailuja on noin 20 vuoden aikana. Tämä edellyttää tutkimuslääkityksen ottamista, elintoimintojen tarkistamista, kyselylomakkeiden täyttämistä, sivuvaikutusten tarkastelua sekä normaalin lääketieteellisen ja mielenterveyshoidon jatkamista.
Onko kustannuksia tai maksuja? Kysy, oletko vastuussa tutkimukseen liittyvistä kuluista tai saatko osallistumisestasi palkkaa. Kyllä, hakutuloksissa käsitellään kuluja ja maksuja. Sinua ei veloiteta mistään tutkimukseen kuuluvista hoidoista tai toimenpiteistä. Sinun on kuitenkin silti maksettava tavanomaiset VA-osuudet hoidosta ja tutkimukseen liittymättömistä lääkkeistä. Osallistumisesta ei makseta, mutta tutkimus korvaa osallistumiseen liittyvät kulut, kuten kuljetukset, pysäköinti jne. Korvaussummat ja -prosessi ilmoitetaan.
Miten yksityisyyttäni suojataan? Lomakkeessa tulee selittää, kuinka henkilökohtaiset terveystietosi pidetään luottamuksellisina ennen koetta, sen aikana ja sen jälkeen. Yksityisyytesi suojataan suorittamalla haastatteluja yksityisesti, tekemällä kirjallisia muistiinpanoja lukituissa tiedostoissa ja toimistoissa, tallentamalla sähköisiä tietoja salattuihin ja salasanalla suojattuihin tiedostoihin ja hankkimalla luottamuksellisuustodistus terveys- ja henkilöstöhallinnon osastolta, jotta estetään sinut tunnistavien tietojen paljastaminen. . Tietoja, jotka tunnistavat sinut, voidaan jakaa hoidostasi vastaavien lääkäreiden kanssa tai valtion virastojen auditoinneista ja arvioinneista, mutta tutkimukseen liittyvät keskustelut ja paperit eivät tunnista sinua.

Tee kysely käyttämällä Amazon Bedrock Retrieve -sovellusliittymää

Voit mukauttaa RAG-työnkulkuasi käyttämällä Retrieve API -sovellusliittymää hakemaan tarvittavat palat kyselysi perusteella ja välittämään sen mille tahansa Amazon Bedrockin tarjoamalle LLM:lle. Voit käyttää Retrieve API:ta määrittämällä se seuraavasti:

def retrieve(query: str, kbId: str, numberOfResults: int = 5):
    return bedrock_agent_client.retrieve(
        retrievalQuery={"text": query},
        knowledgeBaseId=kbId,
        retrievalConfiguration={
            "vectorSearchConfiguration": {"numberOfResults": numberOfResults}
        },
    )

Hae vastaava konteksti (joita on muokattu lyhyyden vuoksi):

query = "What is the purpose of the medical research study?"
response = retrieve(query, kb_id, 3)
retrievalResults = response["retrievalResults"]
>>> [
    {
        "content": {"text": "You will not be charged for any procedures that..."},
        "location": {"type": "S3", "s3Location": {"uri": "s3://XXXXX/XXXX.pdf"}},
        "score": 0.6552521,
    },
    {
        "content": {"text": "and possible benefits of the study. You have been..."},
        "location": {"type": "S3", "s3Location": {"uri": "s3://XXXX/XXXX.pdf"}},
        "score": 0.6581577,
    },
    ...,
]

Pura kehotemallin konteksti:

def get_contexts(retrievalResults):
    contexts = []
    for retrievedResult in retrievalResults:
        contexts.append(retrievedResult["content"]["text"])
    return " ".join(contexts)

contexts = get_contexts(retrievalResults)

Tuo Python-moduulit ja määritä kontekstin sisäisen kysymyksen vastauskehotemalli ja luo sitten lopullinen vastaus:

from langchain.prompts import PromptTemplate

PROMPT_TEMPLATE = """
Human: You are an AI system working on medical trial research, and provides answers to questions 
by using fact based and statistical information when possible.
Use the following pieces of information to provide a concise answer to the question enclosed in <question> tags.
If you don't know the answer, just say that you don't know, don't try to make up an answer.

<context>
{context_str}
</context>

<question>
{query_str}
</question>

The response should be specific and use statistics or numbers when possible.

Assistant:"""

claude_prompt = PromptTemplate(
    template=PROMPT_TEMPLATE, input_variables=["context_str", "query_str"]
)

prompt = claude_prompt.format(context_str=contexts, query_str=query)
response = claude_llm(prompt)
>>> "Based on the context provided, the purpose of this medical research study is to evaluate the efficacy of lithium compared to a placebo in preventing suicide over a 1 year period. Specifically, participants will be randomly assigned to receive either lithium or a placebo pill for 1 year, with their doctors and the participants themselves not knowing which treatment they receive (double-blind). Blood lithium levels will be monitored and doses adjusted over the first 6-8 visits, then participants will be followed monthly for 1 year to assess outcomes."

Kysely käyttämällä Amazon Bedrock LangChain -integraatiota

Jotta voit luoda päästä päähän mukautetun Q&A-sovelluksen, Knowledge Bases for Amazon Bedrock tarjoaa integroinnin LangChainin kanssa. Jos haluat määrittää LangChain-noutajan, anna tietokannan tunnus ja määritä kyselystä palautettavien tulosten määrä:

from langchain.retrievers.bedrock import AmazonKnowledgeBasesRetriever

retriever = AmazonKnowledgeBasesRetriever(
    knowledge_base_id=kb_id,
    retrieval_config={"vectorSearchConfiguration": {"numberOfResults": 4}},
)

Määritä nyt LangChain RetrievalQA ja luo vastauksia tietokannasta:

from langchain.chains import RetrievalQA

qa = RetrievalQA.from_chain_type(
    llm=claude_llm,
    chain_type="stuff",
    retriever=retriever,
    return_source_documents=True,
    chain_type_kwargs={"prompt": claude_prompt},
)

[qa(q)["result"] for q in questions]

Tämä luo vastaavat vastaukset, jotka ovat samankaltaisia ​​kuin edellisessä taulukossa luetellut.

Puhdistaa

Muista poistaa seuraavat resurssit välttääksesi lisäkuluja:

Yhteenveto

Amazon Bedrock tarjoaa laajan joukon syvästi integroituja palveluita kaiken mittakaavan RAG-sovelluksiin, mikä tekee yrityksesi tietojen analysoinnin aloittamisesta helppoa. Knowledge Bases for Amazon Bedrock integroituu Amazon Bedrock -perustusmallien kanssa rakentaakseen skaalautuvia dokumenttien upotusputkia ja asiakirjanhakupalveluita useiden sisäisten ja asiakaskohtaisten sovellusten tehostamiseksi. Olemme innoissamme tulevasta, ja palautteesi on tärkeä rooli tämän tuotteen kehityksen ohjaamisessa. Lisätietoja Amazon Bedrockin ominaisuuksista ja tietokannoista on osoitteessa Amazon Bedrockin tietokanta.


Tietoja Tekijät

Käytä RAG:ta lääkkeiden löytämiseen Amazon Bedrockin tietokannan avulla | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.Mark Roy on AWS:n koneoppimisarkkitehti, joka auttaa asiakkaita suunnittelemaan ja rakentamaan AI/ML-ratkaisuja. Markin työ kattaa laajan valikoiman ML-käyttötapauksia, ja hänen ensisijaisena kiinnostuksena ovat tietokonenäkö, syväoppiminen ja ML:n skaalaaminen koko yrityksessä. Hän on auttanut yrityksiä monilla toimialoilla, mukaan lukien vakuutus-, rahoitus-, media- ja viihde-, terveydenhuolto, yleishyödylliset palvelut ja valmistus. Markilla on kuusi AWS-sertifikaattia, mukaan lukien ML Specialty Certification. Ennen AWS:lle tuloaan Mark oli arkkitehti, kehittäjä ja teknologiajohtaja yli 25 vuoden ajan, joista 19 vuotta rahoituspalveluissa.

Käytä RAG:ta lääkkeiden löytämiseen Amazon Bedrockin tietokannan avulla | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.Mani Khanuja on tekninen johtaja – Generative AI Specialists, kirjoittanut kirjan – Applied Machine Learning and High Performance Computing on AWS, ja hallituksen jäsen, Women in Manufacturing Education Foundation hallituksen. Hän johtaa koneoppimisprojekteja eri aloilla, kuten tietokonenäön, luonnollisen kielen käsittelyn ja generatiivisen tekoälyn aloilla. Hän auttaa asiakkaita rakentamaan, kouluttamaan ja ottamaan käyttöön suuria koneoppimismalleja mittakaavassa. Hän puhuu sisäisissä ja ulkoisissa konferensseissa, kuten Re:Invent, Women in Manufacturing West, YouTube webinaareissa ja GHC 23:ssa. Vapaa-ajallaan hän tykkää käydä pitkillä lenkillä rannalla.

Käytä RAG:ta lääkkeiden löytämiseen Amazon Bedrockin tietokannan avulla | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.Tohtori Baichuan Sun, joka toimii tällä hetkellä Sr. AI/ML Solution Architectina AWS:ssä, keskittyy generatiiviseen tekoälyyn ja soveltaa tietojaan datatieteessä ja koneoppimisessa tarjotakseen käytännöllisiä, pilvipohjaisia ​​liiketoimintaratkaisuja. Hänellä on kokemusta liikkeenjohdon konsultoinnista ja tekoälyratkaisujen arkkitehtuurista, ja hän vastaa moniin monimutkaisiin haasteisiin, kuten robotiikan tietokonenäön, aikasarjojen ennustamiseen ja ennakoivaan ylläpitoon. Hänen työnsä pohjautuu vankkaan projektinhallinnan, ohjelmistotuotannon ja -kehityksen sekä akateemisen taustaan. Työn ulkopuolella tohtori Sun nauttii tasapainosta matkustaessaan ja viettäen aikaa perheen ja ystävien kanssa.

Käytä RAG:ta lääkkeiden löytämiseen Amazon Bedrockin tietokannan avulla | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.Derrick Choo on AWS:n vanhempi ratkaisuarkkitehti, joka keskittyy nopeuttamaan asiakkaiden matkaa pilveen ja muuttamaan liiketoimintaansa ottamalla käyttöön pilvipohjaisia ​​ratkaisuja. Hänen asiantuntemuksensa on täyden pinon sovellusten ja koneoppimisen kehittäminen. Hän auttaa asiakkaita suunnittelemaan ja rakentamaan kokonaisvaltaisia ​​ratkaisuja, jotka kattavat käyttöliittymät, IoT-sovellukset, API- ja dataintegraatiot sekä koneoppimismallit. Vapaa-ajallaan hän viettää aikaa perheensä kanssa ja kokeilee valokuvausta ja videokuvaa.

Käytä RAG:ta lääkkeiden löytämiseen Amazon Bedrockin tietokannan avulla | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.Frank Winkler on Singaporessa sijaitsevan AWS:n vanhempi ratkaisuarkkitehti ja generatiivisen tekoälyn asiantuntija, joka keskittyy koneoppimiseen ja generatiiviseen tekoälyyn. Hän työskentelee maailmanlaajuisten digitaalisten alkuperäisyritysten kanssa suunnitellakseen skaalautuvia, turvallisia ja kustannustehokkaita tuotteita ja palveluita AWS:lle. Vapaa-ajallaan hän viettää aikaa poikansa ja tyttärensä kanssa ja matkustaa nauttimaan ASEANin aalloista.

Käytä RAG:ta lääkkeiden löytämiseen Amazon Bedrockin tietokannan avulla | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.Nihir Chadderwala on vanhempi AI/ML Solutions -arkkitehti Global Healthcare and Life Sciences -tiimissä. Hänen asiantuntemuksensa on Big Data- ja tekoälypohjaisten ratkaisujen rakentaminen asiakkaiden ongelmiin erityisesti biolääketieteen, biotieteiden ja terveydenhuollon alalla. Hän on myös innoissaan kvanttitietotieteen ja tekoälyn risteyksestä ja nauttii oppimisesta ja osallistumisesta tähän tilaan. Vapaa-ajallaan hän pelaa tennistä, matkustaa ja opiskelee kosmologiaa.

Aikaleima:

Lisää aiheesta AWS-koneoppiminen