Használja a RAG-ot gyógyszerkutatáshoz az Amazon Bedrock | tudásbázisaival Amazon webszolgáltatások

Használja a RAG-ot gyógyszerkutatáshoz az Amazon Bedrock | tudásbázisaival Amazon webszolgáltatások

Amazon alapkőzet az Amazon és külső szolgáltatók modelljeinek széles skáláját kínálja, beleértve az Anthropic, AI21, Meta, Cohere és a Stabilitási AI-t, és a felhasználási esetek széles skáláját fedi le, beleértve a szöveg- és képgenerálást, a beágyazást, a csevegést és a magas szintű ügynököket. érveléssel és hangszereléssel, és így tovább. Tudásbázisok az Amazon Bedrock számára lehetővé teszi, hogy hatékony és testreszabott Retrieval Augmented Generation (RAG) alkalmazásokat építsen az AWS és harmadik féltől származó vektortárak tetejére, mind AWS, mind harmadik féltől származó modellek használatával. Az Amazon Bedrock tudásbázisai automatizálják az adatok szinkronizálását a vektortárral, beleértve az adatok differenciálását frissítéskor, a dokumentumok betöltését és darabolását, valamint a szemantikai beágyazást. Lehetővé teszi a RAG promptok és visszakeresési stratégiák zökkenőmentes testreszabását – mi biztosítjuk a forrás-hozzárendelést, és automatikusan kezeljük a memóriakezelést. A Tudásbázisok teljesen kiszolgáló nélküliek, így nem kell semmilyen infrastruktúrát felügyelnie, a Tudásbázisok használatakor pedig csak a használt modellekért, vektoradatbázisokért és tárhelyért kell fizetnie.

A RAG egy népszerű technika, amely egyesíti a személyes adatok használatát nagy nyelvi modellekkel (LLM). A RAG egy kezdeti lépéssel kezdődik, hogy a felhasználó lekérdezése alapján lekérje a releváns dokumentumokat egy adattárból (leggyakrabban vektorindex). Ezután egy nyelvi modellt használ a válasz generálásához, figyelembe véve mind a letöltött dokumentumokat, mind az eredeti lekérdezést.

Ebben a bejegyzésben bemutatjuk, hogyan lehet RAG-munkafolyamatot felépíteni az Amazon Bedrock tudásbázisaival egy gyógyszerfelfedezési esethez.

Az Amazon Bedrock tudásbázisainak áttekintése

A Knowledge Bases for Amazon Bedrock a gyakori fájltípusok széles skáláját támogatja, beleértve a .txt, .docx, .pdf, .csv és egyebeket. A személyes adatokból való hatékony visszakeresés érdekében általános gyakorlat, hogy ezeket a dokumentumokat először kezelhető darabokra osztják. A Knowledge Bases egy alapértelmezett csonkolási stratégiát vezetett be, amely a legtöbb esetben jól működik, és lehetővé teszi a gyorsabb kezdést. Ha nagyobb szabályozást szeretne, a Tudásbázisok segítségével előre konfigurált beállításokkal szabályozhatja a darabolási stratégiát. Szabályozhatja a token maximális méretét és a darabok között létrehozandó átfedés mértékét, hogy koherens kontextust biztosítson a beágyazásnak. Az Amazon Bedrock tudásbázisa kezeli az Ön adatainak szinkronizálásának folyamatát Amazon egyszerű tárolási szolgáltatás (Amazon S3) vödörben, kisebb darabokra bontja, vektoros beágyazásokat generál, és a beágyazásokat vektorindexben tárolja. Ez a folyamat intelligens differenciálással, áteresztőképességgel és hibakezeléssel jár.

Futás közben egy beágyazási modellt használnak a felhasználó lekérdezésének vektorrá alakítására. Ezután lekérdezi a vektorindexet, hogy a felhasználó lekérdezéséhez hasonló dokumentumokat keressen, összehasonlítva a dokumentumvektorokat a felhasználói lekérdezési vektorral. Az utolsó lépésben a vektorindexből lekért, szemantikailag hasonló dokumentumokat adják hozzá az eredeti felhasználói lekérdezés kontextusaként. Amikor választ generál a felhasználó számára, a szemantikailag hasonló dokumentumokat a szöveges modellben kérik, a nyomon követhetőség érdekében forrás-hozzárendeléssel együtt.

Az Amazon Bedrock tudásbázisai több vektoros adatbázist támogatnak, beleértve Amazon OpenSearch kiszolgáló nélküli, Amazon Aurora, Pinecone és Redis Enterprise Cloud. A Retrieve és RetrieveAndGenerate API lehetővé teszi az alkalmazások számára, hogy egységes és szabványos szintaxis használatával közvetlenül lekérdezzék az indexet anélkül, hogy minden egyes vektoradatbázishoz külön API-t kellene megtanulniuk, így csökkentve kell az egyéni indexlekérdezéseket a vektortárhoz. A Retrieve API fogadja a bejövő lekérdezést, beágyazási vektorgá alakítja, és lekérdezi a háttértárat a vektoradatbázis szintjén konfigurált algoritmusok segítségével; a RetrieveAndGenerate API az Amazon Bedrock által biztosított, felhasználó által konfigurált LLM-et használ, és természetes nyelven generálja a végső választ. A natív nyomonkövetési támogatás tájékoztatja a kérelmező alkalmazást a kérdés megválaszolásához használt forrásokról. A vállalati megvalósításokhoz a tudásbázisok támogatják AWS kulcskezelési szolgáltatás (AWS KMS) titkosítás, AWS CloudTrail integráció, és így tovább.

A következő szakaszokban bemutatjuk, hogyan lehet RAG-munkafolyamatot felépíteni az OpenSearch Serverless vektormotor által támogatott Amazon Bedrock tudásbázisok segítségével, hogy elemezhessünk egy strukturálatlan klinikai vizsgálati adatkészletet egy gyógyszerfelfedezési felhasználási esethez. Ezek az adatok információban gazdagok, de rendkívül heterogének lehetnek. A speciális terminológia és a különböző formátumú fogalmak megfelelő kezelése elengedhetetlen a betekintések észleléséhez és az elemzési integritás biztosításához. Az Amazon Bedrock tudásbázisaival egyszerű, természetes lekérdezések segítségével érheti el a részletes információkat.

Építsen tudásbázist az Amazon Bedrock számára

Ebben a részben az Amazon Bedrock tudásbázisának konzolon keresztüli létrehozásának folyamatát mutatjuk be. Hajtsa végre a következő lépéseket:

  1. Az Amazon Bedrock konzolon, alatt hangszerelés a navigációs ablakban válassza a lehetőséget Blog.
  2. A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Tudásbázis létrehozása.

Használja a RAG-ot gyógyszerkutatáshoz az Amazon Bedrock | tudásbázisaival Amazon Web Services PlatoBlockchain Data Intelligence. Függőleges keresés. Ai.

  1. A Tudásbázis részletei szakaszban adja meg a nevet és az opcionális leírást.
  2. A IAM engedélyek válasszon Hozzon létre és használjon új szolgáltatási szerepet.
  3. A Szolgáltatásnév szerepkör, adjon meg egy nevet a szerepének, amelynek a következővel kell kezdődnie AmazonBedrockExecutionRoleForKnowledgeBase_.
  4. A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Következő.

Használja a RAG-ot gyógyszerkutatáshoz az Amazon Bedrock | tudásbázisaival Amazon Web Services PlatoBlockchain Data Intelligence. Függőleges keresés. Ai.

  1. A Adatforrás szakaszban adja meg az adatforrás nevét és az S3 URI-t, ahol az adatkészlet található. A Tudásbázisok a következő fájlformátumokat támogatják:
    • Egyszerű szöveg (.txt)
    • Markdown (.md)
    • Hypertext Markup Language (.html)
    • Microsoft Word dokumentum (.doc/.docx)
    • Vesszővel elválasztott értékek (.csv)
    • Microsoft Excel táblázat (.xls/.xlsx)
    • Hordozható dokumentum formátum (.pdf)
  1. Alatt további beállítások¸ válassza ki a kívánt darabolási stratégiát (ennél a bejegyzésnél mi választjuk Fix méretű darabolás), és adja meg a darabméretet és a fedvényt százalékban. Alternatív megoldásként használhatja az alapértelmezett beállításokat.
  2. A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Következő.

Használja a RAG-ot gyógyszerkutatáshoz az Amazon Bedrock | tudásbázisaival Amazon Web Services PlatoBlockchain Data Intelligence. Függőleges keresés. Ai.

  1. A Beágyazási modell részben válassza ki az Amazon Bedrock Titan Embeddings modelljét.
  2. A Vektoros adatbázis válasszon Hozzon létre gyorsan egy új vektortárat, amely a vektortár létrehozásának folyamatát kezeli.
  3. A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Következő.

Használja a RAG-ot gyógyszerkutatáshoz az Amazon Bedrock | tudásbázisaival Amazon Web Services PlatoBlockchain Data Intelligence. Függőleges keresés. Ai.

  1. Tekintse át a beállításokat, és válasszon Tudásbázis létrehozása.

Használja a RAG-ot gyógyszerkutatáshoz az Amazon Bedrock | tudásbázisaival Amazon Web Services PlatoBlockchain Data Intelligence. Függőleges keresés. Ai.

  1. Várja meg, amíg a tudásbázis létrehozása befejeződik, és erősítse meg az állapotát Kész.
  2. A Adatforrás szakaszban, vagy az oldal tetején lévő szalaghirdetésen vagy a tesztablak felugró ablakában válassza a lehetőséget Szinkronizálás elindítja az adatok betöltését az S3 tárolóból, az Ön által megadott méretű darabokra való felosztását, a vektorbeágyazások generálását a kiválasztott szövegbeágyazási modell segítségével, és az Amazon Bedrock tudásbázisai által kezelt vektortárban való tárolását.

Használja a RAG-ot gyógyszerkutatáshoz az Amazon Bedrock | tudásbázisaival Amazon Web Services PlatoBlockchain Data Intelligence. Függőleges keresés. Ai.

A szinkronizálási funkció támogatja a dokumentumok feldolgozását, frissítését és törlését a vektorindexből az Amazon S3 dokumentumainak változásai alapján. Használhatja a StartIngestionJob API az AWS SDK-n keresztüli szinkronizálás elindításához.

Amikor a szinkronizálás befejeződött, a szinkronizálási előzmények állapotát mutatja Elkészült.

Használja a RAG-ot gyógyszerkutatáshoz az Amazon Bedrock | tudásbázisaival Amazon Web Services PlatoBlockchain Data Intelligence. Függőleges keresés. Ai.

Kérdezze le a tudásbázist

Ebben a részben bemutatjuk, hogyan lehet egyszerű és természetes lekérdezéseken keresztül hozzáférni a tudásbázis részletes információihoz. Strukturálatlan szintetikus adatkészletet használunk, amely PDF-fájlokból áll, mindegyik oldalszáma 10-100 oldal között mozog, szimulálva egy javasolt új gyógyszer klinikai vizsgálati tervét, beleértve a statisztikai elemzési módszereket és a résztvevők hozzájárulási űrlapját. Az Amazon Bedrock tudásbázisait használjuk retrieve_and_generate és a retrieve API-k a Amazon Bedrock LangChain integráció.

Mielőtt az Amazon Bedrock API-t használó szkripteket írhatna, telepítenie kell az AWS SDK megfelelő verzióját a környezetében. Python szkripteknél ez lesz a AWS SDK Pythonhoz (Boto3):

pip install langchain
pip install boto3

Ezenkívül engedélyezze a hozzáférést az Amazon Titan Embeddings modellhez és az Anthropic Claude v2-hez vagy v1-hez. További információkért lásd: Modell hozzáférés.

Generáljon kérdéseket az Amazon Bedrock segítségével

Használhatjuk az Anthropic Claude 2.1 for Amazon Bedrock alkalmazást a klinikai vizsgálati adatkészlettel kapcsolatos kérdések listájára:

import boto3
from langchain.llms.bedrock import Bedrock

bedrock_client = boto3.client("bedrock-runtime")

# Start with the query
prompt = "For medical research trial consent forms to sign, what are the top 5 questions can be asked?"

claude_llm = Bedrock(
    model_id="anthropic.claude-v2:1",
    model_kwargs={"temperature": 0, "top_k": 10, "max_tokens_to_sample": 3000},
    client=bedrock_client,
)

# Provide the prompt to the LLM to generate an answer to the query without any additional context provided
response = claude_llm(prompt)
questions = [
    item.split(".")[1].strip() for item in response.strip().split("nn")[1:-1]
]
questions
>>> answer:
'What is the purpose of the study? Make sure you understand the goals of the research and what the study procedures will entail',
'What are the risks and potential benefits? The form should explain all foreseeable risks, side effects, or discomforts you might experience from participating',
'What will participation involve? Get details on what tests, medications, lifestyle changes, or procedures you will go through, how much time it will take, and how long the study will last',
'Are there any costs or payments? Ask if you will be responsible for any costs related to the study or get paid for participating',
'How will my privacy be protected? The form should explain how your personal health information will be kept confidential before, during, and after the trial'

Használja az Amazon Bedrock RetrieveAndGenerate API-t

A teljesen felügyelt RAG-élmény érdekében használhatja az Amazon Bedrock natív tudásbázisait RetrieveAndGenerate API a válaszok közvetlen megszerzéséhez:

bedrock_agent_client = boto3.client("bedrock-agent-runtime")

kb_id = "<YOUR_KNOWLEDGE_BASE_ID>"

def retrieveAndGenerate(
    input: str,
    kbId: str,
    region: str = "us-east-1",
    sessionId: str = None,
    model_id: str = "anthropic.claude-v2:1",
):
    model_arn = f"arn:aws:bedrock:{region}::foundation-model/{model_id}"

    if sessionId:
        return bedrock_agent_client.retrieve_and_generate(
            input={"text": input},
            retrieveAndGenerateConfiguration={
                "type": "KNOWLEDGE_BASE",
                "knowledgeBaseConfiguration": {
                    "knowledgeBaseId": kbId,
                    "modelArn": model_arn,
                },
            },
            sessionId=sessionId,
        )

    else:
        return bedrock_agent_client.retrieve_and_generate(
            input={"text": input},
            retrieveAndGenerateConfiguration={
                "type": "KNOWLEDGE_BASE",
                "knowledgeBaseConfiguration": {
                    "knowledgeBaseId": kbId,
                    "modelArn": model_arn,
                },
            },
        )

response = retrieveAndGenerate(
    "What are the potential risks and benefits of participating?", kb_id
)

generated_text = response["output"]["text"]
>>> "The potential risks include side effects from the study medication lithium such as nausea, loose stools, thirst, urination changes, shakiness, headaches, sweating, fatigue, decreased concentration, and skin rash. There is also a risk of lithium interaction with other medications. For women, there is a risk of birth defects if lithium is taken during pregnancy. There are no guaranteed benefits, but possible benefits include new information that could help the participant from the interviews and tests conducted during the study."

Az idézett információforrás a következő kóddal érhető el (a kimenet egy részét a rövidség kedvéért redukáltuk):

response["citations"]

>>> [
    {
        "generatedResponsePart": {
            "textResponsePart": {
                "text": " The potential risks include side effects from the study...",
                "span": {"start": 0, "end": 361},
            }
        },
        "retrievedReferences": [
            {
                "content": {
                    "text": "590 ICF#2 Page 7 of 19 The primary risks and discomforts of participation…"
                },
                "location": {"type": "S3", "s3Location": {"uri": "s3://XXXX/XXXX.pdf"}},
            },
            {
                "content": {
                    "text": "N/A CSP 590 ICF#2 Page 10 of 19 Risks associated with suddenly stopping study medications..."
                },
                "location": {"type": "S3", "s3Location": {"uri": "s3://XXXX/XXXX.pdf"}},
            },
        ],
    },
    {
        "generatedResponsePart": {
            "textResponsePart": {
                "text": " There are no guaranteed benefits, but possible benefits include...",
                "span": {"start": 363, "end": 531},
            }
        },
        "retrievedReferences": [
            {
                "content": {
                    "text": "research, not usual clinical care. After these are done we ask..."
                },
                "location": {"type": "S3", "s3Location": {"uri": "s3://XXXX/XXXX.pdf"}},
            }
        ],
    },
]

A munkamenet azonosítójának átadásával RetrieveAndGenerate API, megőrizheti a beszélgetés kontextusát, és további kérdéseket tehet fel. Például a kontextus nélkül, ha további részleteket kér az előző válaszból, előfordulhat, hogy nem tud helyesen válaszolni:

retrieveAndGenerate("elaborate more on the first side effect", kb_id, sessionId=None)["output"]["text"]
>>> "The search results do not provide additional details about the mild nausea side effect that would allow me to elaborate further on it."

De a munkamenet-azonosító átadásával a RAG-folyamat képes azonosítani a megfelelő kontextust, és visszaadni a releváns válaszokat:

retrieveAndGenerate("elaborate more on the first side effect", kb_id, sessionId=response["sessionId"])["output"]["text"]
>>> "The search results provide details that nausea from taking lithium is usually mild and goes away after days or weeks for most people. Specifically, up to 75% of people may experience mild nausea when first starting lithium, but this goes away in 90-99% of people who continue taking it."

Az alábbi táblázat az összes megfelelő kérdésre lekeresett választ mutatja be.

Kérdés Válasz
Mi a tanulmány célja? Győződjön meg arról, hogy tisztában van a kutatás céljaival és azzal, hogy a vizsgálati eljárások mit tartalmaznak. A vizsgálat célja annak tesztelése, hogy a lítium hatékony-e az ismétlődő öngyilkos öngyilkos erőszak megelőzésében depresszióban vagy bipoláris zavarban szenvedő betegeknél.
Mik a kockázatok és a lehetséges előnyök? Az űrlapnak meg kell magyaráznia minden előrelátható kockázatot, mellékhatást vagy kellemetlenséget, amelyet a részvétel során tapasztalhat. A lehetséges kockázatok vagy kellemetlenségek a következők: a kényelmetlenséget okozó interjúkérdések, a lítium gyógyszer mellékhatásai, például hányinger, laza széklet, szomjúság, vizeletürítési változások, remegés, fejfájás, izzadás, fáradtság, csökkent koncentráció, bőrkiütés, pajzsmirigy-elváltozások, súlyosbodó akne /psoriasis, lítium toxicitás és kockázatok, ha hirtelen leállítják a gyógyszert. A lehetséges előnyök az, hogy a tesztek új információkhoz vezethetnek, amelyek segíthetik a résztvevőt, a lítium pedig segíthet megelőzni az ismételt öngyilkos öngyilkos erőszakot a depresszióban vagy bipoláris zavarban szenvedőknél.
Mit jelent majd a részvétel? Részleteket kaphat arról, hogy milyen teszteken, gyógyszereken, életmódbeli változtatásokon vagy eljárásokon kell keresztülmennie, mennyi időt vesz igénybe, és mennyi ideig tart a vizsgálat. A részvétel magában foglalja egy interjú és kérdőívek kitöltését, amelyek kiterjednek a gondolkodásra, a viselkedésre, a mentális egészségügyi kezelésekre, a gyógyszerekre, az alkohol- és droghasználatra, az otthoni és szociális támogatásokra, valamint a kutatási tanulmány megértésére. Ez körülbelül két órát vesz igénybe, és több alkalommal, személyesen és telefonon is megtehető. Ha jogosult a teljes vizsgálatra, körülbelül 20 tanulmányi látogatásra kerül sor egy év alatt. Ez magában foglalja a vizsgálati gyógyszerek szedését, az életjelek ellenőrzését, a kérdőívek kitöltését, a mellékhatások áttekintését, valamint a normál orvosi és mentális egészségügyi ellátás folytatását.
Vannak-e költségek vagy kifizetések? Kérdezze meg, hogy Önt terheli-e a vizsgálattal kapcsolatos költségek, vagy kap-e pénzt a részvételért. Igen, a keresési eredmények között szerepelnek költségek és kifizetések. Nem kell fizetnie semmilyen kezelésért vagy eljárásért, amely a vizsgálat részét képezi. Mindazonáltal Önnek továbbra is fizetnie kell minden szokásos VA önrészt az ellátásért és a nem a vizsgálathoz kapcsolódó gyógyszerekért. A részvételért nem fizetnek, de a tanulmány megtéríti a részvétellel kapcsolatos költségeket, mint a közlekedés, parkolás stb. A visszatérítés összegét és menetét megadjuk.
Hogyan lesz megvédve a magánéletem? Az űrlapnak el kell magyaráznia, hogy személyes egészségügyi adatait hogyan kezelik bizalmasan a tárgyalás előtt, alatt és után. Személyes adatait védjük privát interjúk lebonyolításával, írásos feljegyzésekkel zárolt fájlokban és irodákban, elektronikus információk titkosított és jelszóval védett fájlokban való tárolásával, valamint az Egészségügyi és Humánszolgáltatási Minisztériumtól kapott titoktartási tanúsítvány beszerzésével, hogy megakadályozzák az Önt azonosító információk nyilvánosságra hozatalát. . Az Ön azonosítására szolgáló információkat megoszthatják az Ön ellátásáért vagy a kormányzati szervek által végzett auditok és értékelésekért felelős orvosokkal, de a vizsgálattal kapcsolatos beszélgetések és dokumentumok nem azonosítják Önt.

Lekérdezés az Amazon Bedrock Retrieve API használatával

A RAG-munkafolyamat testreszabásához a Retrieve API segítségével lekérheti a releváns darabokat a lekérdezés alapján, és átadhatja azt az Amazon Bedrock által biztosított bármely LLM-nek. A Retrieve API használatához a következőképpen határozza meg:

def retrieve(query: str, kbId: str, numberOfResults: int = 5):
    return bedrock_agent_client.retrieve(
        retrievalQuery={"text": query},
        knowledgeBaseId=kbId,
        retrievalConfiguration={
            "vectorSearchConfiguration": {"numberOfResults": numberOfResults}
        },
    )

Keresse meg a megfelelő kontextust (a kimenet egy részét a rövidség kedvéért redukáljuk):

query = "What is the purpose of the medical research study?"
response = retrieve(query, kb_id, 3)
retrievalResults = response["retrievalResults"]
>>> [
    {
        "content": {"text": "You will not be charged for any procedures that..."},
        "location": {"type": "S3", "s3Location": {"uri": "s3://XXXXX/XXXX.pdf"}},
        "score": 0.6552521,
    },
    {
        "content": {"text": "and possible benefits of the study. You have been..."},
        "location": {"type": "S3", "s3Location": {"uri": "s3://XXXX/XXXX.pdf"}},
        "score": 0.6581577,
    },
    ...,
]

Bontsa ki a prompt sablon kontextusát:

def get_contexts(retrievalResults):
    contexts = []
    for retrievedResult in retrievalResults:
        contexts.append(retrievedResult["content"]["text"])
    return " ".join(contexts)

contexts = get_contexts(retrievalResults)

Importálja a Python modulokat, állítsa be a kontextuson belüli kérdésre válaszoló prompt sablont, majd hozza létre a végső választ:

from langchain.prompts import PromptTemplate

PROMPT_TEMPLATE = """
Human: You are an AI system working on medical trial research, and provides answers to questions 
by using fact based and statistical information when possible.
Use the following pieces of information to provide a concise answer to the question enclosed in <question> tags.
If you don't know the answer, just say that you don't know, don't try to make up an answer.

<context>
{context_str}
</context>

<question>
{query_str}
</question>

The response should be specific and use statistics or numbers when possible.

Assistant:"""

claude_prompt = PromptTemplate(
    template=PROMPT_TEMPLATE, input_variables=["context_str", "query_str"]
)

prompt = claude_prompt.format(context_str=contexts, query_str=query)
response = claude_llm(prompt)
>>> "Based on the context provided, the purpose of this medical research study is to evaluate the efficacy of lithium compared to a placebo in preventing suicide over a 1 year period. Specifically, participants will be randomly assigned to receive either lithium or a placebo pill for 1 year, with their doctors and the participants themselves not knowing which treatment they receive (double-blind). Blood lithium levels will be monitored and doses adjusted over the first 6-8 visits, then participants will be followed monthly for 1 year to assess outcomes."

Lekérdezés az Amazon Bedrock LangChain integrációjával

A végpontokig testreszabott Q&A-alkalmazások létrehozásához a Knowledge Bases for Amazon Bedrock integrációt biztosít a LangChain-nel. A LangChain retriever beállításához adja meg a tudásbázis azonosítóját, és adja meg a lekérdezésből visszaadandó eredmények számát:

from langchain.retrievers.bedrock import AmazonKnowledgeBasesRetriever

retriever = AmazonKnowledgeBasesRetriever(
    knowledge_base_id=kb_id,
    retrieval_config={"vectorSearchConfiguration": {"numberOfResults": 4}},
)

Most állítsa be a LangChain RetrievalQA-t, és állítson elő válaszokat a tudásbázisból:

from langchain.chains import RetrievalQA

qa = RetrievalQA.from_chain_type(
    llm=claude_llm,
    chain_type="stuff",
    retriever=retriever,
    return_source_documents=True,
    chain_type_kwargs={"prompt": claude_prompt},
)

[qa(q)["result"] for q in questions]

Ez az előző táblázatban felsoroltakhoz hasonló megfelelő válaszokat generál.

Tisztítsuk meg

A további költségek elkerülése érdekében feltétlenül törölje a következő forrásokat:

Következtetés

Az Amazon Bedrock mélyen integrált szolgáltatások széles skáláját kínálja minden léptékű RAG-alkalmazások működtetéséhez, így egyszerűvé téve a vállalati adatok elemzésének megkezdését. Az Amazon Bedrock tudásbázisai integrálódnak az Amazon Bedrock alapmodelljeivel, hogy méretezhető dokumentumbeágyazó folyamatokat és dokumentum-visszakereső szolgáltatásokat építsenek ki a belső és ügyfélközpontú alkalmazások széles skálájának ellátásához. Izgatottan várjuk az előttünk álló jövőt, és az Ön visszajelzése létfontosságú szerepet fog játszani a termék fejlődésében. Ha többet szeretne megtudni az Amazon Bedrock képességeiről és a tudásbázisokról, tekintse meg a Az Amazon Bedrock tudásbázisa.


A szerzőkről

Használja a RAG-ot gyógyszerkutatáshoz az Amazon Bedrock | tudásbázisaival Amazon Web Services PlatoBlockchain Data Intelligence. Függőleges keresés. Ai.Mark Roy az AWS fő gépi tanulási építésze, aki segít az ügyfeleknek AI/ML megoldások tervezésében és kivitelezésében. Mark munkája az ML felhasználási esetek széles skáláját fedi le, elsősorban a számítógépes látás, a mély tanulás és az ML méretezése a vállalaton belül. Számos iparágban segített cégeknek, beleértve a biztosítást, a pénzügyi szolgáltatásokat, a médiát és a szórakoztatást, az egészségügyet, a közműveket és a gyártást. Mark hat AWS-tanúsítvánnyal rendelkezik, köztük az ML Specialty Certification-vel. Mielőtt csatlakozott az AWS-hez, Mark több mint 25 éven át építész, fejlesztő és technológiai vezető volt, ebből 19 évig pénzügyi szolgáltatásokkal foglalkozott.

Használja a RAG-ot gyógyszerkutatáshoz az Amazon Bedrock | tudásbázisaival Amazon Web Services PlatoBlockchain Data Intelligence. Függőleges keresés. Ai.Mani Khanuja Technikai vezető – Generatív mesterségesintelligencia-specialisták, az Alkalmazott gépi tanulás és nagy teljesítményű számítástechnika az AWS-en című könyv szerzője, valamint a Nők a Gyáriparos Oktatásban Alapítvány igazgatótanácsának tagja. Gépi tanulási (ML) projekteket vezet különböző területeken, mint például a számítógépes látás, a természetes nyelvi feldolgozás és a generatív mesterséges intelligencia. Segít ügyfeleinek nagyméretű gépi tanulási modellek létrehozásában, betanításában és üzembe helyezésében. Felszólal belső és külső konferenciákon, mint például a Re:Invent, a Women in Manufacturing West, a YouTube webináriumokon és a GHC 23-ban. Szabadidejében szeret hosszasan futni a tengerparton.

Használja a RAG-ot gyógyszerkutatáshoz az Amazon Bedrock | tudásbázisaival Amazon Web Services PlatoBlockchain Data Intelligence. Függőleges keresés. Ai.Dr. Baichuan Sun, aki jelenleg Sr. AI/ML Solution Architectként dolgozik az AWS-nél, a generatív AI-ra összpontosít, és tudását az adattudományban és a gépi tanulásban alkalmazza gyakorlati, felhő alapú üzleti megoldások biztosításában. Vezetési tanácsadásban és mesterséges intelligencia-megoldások architektúrájában szerzett tapasztalatával számos összetett kihívással foglalkozik, többek között a robotika számítógépes látásmódjával, az idősoros előrejelzéssel és a prediktív karbantartással. Munkája a projektmenedzsment, a szoftver-kutatás és -fejlesztés, valamint az akadémiai tevékenységek szilárd hátterére épül. A munkán kívül Dr. Sun élvezi az utazás és a családjával és barátaival töltött idő egyensúlyát.

Használja a RAG-ot gyógyszerkutatáshoz az Amazon Bedrock | tudásbázisaival Amazon Web Services PlatoBlockchain Data Intelligence. Függőleges keresés. Ai.Derrick Choo az AWS vezető megoldástervezője, aki arra összpontosít, hogy felgyorsítsa az ügyfelek felhőhöz vezető útját, és átalakítsa vállalkozásukat felhőalapú megoldások bevezetésével. Szakértelme a full stack alkalmazások és a gépi tanulás fejlesztésében van. Segít ügyfeleinek a frontend felhasználói felületekre, az IoT-alkalmazásokra, az API- és adatintegrációkra, valamint a gépi tanulási modellekre kiterjedő, végpontok közötti megoldások tervezésében és felépítésében. Szabadidejében szívesen tölt időt a családjával, és kísérletezik fotózással és videózással.

Használja a RAG-ot gyógyszerkutatáshoz az Amazon Bedrock | tudásbázisaival Amazon Web Services PlatoBlockchain Data Intelligence. Függőleges keresés. Ai.Frank Winkler a szingapúri székhelyű AWS vezető megoldástervezője és generatív AI-szakértője, a gépi tanulással és a generatív AI-val foglalkozik. Globális digitális natív vállalatokkal dolgozik együtt, hogy méretezhető, biztonságos és költséghatékony termékeket és szolgáltatásokat tervezzen az AWS-en. Szabadidejében fiával és lányával tölti az időt, és utazik, hogy élvezze a hullámokat az ASEAN-on.

Használja a RAG-ot gyógyszerkutatáshoz az Amazon Bedrock | tudásbázisaival Amazon Web Services PlatoBlockchain Data Intelligence. Függőleges keresés. Ai.Nihir Chadderwala Sr. AI/ML Solutions Architect a Global Healthcare and Life Sciences csapatban. Szakértelme Big Data és mesterséges intelligencia által vezérelt megoldások kidolgozásában áll az ügyfelek problémáira, különösen az orvosbiológiai, élettudományi és egészségügyi területen. Őt is izgatja a kvantuminformáció-tudomány és a mesterséges intelligencia találkozása, és szívesen tanul és hozzájárul ehhez a térhez. Szabadidejében szívesen teniszez, utazik és kozmológiát tanul.

Időbélyeg:

Még több AWS gépi tanulás