השתמש ב-RAG לגילוי תרופות עם בסיסי ידע עבור אמזון יסוד | שירותי האינטרנט של אמזון

השתמש ב-RAG לגילוי תרופות עם בסיסי ידע עבור אמזון יסוד | שירותי האינטרנט של אמזון

סלע אמזון מספק מגוון רחב של דגמים מאמזון וספקי צד שלישי, כולל Anthropic, AI21, Meta, Cohere ו-Stability AI, ומכסה מגוון רחב של מקרי שימוש, כולל יצירת טקסט ותמונה, הטמעה, צ'אט, סוכנים ברמה גבוהה עם הגיון ותזמור ועוד. בסיסי ידע עבור Amazon Bedrock מאפשר לך לבנות אפליקציות ביצועיות ומותאמות אישית של Retrieval Augmented Generation (RAG) על גבי AWS וחנויות וקטורים של צד שלישי תוך שימוש במודלים של AWS וצד שלישי. Base Knowledge for Amazon Bedrock הופך את הסנכרון של הנתונים שלך עם מאגר הווקטורים שלך לאוטומטי, כולל חלוקה של הנתונים כשהם מתעדכנים, טעינת מסמכים וחתכים, כמו גם הטמעה סמנטית. זה מאפשר לך להתאים בצורה חלקה את הנחיות ה-RAG ואסטרטגיות האחזור שלך - אנו מספקים את ייחוס המקור, ואנחנו מטפלים בניהול זיכרון באופן אוטומטי. Knowledge Bases הוא חסר שרת לחלוטין, כך שאינך צריך לנהל שום תשתית, ובשימוש ב Knowledge Bases, אתה מחויב רק עבור הדגמים, מסדי הנתונים הווקטוריים והאחסון שבהם אתה משתמש.

RAG היא טכניקה פופולרית המשלבת שימוש בנתונים פרטיים עם מודלים של שפה גדולה (LLM). RAG מתחיל בשלב ראשוני לאחזור מסמכים רלוונטיים ממאגר נתונים (בדרך כלל אינדקס וקטור) בהתבסס על השאילתה של המשתמש. לאחר מכן הוא משתמש במודל שפה כדי ליצור תגובה על ידי התחשבות הן במסמכים שאוחזרו והן בשאילתה המקורית.

בפוסט זה, אנו מדגימים כיצד לבנות זרימת עבודה של RAG תוך שימוש בבסיסי ידע עבור Amazon Bedrock למקרה שימוש בגילוי תרופות.

סקירה כללית של בסיסי ידע עבור אמזון

בסיס ידע עבור Amazon Bedrock תומך במגוון רחב של סוגי קבצים נפוצים, כולל .txt, .docx, .pdf, .csv ועוד. כדי לאפשר שליפה יעילה מנתונים פרטיים, נוהג נפוץ הוא תחילה לפצל את המסמכים הללו לנתחים שניתנים לניהול. Knowledge Bases הטמיעה אסטרטגיית chunking ברירת מחדל שעובדת טוב ברוב המקרים כדי לאפשר לך להתחיל מהר יותר. אם אתה רוצה יותר שליטה, Knowledge Bases מאפשר לך לשלוט באסטרטגיית החתכים באמצעות קבוצה של אפשרויות מוגדרות מראש. אתה יכול לשלוט בגודל האסימון המרבי ובכמות החפיפה שתיווצר על פני נתחים כדי לספק הקשר קוהרנטי להטמעה. Base Knowledge for Amazon Bedrock מנהל את תהליך סנכרון הנתונים שלך שירות אחסון פשוט של אמזון (Amazon S3) דלי, מפצל אותו לנתחים קטנים יותר, יוצר הטבעות וקטוריות ומאחסן את ההטבעות באינדקס וקטור. תהליך זה מגיע עם ניהול נבדל, תפוקה וכשלים מושכל.

בזמן ריצה, נעשה שימוש במודל הטמעה כדי להמיר את השאילתה של המשתמש לוקטור. לאחר מכן, האינדקס הווקטור נבדק כדי למצוא מסמכים הדומים לשאילתה של המשתמש על ידי השוואת וקטורי מסמכים לוקטור שאילתת המשתמש. בשלב האחרון, מסמכים דומים מבחינה סמנטית שאוחזרו מהאינדקס הווקטורי מתווספים כהקשר עבור שאילתת המשתמש המקורית. בעת יצירת תגובה עבור המשתמש, המסמכים הדומים מבחינה סמנטית מופעלים במודל הטקסט, יחד עם ייחוס מקור לעקיבות.

בסיסי ידע עבור Amazon Bedrock תומך במספר מסדי נתונים וקטוריים, כולל Amazon OpenSearch ללא שרתים, אמזון אורורה, Pinecone ו- Redis Enterprise Cloud. ממשקי ה-API של Retrieve ו-RetrieveAndGenerate מאפשרים ליישומים שלך לבצע שאילתות ישירות על האינדקס באמצעות תחביר מאוחד וסטנדרטי מבלי ללמוד ממשקי API נפרדים עבור כל מסד נתונים וקטורי שונה, מה שמפחית את הצורך לכתוב שאילתות אינדקס מותאמות אישית כנגד מאגר הווקטורים שלך. ה-API של Retrieve לוקח את השאילתה הנכנסת, ממיר אותה לוקטור הטמעה, ומבצע שאילתות במאגר הקצה האחורי באמצעות האלגוריתמים המוגדרים ברמת מסד הנתונים הווקטוריים; ה-API של RetrieveAndGenerate משתמש ב-LLM המוגדר על ידי משתמש המסופק על ידי Amazon Bedrock ומייצר את התשובה הסופית בשפה טבעית. תמיכת העקיבות המקורית מודיעה לאפליקציה המבקשת לגבי המקורות המשמשים כדי לענות על שאלה. עבור הטמעות ארגוניות, Knowledge Bases תומך שירות ניהול מפתח AWS הצפנה (AWS KMS), AWS CloudTrail אינטגרציה ועוד.

בסעיפים הבאים, אנו מדגימים כיצד לבנות זרימת עבודה של RAG באמצעות Knowledge Bases עבור Amazon Bedrock, בגיבוי מנוע הווקטור OpenSearch Serverless, כדי לנתח מערך נתונים של ניסויים קליניים לא מובנה עבור מקרה שימוש בגילוי תרופות. נתונים אלה עשירים במידע אך יכולים להיות הטרוגניים במידה רבה. טיפול נכון בטרמינולוגיה ומושגים מיוחדים בפורמטים שונים חיוני כדי לזהות תובנות ולהבטיח שלמות אנליטית. עם Base Knowledge for Amazon Bedrock, אתה יכול לגשת למידע מפורט באמצעות שאילתות פשוטות וטבעיות.

בנה בסיס ידע עבור Amazon Bedrock

בחלק זה, אנו מדגימים את התהליך של יצירת בסיס ידע עבור Amazon Bedrock דרך הקונסולה. השלם את השלבים הבאים:

  1. בקונסולת Amazon Bedrock, מתחת תזמורת בחלונית הניווט, בחר בסיס ידע.
  2. בחרו צור בסיס ידע.

השתמש ב-RAG לגילוי תרופות עם בסיסי ידע עבור אמזון יסוד | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

  1. ב פרטי מאגר הידע מקטע, הזן שם ותיאור אופציונלי.
  2. ב הרשאות IAM בחר, בחר צור תפקיד שירות חדש והשתמש בו.
  3. בעד תפקיד שם שירות, הזן שם לתפקיד שלך, שעליו להתחיל עם AmazonBedrockExecutionRoleForKnowledgeBase_.
  4. בחרו הַבָּא.

השתמש ב-RAG לגילוי תרופות עם בסיסי ידע עבור אמזון יסוד | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

  1. ב מקור נתונים בקטע, הזן שם עבור מקור הנתונים שלך ואת ה-URI S3 שבו נמצא מערך הנתונים. מאגרי ידע תומכים בפורמטים הבאים של קבצים:
    • טקסט רגיל (.txt)
    • Markdown (.md)
    • HyperText Markup Language (.html)
    • מסמך Microsoft Word (.doc/.docx)
    • ערכים מופרדים בפסיקים (.csv)
    • גיליון אלקטרוני של Microsoft Excel (.xls/.xlsx)
    • פורמט מסמך נייד (.pdf)
  1. תַחַת הגדרות נוספות¸ בחר את אסטרטגיית החתכים המועדפת עליך (עבור פוסט זה, אנו בוחרים חתיכות בגודל קבוע) וציין את גודל הנתח ושכבת העל באחוזים. לחלופין, אתה יכול להשתמש בהגדרות ברירת המחדל.
  2. בחרו הַבָּא.

השתמש ב-RAG לגילוי תרופות עם בסיסי ידע עבור אמזון יסוד | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

  1. ב דגם הטבעות בקטע, בחר את הדגם Titan Embeddings מ- Amazon Bedrock.
  2. ב מסד נתונים וקטורי בחר, בחר צור במהירות חנות וקטורית חדשה, המנהלת את תהליך הקמת חנות וקטורית.
  3. בחרו הַבָּא.

השתמש ב-RAG לגילוי תרופות עם בסיסי ידע עבור אמזון יסוד | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

  1. עיין בהגדרות ובחר צור בסיס ידע.

השתמש ב-RAG לגילוי תרופות עם בסיסי ידע עבור אמזון יסוד | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

  1. המתן לסיום יצירת בסיס הידע ואשר את המצב שלו מוכן.
  2. ב מקור נתונים מקטע, או על הבאנר בראש העמוד או בחלון הקופץ בחלון הבדיקה, בחר לסנכרן להפעיל את תהליך טעינת הנתונים מה-S3 bucket, פיצול אותם לנתחים בגודל שציינת, יצירת הטמעות וקטוריות באמצעות מודל הטבעת הטקסט שנבחר, ואחסנם בחנות הווקטורית המנוהלת על ידי Knowledge Bases עבור Amazon Bedrock.

השתמש ב-RAG לגילוי תרופות עם בסיסי ידע עבור אמזון יסוד | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

פונקציית הסנכרון תומכת בהטמעה, עדכון ומחיקה של המסמכים מהאינדקס הווקטור על סמך שינויים במסמכים באמזון S3. אתה יכול גם להשתמש ב StartIngestionJob API להפעלת הסנכרון דרך AWS SDK.

כאשר הסנכרון הושלם, היסטוריית הסנכרון מציגה את הסטטוס הושלם.

השתמש ב-RAG לגילוי תרופות עם בסיסי ידע עבור אמזון יסוד | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

שאל את בסיס הידע

בחלק זה, אנו מדגימים כיצד לגשת למידע מפורט במאגר הידע באמצעות שאילתות פשוטות וטבעיות. אנו משתמשים במערך נתונים סינתטי לא מובנה המורכב מקובצי PDF, שמספר העמודים של כל אחד מהם נע בין 10-100 עמודים, המדמה תוכנית ניסוי קליני של תרופה חדשה מוצעת, כולל שיטות ניתוח סטטיסטי וטפסי הסכמה של משתתפים. אנו משתמשים בבסיסי הידע עבור Amazon Bedrock retrieve_and_generate ו retrieve ממשקי API עם אינטגרציה של Amazon Bedrock LangChain.

לפני שתוכל לכתוב סקריפטים המשתמשים ב-Amazon Bedrock API, תצטרך להתקין את הגרסה המתאימה של AWS SDK בסביבה שלך. עבור סקריפטים של Python, זה יהיה AWS SDK עבור Python (Boto3):

pip install langchain
pip install boto3

בנוסף, אפשר גישה לדגם Amazon Titan Embeddings ו-Anthropic Claude v2 או v1. למידע נוסף, עיין ב גישה לדגם.

צור שאלות באמצעות Amazon Bedrock

אנו יכולים להשתמש ב-Anthropic Claude 2.1 עבור Amazon Bedrock כדי להציע רשימה של שאלות שיש לשאול במערך הנתונים של הניסויים הקליניים:

import boto3
from langchain.llms.bedrock import Bedrock

bedrock_client = boto3.client("bedrock-runtime")

# Start with the query
prompt = "For medical research trial consent forms to sign, what are the top 5 questions can be asked?"

claude_llm = Bedrock(
    model_id="anthropic.claude-v2:1",
    model_kwargs={"temperature": 0, "top_k": 10, "max_tokens_to_sample": 3000},
    client=bedrock_client,
)

# Provide the prompt to the LLM to generate an answer to the query without any additional context provided
response = claude_llm(prompt)
questions = [
    item.split(".")[1].strip() for item in response.strip().split("nn")[1:-1]
]
questions
>>> answer:
'What is the purpose of the study? Make sure you understand the goals of the research and what the study procedures will entail',
'What are the risks and potential benefits? The form should explain all foreseeable risks, side effects, or discomforts you might experience from participating',
'What will participation involve? Get details on what tests, medications, lifestyle changes, or procedures you will go through, how much time it will take, and how long the study will last',
'Are there any costs or payments? Ask if you will be responsible for any costs related to the study or get paid for participating',
'How will my privacy be protected? The form should explain how your personal health information will be kept confidential before, during, and after the trial'

השתמש ב-Amazon Bedrock RetrieveAndGenerate API

לחוויית RAG מנוהלת במלואה, אתה יכול להשתמש בבסיסי הידע המקוריים עבור Amazon Bedrock RetrieveAndGenerate API כדי לקבל את התשובות ישירות:

bedrock_agent_client = boto3.client("bedrock-agent-runtime")

kb_id = "<YOUR_KNOWLEDGE_BASE_ID>"

def retrieveAndGenerate(
    input: str,
    kbId: str,
    region: str = "us-east-1",
    sessionId: str = None,
    model_id: str = "anthropic.claude-v2:1",
):
    model_arn = f"arn:aws:bedrock:{region}::foundation-model/{model_id}"

    if sessionId:
        return bedrock_agent_client.retrieve_and_generate(
            input={"text": input},
            retrieveAndGenerateConfiguration={
                "type": "KNOWLEDGE_BASE",
                "knowledgeBaseConfiguration": {
                    "knowledgeBaseId": kbId,
                    "modelArn": model_arn,
                },
            },
            sessionId=sessionId,
        )

    else:
        return bedrock_agent_client.retrieve_and_generate(
            input={"text": input},
            retrieveAndGenerateConfiguration={
                "type": "KNOWLEDGE_BASE",
                "knowledgeBaseConfiguration": {
                    "knowledgeBaseId": kbId,
                    "modelArn": model_arn,
                },
            },
        )

response = retrieveAndGenerate(
    "What are the potential risks and benefits of participating?", kb_id
)

generated_text = response["output"]["text"]
>>> "The potential risks include side effects from the study medication lithium such as nausea, loose stools, thirst, urination changes, shakiness, headaches, sweating, fatigue, decreased concentration, and skin rash. There is also a risk of lithium interaction with other medications. For women, there is a risk of birth defects if lithium is taken during pregnancy. There are no guaranteed benefits, but possible benefits include new information that could help the participant from the interviews and tests conducted during the study."

ניתן להשיג את מקור המידע המצוטט באמצעות הקוד הבא (כאשר חלק מהפלט כתוב לקיצור):

response["citations"]

>>> [
    {
        "generatedResponsePart": {
            "textResponsePart": {
                "text": " The potential risks include side effects from the study...",
                "span": {"start": 0, "end": 361},
            }
        },
        "retrievedReferences": [
            {
                "content": {
                    "text": "590 ICF#2 Page 7 of 19 The primary risks and discomforts of participation…"
                },
                "location": {"type": "S3", "s3Location": {"uri": "s3://XXXX/XXXX.pdf"}},
            },
            {
                "content": {
                    "text": "N/A CSP 590 ICF#2 Page 10 of 19 Risks associated with suddenly stopping study medications..."
                },
                "location": {"type": "S3", "s3Location": {"uri": "s3://XXXX/XXXX.pdf"}},
            },
        ],
    },
    {
        "generatedResponsePart": {
            "textResponsePart": {
                "text": " There are no guaranteed benefits, but possible benefits include...",
                "span": {"start": 363, "end": 531},
            }
        },
        "retrievedReferences": [
            {
                "content": {
                    "text": "research, not usual clinical care. After these are done we ask..."
                },
                "location": {"type": "S3", "s3Location": {"uri": "s3://XXXX/XXXX.pdf"}},
            }
        ],
    },
]

על ידי העברת מזהה הפגישה של RetrieveAndGenerate API, אתה יכול לשמר את הקשר השיחה ולשאול שאלות המשך. לדוגמה, ללא ההקשר, אם אתה מבקש פרטים נוספים מהתשובה הקודמת, ייתכן שהיא לא תוכל לענות נכון:

retrieveAndGenerate("elaborate more on the first side effect", kb_id, sessionId=None)["output"]["text"]
>>> "The search results do not provide additional details about the mild nausea side effect that would allow me to elaborate further on it."

אבל על ידי העברת מזהה הפגישה, צינור RAG מסוגל לזהות את ההקשר המתאים ולהחזיר תשובות רלוונטיות:

retrieveAndGenerate("elaborate more on the first side effect", kb_id, sessionId=response["sessionId"])["output"]["text"]
>>> "The search results provide details that nausea from taking lithium is usually mild and goes away after days or weeks for most people. Specifically, up to 75% of people may experience mild nausea when first starting lithium, but this goes away in 90-99% of people who continue taking it."

הטבלה הבאה מציגה את התשובות שאוחזרו לכל השאלות המתאימות.

שאלה תשובה
מהי מטרת המחקר? ודא שאתה מבין את מטרות המחקר ומה יכלול נהלי המחקר. מטרת המחקר היא לבדוק האם ליתיום יעיל במניעת אלימות מכוונת עצמית חוזרת ונשנית בחולים עם דיכאון או הפרעה דו-קוטבית.
מהם הסיכונים והיתרונות הפוטנציאליים? הטופס אמור להסביר את כל הסיכונים, תופעות הלוואי או אי הנוחות הצפויים לך מההשתתפות. הסיכונים או אי הנוחות האפשריים כוללים: שאלות הראיון הגורמות לאי נוחות, תופעות לוואי מתרופות הליתיום כגון בחילות, צואה רופפת, צמא, שינויים במתן שתן, רעידות, כאבי ראש, הזעה, עייפות, ירידה בריכוז, פריחה בעור, שינויים בבלוטת התריס, החמרה באקנה. /פסוריאזיס, רעילות ליתיום וסיכונים אם התרופה תופסק פתאום. היתרונות הפוטנציאליים הם שהבדיקות עשויות להוביל למידע חדש שיעזור למשתתף, וליתיום עשוי לסייע במניעת אלימות חוזרת ונשנית מכוונת עצמית של אנשים עם דיכאון או הפרעה דו-קוטבית.
מה תכלול ההשתתפות? קבלו פרטים על הבדיקות, התרופות, השינויים באורח החיים או ההליכים שתעברו, כמה זמן זה ייקח וכמה זמן יימשך המחקר. ההשתתפות תהיה כרוכה בהשלמת ראיון ושאלונים המכסים חשיבה, התנהגויות, טיפול בבריאות הנפש, תרופות, שימוש באלכוהול וסמים, תמיכה ביתית וחברתית, והבנת המחקר. זה לוקח כשעתיים וניתן לעשות זאת במספר פגישות, באופן אישי וטלפוני. אם יהיה זכאי ללימוד המלא, יהיו כ-20 ביקורי לימוד במשך שנה. זה יכלול נטילת תרופות מחקר, בדיקת סימנים חיוניים, מילוי שאלונים, סקירת תופעות לוואי והמשך טיפול רפואי ונפשי רגיל.
האם יש עלויות או תשלומים? שאל אם תהיה אחראי לכל עלויות הקשורות למחקר או לקבל תשלום עבור ההשתתפות. כן, יש עלויות ותשלומים שנדונו בתוצאות החיפוש. לא תחויב עבור כל טיפול או פרוצדורה שהם חלק מהמחקר. עם זאת, עדיין תצטרך לשלם כל השתתפות עצמית רגילה של VA עבור טיפול ותרופות שאינן קשורות למחקר. לא תקבל תשלום עבור ההשתתפות, אך המחקר יפצה הוצאות הקשורות להשתתפות כמו תחבורה, חניה וכו'. סכומי ההחזר והתהליך מסופקים.
איך הפרטיות שלי תוגן? הטופס צריך להסביר כיצד המידע הבריאותי האישי שלך יישמר חסוי לפני, במהלך ואחרי הניסיון. פרטיותך תוגן על ידי עריכת ראיונות בפרטיות, שמירת הערות כתובות בתיקים ובמשרדים נעולים, אחסון מידע אלקטרוני בקבצים מוצפנים ומוגנים בסיסמה וקבלת תעודת סודיות ממשרד הבריאות ושירותי אנוש למניעת חשיפת מידע המזהה אותך. . מידע המזהה אותך עשוי להיות משותף עם רופאים האחראים לטיפול שלך או לביקורות והערכות על ידי סוכנויות ממשלתיות, אך שיחות ועיתונים על המחקר לא יזהו אותך.

שאילתה באמצעות אחזור ה-API של Amazon Bedrock

כדי להתאים אישית את זרימת העבודה של RAG שלך, אתה יכול להשתמש ב-Retrieve API כדי להביא את הנתחים הרלוונטיים על סמך השאילתה שלך ולהעביר אותה לכל LLM שסופק על ידי Amazon Bedrock. כדי להשתמש ב-Retrieve API, הגדר אותו באופן הבא:

def retrieve(query: str, kbId: str, numberOfResults: int = 5):
    return bedrock_agent_client.retrieve(
        retrievalQuery={"text": query},
        knowledgeBaseId=kbId,
        retrievalConfiguration={
            "vectorSearchConfiguration": {"numberOfResults": numberOfResults}
        },
    )

אחזר את ההקשר המתאים (כאשר חלק מהפלט כתוב לקיצור):

query = "What is the purpose of the medical research study?"
response = retrieve(query, kb_id, 3)
retrievalResults = response["retrievalResults"]
>>> [
    {
        "content": {"text": "You will not be charged for any procedures that..."},
        "location": {"type": "S3", "s3Location": {"uri": "s3://XXXXX/XXXX.pdf"}},
        "score": 0.6552521,
    },
    {
        "content": {"text": "and possible benefits of the study. You have been..."},
        "location": {"type": "S3", "s3Location": {"uri": "s3://XXXX/XXXX.pdf"}},
        "score": 0.6581577,
    },
    ...,
]

חלץ את ההקשר עבור תבנית ההנחיה:

def get_contexts(retrievalResults):
    contexts = []
    for retrievedResult in retrievalResults:
        contexts.append(retrievedResult["content"]["text"])
    return " ".join(contexts)

contexts = get_contexts(retrievalResults)

ייבא את המודולים של Python והגדר את תבנית בקשת התשובה לשאלות בתוך ההקשר, ולאחר מכן הפק את התשובה הסופית:

from langchain.prompts import PromptTemplate

PROMPT_TEMPLATE = """
Human: You are an AI system working on medical trial research, and provides answers to questions 
by using fact based and statistical information when possible.
Use the following pieces of information to provide a concise answer to the question enclosed in <question> tags.
If you don't know the answer, just say that you don't know, don't try to make up an answer.

<context>
{context_str}
</context>

<question>
{query_str}
</question>

The response should be specific and use statistics or numbers when possible.

Assistant:"""

claude_prompt = PromptTemplate(
    template=PROMPT_TEMPLATE, input_variables=["context_str", "query_str"]
)

prompt = claude_prompt.format(context_str=contexts, query_str=query)
response = claude_llm(prompt)
>>> "Based on the context provided, the purpose of this medical research study is to evaluate the efficacy of lithium compared to a placebo in preventing suicide over a 1 year period. Specifically, participants will be randomly assigned to receive either lithium or a placebo pill for 1 year, with their doctors and the participants themselves not knowing which treatment they receive (double-blind). Blood lithium levels will be monitored and doses adjusted over the first 6-8 visits, then participants will be followed monthly for 1 year to assess outcomes."

שאילתה באמצעות אינטגרציה של Amazon Bedrock LangChain

כדי ליצור יישום שאלות ותשובות מותאם אישית מקצה לקצה, Knowledge Bases for Amazon Bedrock מספק אינטגרציה עם LangChain. כדי להגדיר את משחזר LangChain, ספק את מזהה בסיס הידע וציין את מספר התוצאות להחזר מהשאילתה:

from langchain.retrievers.bedrock import AmazonKnowledgeBasesRetriever

retriever = AmazonKnowledgeBasesRetriever(
    knowledge_base_id=kb_id,
    retrieval_config={"vectorSearchConfiguration": {"numberOfResults": 4}},
)

כעת הגדר את LangChain RetrievalQA והפק תשובות ממאגר הידע:

from langchain.chains import RetrievalQA

qa = RetrievalQA.from_chain_type(
    llm=claude_llm,
    chain_type="stuff",
    retriever=retriever,
    return_source_documents=True,
    chain_type_kwargs={"prompt": claude_prompt},
)

[qa(q)["result"] for q in questions]

זה ייצור תשובות מתאימות הדומות לאלו המפורטות בטבלה הקודמת.

לנקות את

הקפד למחוק את המשאבים הבאים כדי להימנע מחיובים נוספים:

סיכום

Amazon Bedrock מספקת קבוצה רחבה של שירותים משולבים עמוקים להפעלת יישומי RAG בכל קנה מידה, מה שהופך את זה לפשוט להתחיל עם ניתוח נתוני החברה שלך. בסיס ידע עבור Amazon Bedrock משתלב עם מודלים של Amazon Bedrock לבניית צינורות להטמעת מסמכים ניתנים להרחבה ושירותי אחזור מסמכים כדי להפעיל מגוון רחב של יישומים פנימיים ופונים ללקוחות. אנו נרגשים מהעתיד שלפנינו, והמשוב שלך ישחק תפקיד חיוני בהנחיית ההתקדמות של מוצר זה. למידע נוסף על היכולות של Amazon Bedrock ובסיסי ידע, עיין ב בסיס ידע עבור Amazon Bedrock.


על הכותבים

השתמש ב-RAG לגילוי תרופות עם בסיסי ידע עבור אמזון יסוד | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.מארק רוי הוא ארכיטקט למידת מכונה ראשי עבור AWS, שעוזר ללקוחות לתכנן ולבנות פתרונות AI/ML. עבודתו של מארק מכסה מגוון רחב של מקרי שימוש ב-ML, עם עניין עיקרי בראייה ממוחשבת, למידה עמוקה והרחבת ML ברחבי הארגון. הוא עזר לחברות בתעשיות רבות, כולל ביטוח, שירותים פיננסיים, מדיה ובידור, שירותי בריאות, שירותים וייצור. מארק מחזיק בשש הסמכות AWS, כולל הסמכת ML Specialty. לפני שהצטרף ל-AWS, מארק היה אדריכל, מפתח ומוביל טכנולוגיה במשך למעלה מ-25 שנים, כולל 19 שנים בשירותים פיננסיים.

השתמש ב-RAG לגילוי תרופות עם בסיסי ידע עבור אמזון יסוד | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.מני חנוג'ה היא מובילה טכנולוגית – מומחי בינה מלאכותית, מחברת הספר – Applied Machine Learning and High Performance Computing on AWS, וחברה במועצת המנהלים של קרן החינוך לנשים בייצור. היא מובילה פרויקטים של למידת מכונה (ML) בתחומים שונים כמו ראייה ממוחשבת, עיבוד שפה טבעית ובינה מלאכותית גנרטיבית. היא עוזרת ללקוחות לבנות, לאמן ולפרוס מודלים גדולים של למידת מכונה בקנה מידה. היא מדברת בכנסים פנימיים וחיצוניים כגון re:Invent, Women in Manufacturing West, סמינרים מקוונים ביוטיוב ו-GHC 23. בזמנה הפנוי היא אוהבת לצאת לריצות ארוכות לאורך החוף.

השתמש ב-RAG לגילוי תרופות עם בסיסי ידע עבור אמזון יסוד | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.ד"ר באצ'ואן סאן, המשמש כיום כ-Sr. AI/ML Solution Architect ב-AWS, מתמקד ב-AI גנרטיבי ומיישם את הידע שלו במדעי הנתונים ולמידת מכונה כדי לספק פתרונות עסקיים מעשיים מבוססי ענן. עם ניסיון בייעוץ ניהולי וארכיטקטורת פתרונות בינה מלאכותית, הוא נותן מענה למגוון אתגרים מורכבים, כולל ראייה ממוחשבת ברובוטיקה, חיזוי סדרות זמן ותחזוקה חזויה, בין היתר. עבודתו מבוססת על רקע מוצק של ניהול פרויקטים, מו"פ תוכנה ועיסוקים אקדמיים. מחוץ לעבודה, ד"ר סאן נהנה מהאיזון שבין נסיעות ובילוי עם משפחה וחברים.

השתמש ב-RAG לגילוי תרופות עם בסיסי ידע עבור אמזון יסוד | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.דריק צ'ו הוא ארכיטקט פתרונות בכיר ב-AWS המתמקד בהאצת המסע של הלקוחות לענן ובשינוי העסק שלהם באמצעות אימוץ פתרונות מבוססי ענן. המומחיות שלו היא בפיתוח יישומים מלאים ולמידת מכונה. הוא עוזר ללקוחות לתכנן ולבנות פתרונות מקצה לקצה המכסים ממשקי משתמש חזיתיים, יישומי IoT, שילובי API ונתונים ומודלים של למידת מכונה. בזמנו הפנוי הוא נהנה לבלות עם משפחתו ולהתנסות בצילום ווידאו.

השתמש ב-RAG לגילוי תרופות עם בסיסי ידע עבור אמזון יסוד | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.פרנק וינקלר הוא ארכיטקט פתרונות בכיר ומומחה בינה מלאכותית בינה מלאכותית ב-AWS שבסיסה בסינגפור, מתמקדת בלמידת מכונה ובינה מלאכותית גנרית. הוא עובד עם חברות מקוריות דיגיטליות גלובליות כדי לעצב מוצרים ושירותים ניתנים להרחבה, מאובטחים וחסכוניים ב-AWS. בזמנו הפנוי, הוא מבלה עם בנו ובתו, ונוסע ליהנות מהגלים ברחבי ASEAN.

השתמש ב-RAG לגילוי תרופות עם בסיסי ידע עבור אמזון יסוד | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.ניהיר צ'אדרוואלה הוא Sr. AI/ML Solutions Architect בצוות הבריאות העולמי ומדעי החיים. המומחיות שלו היא בבניית פתרונות ביג דאטה ו-AI לבעיות לקוחות במיוחד בתחום הביו-רפואי, מדעי החיים והבריאות. הוא גם נרגש מהמפגש בין מדע המידע הקוונטי ובינה מלאכותית ונהנה ללמוד ולתרום למרחב הזה. בזמנו הפנוי, הוא נהנה לשחק טניס, לטייל וללמוד על קוסמולוגיה.

בול זמן:

עוד מ למידת מכונות AWS