Gunakan RAG untuk penemuan obat dengan Basis Pengetahuan untuk Amazon Bedrock | Layanan Web Amazon

Gunakan RAG untuk penemuan obat dengan Basis Pengetahuan untuk Amazon Bedrock | Layanan Web Amazon

Batuan Dasar Amazon menyediakan berbagai model dari Amazon dan penyedia pihak ketiga, termasuk Anthropic, AI21, Meta, Cohere, dan Stability AI, dan mencakup berbagai kasus penggunaan, termasuk pembuatan teks dan gambar, penyematan, obrolan, agen tingkat tinggi dengan penalaran dan orkestrasi, dan banyak lagi. Basis Pengetahuan untuk Batuan Dasar Amazon memungkinkan Anda membangun aplikasi Retrieval Augmented Generation (RAG) yang berkinerja dan disesuaikan di atas AWS dan penyimpanan vektor pihak ketiga menggunakan model AWS dan pihak ketiga. Basis Pengetahuan untuk Amazon Bedrock mengotomatiskan sinkronisasi data Anda dengan penyimpanan vektor Anda, termasuk membedakan data saat diperbarui, pemuatan dan pemotongan dokumen, serta penyematan semantik. Hal ini memungkinkan Anda menyesuaikan permintaan RAG dan strategi pengambilan dengan lancarโ€”kami menyediakan atribusi sumber, dan kami menangani manajemen memori secara otomatis. Basis Pengetahuan sepenuhnya tanpa server, jadi Anda tidak perlu mengelola infrastruktur apa pun, dan saat menggunakan Basis Pengetahuan, Anda hanya dikenakan biaya untuk model, database vektor, dan penyimpanan yang Anda gunakan.

RAG adalah teknik populer yang menggabungkan penggunaan data pribadi dengan model bahasa besar (LLM). RAG dimulai dengan langkah awal untuk mengambil dokumen yang relevan dari penyimpanan data (umumnya indeks vektor) berdasarkan kueri pengguna. Kemudian menggunakan model bahasa untuk menghasilkan respons dengan mempertimbangkan dokumen yang diambil dan kueri asli.

Dalam postingan ini, kami mendemonstrasikan cara membangun alur kerja RAG menggunakan Basis Pengetahuan untuk Amazon Bedrock untuk kasus penggunaan penemuan obat.

Ikhtisar Basis Pengetahuan untuk Amazon Bedrock

Basis Pengetahuan untuk Amazon Bedrock mendukung berbagai jenis file umum, termasuk .txt, .docx, .pdf, .csv, dan banyak lagi. Untuk memungkinkan pengambilan data pribadi secara efektif, praktik yang umum dilakukan adalah dengan terlebih dahulu membagi dokumen-dokumen ini menjadi beberapa bagian yang dapat dikelola. Basis Pengetahuan telah menerapkan strategi pengelompokan default yang berfungsi dengan baik dalam banyak kasus untuk memungkinkan Anda memulai lebih cepat. Jika Anda menginginkan kontrol lebih besar, Basis Pengetahuan memungkinkan Anda mengontrol strategi pengelompokan melalui serangkaian opsi yang telah dikonfigurasi sebelumnya. Anda dapat mengontrol ukuran token maksimum dan jumlah tumpang tindih yang akan dibuat di seluruh bagian untuk memberikan konteks yang koheren pada penyematan. Basis Pengetahuan untuk Amazon Bedrock mengelola proses sinkronisasi data dari Anda Layanan Penyimpanan Sederhana Amazon (Amazon S3), membaginya menjadi bagian-bagian yang lebih kecil, menghasilkan penyematan vektor, dan menyimpan penyematan dalam indeks vektor. Proses ini dilengkapi dengan pembedaan cerdas, throughput, dan manajemen kegagalan.

Saat runtime, model penyematan digunakan untuk mengonversi kueri pengguna menjadi vektor. Indeks vektor kemudian dikueri untuk menemukan dokumen yang mirip dengan kueri pengguna dengan membandingkan vektor dokumen dengan vektor kueri pengguna. Pada langkah terakhir, dokumen serupa secara semantik yang diambil dari indeks vektor ditambahkan sebagai konteks untuk kueri pengguna asli. Saat menghasilkan respons untuk pengguna, dokumen yang serupa secara semantik diminta dalam model teks, bersama dengan atribusi sumber untuk ketertelusuran.

Basis Pengetahuan untuk Amazon Bedrock mendukung beberapa database vektor, termasuk Amazon OpenSearch Tanpa Server, Amazon Aurora, Biji Pinus, dan Redis Enterprise Cloud. API Retrieve dan RetrieveAndGenerate memungkinkan aplikasi Anda melakukan kueri indeks secara langsung menggunakan sintaks terpadu dan standar tanpa harus mempelajari API terpisah untuk setiap basis data vektor yang berbeda, sehingga mengurangi kebutuhan untuk menulis kueri indeks khusus terhadap penyimpanan vektor Anda. Retrieve API mengambil kueri masuk, mengubahnya menjadi vektor penyematan, dan menanyakan penyimpanan backend menggunakan algoritme yang dikonfigurasi pada tingkat basis data vektor; API RetrieveAndGenerate menggunakan LLM yang dikonfigurasi pengguna yang disediakan oleh Amazon Bedrock dan menghasilkan jawaban akhir dalam bahasa alami. Dukungan penelusuran asli menginformasikan aplikasi yang meminta tentang sumber yang digunakan untuk menjawab pertanyaan. Untuk implementasi perusahaan, Basis Pengetahuan mendukung Layanan Manajemen Kunci AWS (AWS KMS), AWS CloudTrail integrasi, dan lainnya.

Pada bagian berikut, kami mendemonstrasikan cara membangun alur kerja RAG menggunakan Basis Pengetahuan untuk Amazon Bedrock, yang didukung oleh mesin vektor OpenSearch Serverless, untuk menganalisis kumpulan data uji klinis tidak terstruktur untuk kasus penggunaan penemuan obat. Data ini kaya akan informasi namun bisa sangat heterogen. Penanganan terminologi dan konsep khusus yang tepat dalam berbagai format sangat penting untuk mendeteksi wawasan dan memastikan integritas analitis. Dengan Basis Pengetahuan untuk Amazon Bedrock, Anda dapat mengakses informasi terperinci melalui kueri yang sederhana dan alami.

Bangun basis pengetahuan untuk Amazon Bedrock

Di bagian ini, kami mendemonstrasikan proses pembuatan basis pengetahuan untuk Amazon Bedrock melalui konsol. Selesaikan langkah-langkah berikut:

  1. Di konsol Amazon Bedrock, di bawah Orkestrasi di panel navigasi, pilih Dasar pengetahuan.
  2. Pilih Buat basis pengetahuan.

Gunakan RAG untuk penemuan obat dengan Basis Pengetahuan untuk Amazon Bedrock | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

  1. Dalam majalah Detail basis pengetahuan bagian, masukkan nama dan deskripsi opsional.
  2. Dalam majalah izin IAM bagian, pilih Buat dan gunakan peran layanan baru.
  3. Untuk Peran nama layanan, masukkan nama untuk peran Anda, yang harus diawali dengan AmazonBedrockExecutionRoleForKnowledgeBase_.
  4. Pilih Selanjutnya.

Gunakan RAG untuk penemuan obat dengan Basis Pengetahuan untuk Amazon Bedrock | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

  1. Dalam majalah Sumber data bagian, masukkan nama untuk sumber data Anda dan URI S3 tempat himpunan data berada. Basis Pengetahuan mendukung format file berikut:
    • Teks biasa (.txt)
    • Penurunan harga (.md)
    • Bahasa Markup HyperTeks (.html)
    • Dokumen Microsoft Word (.doc/.docx)
    • Nilai yang dipisahkan koma (.csv)
    • Lembar kerja Microsoft Excel (.xls/.xlsx)
    • Format Dokumen Portabel (.pdf)
  1. Bawah Additional settingsยธ pilih strategi chunking pilihan Anda (untuk posting ini, kami memilih Potongan ukuran tetap) dan tentukan ukuran potongan dan persentase overlay. Alternatifnya, Anda dapat menggunakan pengaturan default.
  2. Pilih Selanjutnya.

Gunakan RAG untuk penemuan obat dengan Basis Pengetahuan untuk Amazon Bedrock | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

  1. Dalam majalah Model penyematan bagian, pilih model Titan Embeddings dari Amazon Bedrock.
  2. Dalam majalah Basis data vektor bagian, pilih Buat toko vektor baru dengan cepat, yang mengelola proses penyiapan penyimpanan vektor.
  3. Pilih Selanjutnya.

Gunakan RAG untuk penemuan obat dengan Basis Pengetahuan untuk Amazon Bedrock | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

  1. Tinjau pengaturan dan pilih Buat basis pengetahuan.

Gunakan RAG untuk penemuan obat dengan Basis Pengetahuan untuk Amazon Bedrock | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

  1. Tunggu hingga pembuatan basis pengetahuan selesai dan konfirmasikan statusnya Siap.
  2. Dalam majalah Sumber data bagian, atau pada spanduk di bagian atas halaman atau munculan di jendela pengujian, pilih Sync untuk memicu proses memuat data dari bucket S3, membaginya menjadi beberapa bagian dengan ukuran yang Anda tentukan, menghasilkan penyematan vektor menggunakan model penyematan teks yang dipilih, dan menyimpannya di penyimpanan vektor yang dikelola oleh Basis Pengetahuan untuk Amazon Bedrock.

Gunakan RAG untuk penemuan obat dengan Basis Pengetahuan untuk Amazon Bedrock | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

Fungsi sinkronisasi mendukung penyerapan, pembaruan, dan penghapusan dokumen dari indeks vektor berdasarkan perubahan pada dokumen di Amazon S3. Anda juga dapat menggunakan StartIngestionJob API untuk memicu sinkronisasi melalui AWS SDK.

Ketika sinkronisasi selesai, Riwayat sinkronisasi menunjukkan status Selesai.

Gunakan RAG untuk penemuan obat dengan Basis Pengetahuan untuk Amazon Bedrock | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

Kueri basis pengetahuan

Di bagian ini, kami mendemonstrasikan cara mengakses informasi mendetail di basis pengetahuan melalui kueri yang lugas dan alami. Kami menggunakan kumpulan data sintetik tidak terstruktur yang terdiri dari file PDF, nomor halaman masing-masing berkisar antara 10โ€“100 halaman, yang menyimulasikan rencana uji klinis dari obat baru yang diusulkan termasuk metode analisis statistik dan formulir persetujuan peserta. Kami menggunakan Basis Pengetahuan untuk Amazon Bedrock retrieve_and_generate dan retrieve API dengan Integrasi Amazon Bedrock LangChain.

Sebelum Anda dapat menulis skrip yang menggunakan API Amazon Bedrock, Anda harus menginstal versi AWS SDK yang sesuai di lingkungan Anda. Untuk skrip Python, ini akan menjadi AWS SDK untuk Python (Boto3):

pip install langchain
pip install boto3

Selain itu, aktifkan akses ke model Amazon Titan Embeddings dan Anthropic Claude v2 atau v1. Untuk informasi lebih lanjut, lihat Akses model.

Hasilkan pertanyaan menggunakan Amazon Bedrock

Kita dapat menggunakan Anthropic Claude 2.1 untuk Amazon Bedrock untuk mengajukan daftar pertanyaan untuk ditanyakan pada kumpulan data uji klinis:

import boto3
from langchain.llms.bedrock import Bedrock

bedrock_client = boto3.client("bedrock-runtime")

# Start with the query
prompt = "For medical research trial consent forms to sign, what are the top 5 questions can be asked?"

claude_llm = Bedrock(
    model_id="anthropic.claude-v2:1",
    model_kwargs={"temperature": 0, "top_k": 10, "max_tokens_to_sample": 3000},
    client=bedrock_client,
)

# Provide the prompt to the LLM to generate an answer to the query without any additional context provided
response = claude_llm(prompt)
questions = [
    item.split(".")[1].strip() for item in response.strip().split("nn")[1:-1]
]
questions
>>> answer:
'What is the purpose of the study? Make sure you understand the goals of the research and what the study procedures will entail',
'What are the risks and potential benefits? The form should explain all foreseeable risks, side effects, or discomforts you might experience from participating',
'What will participation involve? Get details on what tests, medications, lifestyle changes, or procedures you will go through, how much time it will take, and how long the study will last',
'Are there any costs or payments? Ask if you will be responsible for any costs related to the study or get paid for participating',
'How will my privacy be protected? The form should explain how your personal health information will be kept confidential before, during, and after the trial'

Gunakan API Amazon Bedrock RetrieveAndGenerate

Untuk pengalaman RAG yang terkelola sepenuhnya, Anda dapat menggunakan Basis Pengetahuan asli untuk Amazon Bedrock RetrieveAndGenerate API untuk mendapatkan jawabannya secara langsung:

bedrock_agent_client = boto3.client("bedrock-agent-runtime")

kb_id = "<YOUR_KNOWLEDGE_BASE_ID>"

def retrieveAndGenerate(
    input: str,
    kbId: str,
    region: str = "us-east-1",
    sessionId: str = None,
    model_id: str = "anthropic.claude-v2:1",
):
    model_arn = f"arn:aws:bedrock:{region}::foundation-model/{model_id}"

    if sessionId:
        return bedrock_agent_client.retrieve_and_generate(
            input={"text": input},
            retrieveAndGenerateConfiguration={
                "type": "KNOWLEDGE_BASE",
                "knowledgeBaseConfiguration": {
                    "knowledgeBaseId": kbId,
                    "modelArn": model_arn,
                },
            },
            sessionId=sessionId,
        )

    else:
        return bedrock_agent_client.retrieve_and_generate(
            input={"text": input},
            retrieveAndGenerateConfiguration={
                "type": "KNOWLEDGE_BASE",
                "knowledgeBaseConfiguration": {
                    "knowledgeBaseId": kbId,
                    "modelArn": model_arn,
                },
            },
        )

response = retrieveAndGenerate(
    "What are the potential risks and benefits of participating?", kb_id
)

generated_text = response["output"]["text"]
>>> "The potential risks include side effects from the study medication lithium such as nausea, loose stools, thirst, urination changes, shakiness, headaches, sweating, fatigue, decreased concentration, and skin rash. There is also a risk of lithium interaction with other medications. For women, there is a risk of birth defects if lithium is taken during pregnancy. There are no guaranteed benefits, but possible benefits include new information that could help the participant from the interviews and tests conducted during the study."

Sumber informasi yang dikutip dapat diperoleh melalui kode berikut (dengan beberapa keluaran disunting agar singkatnya):

response["citations"]

>>> [
    {
        "generatedResponsePart": {
            "textResponsePart": {
                "text": " The potential risks include side effects from the study...",
                "span": {"start": 0, "end": 361},
            }
        },
        "retrievedReferences": [
            {
                "content": {
                    "text": "590 ICF#2 Page 7 of 19 The primary risks and discomforts of participationโ€ฆ"
                },
                "location": {"type": "S3", "s3Location": {"uri": "s3://XXXX/XXXX.pdf"}},
            },
            {
                "content": {
                    "text": "N/A CSP 590 ICF#2 Page 10 of 19 Risks associated with suddenly stopping study medications..."
                },
                "location": {"type": "S3", "s3Location": {"uri": "s3://XXXX/XXXX.pdf"}},
            },
        ],
    },
    {
        "generatedResponsePart": {
            "textResponsePart": {
                "text": " There are no guaranteed benefits, but possible benefits include...",
                "span": {"start": 363, "end": 531},
            }
        },
        "retrievedReferences": [
            {
                "content": {
                    "text": "research, not usual clinical care. After these are done we ask..."
                },
                "location": {"type": "S3", "s3Location": {"uri": "s3://XXXX/XXXX.pdf"}},
            }
        ],
    },
]

Dengan meneruskan ID sesi dari RetrieveAndGenerate API, Anda dapat mempertahankan konteks percakapan dan mengajukan pertanyaan lanjutan. Misalnya tanpa konteks, jika Anda menanyakan lebih detail dari jawaban sebelumnya, mungkin tidak bisa menjawab dengan benar:

retrieveAndGenerate("elaborate more on the first side effect", kb_id, sessionId=None)["output"]["text"]
>>> "The search results do not provide additional details about the mild nausea side effect that would allow me to elaborate further on it."

Namun dengan meneruskan ID sesi, pipeline RAG dapat mengidentifikasi konteks yang sesuai dan mengembalikan jawaban yang relevan:

retrieveAndGenerate("elaborate more on the first side effect", kb_id, sessionId=response["sessionId"])["output"]["text"]
>>> "The search results provide details that nausea from taking lithium is usually mild and goes away after days or weeks for most people. Specifically, up to 75% of people may experience mild nausea when first starting lithium, but this goes away in 90-99% of people who continue taking it."

Tabel berikut menunjukkan jawaban yang diambil untuk semua pertanyaan terkait.

Pertanyaan Menjawab
Apa tujuan dari penelitian ini? Pastikan Anda memahami tujuan penelitian dan prosedur penelitian yang diperlukan. Tujuan dari penelitian ini adalah untuk menguji apakah litium efektif dalam mencegah kekerasan bunuh diri berulang yang diarahkan pada pasien dengan depresi atau gangguan bipolar.
Apa risiko dan potensi manfaatnya? Formulir tersebut harus menjelaskan semua risiko, efek samping, atau ketidaknyamanan yang mungkin Anda alami saat berpartisipasi. Risiko atau ketidaknyamanan yang mungkin terjadi antara lain: pertanyaan wawancara yang menyebabkan ketidaknyamanan, efek samping obat lithium seperti mual, mencret, haus, perubahan buang air kecil, gemetar, sakit kepala, berkeringat, kelelahan, penurunan konsentrasi, ruam kulit, perubahan tiroid, jerawat yang semakin parah. /psoriasis, toksisitas litium, dan risiko jika pengobatan tiba-tiba dihentikan. Manfaat potensialnya adalah tes ini dapat memberikan informasi baru untuk membantu peserta, dan litium dapat membantu mencegah berulangnya kekerasan bunuh diri yang diarahkan pada diri sendiri bagi mereka yang menderita depresi atau gangguan bipolar.
Apa saja yang termasuk dalam partisipasi? Dapatkan rincian tentang tes, pengobatan, perubahan gaya hidup, atau prosedur apa yang akan Anda jalani, berapa lama waktu yang dibutuhkan, dan berapa lama penelitian akan berlangsung. Partisipasi akan melibatkan penyelesaian wawancara dan kuesioner yang mencakup pemikiran, perilaku, perawatan kesehatan mental, pengobatan, penggunaan alkohol dan narkoba, dukungan rumah dan sosial, dan pemahaman tentang studi penelitian. Ini memakan waktu sekitar dua jam dan dapat dilakukan dalam beberapa sesi, secara langsung dan melalui telepon. Jika memenuhi syarat untuk studi penuh, akan ada sekitar 20 kunjungan studi selama satu tahun. Hal ini mencakup meminum obat penelitian, memeriksa tanda-tanda vital, mengisi kuesioner, meninjau efek samping, dan melanjutkan perawatan medis dan kesehatan mental yang normal.
Apakah ada biaya atau pembayaran? Tanyakan apakah Anda akan bertanggung jawab atas segala biaya yang berkaitan dengan studi atau mendapatkan bayaran untuk berpartisipasi. Ya, ada biaya dan pembayaran yang dibahas di hasil pencarian. Anda tidak akan dikenakan biaya untuk perawatan atau prosedur apa pun yang merupakan bagian dari penelitian. Namun, Anda masih harus membayar pembayaran tambahan VA untuk perawatan dan pengobatan yang tidak terkait dengan penelitian. Anda tidak akan dibayar untuk berpartisipasi, namun studi ini akan mengganti biaya yang berkaitan dengan partisipasi seperti transportasi, parkir, dll. Jumlah dan proses penggantian disediakan.
Bagaimana privasi saya dilindungi? Formulir tersebut harus menjelaskan bagaimana informasi kesehatan pribadi Anda akan dirahasiakan sebelum, selama, dan setelah persidangan. Privasi Anda akan dilindungi dengan melakukan wawancara secara pribadi, menyimpan catatan tertulis di arsip dan kantor yang terkunci, menyimpan informasi elektronik dalam file terenkripsi dan dilindungi kata sandi, dan memperoleh Sertifikat Kerahasiaan dari Departemen Kesehatan dan Layanan Kemanusiaan untuk mencegah pengungkapan informasi yang mengidentifikasi Anda . Informasi yang mengidentifikasi Anda mungkin dibagikan kepada dokter yang bertanggung jawab atas perawatan Anda atau untuk audit dan evaluasi oleh lembaga pemerintah, namun pembicaraan dan makalah tentang penelitian tersebut tidak akan mengidentifikasi Anda.

Kueri menggunakan Amazon Bedrock Retrieve API

Untuk menyesuaikan alur kerja RAG, Anda dapat menggunakan Retrieve API untuk mengambil potongan yang relevan berdasarkan kueri Anda dan meneruskannya ke LLM mana pun yang disediakan oleh Amazon Bedrock. Untuk menggunakan Retrieve API, definisikan sebagai berikut:

def retrieve(query: str, kbId: str, numberOfResults: int = 5):
    return bedrock_agent_client.retrieve(
        retrievalQuery={"text": query},
        knowledgeBaseId=kbId,
        retrievalConfiguration={
            "vectorSearchConfiguration": {"numberOfResults": numberOfResults}
        },
    )

Ambil konteks yang sesuai (dengan beberapa keluaran disunting agar singkatnya):

query = "What is the purpose of the medical research study?"
response = retrieve(query, kb_id, 3)
retrievalResults = response["retrievalResults"]
>>> [
    {
        "content": {"text": "You will not be charged for any procedures that..."},
        "location": {"type": "S3", "s3Location": {"uri": "s3://XXXXX/XXXX.pdf"}},
        "score": 0.6552521,
    },
    {
        "content": {"text": "and possible benefits of the study. You have been..."},
        "location": {"type": "S3", "s3Location": {"uri": "s3://XXXX/XXXX.pdf"}},
        "score": 0.6581577,
    },
    ...,
]

Ekstrak konteks untuk template prompt:

def get_contexts(retrievalResults):
    contexts = []
    for retrievedResult in retrievalResults:
        contexts.append(retrievedResult["content"]["text"])
    return " ".join(contexts)

contexts = get_contexts(retrievalResults)

Impor modul Python dan siapkan templat prompt menjawab pertanyaan dalam konteks, lalu buat jawaban akhir:

from langchain.prompts import PromptTemplate

PROMPT_TEMPLATE = """
Human: You are an AI system working on medical trial research, and provides answers to questions 
by using fact based and statistical information when possible.
Use the following pieces of information to provide a concise answer to the question enclosed in <question> tags.
If you don't know the answer, just say that you don't know, don't try to make up an answer.

<context>
{context_str}
</context>

<question>
{query_str}
</question>

The response should be specific and use statistics or numbers when possible.

Assistant:"""

claude_prompt = PromptTemplate(
    template=PROMPT_TEMPLATE, input_variables=["context_str", "query_str"]
)

prompt = claude_prompt.format(context_str=contexts, query_str=query)
response = claude_llm(prompt)
>>> "Based on the context provided, the purpose of this medical research study is to evaluate the efficacy of lithium compared to a placebo in preventing suicide over a 1 year period. Specifically, participants will be randomly assigned to receive either lithium or a placebo pill for 1 year, with their doctors and the participants themselves not knowing which treatment they receive (double-blind). Blood lithium levels will be monitored and doses adjusted over the first 6-8 visits, then participants will be followed monthly for 1 year to assess outcomes."

Kueri menggunakan integrasi Amazon Bedrock LangChain

Untuk membuat aplikasi Tanya Jawab yang disesuaikan secara menyeluruh, Basis Pengetahuan untuk Amazon Bedrock menyediakan integrasi dengan LangChain. Untuk menyiapkan pengambilan LangChain, berikan ID basis pengetahuan dan tentukan jumlah hasil yang akan dihasilkan dari kueri:

from langchain.retrievers.bedrock import AmazonKnowledgeBasesRetriever

retriever = AmazonKnowledgeBasesRetriever(
    knowledge_base_id=kb_id,
    retrieval_config={"vectorSearchConfiguration": {"numberOfResults": 4}},
)

Sekarang siapkan LangChain RetrievalQA dan hasilkan jawaban dari basis pengetahuan:

from langchain.chains import RetrievalQA

qa = RetrievalQA.from_chain_type(
    llm=claude_llm,
    chain_type="stuff",
    retriever=retriever,
    return_source_documents=True,
    chain_type_kwargs={"prompt": claude_prompt},
)

[qa(q)["result"] for q in questions]

Ini akan menghasilkan jawaban yang serupa dengan yang tercantum pada tabel sebelumnya.

Membersihkan

Pastikan untuk menghapus sumber daya berikut untuk menghindari dikenakan biaya tambahan:

Kesimpulan

Amazon Bedrock menyediakan serangkaian layanan yang sangat terintegrasi untuk mendukung aplikasi RAG di semua skala, sehingga memudahkan untuk mulai menganalisis data perusahaan Anda. Basis Pengetahuan untuk Amazon Bedrock terintegrasi dengan model fondasi Amazon Bedrock untuk membangun alur penyematan dokumen yang dapat diskalakan dan layanan pengambilan dokumen untuk mendukung berbagai aplikasi internal dan yang berhubungan dengan pelanggan. Kami sangat antusias dengan masa depan, dan masukan Anda akan memainkan peran penting dalam memandu kemajuan produk ini. Untuk mempelajari lebih lanjut tentang kemampuan Amazon Bedrock dan basis pengetahuan, lihat Basis pengetahuan untuk Amazon Bedrock.


Tentang Penulis

Gunakan RAG untuk penemuan obat dengan Basis Pengetahuan untuk Amazon Bedrock | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.Tandai Roy adalah Arsitek Pembelajaran Mesin Utama untuk AWS, membantu pelanggan merancang dan membangun solusi AI/ML. Pekerjaan Mark mencakup berbagai kasus penggunaan ML, dengan minat utama pada visi komputer, pembelajaran mendalam, dan penskalaan ML di seluruh perusahaan. Dia telah membantu perusahaan di banyak industri, termasuk asuransi, jasa keuangan, media dan hiburan, perawatan kesehatan, utilitas, dan manufaktur. Mark memegang enam Sertifikasi AWS, termasuk Sertifikasi Khusus ML. Sebelum bergabung dengan AWS, Mark adalah seorang arsitek, pengembang, dan pemimpin teknologi selama lebih dari 25 tahun, termasuk 19 tahun di bidang layanan keuangan.

Gunakan RAG untuk penemuan obat dengan Basis Pengetahuan untuk Amazon Bedrock | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.Mani Khanuja adalah Pimpinan Teknologi โ€“ Spesialis AI Generatif, penulis buku โ€“ Pembelajaran Mesin Terapan dan Komputasi Kinerja Tinggi di AWS, dan anggota Dewan Direksi Wanita di Dewan Yayasan Pendidikan Manufaktur. Dia memimpin proyek pembelajaran mesin (ML) di berbagai domain seperti visi komputer, pemrosesan bahasa alami, dan AI generatif. Dia membantu pelanggan membangun, melatih, dan menerapkan model pembelajaran mesin besar dalam skala besar. Dia berbicara dalam konferensi internal dan eksternal seperti re:Invent, Women in Manufacturing West, webinar YouTube, dan GHC 23. Di waktu luangnya, dia suka berjalan-jalan di sepanjang pantai.

Gunakan RAG untuk penemuan obat dengan Basis Pengetahuan untuk Amazon Bedrock | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.Dr Baichuan Sun, yang saat ini menjabat sebagai Sr. Arsitek Solusi AI/ML di AWS, berfokus pada AI generatif dan menerapkan pengetahuannya dalam ilmu data dan pembelajaran mesin untuk memberikan solusi bisnis praktis berbasis cloud. Dengan pengalaman dalam konsultasi manajemen dan arsitektur solusi AI, ia mengatasi berbagai tantangan kompleks, antara lain termasuk visi komputer robotika, perkiraan rangkaian waktu, dan pemeliharaan prediktif. Karyanya didasarkan pada latar belakang yang kuat dalam manajemen proyek, penelitian dan pengembangan perangkat lunak, dan kegiatan akademis. Di luar pekerjaan, Dr. Sun menikmati keseimbangan antara bepergian dan menghabiskan waktu bersama keluarga dan teman.

Gunakan RAG untuk penemuan obat dengan Basis Pengetahuan untuk Amazon Bedrock | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.Derrick Choo adalah Arsitek Solusi Senior di AWS yang berfokus pada percepatan perjalanan pelanggan ke cloud dan mentransformasi bisnis mereka melalui penerapan solusi berbasis cloud. Keahliannya adalah dalam aplikasi full stack dan pengembangan pembelajaran mesin. Dia membantu pelanggan merancang dan membangun solusi menyeluruh yang mencakup antarmuka pengguna frontend, aplikasi IoT, integrasi API dan data, serta model pembelajaran mesin. Di waktu luangnya, ia menikmati menghabiskan waktu bersama keluarga dan bereksperimen dengan fotografi dan videografi.

Gunakan RAG untuk penemuan obat dengan Basis Pengetahuan untuk Amazon Bedrock | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.Frank Winkler adalah Arsitek Solusi Senior dan Spesialis AI Generatif di AWS yang berbasis di Singapura, dengan fokus pada Pembelajaran Mesin dan AI Generatif. Dia bekerja dengan perusahaan digital native global untuk merancang produk dan layanan yang skalabel, aman, dan hemat biaya di AWS. Di waktu luangnya, ia menghabiskan waktu bersama putra dan putrinya, serta berwisata menikmati deburan ombak melintasi ASEAN.

Gunakan RAG untuk penemuan obat dengan Basis Pengetahuan untuk Amazon Bedrock | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.Nihir Chadderwala adalah Sr. Arsitek Solusi AI/ML di tim Perawatan Kesehatan dan Ilmu Hayati Global. Keahliannya adalah dalam membangun Big Data dan solusi bertenaga AI untuk permasalahan pelanggan khususnya di bidang biomedis, ilmu hayati, dan perawatan kesehatan. Dia juga tertarik dengan titik temu antara ilmu informasi kuantum dan AI, serta senang belajar dan berkontribusi pada bidang ini. Di waktu luangnya, ia menikmati bermain tenis, jalan-jalan, dan belajar tentang kosmologi.

Stempel Waktu:

Lebih dari Pembelajaran Mesin AWS