ฐานความรู้ใน Amazon Bedrock ช่วยให้การถามคำถามในเอกสารฉบับเดียวง่ายขึ้น | อเมซอนเว็บเซอร์วิส

ฐานความรู้ใน Amazon Bedrock ช่วยให้การถามคำถามในเอกสารฉบับเดียวง่ายขึ้น | อเมซอนเว็บเซอร์วิส

At AWS re:ประดิษฐ์ ในปี 2023 เราได้ประกาศความพร้อมใช้งานทั่วไปของ ฐานความรู้สำหรับ Amazon Bedrock- ด้วยฐานความรู้สำหรับ Amazon Bedrock คุณสามารถเชื่อมต่อโมเดลพื้นฐาน (FM) ได้อย่างปลอดภัย อเมซอน เบดร็อค ไปยังข้อมูลบริษัทของคุณสำหรับรุ่นดึงข้อมูลเสริม (RAG) ที่มีการจัดการเต็มรูปแบบ

ในโพสต์ก่อนหน้านี้ เราได้กล่าวถึงความสามารถใหม่ๆ เช่น การสนับสนุนการค้นหาแบบไฮบริด, การกรองข้อมูลเมตาเพื่อปรับปรุงความแม่นยำในการดึงข้อมูลและวิธีการ ฐานความรู้สำหรับ Amazon Bedrock จัดการเวิร์กโฟลว์ RAG แบบครบวงจร.

วันนี้ เราขอแนะนำความสามารถใหม่ในการแชทกับเอกสารของคุณโดยไม่ต้องตั้งค่าใดๆ ในฐานความรู้สำหรับ Amazon Bedrock ด้วยความสามารถใหม่นี้ คุณสามารถถามคำถามได้อย่างปลอดภัยในเอกสารเดียว โดยไม่ต้องเสียค่าใช้จ่ายในการตั้งค่าฐานข้อมูลเวกเตอร์หรือนำเข้าข้อมูล ทำให้ธุรกิจใช้ข้อมูลองค์กรได้อย่างง่ายดาย คุณจะต้องจัดเตรียมไฟล์ข้อมูลที่เกี่ยวข้องเป็นอินพุตและเลือก FM ของคุณเพื่อเริ่มต้น

แต่ก่อนที่เราจะเจาะลึกรายละเอียดของคุณสมบัตินี้ เรามาเริ่มด้วยพื้นฐานและทำความเข้าใจว่า RAG คืออะไร ประโยชน์ของมัน และความสามารถใหม่นี้ช่วยให้สามารถดึงข้อมูลและสร้างเนื้อหาสำหรับความต้องการชั่วคราวได้อย่างไร

การดึงข้อมูล Augmented Generation คืออะไร?

ผู้ช่วยปัญญาประดิษฐ์ (AI) ที่ขับเคลื่อนโดย FM มีข้อจำกัด เช่น การให้ข้อมูลที่ล้าสมัย หรือการดิ้นรนกับบริบทภายนอกข้อมูลการฝึกอบรม RAG แก้ไขปัญหาเหล่านี้โดยอนุญาตให้ FM อ้างอิงแหล่งความรู้ที่เชื่อถือได้ก่อนที่จะสร้างคำตอบ

ด้วย RAG เมื่อผู้ใช้ถามคำถาม ระบบจะดึงบริบทที่เกี่ยวข้องจากฐานความรู้ที่รวบรวมไว้ เช่น เอกสารของบริษัท โดยจะให้บริบทนี้แก่ FM ซึ่งจะใช้เพื่อสร้างการตอบสนองที่มีข้อมูลครบถ้วนและแม่นยำยิ่งขึ้น RAG ช่วยเอาชนะข้อจำกัด FM ด้วยการเพิ่มขีดความสามารถด้วยความรู้ที่เป็นกรรมสิทธิ์ขององค์กร ช่วยให้แชทบอทและผู้ช่วย AI สามารถให้ข้อมูลที่ทันสมัยและเฉพาะบริบทซึ่งปรับให้เหมาะกับความต้องการทางธุรกิจ โดยไม่ต้องฝึกอบรม FM ทั้งหมดใหม่ ที่ AWS เราตระหนักถึงศักยภาพของ RAG และได้ดำเนินการเพื่อลดความซับซ้อนของการนำไปใช้ผ่านฐานความรู้สำหรับ Amazon Bedrock โดยมอบประสบการณ์ RAG ที่มีการจัดการเต็มรูปแบบ

ความต้องการข้อมูลระยะสั้นและเร่งด่วน

แม้ว่าฐานความรู้จะช่วยยกภาระหนักทั้งหมดและทำหน้าที่เป็นแหล่งเก็บความรู้ระดับองค์กรขนาดใหญ่อย่างต่อเนื่อง แต่คุณอาจต้องเข้าถึงข้อมูลชั่วคราวสำหรับงานเฉพาะหรือการวิเคราะห์ภายในเซสชันผู้ใช้ที่แยกออกมา วิธี RAG แบบเดิมไม่ได้รับการปรับให้เหมาะสมสำหรับสถานการณ์การเข้าถึงข้อมูลตามเซสชันในระยะสั้น

ธุรกิจต้องเสียค่าใช้จ่ายสำหรับการจัดเก็บและการจัดการข้อมูล สิ่งนี้อาจทำให้ RAG คุ้มค่าน้อยลงสำหรับองค์กรที่มีความต้องการข้อมูลแบบไดนามิกหรือชั่วคราวสูง โดยเฉพาะอย่างยิ่งเมื่อข้อมูลจำเป็นสำหรับงานหรือการวิเคราะห์เฉพาะเจาะจงเท่านั้น

ถามคำถามในเอกสารฉบับเดียวโดยไม่ต้องตั้งค่าใดๆ

ความสามารถใหม่นี้ในการแชทกับเอกสารของคุณภายในฐานความรู้สำหรับ Amazon Bedrock จัดการกับความท้าทายที่กล่าวมาข้างต้น โดยมีวิธีการตั้งค่าเป็นศูนย์เพื่อใช้เอกสารฉบับเดียวของคุณสำหรับการดึงเนื้อหาและงานที่เกี่ยวข้องกับการสร้าง พร้อมด้วย FM ที่ Amazon Bedrock มอบให้ ด้วยความสามารถใหม่นี้ คุณสามารถถามคำถามเกี่ยวกับข้อมูลของคุณได้โดยไม่ต้องเสียค่าใช้จ่ายในการตั้งค่าฐานข้อมูลเวกเตอร์หรือนำเข้าข้อมูล ทำให้ใช้ข้อมูลองค์กรของคุณได้อย่างง่ายดาย

ตอนนี้คุณสามารถโต้ตอบกับเอกสารของคุณแบบเรียลไทม์โดยไม่ต้องนำเข้าข้อมูลหรือกำหนดค่าฐานข้อมูลล่วงหน้า คุณไม่จำเป็นต้องทำตามขั้นตอนความพร้อมของข้อมูลเพิ่มเติมก่อนที่จะสืบค้นข้อมูล

วิธีการตั้งค่าแบบศูนย์นี้ทำให้การใช้แอสเซทข้อมูลองค์กรของคุณกับ AI เชิงสร้างสรรค์โดยใช้ Amazon Bedrock เป็นเรื่องง่าย

กรณีการใช้งานและคุณประโยชน์

พิจารณาบริษัทจัดหางานที่ต้องวิเคราะห์เรซูเม่และจับคู่ผู้สมัครกับโอกาสในการทำงานที่เหมาะสมโดยพิจารณาจากประสบการณ์และทักษะของพวกเขา ก่อนหน้านี้ คุณจะต้องตั้งค่าฐานความรู้ โดยเรียกใช้เวิร์กโฟลว์การนำเข้าข้อมูลเพื่อให้แน่ใจว่ามีเพียงผู้สรรหาที่ได้รับอนุญาตเท่านั้นที่สามารถเข้าถึงข้อมูลได้ นอกจากนี้ คุณจะต้องจัดการการล้างข้อมูลเมื่อไม่จำเป็นต้องใช้ข้อมูลสำหรับเซสชันหรือผู้สมัครอีกต่อไป ในท้ายที่สุด คุณจะต้องจ่ายเงินสำหรับการจัดเก็บและการจัดการฐานข้อมูลเวกเตอร์มากกว่าการใช้งาน FM จริง คุณสมบัติใหม่ในฐานความรู้สำหรับ Amazon Bedrock ช่วยให้ผู้สรรหาสามารถวิเคราะห์เรซูเม่ได้อย่างรวดเร็วและชั่วคราว และจับคู่ผู้สมัครกับโอกาสในการทำงานที่เหมาะสมตามประสบการณ์และชุดทักษะของผู้สมัคร

อีกตัวอย่างหนึ่ง ให้พิจารณาผู้จัดการผลิตภัณฑ์ของบริษัทเทคโนโลยีที่ต้องการวิเคราะห์คำติชมของลูกค้าอย่างรวดเร็วและตั๋วสนับสนุนเพื่อระบุปัญหาทั่วไปและพื้นที่ที่ต้องปรับปรุง ด้วยความสามารถใหม่นี้ คุณสามารถอัปโหลดเอกสารเพื่อดึงข้อมูลเชิงลึกได้ในเวลาอันรวดเร็ว ตัวอย่างเช่น คุณอาจถามว่า "ข้อกำหนดสำหรับแอปบนอุปกรณ์เคลื่อนที่มีอะไรบ้าง" หรือ “ปัญหาทั่วไปที่ลูกค้ากล่าวถึงเกี่ยวกับกระบวนการเริ่มต้นใช้งานของเราคืออะไร” คุณลักษณะนี้ช่วยให้คุณสามารถสังเคราะห์ข้อมูลนี้ได้อย่างรวดเร็วโดยไม่ต้องยุ่งยากในการเตรียมข้อมูลหรือค่าใช้จ่ายในการจัดการใดๆ คุณยังสามารถขอสรุปหรือประเด็นสำคัญได้ เช่น “อะไรคือประเด็นสำคัญจากเอกสารข้อกำหนดนี้”

ประโยชน์ของคุณสมบัตินี้มีมากกว่าการประหยัดต้นทุนและประสิทธิภาพการดำเนินงาน ด้วยการขจัดความจำเป็นในการใช้ฐานข้อมูลเวกเตอร์และการนำเข้าข้อมูล ความสามารถใหม่นี้ภายในฐานความรู้สำหรับ Amazon Bedrock ช่วยรักษาความปลอดภัยข้อมูลที่เป็นกรรมสิทธิ์ของคุณ ทำให้สามารถเข้าถึงได้เฉพาะในบริบทของเซสชันผู้ใช้ที่แยกออกมาเท่านั้น

ตอนนี้เราได้กล่าวถึงคุณประโยชน์ของคุณสมบัติและกรณีการใช้งานที่เปิดใช้งานแล้ว มาดูวิธีที่คุณสามารถเริ่มใช้คุณสมบัติใหม่นี้จากฐานความรู้สำหรับ Amazon Bedrock กันดีกว่า

สนทนากับเอกสารของคุณในฐานความรู้สำหรับ Amazon Bedrock

คุณมีตัวเลือกมากมายในการเริ่มใช้คุณสมบัตินี้:

  • คอนโซล Amazon Bedrock
  • ฐานหินอเมซอน RetrieveAndGenerate เอพีไอ (SDK)

มาดูกันว่าเราจะเริ่มต้นใช้งานคอนโซล Amazon Bedrock ได้อย่างไร:

  1. บนคอนโซล Amazon Bedrock ด้านล่าง orchestration ในบานหน้าต่างนำทาง ให้เลือก ฐานความรู้.
  2. Choose สนทนากับเอกสารของคุณ.
    Knowledge Bases in Amazon Bedrock now simplifies asking questions on a single document | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  3. ภายใต้ รุ่นเลือก เลือกรุ่น.
    Knowledge Bases in Amazon Bedrock now simplifies asking questions on a single document | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  4. เลือกรุ่นของคุณ สำหรับตัวอย่างนี้ เราใช้โมเดล Claude 3 Sonnet (เรารองรับเฉพาะ Sonnet ณ เวลาที่เปิดตัวเท่านั้น)
  5. Choose ใช้.
    Knowledge Bases in Amazon Bedrock now simplifies asking questions on a single document | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  6. ภายใต้ ข้อมูลคุณสามารถอัพโหลดเอกสารที่คุณต้องการสนทนาด้วยหรือชี้ไปที่ บริการจัดเก็บข้อมูลอย่างง่ายของ Amazon ตำแหน่งบัคเก็ต (Amazon S3) ที่มีไฟล์ของคุณ สำหรับโพสต์นี้ เราอัปโหลดเอกสารจากคอมพิวเตอร์ของเรา

รูปแบบไฟล์ที่รองรับ ได้แก่ PDF, MD (Markdown), TXT, DOCX, HTML, CSV, XLS และ XLSX กำหนดขนาดไฟล์ไม่เกิน 10 MB และมีโทเค็นไม่เกิน 20,000 รายการ ก โทเค็น ถือเป็นหน่วยของข้อความ เช่น คำ คำย่อย ตัวเลข หรือสัญลักษณ์ ที่ถูกประมวลผลเป็นเอนทิตีเดียว เนื่องจากขีดจำกัดโทเค็นการนำเข้าที่กำหนดไว้ล่วงหน้า ขอแนะนำให้ใช้ไฟล์ที่มีขนาดไม่เกิน 10MB อย่างไรก็ตาม ไฟล์ที่มีข้อความจำนวนมากซึ่งมีขนาดเล็กกว่า 10MB มาก อาจละเมิดขีดจำกัดโทเค็นได้

Knowledge Bases in Amazon Bedrock now simplifies asking questions on a single document | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

ตอนนี้คุณพร้อมที่จะสนทนากับเอกสารของคุณแล้ว

Knowledge Bases in Amazon Bedrock now simplifies asking questions on a single document | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

ดังที่แสดงในภาพหน้าจอต่อไปนี้ คุณสามารถสนทนากับเอกสารของคุณได้แบบเรียลไทม์

Knowledge Bases in Amazon Bedrock now simplifies asking questions on a single document | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

หากต้องการปรับแต่งพรอมต์ของคุณ ให้ป้อนพรอมต์ของคุณด้านล่าง System รวดเร็ว.

Knowledge Bases in Amazon Bedrock now simplifies asking questions on a single document | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

ในทำนองเดียวกัน คุณสามารถใช้ AWS SDK ผ่านทาง retrieve_and_generate API ในภาษาการเข้ารหัสหลัก ในตัวอย่างต่อไปนี้ เราใช้ AWS SDK สำหรับ Python (Boto3):

import boto3

bedrock_client = boto3.client(service_name='bedrock-agent-runtime')
model_id = "your_model_id_here"    # Replace with your modelID
document_uri = "your_s3_uri_here"  # Replace with your S3 URI

def retrieveAndGenerate(input_text, sourceType, model_id, document_s3_uri=None, data=None):
    region = 'us-west-2'  
    model_arn = f'arn:aws:bedrock:{region}::foundation-model/{model_id}'

    if sourceType == "S3":
        return bedrock_client.retrieve_and_generate(
            input={'text': input_text},
            retrieveAndGenerateConfiguration={
                'type': 'EXTERNAL_SOURCES',
                'externalSourcesConfiguration': {
                    'modelArn': model_arn,
                    'sources': [
                        {
                            "sourceType": sourceType,
                            "s3Location": {
                                "uri": document_s3_uri  
                            }
                        }
                    ]
                }
            }
        )
        
    else:
        return bedrock_client.retrieve_and_generate(
            input={'text': input_text},
            retrieveAndGenerateConfiguration={
                'type': 'EXTERNAL_SOURCES',
                'externalSourcesConfiguration': {
                    'modelArn': model_arn,
                    'sources': [
                        {
                            "sourceType": sourceType,
                            "byteContent": {
                                "identifier": "testFile.txt",
                                "contentType": "text/plain",
                                "data": data  
                            }
                        }
                    ]
                }
            }
        )

response = retrieveAndGenerate(
                                input_text="What is the main topic of this document?",
                                sourceType="S3", 
                                model_id=model_id,
                                document_s3_uri=document_uri
                              )
                    
print(response['output']['text'])

สรุป

ในโพสต์นี้ เราได้กล่าวถึงวิธีที่ฐานความรู้สำหรับ Amazon Bedrock ช่วยให้การถามคำถามในเอกสารฉบับเดียวง่ายขึ้นได้อย่างไร เราได้สำรวจแนวคิดหลักเบื้องหลัง RAG ความท้าทายในฟีเจอร์ใหม่นี้ และกรณีการใช้งานต่างๆ ที่เกิดขึ้นในบทบาทและอุตสาหกรรมที่แตกต่างกัน นอกจากนี้เรายังสาธิตวิธีกำหนดค่าและใช้ความสามารถนี้ผ่านคอนโซล Amazon Bedrock และ AWS SDK ซึ่งแสดงให้เห็นถึงความเรียบง่ายและความยืดหยุ่นของคุณสมบัตินี้ ซึ่งมอบโซลูชันที่ไม่ต้องตั้งค่าใดๆ เพื่อรวบรวมข้อมูลจากเอกสารเดียว โดยไม่ต้องตั้งค่าฐานข้อมูลเวกเตอร์ .

หากต้องการสำรวจความสามารถของฐานความรู้เพิ่มเติมสำหรับ Amazon Bedrock โปรดดูแหล่งข้อมูลต่อไปนี้:

แบ่งปันและเรียนรู้กับชุมชน AI สร้างสรรค์ของเราที่ community.aws.


เกี่ยวกับผู้แต่ง

Knowledge Bases in Amazon Bedrock now simplifies asking questions on a single document | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.
สุมาน เด็บนาถ เป็นผู้สนับสนุนหลักของนักพัฒนาสำหรับ Machine Learning ที่ Amazon Web Services เขามักจะพูดในการประชุม AI/ML กิจกรรม และการพบปะทั่วโลก เขามีความหลงใหลในระบบแบบกระจายขนาดใหญ่ และเป็นแฟนตัวยงของ Python

Knowledge Bases in Amazon Bedrock now simplifies asking questions on a single document | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.
เซบาสเตียน มูเนรา เป็นวิศวกรซอฟต์แวร์ในทีมฐานความรู้ Amazon Bedrock ที่ AWS ซึ่งเขามุ่งเน้นที่การสร้างโซลูชันสำหรับลูกค้าที่ใช้ประโยชน์จากแอปพลิเคชัน Generative AI และ RAG ก่อนหน้านี้เขาเคยทำงานเกี่ยวกับการสร้างโซลูชันที่ใช้ Generative AI สำหรับลูกค้าเพื่อปรับปรุงกระบวนการและแอปพลิเคชันที่ใช้โค้ดน้อย/ไม่มีโค้ด ในเวลาว่าง เขาสนุกกับการวิ่ง ยกของ และซ่อมแซมด้วยเทคโนโลยี

ประทับเวลา:

เพิ่มเติมจาก AWS Machine Learning AWS