กำเนิด AI โมเดลมีศักยภาพในการปฏิวัติการดำเนินงานขององค์กร แต่ธุรกิจต่างๆ จะต้องพิจารณาอย่างรอบคอบถึงวิธีควบคุมพลังของตนในขณะที่เอาชนะความท้าทาย เช่น การปกป้องข้อมูล และการรับรองคุณภาพของเนื้อหาที่สร้างโดย AI
เฟรมเวิร์กการดึงข้อมูล-Augmented Generation (RAG) เสริมพร้อมท์ด้วยข้อมูลภายนอกจากหลายแหล่ง เช่น ที่เก็บเอกสาร ฐานข้อมูล หรือ API เพื่อทำให้โมเดลพื้นฐานมีประสิทธิภาพสำหรับงานเฉพาะโดเมน โพสต์นี้นำเสนอความสามารถของโมเดล RAG และเน้นย้ำถึงศักยภาพในการเปลี่ยนแปลงของ MongoDB Atlas ด้วยคุณสมบัติ Vector Search
แผนที่ MongoDB คือชุดบริการข้อมูลแบบครบวงจรที่ช่วยเร่งและลดความซับซ้อนในการพัฒนาแอปพลิเคชันที่ขับเคลื่อนด้วยข้อมูล ที่เก็บข้อมูลเวกเตอร์สามารถผสานรวมกับพื้นที่จัดเก็บข้อมูลการปฏิบัติงานได้อย่างลงตัว โดยไม่จำเป็นต้องใช้ฐานข้อมูลแยกต่างหาก การบูรณาการนี้ช่วยให้สามารถค้นหาความหมายผ่านความหมายที่มีประสิทธิภาพได้ ค้นหาเวกเตอร์ซึ่งเป็นวิธีที่รวดเร็วในการสร้างการค้นหาเชิงความหมายและแอปพลิเคชันที่ขับเคลื่อนด้วย AI
อเมซอน SageMaker ช่วยให้องค์กรต่างๆ สร้าง ฝึกอบรม และปรับใช้โมเดลการเรียนรู้ของเครื่อง (ML) Amazon SageMaker JumpStart จัดเตรียมโมเดลและข้อมูลที่ได้รับการฝึกอบรมล่วงหน้าเพื่อช่วยให้คุณเริ่มต้นใช้งาน ML คุณสามารถเข้าถึง ปรับแต่ง และปรับใช้โมเดลและข้อมูลที่ได้รับการฝึกอบรมล่วงหน้าผ่านทางหน้า Landing Page ของ SageMaker JumpStart สตูดิโอ Amazon SageMaker เพียงไม่กี่คลิก
อเมซอน เล็กซ์ เป็นอินเทอร์เฟซการสนทนาที่ช่วยให้ธุรกิจสร้างแชทบอทและบอทเสียงที่มีการโต้ตอบที่เป็นธรรมชาติและสมจริง ด้วยการผสานรวม Amazon Lex เข้ากับ Generative AI ธุรกิจจะสามารถสร้างระบบนิเวศแบบองค์รวมที่ข้อมูลที่ผู้ใช้เปลี่ยนไปสู่การตอบสนองที่สอดคล้องกันและเกี่ยวข้องกับบริบทได้อย่างราบรื่น
ภาพรวมโซลูชัน
ไดอะแกรมต่อไปนี้แสดงสถาปัตยกรรมโซลูชัน
ในส่วนต่อไปนี้ เราจะอธิบายขั้นตอนต่างๆ เพื่อนำโซลูชันนี้ไปใช้และส่วนประกอบต่างๆ
ตั้งค่าคลัสเตอร์ MongoDB
หากต้องการสร้างคลัสเตอร์ MongoDB Atlas ระดับฟรี ให้ทำตามคำแนะนำใน สร้างคลัสเตอร์. ตั้งค่าฐานข้อมูล เข้า และเครือข่าย เข้า.
ปรับใช้โมเดลการฝัง SageMaker
คุณสามารถเลือกรูปแบบการฝัง (ALL MiniLM L6 v2) บน โมเดล SageMaker JumpStart โน้ตบุ๊ก โซลูชัน หน้า.
Choose ปรับใช้ เพื่อปรับใช้โมเดล
ตรวจสอบว่าโมเดลปรับใช้ได้สำเร็จ และตรวจสอบปลายทางที่ถูกสร้างขึ้น
การฝังเวกเตอร์
การฝังเวกเตอร์ เป็นกระบวนการแปลงข้อความหรือรูปภาพให้เป็นการแสดงเวกเตอร์ ด้วยโค้ดต่อไปนี้ เราสามารถสร้างการฝังเวกเตอร์ด้วย SageMaker JumpStart และอัปเดตคอลเลกชันด้วยเวกเตอร์ที่สร้างขึ้นสำหรับทุกเอกสาร:
payload = {"text_inputs": [document[field_name_to_be_vectorized]]}
query_response = query_endpoint_with_json_payload(json.dumps(payload).encode('utf-8'))
embeddings = parse_response_multiple_texts(query_response) # update the document
update = {'$set': {vector_field_name : embeddings[0]}}
collection.update_one(query, update)
โค้ดด้านบนแสดงวิธีอัปเดตออบเจ็กต์เดี่ยวในคอลเลกชัน หากต้องการอัปเดตวัตถุทั้งหมดให้ปฏิบัติตาม คำแนะนำการใช้.
ที่เก็บข้อมูลเวกเตอร์ MongoDB
การค้นหาเวกเตอร์ MongoDB Atlas เป็นคุณสมบัติใหม่ที่ช่วยให้คุณจัดเก็บและค้นหาข้อมูลเวกเตอร์ใน MongoDB ข้อมูลเวกเตอร์เป็นข้อมูลประเภทหนึ่งที่แสดงถึงจุดในพื้นที่มิติสูง ข้อมูลประเภทนี้มักใช้ในแอปพลิเคชัน ML และปัญญาประดิษฐ์ MongoDB Atlas Vector Search ใช้เทคนิคที่เรียกว่า k-เพื่อนบ้านที่ใกล้ที่สุด (k-NN) เพื่อค้นหาเวกเตอร์ที่คล้ายกัน k-NN ทำงานโดยการค้นหา k เวกเตอร์ที่คล้ายกันมากที่สุดกับเวกเตอร์ที่กำหนด เวกเตอร์ที่คล้ายกันมากที่สุดคือเวกเตอร์ที่อยู่ใกล้กับเวกเตอร์ที่กำหนดมากที่สุดในแง่ของระยะทางแบบยุคลิด
การจัดเก็บข้อมูลเวกเตอร์ถัดจากข้อมูลการปฏิบัติงานสามารถปรับปรุงประสิทธิภาพได้โดยการลดความจำเป็นในการย้ายข้อมูลระหว่างระบบจัดเก็บข้อมูลที่แตกต่างกัน สิ่งนี้เป็นประโยชน์อย่างยิ่งสำหรับแอปพลิเคชันที่ต้องการการเข้าถึงข้อมูลเวกเตอร์แบบเรียลไทม์
สร้างดัชนีการค้นหาเวกเตอร์
ขั้นตอนต่อไปคือการสร้าง ดัชนีการค้นหาเวกเตอร์ MongoDB บนสนามเวกเตอร์ที่คุณสร้างขึ้นในขั้นตอนก่อนหน้า MongoDB ใช้ knnVector
พิมพ์เพื่อสร้างดัชนีการฝังเวกเตอร์ ฟิลด์เวกเตอร์ควรแสดงเป็นอาร์เรย์ของตัวเลข (BSON int32, int64 หรือประเภทข้อมูลคู่เท่านั้น)
เอ่ยถึง ตรวจสอบข้อจำกัดประเภท knnVector สำหรับข้อมูลเพิ่มเติมเกี่ยวกับข้อจำกัดของ knnVector
ชนิด
รหัสต่อไปนี้คือคำจำกัดความของดัชนีตัวอย่าง:
{ "mappings": { "dynamic": true, "fields": { "egVector": { "dimensions": 384, "similarity": "euclidean", "type": "knnVector" } } }
}
โปรดทราบว่ามิติข้อมูลจะต้องตรงกับมิติโมเดลการฝังของคุณ
ค้นหาที่เก็บข้อมูลเวกเตอร์
คุณสามารถสืบค้นที่เก็บข้อมูลเวกเตอร์ได้โดยใช้ ท่อรวมการค้นหาเวกเตอร์. โดยจะใช้ดัชนี Vector Search และดำเนินการ การค้นหาความหมาย บนแหล่งเก็บข้อมูลเวกเตอร์
รหัสต่อไปนี้คือคำจำกัดความการค้นหาตัวอย่าง:
{ $search: { "index": "<index name>", // optional, defaults to "default" "knnBeta": { "vector": [<array-of-numbers>], "path": "<field-to-search>", "filter": {<filter-specification>}, "k": <number>, "score": {<options>} } }
}
ปรับใช้โมเดลภาษาขนาดใหญ่ของ SageMaker
โมเดลพื้นฐานของ SageMaker JumpStart คือโมเดลภาษาขนาดใหญ่ (LLM) ที่ได้รับการฝึกอบรมล่วงหน้า ซึ่งใช้ในการแก้ปัญหางานการประมวลผลภาษาธรรมชาติ (NLP) ต่างๆ เช่น การสรุปข้อความ การตอบคำถาม และการอนุมานภาษาธรรมชาติ มีให้เลือกหลายขนาดและหลายรูปแบบ ในโซลูชันนี้ เราใช้ กอดหน้า รุ่น FLAN-T5-XL
ค้นหารุ่น FLAN-T5-XL ใน SageMaker JumpStart
Choose ปรับใช้ เพื่อตั้งค่ารุ่น FLAN-T5-XL
ตรวจสอบว่าโมเดลปรับใช้ได้สำเร็จและปลายทางทำงานอยู่
สร้างบอท Amazon Lex
หากต้องการสร้างบอต Amazon Lex ให้ทำตามขั้นตอนต่อไปนี้:
- บนคอนโซล Amazon Lex ให้เลือก สร้างบอท.
- สำหรับ ชื่อบอท, ป้อนชื่อ
- สำหรับ บทบาทรันไทม์ให้เลือก สร้างบทบาทด้วยการอนุญาตพื้นฐานของ Amazon Lex.
- ระบุการตั้งค่าภาษาของคุณ จากนั้นเลือก เสร็จสิ้น.
- เพิ่มตัวอย่างคำพูดใน
NewIntent
UI และเลือก บันทึกความตั้งใจ. - ไปที่
FallbackIntent
ที่สร้างขึ้นสำหรับคุณโดยค่าเริ่มต้นและสลับ ใช้งาน ใน การบรรลุเป้าหมาย มาตรา. - Choose สร้าง และหลังจากสร้างสำเร็จแล้ว ให้เลือก ทดสอบ.
- ก่อนการทดสอบ ให้เลือกไอคอนรูปเฟือง
- ระบุ AWS แลมบ์ดา ฟังก์ชั่นที่จะโต้ตอบกับ MongoDB Atlas และ LLM เพื่อให้การตอบกลับ หากต้องการสร้างฟังก์ชันแลมบ์ดาให้ปฏิบัติตาม ขั้นตอนเหล่านี้.
- ตอนนี้คุณสามารถโต้ตอบกับ LLM ได้แล้ว
ทำความสะอาด
ในการทำความสะอาดทรัพยากรของคุณ ให้ทำตามขั้นตอนต่อไปนี้:
- ลบบอท Amazon Lex
- ลบฟังก์ชันแลมบ์ดา
- ลบตำแหน่งข้อมูล LLM SageMaker
- ลบจุดสิ้นสุด SageMaker ของโมเดลการฝัง
- ลบคลัสเตอร์ MongoDB Atlas
สรุป
ในโพสต์ เราได้แสดงวิธีสร้างบอทง่ายๆ ที่ใช้การค้นหาเชิงความหมาย MongoDB Atlas และผสานรวมกับโมเดลจาก SageMaker JumpStart บอทนี้ช่วยให้คุณสร้างต้นแบบการโต้ตอบของผู้ใช้กับ LLM ต่างๆ ได้อย่างรวดเร็วใน SageMaker Jumpstart ในขณะที่จับคู่กับบริบทที่มีต้นกำเนิดใน MongoDB Atlas
และเช่นเคย AWS ยินดีรับฟังความคิดเห็น กรุณาแสดงความคิดเห็นและคำถามของคุณในส่วนความคิดเห็น
เกี่ยวกับผู้แต่ง
อิกอร์ อเล็กเซเยฟ เป็น Senior Partner Solution Architect ที่ AWS ในโดเมน Data and Analytics ในบทบาทของเขา Igor กำลังทำงานร่วมกับพันธมิตรเชิงกลยุทธ์ที่ช่วยสร้างสถาปัตยกรรมที่ซับซ้อนและปรับแต่ง AWS ก่อนเข้าร่วม AWS ในฐานะ Data/Solution Architect เขาได้ดำเนินการหลายโครงการในโดเมน Big Data รวมถึง Data Lake หลายแห่งในระบบนิเวศ Hadoop ในฐานะวิศวกรข้อมูล เขามีส่วนร่วมในการใช้ AI/ML เพื่อตรวจจับการฉ้อโกงและระบบอัตโนมัติในสำนักงาน
บาบู ศรีนิวาสัน เป็น Senior Partner Solutions Architect ที่ MongoDB ในบทบาทปัจจุบัน เขากำลังทำงานร่วมกับ AWS เพื่อสร้างการผสานรวมทางเทคนิคและสถาปัตยกรรมอ้างอิงสำหรับโซลูชัน AWS และ MongoDB เขามีประสบการณ์มากกว่าสองทศวรรษในด้านเทคโนโลยีฐานข้อมูลและคลาวด์ เขามีความกระตือรือร้นในการให้บริการโซลูชันทางเทคนิคแก่ลูกค้าที่ทำงานร่วมกับ Global System Integrators (GSI) หลายรายในหลากหลายภูมิภาค
- เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
- PlatoData.Network Vertical Generative Ai เพิ่มพลังให้กับตัวเอง เข้าถึงได้ที่นี่.
- เพลโตไอสตรีม. Web3 อัจฉริยะ ขยายความรู้ เข้าถึงได้ที่นี่.
- เพลโตESG. คาร์บอน, คลีนเทค, พลังงาน, สิ่งแวดล้อม แสงอาทิตย์, การจัดการของเสีย. เข้าถึงได้ที่นี่.
- เพลโตสุขภาพ เทคโนโลยีชีวภาพและข่าวกรองการทดลองทางคลินิก เข้าถึงได้ที่นี่.
- ที่มา: https://aws.amazon.com/blogs/machine-learning/retrieval-augmented-generation-with-langchain-amazon-sagemaker-jumpstart-and-mongodb-atlas-semantic-search/
- :มี
- :เป็น
- :ที่ไหน
- $ ขึ้น
- 100
- 200
- 321
- 361
- 7
- 9
- a
- เกี่ยวกับเรา
- ข้างบน
- เร่งความเร็ว
- เข้า
- ข้าม
- คล่องแคล่ว
- หลังจาก
- การรวมตัว
- AI
- ขับเคลื่อนด้วย AI
- AI / ML
- ทั้งหมด
- ช่วยให้
- เสมอ
- อเมซอน
- อเมซอน เล็กซ์
- อเมซอน SageMaker
- Amazon SageMaker JumpStart
- Amazon Web Services
- an
- การวิเคราะห์
- และ
- APIs
- การใช้งาน
- การประยุกต์ใช้
- สถาปัตยกรรม
- เป็น
- แถว
- เทียม
- ปัญญาประดิษฐ์
- AS
- At
- การเพิ่ม
- อัตโนมัติ
- ใช้ได้
- AWS
- AWS แลมบ์ดา
- ขั้นพื้นฐาน
- BE
- เป็นประโยชน์
- ระหว่าง
- ใหญ่
- ข้อมูลขนาดใหญ่
- ธ ปท
- บอท
- สร้าง
- ธุรกิจ
- แต่
- by
- ที่เรียกว่า
- CAN
- ความสามารถในการ
- รอบคอบ
- ความท้าทาย
- chatbots
- Choose
- ปลาเดยส์
- เมฆ
- Cluster
- รหัส
- สอดคล้องกัน
- ชุด
- ความคิดเห็น
- สมบูรณ์
- ซับซ้อน
- ส่วนประกอบ
- พิจารณา
- ปลอบใจ
- เนื้อหา
- สิ่งแวดล้อม
- การสนทนา
- การแปลง
- สร้าง
- ที่สร้างขึ้น
- ปัจจุบัน
- ลูกค้า
- ปรับแต่ง
- ข้อมูล
- การจัดเก็บข้อมูล
- ที่ขับเคลื่อนด้วยข้อมูล
- ฐานข้อมูล
- ฐานข้อมูล
- ทศวรรษที่ผ่านมา
- ค่าเริ่มต้น
- ค่าเริ่มต้น
- คำนิยาม
- ปรับใช้
- นำไปใช้
- การตรวจพบ
- พัฒนาการ
- ต่าง
- Dimension
- มิติ
- ระยะทาง
- เอกสาร
- โดเมน
- สอง
- พลวัต
- ระบบนิเวศ
- มีประสิทธิภาพ
- การกำจัด
- การฝัง
- ช่วยให้
- ปลายทาง
- ว่าจ้าง
- วิศวกร
- การสร้างความมั่นใจ
- เข้าสู่
- Enterprise
- ผู้ประกอบการ
- โดยเฉพาะอย่างยิ่ง
- ทุกๆ
- ประสบการณ์
- ภายนอก
- FAST
- ลักษณะ
- ข้อเสนอแนะ
- สองสาม
- สนาม
- สาขา
- กรอง
- หา
- ปฏิบัติตาม
- ดังต่อไปนี้
- สำหรับ
- รากฐาน
- กรอบ
- การหลอกลวง
- การตรวจจับการฉ้อโกง
- ฟรี
- ราคาเริ่มต้นที่
- ฟังก์ชัน
- เกียร์
- สร้าง
- รุ่น
- กำเนิด
- กำเนิด AI
- ภูมิศาสตร์
- ได้รับ
- กำหนด
- เหตุการณ์ที่
- เทียม
- มี
- he
- ช่วย
- การช่วยเหลือ
- จะช่วยให้
- ไฮไลท์
- ของเขา
- แบบองค์รวม
- สรุป ความน่าเชื่อถือของ Olymp Trade?
- ทำอย่างไร
- HTML
- ที่ http
- HTTPS
- ICON
- แสดงให้เห็นถึง
- ภาพ
- การดำเนินการ
- การดำเนินการ
- ปรับปรุง
- in
- รวมทั้ง
- ดัชนี
- ข้อมูล
- อินพุต
- คำแนะนำการใช้
- แบบบูรณาการ
- รวม
- การบูรณาการ
- บูรณาการ
- การผสานรวม
- Intelligence
- โต้ตอบ
- ปฏิสัมพันธ์
- ปฏิสัมพันธ์
- อินเตอร์เฟซ
- เข้าไป
- ร่วมมือ
- IT
- ITS
- การร่วม
- JSON
- เพียงแค่
- ชล
- เชื่อมโยงไปถึง
- ภาษา
- ใหญ่
- การเรียนรู้
- ทิ้ง
- เหมือนจริง
- ข้อ จำกัด
- LLM
- เครื่อง
- เรียนรู้เครื่อง
- ทำ
- หลาย
- การจับคู่
- ML
- แบบ
- โมเดล
- MongoDB
- ข้อมูลเพิ่มเติม
- มากที่สุด
- ย้าย
- หลาย
- ต้อง
- ชื่อ
- โดยธรรมชาติ
- ประมวลผลภาษาธรรมชาติ
- จำเป็นต้อง
- เครือข่าย
- ใหม่
- ถัดไป
- NLP
- ตอนนี้
- ตัวเลข
- วัตถุ
- วัตถุ
- of
- Office
- มักจะ
- on
- คน
- เพียง
- การดำเนินงาน
- การดำเนินการ
- or
- มีต้นกำเนิด
- การเอาชนะ
- ภาพรวม
- หน้า
- การจับคู่
- หุ้นส่วน
- พาร์ทเนอร์
- หลงใหล
- เส้นทาง
- การปฏิบัติ
- ดำเนินการ
- เพลโต
- เพลโตดาต้าอินเทลลิเจนซ์
- เพลโตดาต้า
- กรุณา
- จุด
- โพสต์
- ที่มีศักยภาพ
- อำนาจ
- ที่มีประสิทธิภาพ
- นำเสนอ
- ก่อน
- ก่อน
- กระบวนการ
- การประมวลผล
- โครงการ
- ต้นแบบ
- ให้
- ให้
- การให้
- คุณภาพ
- คำถาม
- คำถาม
- อย่างรวดเร็ว
- เรียลไทม์
- ลด
- การอ้างอิง
- ตรงประเด็น
- การแสดง
- เป็นตัวแทนของ
- แสดงให้เห็นถึง
- ต้องการ
- แหล่งข้อมูล
- การตอบสนอง
- ปฏิวัติ
- บทบาท
- การป้องกัน
- sagemaker
- คะแนน
- ได้อย่างลงตัว
- ค้นหา
- Section
- ส่วน
- ระดับอาวุโส
- แยก
- บริการ
- ชุด
- การตั้งค่า
- หลาย
- น่า
- แสดงให้เห็นว่า
- แสดงให้เห็นว่า
- คล้ายคลึงกัน
- ง่าย
- ลดความซับซ้อน
- เดียว
- ขนาด
- ทางออก
- โซลูชัน
- แก้
- แหล่งที่มา
- ช่องว่าง
- ข้อความที่เริ่ม
- ขั้นตอน
- ขั้นตอน
- การเก็บรักษา
- จัดเก็บ
- ยุทธศาสตร์
- พันธมิตรเชิงกลยุทธ์
- ที่ประสบความสำเร็จ
- ประสบความสำเร็จ
- อย่างเช่น
- ชุด
- ระบบ
- ระบบ
- งาน
- วิชาการ
- เทคนิค
- เทคโนโลยี
- เงื่อนไขการใช้บริการ
- ทดสอบ
- การทดสอบ
- ข้อความ
- กว่า
- ที่
- พื้นที่
- ของพวกเขา
- พวกเขา
- แล้วก็
- พวกเขา
- นี้
- ตลอด
- ชั้น
- ไปยัง
- รถไฟ
- กระแส
- การเปลี่ยน
- จริง
- สอง
- ชนิด
- ชนิด
- ui
- บันทึก
- ใช้
- มือสอง
- ผู้ใช้งาน
- ใช้
- การใช้
- ความหลากหลาย
- ตรวจสอบ
- เสียงพูด
- เดิน
- คือ
- ทาง..
- we
- เว็บ
- บริการเว็บ
- ยินดีต้อนรับ
- ในขณะที่
- จะ
- กับ
- การทำงาน
- โรงงาน
- คุณ
- ของคุณ
- ลมทะเล