ส่งเสริมให้ผู้ใช้ทางธุรกิจของคุณดึงข้อมูลเชิงลึกจากเอกสารของบริษัทโดยใช้ Amazon SageMaker Canvas และ Generative AI | อเมซอนเว็บเซอร์วิส

ส่งเสริมให้ผู้ใช้ทางธุรกิจของคุณดึงข้อมูลเชิงลึกจากเอกสารของบริษัทโดยใช้ Amazon SageMaker Canvas และ Generative AI | อเมซอนเว็บเซอร์วิส

องค์กรต่างๆ พยายามใช้ประโยชน์จากศักยภาพของ Machine Learning (ML) เพื่อแก้ไขปัญหาที่ซับซ้อนและปรับปรุงผลลัพธ์ จนกระทั่งเมื่อไม่นานมานี้ การสร้างและการปรับใช้โมเดล ML ต้องใช้ทักษะด้านเทคนิคและการเขียนโค้ดในระดับลึก รวมถึงการปรับแต่งโมเดล ML และการบำรุงรักษาไปป์ไลน์การปฏิบัติงาน นับตั้งแต่เปิดตัวในปี 2021 ผืนผ้าใบ Amazon SageMaker ช่วยให้นักวิเคราะห์ธุรกิจสามารถสร้าง ปรับใช้ และใช้โมเดล ML ที่หลากหลาย รวมถึงแบบตาราง คอมพิวเตอร์วิทัศน์ และการประมวลผลภาษาธรรมชาติ โดยไม่ต้องเขียนโค้ดแม้แต่บรรทัดเดียว สิ่งนี้ได้เร่งความสามารถขององค์กรในการนำ ML ไปใช้ในกรณีต่างๆ เช่น การคาดการณ์อนุกรมเวลา การทำนายการเลิกใช้งานของลูกค้า การวิเคราะห์ความรู้สึก การตรวจจับข้อบกพร่องทางอุตสาหกรรม และอื่นๆ อีกมากมาย

ตามที่ประกาศเมื่อ ตุลาคม 5, 2023SageMaker Canvas ขยายการรองรับโมเดลเป็นโมเดลพื้นฐาน (FM) ซึ่งเป็นโมเดลภาษาขนาดใหญ่ที่ใช้ในการสร้างและสรุปเนื้อหา กับ เปิดตัว 12 ตุลาคม 2023SageMaker Canvas ช่วยให้ผู้ใช้ถามคำถามและรับคำตอบซึ่งมีพื้นฐานอยู่ในข้อมูลองค์กรของตน ซึ่งจะทำให้แน่ใจได้ว่าผลลัพธ์จะเฉพาะบริบท โดยเปิดกรณีการใช้งานเพิ่มเติมที่สามารถใช้ ML ที่ไม่มีโค้ดเพื่อแก้ไขปัญหาทางธุรกิจได้ ตัวอย่างเช่น ทีมธุรกิจสามารถกำหนดคำตอบที่สอดคล้องกับคำศัพท์และหลักคำสอนเฉพาะขององค์กร และสามารถสืบค้นเอกสารที่มีความยาวได้รวดเร็วยิ่งขึ้น เพื่อให้ได้คำตอบที่เฉพาะเจาะจงและอิงตามเนื้อหาของเอกสารเหล่านั้น เนื้อหาทั้งหมดนี้ดำเนินการในลักษณะที่เป็นส่วนตัวและปลอดภัย เพื่อให้มั่นใจว่าข้อมูลที่ละเอียดอ่อนทั้งหมดได้รับการเข้าถึงด้วยการกำกับดูแลและการป้องกันที่เหมาะสม

ในการเริ่มต้น ผู้ดูแลระบบคลาวด์จะกำหนดค่าและเติมข้อมูล อเมซอน เคนดรา จัดทำดัชนีด้วยข้อมูลองค์กรเป็นแหล่งข้อมูลสำหรับ SageMaker Canvas ผู้ใช้ Canvas เลือกดัชนีว่าเอกสารของตนอยู่ที่ไหน และสามารถเสนอแนวคิด ค้นคว้า และสำรวจโดยรู้ว่าผลลัพธ์จะได้รับการสนับสนุนจากแหล่งที่มาของความจริงเสมอ SageMaker Canvas ใช้ FM ที่ล้ำสมัยจาก อเมซอน เบดร็อค และ Amazon SageMaker JumpStart. การสนทนาสามารถเริ่มต้นได้ด้วย FM หลายเครื่องเคียงข้างกัน เปรียบเทียบผลลัพธ์ และทำให้ทุกคนสามารถเข้าถึง generative-AI ได้อย่างแท้จริง

ในโพสต์นี้ เราจะตรวจสอบคุณสมบัติที่เพิ่งเปิดตัว หารือเกี่ยวกับสถาปัตยกรรม และนำเสนอคำแนะนำทีละขั้นตอนเพื่อเปิดใช้งาน SageMaker Canvas เพื่อสืบค้นเอกสารจากฐานความรู้ของคุณ ดังที่แสดงในภาพหน้าจอต่อไปนี้

ส่งเสริมให้ผู้ใช้ธุรกิจของคุณดึงข้อมูลเชิงลึกจากเอกสารของบริษัทโดยใช้ Amazon SageMaker Canvas และ Generative AI | Amazon Web Services PlatoBlockchain ข้อมูลอัจฉริยะ ค้นหาแนวตั้ง AI.

ภาพรวมโซลูชัน

แบบจำลองพื้นฐานสามารถสร้างภาพหลอนได้ - การตอบสนองทั่วไป คลุมเครือ ไม่เกี่ยวข้อง หรือไม่ถูกต้องตามข้อเท็จจริง การดึงข้อมูล Augmented Generation (RAG) เป็นแนวทางที่ใช้บ่อยในการลดอาการประสาทหลอน สถาปัตยกรรม RAG ใช้เพื่อดึงข้อมูลจากภายนอก FM ซึ่งจากนั้นจะใช้ในการเรียนรู้ในบริบทเพื่อตอบคำถามของผู้ใช้ เพื่อให้แน่ใจว่า FM สามารถใช้ข้อมูลจากฐานความรู้ที่เชื่อถือได้ และใช้ความรู้นั้นเพื่อตอบคำถามของผู้ใช้ ซึ่งช่วยลดความเสี่ยงของอาการประสาทหลอน

ด้วย RAG ข้อมูลภายนอก FM และใช้เพื่อเพิ่มการแจ้งเตือนของผู้ใช้สามารถมาจากแหล่งข้อมูลที่แตกต่างกันหลายแห่ง เช่น ที่เก็บเอกสาร ฐานข้อมูล หรือ API ขั้นตอนแรกคือการแปลงเอกสารของคุณและคำค้นหาของผู้ใช้ให้อยู่ในรูปแบบที่เข้ากันได้เพื่อทำการค้นหาความหมายที่เกี่ยวข้อง เพื่อให้รูปแบบเข้ากันได้ คอลเลกชันเอกสาร หรือไลบรารีความรู้ และการสืบค้นที่ผู้ใช้ส่งมาจะถูกแปลงเป็นการแสดงตัวเลขโดยใช้โมเดลแบบฝัง

ในการเปิดตัวครั้งนี้ ฟังก์ชัน RAG นำเสนอในลักษณะที่ไม่ต้องเขียนโค้ดและราบรื่น องค์กรสามารถยกระดับประสบการณ์การแชทใน Canvas ด้วย Amazon Kendra ซึ่งเป็นระบบการจัดการความรู้พื้นฐาน แผนภาพต่อไปนี้แสดงสถาปัตยกรรมโซลูชัน

ส่งเสริมให้ผู้ใช้ธุรกิจของคุณดึงข้อมูลเชิงลึกจากเอกสารของบริษัทโดยใช้ Amazon SageMaker Canvas และ Generative AI | Amazon Web Services PlatoBlockchain ข้อมูลอัจฉริยะ ค้นหาแนวตั้ง AI.

การเชื่อมต่อ SageMaker Canvas กับ Amazon Kendra ต้องมีการตั้งค่าเพียงครั้งเดียว เราอธิบายขั้นตอนการตั้งค่าโดยละเอียดในการตั้งค่า Canvas เพื่อสืบค้นเอกสาร หากคุณยังไม่ได้ตั้งค่าโดเมน SageMaker โปรดดูที่ ออนบอร์ดไปยังโดเมน Amazon SageMaker.

ในฐานะที่เป็นส่วนหนึ่งของการกำหนดค่าโดเมน ผู้ดูแลระบบคลาวด์สามารถเลือกดัชนี Kendra อย่างน้อยหนึ่งดัชนีที่นักวิเคราะห์ธุรกิจสามารถสืบค้นได้เมื่อโต้ตอบกับ FM ผ่าน SageMaker Canvas

หลังจากที่ดัชนี Kendra ได้รับการไฮเดรทและกำหนดค่าแล้ว นักวิเคราะห์ธุรกิจจะใช้ดัชนีเหล่านั้นกับ SageMaker Canvas โดยเริ่มแชทใหม่และเลือกสลับ “สืบค้นเอกสาร” จากนั้น SageMaker Canvas จะจัดการการสื่อสารพื้นฐานระหว่าง Amazon Kendra และ FM ที่เลือกเพื่อดำเนินการต่อไปนี้:

  1. ค้นหาดัชนี Kendra ด้วยคำถามที่มาจากผู้ใช้
  2. ดึงข้อมูลโค้ด (และแหล่งที่มา) จากดัชนี Kendra
  3. ออกแบบพรอมต์ด้วยตัวอย่างข้อมูลด้วยการสืบค้นต้นฉบับ เพื่อให้โมเดลพื้นฐานสามารถสร้างคำตอบจากเอกสารที่ดึงข้อมูลมาได้
  4. ให้คำตอบที่สร้างขึ้นแก่ผู้ใช้ พร้อมด้วยการอ้างอิงถึงหน้า/เอกสารที่ใช้ในการกำหนดคำตอบ

การตั้งค่า Canvas เพื่อสืบค้นเอกสาร

ในส่วนนี้ เราจะแนะนำคุณตลอดขั้นตอนในการตั้งค่า Canvas เพื่อสืบค้นเอกสารที่แสดงผ่านดัชนี Kendra คุณควรมีข้อกำหนดเบื้องต้นดังต่อไปนี้:

  • การตั้งค่าโดเมน SageMaker – ออนบอร์ดไปยังโดเมน Amazon SageMaker
  • สร้าง ดัชนี เคนดรา (หรือมากกว่าหนึ่ง)
  • ตั้งค่าตัวเชื่อมต่อ Kendra Amazon S3 – ปฏิบัติตาม ตัวเชื่อมต่อ Amazon S3 – และอัปโหลดไฟล์ PDF และเอกสารอื่นๆ ไปยังบัคเก็ต Amazon S3 ที่เกี่ยวข้องกับดัชนี Kendra
  • ตั้งค่า IAM เพื่อให้ Canvas มีสิทธิ์ที่เหมาะสม รวมถึงสิทธิ์ที่จำเป็นสำหรับการเรียกใช้ตำแหน่งข้อมูล Amazon Bedrock และ/หรือ SageMaker - ปฏิบัติตาม ตั้งค่า Canvas Chat เอกสาร

ตอนนี้คุณสามารถอัปเดตโดเมนเพื่อให้สามารถเข้าถึงดัชนีที่ต้องการได้ บนคอนโซล SageMaker สำหรับโดเมนที่กำหนด ให้เลือกแก้ไขใต้แท็บการตั้งค่าโดเมน เปิดใช้งานการสลับ “เปิดใช้งานเอกสารการสืบค้นด้วย Amazon Kendra” ซึ่งสามารถพบได้ในขั้นตอนการตั้งค่า Canvas เมื่อเปิดใช้งานแล้ว ให้เลือกดัชนี Kendra หนึ่งรายการขึ้นไปที่คุณต้องการใช้กับ Canvas

ส่งเสริมให้ผู้ใช้ธุรกิจของคุณดึงข้อมูลเชิงลึกจากเอกสารของบริษัทโดยใช้ Amazon SageMaker Canvas และ Generative AI | Amazon Web Services PlatoBlockchain ข้อมูลอัจฉริยะ ค้นหาแนวตั้ง AI.

ส่งเสริมให้ผู้ใช้ธุรกิจของคุณดึงข้อมูลเชิงลึกจากเอกสารของบริษัทโดยใช้ Amazon SageMaker Canvas และ Generative AI | Amazon Web Services PlatoBlockchain ข้อมูลอัจฉริยะ ค้นหาแนวตั้ง AI.

นั่นคือทั้งหมดที่จำเป็นในการกำหนดค่าคุณสมบัติเอกสารการสืบค้น Canvas ขณะนี้ผู้ใช้สามารถกระโดดเข้าสู่การแชทภายใน Canvas และเริ่มใช้ฐานความรู้ที่แนบกับโดเมนผ่านดัชนี Kendra ผู้ดูแลฐานความรู้สามารถอัปเดตแหล่งที่มาของความจริงต่อไปได้ และด้วยความสามารถในการซิงค์ใน Kendra ผู้ใช้แชทจะสามารถใช้ข้อมูลล่าสุดในลักษณะที่ราบรื่นได้โดยอัตโนมัติ

การใช้คุณสมบัติ Query Documents สำหรับการแชท

ในฐานะผู้ใช้ SageMaker Canvas คุณสมบัติ Query Documents สามารถเข้าถึงได้จากภายในแชท หากต้องการเริ่มเซสชันการแชท คลิกหรือค้นหาปุ่ม “สร้าง แยก และสรุปเนื้อหา” จากแท็บโมเดลที่พร้อมใช้งานใน SageMaker Canvas

ส่งเสริมให้ผู้ใช้ธุรกิจของคุณดึงข้อมูลเชิงลึกจากเอกสารของบริษัทโดยใช้ Amazon SageMaker Canvas และ Generative AI | Amazon Web Services PlatoBlockchain ข้อมูลอัจฉริยะ ค้นหาแนวตั้ง AI.

เมื่อถึงที่นั่น คุณสามารถเปิดและปิดเอกสารสืบค้นได้ด้วยการสลับที่ด้านบนของหน้าจอ ตรวจสอบข้อมูลพร้อมท์เพื่อเรียนรู้เพิ่มเติมเกี่ยวกับคุณสมบัตินี้

ส่งเสริมให้ผู้ใช้ธุรกิจของคุณดึงข้อมูลเชิงลึกจากเอกสารของบริษัทโดยใช้ Amazon SageMaker Canvas และ Generative AI | Amazon Web Services PlatoBlockchain ข้อมูลอัจฉริยะ ค้นหาแนวตั้ง AI.

เมื่อเปิดใช้งานเอกสารสืบค้น คุณสามารถเลือกจากรายการดัชนี Kendra ที่เปิดใช้งานโดยผู้ดูแลระบบคลาวด์

ส่งเสริมให้ผู้ใช้ธุรกิจของคุณดึงข้อมูลเชิงลึกจากเอกสารของบริษัทโดยใช้ Amazon SageMaker Canvas และ Generative AI | Amazon Web Services PlatoBlockchain ข้อมูลอัจฉริยะ ค้นหาแนวตั้ง AI.

คุณสามารถเลือกดัชนีเมื่อเริ่มแชทใหม่ จากนั้นคุณสามารถถามคำถามใน UX โดยมีความรู้ที่มาจากดัชนีที่เลือกโดยอัตโนมัติ โปรดทราบว่าหลังจากการสนทนาเริ่มต้นกับดัชนีใดดัชนีหนึ่งแล้ว จะไม่สามารถสลับไปยังดัชนีอื่นได้

ส่งเสริมให้ผู้ใช้ธุรกิจของคุณดึงข้อมูลเชิงลึกจากเอกสารของบริษัทโดยใช้ Amazon SageMaker Canvas และ Generative AI | Amazon Web Services PlatoBlockchain ข้อมูลอัจฉริยะ ค้นหาแนวตั้ง AI.

สำหรับคำถามที่ถาม แชทจะแสดงคำตอบที่สร้างโดย FM พร้อมด้วยเอกสารต้นฉบับที่มีส่วนร่วมในการสร้างคำตอบ เมื่อคลิกเอกสารต้นทางใดๆ Canvas จะเปิดการแสดงตัวอย่างเอกสาร โดยเน้นข้อความที่ตัดตอนมาจาก FM

ส่งเสริมให้ผู้ใช้ธุรกิจของคุณดึงข้อมูลเชิงลึกจากเอกสารของบริษัทโดยใช้ Amazon SageMaker Canvas และ Generative AI | Amazon Web Services PlatoBlockchain ข้อมูลอัจฉริยะ ค้นหาแนวตั้ง AI.

สรุป

AI สนทนามีศักยภาพมหาศาลในการเปลี่ยนแปลงประสบการณ์ของลูกค้าและพนักงานโดยมอบผู้ช่วยที่เหมือนมนุษย์ด้วยการโต้ตอบที่เป็นธรรมชาติและใช้งานง่าย เช่น:

  • ดำเนินการวิจัยในหัวข้อหรือค้นหาและเรียกดูฐานความรู้ขององค์กร
  • สรุปเนื้อหาจำนวนมากเพื่อรวบรวมข้อมูลเชิงลึกอย่างรวดเร็ว
  • ค้นหาเอนทิตี ความรู้สึก PII และข้อมูลที่เป็นประโยชน์อื่นๆ และเพิ่มมูลค่าทางธุรกิจของเนื้อหาที่ไม่มีโครงสร้าง
  • การสร้างร่างสำหรับเอกสารและจดหมายโต้ตอบทางธุรกิจ
  • การสร้างบทความองค์ความรู้จากแหล่งข้อมูลภายในที่แตกต่างกัน (เหตุการณ์ บันทึกการสนทนา วิกิ)

การบูรณาการนวัตกรรมของอินเทอร์เฟซการแชท การดึงความรู้ และ FM ช่วยให้องค์กรต่างๆ สามารถตอบคำถามผู้ใช้ได้อย่างแม่นยำและเกี่ยวข้องโดยใช้ความรู้ในโดเมนและแหล่งที่มาของความจริง

ด้วยการเชื่อมต่อ SageMaker Canvas กับฐานความรู้ใน Amazon Kendra องค์กรต่างๆ สามารถเก็บข้อมูลที่เป็นกรรมสิทธิ์ของตนไว้ภายในสภาพแวดล้อมของตนเอง ในขณะที่ยังคงได้รับประโยชน์จากความสามารถทางภาษาธรรมชาติที่ล้ำสมัยของ FM ด้วยการเปิดตัวฟีเจอร์ Query Documents ของ SageMaker Canvas เรากำลังทำให้องค์กรต่างๆ ใช้ LLM และความรู้ระดับองค์กรของตนเป็นแหล่งที่มาของความจริงได้อย่างง่ายดายเพื่อขับเคลื่อนประสบการณ์การแชทที่ปลอดภัย ฟังก์ชันการทำงานทั้งหมดนี้มีอยู่ในรูปแบบที่ไม่มีโค้ด ช่วยให้ธุรกิจต่างๆ หลีกเลี่ยงการจัดการงานซ้ำๆ และไม่เฉพาะเจาะจงได้

หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับ SageMaker Canvas และวิธีที่ช่วยให้ทุกคนเริ่มต้นใช้งาน Machine Learning ได้ง่ายขึ้น โปรดดูที่ ประกาศเกี่ยวกับ SageMaker Canvas. เรียนรู้เพิ่มเติมเกี่ยวกับวิธีที่ SageMaker Canvas ช่วยส่งเสริมการทำงานร่วมกันระหว่างนักวิทยาศาสตร์ข้อมูลและนักวิเคราะห์ธุรกิจโดยการอ่าน สร้าง แบ่งปัน และปรับใช้โพสต์. สุดท้าย หากต้องการเรียนรู้วิธีสร้างเวิร์กโฟลว์การดึงข้อมูล Augmented Generation ของคุณเอง โปรดดูที่ SageMaker JumpStart RAG.

อ้างอิง

Lewis, P., Perez, E., Piktus, A., Petroni, F., Karpukhin, V., Goyal, N., Küttler, H., Lewis, M., Yih, W., Rocktäschel, T., Riedel, S. , Kiela, D. (2020) การสร้างเสริมการดึงข้อมูลสำหรับงาน NLP ที่เน้นความรู้ ความก้าวหน้าในระบบประมวลผลข้อมูลประสาท, 33, 9459 9474-


เกี่ยวกับผู้เขียน

รูปภาพของ ดาวิเด้ดาวิเด้ กัลลิเตลลี่ เป็นสถาปนิกโซลูชันผู้เชี่ยวชาญอาวุโสสำหรับ AI/ML เขาประจำอยู่ในบรัสเซลส์และทำงานอย่างใกล้ชิดกับลูกค้าทั่วโลกที่ต้องการนำเทคโนโลยี Machine Learning แบบ Low-Code/No-Code และ Generative AI มาใช้ เขาเป็น Developer มาตั้งแต่เด็ก โดยเริ่มเขียนโค้ดเมื่ออายุ 7 ขวบ เขาเริ่มเรียนรู้ AI/ML ที่มหาวิทยาลัย และหลงรักมันตั้งแต่นั้นมา

ส่งเสริมให้ผู้ใช้ธุรกิจของคุณดึงข้อมูลเชิงลึกจากเอกสารของบริษัทโดยใช้ Amazon SageMaker Canvas และ Generative AI | Amazon Web Services PlatoBlockchain ข้อมูลอัจฉริยะ ค้นหาแนวตั้ง AI.บิลาล อาลัม เป็นสถาปนิกโซลูชันระดับองค์กรที่ AWS โดยมุ่งเน้นที่อุตสาหกรรมบริการทางการเงิน เกือบทุกวัน Bilal กำลังช่วยเหลือลูกค้าในการสร้าง ยกระดับ และรักษาความปลอดภัยสภาพแวดล้อม AWS เพื่อปรับใช้ปริมาณงานที่สำคัญที่สุด เขามีประสบการณ์กว้างขวางในด้านโทรคมนาคม ระบบเครือข่าย และการพัฒนาซอฟต์แวร์ ล่าสุด เขากำลังมองหาการใช้ AI/ML เพื่อแก้ไขปัญหาทางธุรกิจ

ส่งเสริมให้ผู้ใช้ธุรกิจของคุณดึงข้อมูลเชิงลึกจากเอกสารของบริษัทโดยใช้ Amazon SageMaker Canvas และ Generative AI | Amazon Web Services PlatoBlockchain ข้อมูลอัจฉริยะ ค้นหาแนวตั้ง AI.พัชมีน มิสทรี เป็นผู้จัดการผลิตภัณฑ์อาวุโสของ AWS นอกเวลางาน Pashmeen ชอบเดินป่าผจญภัย ถ่ายภาพ และใช้เวลากับครอบครัว

ส่งเสริมให้ผู้ใช้ธุรกิจของคุณดึงข้อมูลเชิงลึกจากเอกสารของบริษัทโดยใช้ Amazon SageMaker Canvas และ Generative AI | Amazon Web Services PlatoBlockchain ข้อมูลอัจฉริยะ ค้นหาแนวตั้ง AI.แดน ซินไรช์ เป็นผู้จัดการผลิตภัณฑ์อาวุโสของ AWS ซึ่งช่วยทำให้แมชชีนเลิร์นนิงที่ใช้โค้ดน้อย/ไม่มีโค้ดเป็นประชาธิปไตย ก่อนหน้า AWS นั้น Dan ได้สร้างและจำหน่ายแพลตฟอร์ม SaaS ระดับองค์กรและโมเดลอนุกรมเวลาที่ใช้โดยนักลงทุนสถาบันเพื่อจัดการความเสี่ยงและสร้างพอร์ตการลงทุนที่เหมาะสมที่สุด ภายนอกงาน เขาเล่นฮ็อกกี้ ดำน้ำ และอ่านนิยายวิทยาศาสตร์ได้

ประทับเวลา:

เพิ่มเติมจาก AWS Machine Learning AWS