เรียนรู้วิธีสร้างและปรับใช้ตัวแทน LLM โดยใช้เครื่องมือโดยใช้โมเดล AWS SageMaker JumpStart Foundation

เผยแพร่ซ้ำโดยเพลโต

ผู้ติดตาม: 0

เอเจนต์ Large Language Model (LLM) คือโปรแกรมที่ขยายขีดความสามารถของ LLM แบบสแตนด์อโลนด้วย 1) การเข้าถึงเครื่องมือภายนอก (API ฟังก์ชัน เว็บฮุค ปลั๊กอิน และอื่นๆ) และ 2) ความสามารถในการวางแผนและดำเนินงานด้วยตนเอง -กำกับแฟชั่น บ่อยครั้งที่ LLM จำเป็นต้องโต้ตอบกับซอฟต์แวร์ ฐานข้อมูล หรือ API อื่นๆ เพื่อทำงานที่ซับซ้อนให้สำเร็จ ตัวอย่างเช่น แชทบอทสำหรับผู้ดูแลระบบที่จัดกำหนดการประชุมจำเป็นต้องเข้าถึงปฏิทินและอีเมลของพนักงาน ด้วยการเข้าถึงเครื่องมือ เจ้าหน้าที่ LLM จะมีประสิทธิภาพมากขึ้น โดยต้องแลกกับความซับซ้อนเพิ่มเติม

ในโพสต์นี้ เราแนะนำตัวแทน LLM และสาธิตวิธีสร้างและปรับใช้ตัวแทน LLM อีคอมเมิร์ซโดยใช้ Amazon SageMaker JumpStart และ AWS แลมบ์ดา ตัวแทนจะใช้เครื่องมือเพื่อเพิ่มความสามารถใหม่ๆ เช่น การตอบคำถามเกี่ยวกับการคืนสินค้า (“การคืนสินค้าของฉัน rtn001 ประมวลผลแล้ว?”) และให้ข้อมูลอัปเดตเกี่ยวกับคำสั่งซื้อ (“คุณช่วยบอกฉันได้ไหมว่ามีคำสั่งซื้อหรือไม่” 123456 ได้จัดส่งแล้วหรือยัง?”) ความสามารถใหม่เหล่านี้จำเป็นต้องใช้ LLM เพื่อดึงข้อมูลจากแหล่งข้อมูลหลายแหล่ง (orders, returns) และดำเนินการดึงข้อมูลการสร้างเสริม (RAG)

เพื่อขับเคลื่อนตัวแทน LLM เราใช้ Flan-UL2 โมเดลที่ใช้งานเป็น ปลายทาง SageMaker และใช้เครื่องมือดึงข้อมูลที่สร้างด้วย AWS Lambda สามารถรวมเอเจนต์เข้ากับระบบได้ในภายหลัง อเมซอน เล็กซ์ และใช้เป็นแชทบอทภายในเว็บไซต์หรือ AWS เชื่อมต่อ. เราสรุปโพสต์พร้อมรายการที่ต้องพิจารณาก่อนที่จะปรับใช้ตัวแทน LLM ในการใช้งานจริง สำหรับประสบการณ์ที่ได้รับการจัดการอย่างเต็มรูปแบบสำหรับการสร้างตัวแทน LLM AWS ยังมีบริการ ตัวแทนสำหรับคุณสมบัติ Amazon Bedrock (ในหน้าตัวอย่าง).

ภาพรวมโดยย่อของสถาปัตยกรรมตัวแทน LLM

เอเจนต์ LLM คือโปรแกรมที่ใช้ LLM เพื่อตัดสินใจว่าจะใช้เครื่องมือเมื่อใดและอย่างไรตามความจำเป็นเพื่อทำงานที่ซับซ้อนให้เสร็จสิ้น ด้วยเครื่องมือและความสามารถในการวางแผนงาน เจ้าหน้าที่ LLM สามารถโต้ตอบกับระบบภายนอกและเอาชนะข้อจำกัดแบบดั้งเดิมของ LLM เช่น การตัดความรู้ ภาพหลอน และการคำนวณที่ไม่แม่นยำ เครื่องมืออาจมีได้หลากหลายรูปแบบ เช่น การเรียก API, ฟังก์ชัน Python หรือปลั๊กอินแบบ Webhook ตัวอย่างเช่น LLM สามารถใช้ "ปลั๊กอินการดึงข้อมูล" เพื่อดึงบริบทที่เกี่ยวข้องและดำเนินการ RAG

แล้ว LLM จะต้องเลือกเครื่องมือและวางแผนงานหมายความว่าอย่างไร มีหลายวิธี (เช่น เกิดปฏิกิริยา, มร.เค.แอล, ช่างทำเครื่องมือ, กอดGPTและ ตัวแทนหม้อแปลงไฟฟ้าs) การใช้ LLM ด้วยเครื่องมือ และความก้าวหน้ากำลังเกิดขึ้นอย่างรวดเร็ว แต่วิธีง่ายๆ วิธีหนึ่งคือการแจ้ง LLM พร้อมรายการเครื่องมือและขอให้พิจารณาว่า 1) จำเป็นต้องใช้เครื่องมือเพื่อตอบสนองคำถามของผู้ใช้หรือไม่ และหากเป็นเช่นนั้น 2) เลือกเครื่องมือที่เหมาะสม โดยทั่วไปข้อความแจ้งดังกล่าวจะมีลักษณะเหมือนตัวอย่างต่อไปนี้ และอาจรวมตัวอย่างสั้นๆ เพื่อปรับปรุงความน่าเชื่อถือของ LLM ในการเลือกเครื่องมือที่เหมาะสม

‘’’
Your task is to select a tool to answer a user question. You have access to the following tools. search: search for an answer in FAQs
order: order items
noop: no tool is needed {few shot examples} Question: {input}
Tool:
‘’’

วิธีการที่ซับซ้อนมากขึ้นเกี่ยวข้องกับการใช้ LLM เฉพาะทางที่สามารถถอดรหัส “การเรียก API” หรือ “การใช้เครื่องมือ” ได้โดยตรง เช่น กอริลลาLLM. LLM ที่ได้รับการปรับแต่งอย่างละเอียดดังกล่าวได้รับการฝึกอบรมเกี่ยวกับชุดข้อมูลข้อมูลจำเพาะ API เพื่อจดจำและคาดการณ์การเรียก API ตามคำสั่ง บ่อยครั้งที่ LLM เหล่านี้ต้องการข้อมูลเมตาเกี่ยวกับเครื่องมือที่มีอยู่ (คำอธิบาย, yaml หรือสคีมา JSON สำหรับพารามิเตอร์อินพุต) เพื่อที่จะส่งออกการเรียกใช้เครื่องมือ แนวทางนี้ดำเนินการโดย ตัวแทนของ Amazon Bedrock และ การเรียกใช้ฟังก์ชัน OpenAI. โปรดทราบว่าโดยทั่วไป LLM จะต้องมีขนาดใหญ่และซับซ้อนเพียงพอเพื่อแสดงความสามารถในการเลือกเครื่องมือ

สถาปัตยกรรมตัวแทน LLM ทั่วไป

สมมติว่ามีการเลือกกลไกการวางแผนงานและการเลือกเครื่องมือ โปรแกรมตัวแทน LLM ทั่วไปจะทำงานตามลำดับต่อไปนี้:

คำขอของผู้ใช้ – โปรแกรมรับข้อมูลจากผู้ใช้ เช่น “คำสั่งซื้อของฉันอยู่ที่ไหน” 123456?” จากแอปพลิเคชันไคลเอนต์บางตัว
วางแผนการดำเนินการต่อไปและเลือกเครื่องมือที่จะใช้ – จากนั้น โปรแกรมจะใช้พร้อมต์เพื่อให้ LLM สร้างการดำเนินการถัดไป เช่น “ค้นหาตารางคำสั่งซื้อโดยใช้ OrdersAPI” LLM ได้รับแจ้งให้แนะนำชื่อเครื่องมือ เช่น OrdersAPI จากรายการเครื่องมือที่มีอยู่ที่กำหนดไว้ล่วงหน้าและคำอธิบาย หรืออาจสั่งให้ LLM สร้างการเรียก API โดยตรงด้วยพารามิเตอร์อินพุต เช่น OrdersAPI(12345).
1. โปรดทราบว่าการดำเนินการถัดไปอาจเกี่ยวข้องกับการใช้เครื่องมือหรือ API หรือไม่ก็ได้ ถ้าไม่เช่นนั้น LLM จะตอบสนองต่อการป้อนข้อมูลของผู้ใช้โดยไม่ต้องรวมบริบทเพิ่มเติมจากเครื่องมือหรือเพียงแค่ส่งคืนคำตอบสำเร็จรูป เช่น "ฉันไม่สามารถตอบคำถามนี้ได้"
คำขอเครื่องมือแยกวิเคราะห์ – ต่อไป เราจำเป็นต้องแยกวิเคราะห์และตรวจสอบเครื่องมือ/การทำนายการดำเนินการที่แนะนำโดย LLM จำเป็นต้องมีการตรวจสอบความถูกต้องเพื่อให้แน่ใจว่าชื่อเครื่องมือ, API และพารามิเตอร์คำขอจะไม่เกิดภาพหลอน และเครื่องมือได้รับการเรียกใช้อย่างเหมาะสมตามข้อกำหนด การแยกวิเคราะห์นี้อาจต้องมีการเรียก LLM แยกต่างหาก
เรียกใช้เครื่องมือ – เมื่อมั่นใจชื่อเครื่องมือและพารามิเตอร์ที่ถูกต้องแล้ว เราจะเรียกใช้เครื่องมือ นี่อาจเป็นคำขอ HTTP การเรียกใช้ฟังก์ชัน และอื่นๆ
แยกวิเคราะห์เอาท์พุท – การตอบสนองจากเครื่องมืออาจต้องมีการประมวลผลเพิ่มเติม ตัวอย่างเช่น การเรียก API อาจส่งผลให้มีการตอบสนอง JSON ที่ยาว โดยที่ LLM ให้ความสนใจเพียงชุดย่อยของฟิลด์เท่านั้น การดึงข้อมูลในรูปแบบมาตรฐานที่สะอาดตาสามารถช่วยให้ LLM ตีความผลลัพธ์ได้อย่างน่าเชื่อถือมากขึ้น
ตีความผลลัพธ์ – เมื่อพิจารณาผลลัพธ์จากเครื่องมือ LLM จะได้รับแจ้งอีกครั้งเพื่อทำความเข้าใจและตัดสินใจว่าจะสามารถสร้างคำตอบสุดท้ายกลับไปยังผู้ใช้ได้หรือไม่ หรือจำเป็นต้องดำเนินการเพิ่มเติมหรือไม่
ยุติหรือดำเนินการต่อไปยังขั้นตอนที่ 2 – ส่งคืนคำตอบสุดท้ายหรือคำตอบเริ่มต้นในกรณีที่เกิดข้อผิดพลาดหรือหมดเวลา

กรอบงานตัวแทนที่แตกต่างกันดำเนินการโฟลว์โปรแกรมก่อนหน้าแตกต่างกัน ตัวอย่างเช่น, เกิดปฏิกิริยา รวมการเลือกเครื่องมือและการสร้างคำตอบสุดท้ายไว้ในพรอมต์เดียว แทนที่จะใช้พรอมต์แยกต่างหากสำหรับการเลือกเครื่องมือและการสร้างคำตอบ นอกจากนี้ ตรรกะนี้สามารถรันในการส่งผ่านครั้งเดียวหรือรันในคำสั่ง while (“agent loop”) ซึ่งจะสิ้นสุดเมื่อมีการสร้างคำตอบสุดท้าย มีข้อยกเว้นเกิดขึ้น หรือเกิดการหมดเวลา สิ่งที่ยังคงไม่เปลี่ยนแปลงคือเจ้าหน้าที่ใช้ LLM เป็นจุดศูนย์กลางในการวางแผนและเรียกใช้เครื่องมือจนกว่างานจะสิ้นสุดลง ต่อไป เราจะแสดงวิธีใช้งาน Agent Loop อย่างง่ายโดยใช้บริการของ AWS

ภาพรวมโซลูชัน

สำหรับโพสต์บนบล็อกนี้ เราใช้ตัวแทน LLM ที่รองรับอีคอมเมิร์ซซึ่งมีฟังก์ชันสองประการที่ขับเคลื่อนโดยเครื่องมือ:

เครื่องมือดึงสถานะการคืนสินค้า – ตอบคำถามเกี่ยวกับสถานะการคืนสินค้า เช่น “จะเกิดอะไรขึ้นกับการคืนสินค้าของฉัน” rtn001? "
เครื่องมือดึงสถานะคำสั่งซื้อ – ติดตามสถานะคำสั่งซื้อ เช่น “คำสั่งซื้อของฉันมีสถานะเป็นอย่างไร 123456? "

เอเจนต์ใช้ LLM เป็นเราเตอร์การสืบค้นอย่างมีประสิทธิภาพ จากการสอบถาม (“สถานะการสั่งซื้อคืออะไร 123456?”) เลือกเครื่องมือดึงข้อมูลที่เหมาะสมเพื่อสืบค้นจากแหล่งข้อมูลหลายแหล่ง (นั่นคือ การส่งคืนและคำสั่งซื้อ) เรากำหนดเส้นทางการสืบค้นให้สำเร็จโดยให้ LLM เลือกเครื่องมือดึงข้อมูลหลายรายการ ซึ่งมีหน้าที่รับผิดชอบในการโต้ตอบกับแหล่งข้อมูลและดึงบริบท สิ่งนี้จะขยายรูปแบบ RAG แบบง่าย ซึ่งถือว่าแหล่งข้อมูลเดียว

เครื่องมือดึงข้อมูลทั้งสองเป็นฟังก์ชัน Lambda ที่ใช้รหัส (orderId or returnId) เป็นอินพุต ดึงออบเจ็กต์ JSON จากแหล่งข้อมูล และแปลง JSON ให้เป็นสตริงการแสดงที่เป็นมิตรกับมนุษย์ซึ่ง LLM เหมาะสมที่จะใช้ แหล่งข้อมูลในสถานการณ์จริงอาจเป็นฐานข้อมูล NoSQL ที่ปรับขนาดได้สูง เช่น DynamoDBแต่โซลูชันนี้ใช้ Python แบบธรรมดา Dict พร้อมข้อมูลตัวอย่างเพื่อการสาธิต

คุณสามารถเพิ่มฟังก์ชันการทำงานเพิ่มเติมให้กับตัวแทนได้โดยการเพิ่มเครื่องมือการดึงข้อมูลและแก้ไขพร้อมท์ตามนั้น เอเจนต์นี้สามารถทดสอบบริการแบบสแตนด์อโลนที่ผสานรวมกับ UI ใดๆ บน HTTP ซึ่งสามารถทำได้ง่ายๆ อเมซอน เล็กซ์.

ภาพรวมโซลูชัน

ต่อไปนี้เป็นรายละเอียดเพิ่มเติมเกี่ยวกับองค์ประกอบหลัก:

จุดสิ้นสุดการอนุมาน LLM – หัวใจหลักของโปรแกรมตัวแทนคือ LLM เราจะใช้ฮับโมเดลพื้นฐาน SageMaker JumpStart เพื่อปรับใช้ได้อย่างง่ายดาย Flan-UL2 แบบอย่าง. SageMaker JumpStart ช่วยให้ปรับใช้ตำแหน่งข้อมูลการอนุมาน LLM ในพื้นที่เฉพาะได้อย่างง่ายดาย SageMaker ตัวอย่าง.
ผู้ประสานงานตัวแทน – Agent orchestrator ประสานการโต้ตอบระหว่าง LLM, เครื่องมือ และแอปไคลเอ็นต์ สำหรับโซลูชันของเรา เราใช้ฟังก์ชัน AWS Lambda เพื่อขับเคลื่อนโฟลว์นี้และใช้ฟังก์ชันต่อไปนี้เป็นฟังก์ชันตัวช่วย
- ผู้วางแผนงาน (เครื่องมือ) – ผู้วางแผนงานใช้ LLM เพื่อแนะนำหนึ่งใน 1) การสอบถามการส่งคืน 2) การสอบถามเกี่ยวกับคำสั่งซื้อ หรือ 3) ไม่มีเครื่องมือ เราใช้วิศวกรรมที่รวดเร็วเท่านั้นและ Flan-UL2 ดังที่เป็นอยู่โดยไม่ต้องปรับแต่งอย่างละเอียด
- เครื่องมือแยกวิเคราะห์ – เครื่องมือแยกวิเคราะห์ช่วยให้แน่ใจว่าคำแนะนำเครื่องมือจากผู้วางแผนงานนั้นถูกต้อง โดยเฉพาะอย่างยิ่งเรารับรองว่าตัวเดียว orderId or returnId สามารถแยกวิเคราะห์ได้ มิฉะนั้น เราจะตอบกลับด้วยข้อความเริ่มต้น
- ผู้มอบหมายงานเครื่องมือ – โปรแกรมเลือกจ่ายเครื่องมือเรียกใช้เครื่องมือ (ฟังก์ชันแลมบ์ดา) โดยใช้พารามิเตอร์ที่ถูกต้อง
- ตัวแยกวิเคราะห์เอาท์พุท – ตัวแยกวิเคราะห์เอาต์พุตจะล้างและแยกรายการที่เกี่ยวข้องจาก JSON ลงในสตริงที่มนุษย์สามารถอ่านได้ งานนี้เสร็จสิ้นทั้งโดยเครื่องมือดึงข้อมูลแต่ละอันและภายในผู้เรียบเรียง
- ล่ามเอาท์พุท – ความรับผิดชอบของล่ามเอาท์พุตคือ 1) ตีความเอาท์พุตจากการเรียกใช้เครื่องมือ และ 2) พิจารณาว่าคำขอของผู้ใช้สามารถตอบสนองได้หรือไม่ หรือจำเป็นต้องมีขั้นตอนเพิ่มเติม หากเป็นอย่างหลัง การตอบสนองขั้นสุดท้ายจะถูกสร้างขึ้นแยกจากกันและส่งคืนให้กับผู้ใช้

ตอนนี้ เรามาเจาะลึกลงไปอีกเล็กน้อยในองค์ประกอบหลัก: ผู้ประสานงานตัวแทน ผู้วางแผนงาน และผู้มอบหมายงานเครื่องมือ

ตัวแทนผู้เรียบเรียง

ด้านล่างนี้คือเวอร์ชันย่อของลูปเอเจนต์ภายในฟังก์ชัน Lambda ของเอเจนต์ orchestrator ลูปใช้ฟังก์ชันตัวช่วยเช่น task_planner or tool_parserเพื่อทำให้งานเป็นแบบโมดูลาร์ ลูปที่นี่ได้รับการออกแบบมาให้ทำงานได้สูงสุดสองครั้งเพื่อป้องกันไม่ให้ LLM ติดอยู่ในลูปนานโดยไม่จำเป็น

#.. imports ..
MAX_LOOP_COUNT = 2 # stop the agent loop after up to 2 iterations
# ... helper function definitions ...
def agent_handler(event): user_input = event["query"] print(f"user input: {user_input}") final_generation = "" is_task_complete = False loop_count = 0 # start of agent loop while not is_task_complete and loop_count < MAX_LOOP_COUNT: tool_prediction = task_planner(user_input) print(f"tool_prediction: {tool_prediction}") tool_name, tool_input, tool_output, error_msg = None, None, "", "" try: tool_name, tool_input = tool_parser(tool_prediction, user_input) print(f"tool name: {tool_name}") print(f"tool input: {tool_input}") except Exception as e: error_msg = str(e) print(f"tool parse error: {error_msg}") if tool_name is not None: # if a valid tool is selected and parsed raw_tool_output = tool_dispatch(tool_name, tool_input) tool_status, tool_output = output_parser(raw_tool_output) print(f"tool status: {tool_status}") if tool_status == 200: is_task_complete, final_generation = output_interpreter(user_input, tool_output) else: final_generation = tool_output else: # if no valid tool was selected and parsed, either return the default msg or error msg final_generation = DEFAULT_RESPONSES.NO_TOOL_FEEDBACK if error_msg == "" else error_msg loop_count += 1 return { 'statusCode': 200, 'body': final_generation }

ผู้วางแผนงาน (การทำนายเครื่องมือ)

ผู้จัดเตรียมตัวแทนใช้ task planner เพื่อทำนายเครื่องมือดึงข้อมูลตามการป้อนข้อมูลของผู้ใช้ สำหรับตัวแทน LLM ของเรา เราจะใช้วิศวกรรมที่รวดเร็วและคำแนะนำสั้นๆ เพื่อสอน LLM งานนี้ในบริบท เอเจนต์ที่มีความซับซ้อนมากขึ้นสามารถใช้ LLM ที่ปรับแต่งแล้วสำหรับการทำนายเครื่องมือ ซึ่งอยู่นอกเหนือขอบเขตของโพสต์นี้ พรอมต์มีดังนี้:

tool_selection_prompt_template = """
Your task is to select appropriate tools to satisfy the user input. If no tool is required, then pick "no_tool" Tools available are: returns_inquiry: Database of information about a specific return's status, whether it's pending, processed, etc.
order_inquiry: Information about a specific order's status, such as shipping status, product, amount, etc.
no_tool: No tool is needed to answer the user input. You can suggest multiple tools, separated by a comma. Examples:
user: "What are your business hours?"
tool: no_tool user: "Has order 12345 shipped?"
tool: order_inquiry user: "Has return ret812 processed?"
tool: returns_inquiry user: "How many days do I have until returning orders?"
tool: returns_inquiry user: "What was the order total for order 38745?"
tool: order_inquiry user: "Can I return my order 38756 based on store policy?"
tool: order_inquiry user: "Hi"
tool: no_tool user: "Are you an AI?"
tool: no_tool user: "How's the weather?"
tool: no_tool user: "What is the refund status of order 12347?"
tool: order_inquiry user: "What is the refund status of return ret172?"
tool: returns_inquiry user input: {}
tool: """

ผู้มอบหมายงานเครื่องมือ

กลไกการจัดส่งเครื่องมือทำงานผ่าน if/else ตรรกะในการเรียกใช้ฟังก์ชัน Lambda ที่เหมาะสม โดยขึ้นอยู่กับชื่อของเครื่องมือ ต่อไปนี้คือ tool_dispatch การใช้งานฟังก์ชันตัวช่วย มันถูกใช้ภายใน agent วนซ้ำและส่งกลับการตอบสนองดิบจากฟังก์ชัน Lambda ของเครื่องมือ ซึ่งจากนั้นจะถูกล้างโดย output_parser ฟังก์ชัน


def tool_dispatch(tool_name, tool_input): #... tool_response = None if tool_name == "returns_inquiry": tool_response = lambda_client.invoke( FunctionName=RETURNS_DB_TOOL_LAMBDA, InvocationType="RequestResponse", Payload=json.dumps({ "returnId": tool_input }) ) elif tool_name == "order_inquiry": tool_response = lambda_client.invoke( FunctionName=ORDERS_DB_TOOL_LAMBDA, InvocationType="RequestResponse", Payload=json.dumps({ "orderId": tool_input }) ) else: raise ValueError("Invalid tool invocation") return tool_response

ปรับใช้โซลูชัน

ข้อกำหนดเบื้องต้นที่สำคัญ – ในการเริ่มต้นการปรับใช้ คุณต้องปฏิบัติตามข้อกำหนดเบื้องต้นต่อไปนี้:

การเข้าถึง คอนโซลการจัดการ AWS ผ่านผู้ใช้ที่สามารถเปิดใช้งานได้ สแต็ค AWS CloudFormation
ความคุ้นเคยกับการนำทาง AWS แลมบ์ดา และ อเมซอน เล็กซ์ คอนโซล
Flan-UL2 ต้องใช้อันเดียว ml.g5.12xlarge สำหรับการใช้งานซึ่งอาจจำเป็นต้องเพิ่มขีดจำกัดทรัพยากรผ่านทาง สนับสนุนตั๋ว. ในตัวอย่างของเรา เราใช้ us-east-1 ในฐานะภูมิภาค ดังนั้นโปรดตรวจสอบให้แน่ใจว่าได้เพิ่มโควต้าการบริการ (หากจำเป็น) ใน us-east-1.

ปรับใช้โดยใช้ CloudFormation – คุณสามารถปรับใช้โซลูชันได้ us-east-1 โดยคลิกที่ปุ่มด้านล่าง:

การปรับใช้โซลูชันจะใช้เวลาประมาณ 20 นาที และจะสร้าง LLMAgentStack สแต็ก ซึ่ง:

ปรับใช้ตำแหน่งข้อมูล SageMaker โดยใช้ Flan-UL2 โมเดลจาก SageMaker JumpStart;
ปรับใช้ฟังก์ชัน Lambda สามฟังก์ชัน: LLMAgentOrchestrator, LLMAgentReturnsTool, LLMAgentOrdersToolและ
ปรับใช้ไฟล์ AWS เล็ก บอทที่สามารถใช้เพื่อทดสอบตัวแทน: Sagemaker-Jumpstart-Flan-LLM-Agent-Fallback-Bot.

ทดสอบวิธีแก้ปัญหา

สแต็กปรับใช้บอต Amazon Lex ด้วยชื่อ Sagemaker-Jumpstart-Flan-LLM-Agent-Fallback-Bot. สามารถใช้บอทเพื่อทดสอบเอเจนต์ตั้งแต่ต้นทางถึงปลายทางได้ ต่อไปนี้เป็นคำแนะนำที่ครอบคลุมเพิ่มเติมสำหรับการทดสอบบอต AWS Amazon Lex ด้วยการผสานรวม Lambda และวิธีการผสานการทำงานในระดับสูง โดยสรุปแล้ว บอต Amazon Lex เป็นทรัพยากรที่ให้ UI ที่รวดเร็วเพื่อแชทกับตัวแทน LLM ที่ทำงานภายในฟังก์ชัน Lambda ที่เราสร้างขึ้น (LLMAgentOrchestrator).

กรณีทดสอบตัวอย่างที่ต้องพิจารณามีดังนี้:

สอบถามการสั่งซื้อที่ถูกต้อง (เช่น “สินค้าชิ้นไหนที่สั่ง 123456-
- คำสั่งซื้อ “123456” เป็นคำสั่งซื้อที่ถูกต้อง ดังนั้นเราจึงควรคาดหวังคำตอบที่สมเหตุสมผล (เช่น “สบู่สมุนไพร”)
สอบถามการคืนสินค้าที่ถูกต้อง สำหรับการส่งคืน (เช่น “ฉันจะกลับมาเมื่อใด rtn003 ประมวลผลแล้ว?”)
- เราควรคาดหวังคำตอบที่สมเหตุสมผลเกี่ยวกับสถานะของการคืนสินค้า
ไม่เกี่ยวข้องกับการคืนสินค้าหรือคำสั่งซื้อ (เช่น “ตอนนี้สภาพอากาศในสกอตแลนด์เป็นอย่างไร”)
- คำถามที่ไม่เกี่ยวข้องกับการคืนสินค้าหรือคำสั่งซื้อ ดังนั้นควรส่งคืนคำตอบเริ่มต้น (“ขออภัย ฉันไม่สามารถตอบคำถามนั้นได้”)
การสอบถามคำสั่งซื้อไม่ถูกต้อง (เช่น “สินค้าชิ้นไหนที่สั่ง 383833-
- ไม่มีรหัส 383832 ในชุดข้อมูลคำสั่งซื้อ ดังนั้นเราจึงควรล้มเหลวอย่างสมบูรณ์ (เช่น "ไม่พบคำสั่งซื้อ โปรดตรวจสอบรหัสคำสั่งซื้อของคุณ")
การสอบถามการคืนสินค้าไม่ถูกต้อง (เช่น “ฉันจะกลับมาเมื่อไหร่” rtn123 ประมวลผลแล้ว?”)
- ในทำนองเดียวกันไอดี rtn123 ไม่มีอยู่ในชุดข้อมูลที่ส่งคืน และด้วยเหตุนี้จึงควรล้มเหลวอย่างสวยงาม
การสอบถามการคืนสินค้าที่ไม่เกี่ยวข้อง (เช่น “ผลตอบแทนมีผลกระทบอย่างไร” rtn001 เรื่องสันติภาพโลก?”)
- แม้ว่าคำถามนี้จะเกี่ยวข้องกับคำสั่งซื้อที่ถูกต้อง แต่ก็ไม่เกี่ยวข้อง LLM ใช้เพื่อกรองคำถามที่มีบริบทที่ไม่เกี่ยวข้อง

หากต้องการดำเนินการทดสอบเหล่านี้ด้วยตนเอง ต่อไปนี้เป็นคำแนะนำ

บนคอนโซล Amazon Lex (คอนโซล AWS > Amazon Lex) นำทางไปยังบอทที่ชื่อ Sagemaker-Jumpstart-Flan-LLM-Agent-Fallback-Bot. บอทนี้ได้รับการกำหนดค่าให้เรียก LLMAgentOrchestrator ฟังก์ชั่นแลมบ์ดาเมื่อใดก็ตามที่ FallbackIntent ถูกทริกเกอร์
ในบานหน้าต่างนำทาง เลือก เจตนา.
Choose สร้าง ที่มุมขวาบน
4. รอให้กระบวนการสร้างเสร็จสิ้น เมื่อเสร็จแล้ว คุณจะได้รับข้อความแสดงความสำเร็จ ดังที่แสดงในภาพหน้าจอต่อไปนี้
ทดสอบบอทโดยเข้าสู่กรณีทดสอบ

ทำความสะอาด

เพื่อหลีกเลี่ยงค่าใช้จ่ายเพิ่มเติม ให้ลบทรัพยากรที่สร้างโดยโซลูชันของเราโดยทำตามขั้นตอนเหล่านี้:

เกี่ยวกับ การก่อตัวของ AWS Cloud คอนโซล ให้เลือกสแต็กที่ชื่อ LLMAgentStack (หรือชื่อที่กำหนดเองที่คุณเลือก)
Choose ลบ
ตรวจสอบว่าสแตกถูกลบออกจากคอนโซล CloudFormation แล้ว

สำคัญ: ตรวจสอบอีกครั้งว่าสแต็กถูกลบสำเร็จโดยตรวจสอบให้แน่ใจว่า Flan-UL2 จุดสิ้นสุดการอนุมานจะถูกลบออก

หากต้องการตรวจสอบ ให้ไปที่ คอนโซล AWS > Sagemaker > ตำแหน่งข้อมูล > การอนุมาน หน้า.
หน้านี้ควรแสดงรายการปลายทางที่ใช้งานอยู่ทั้งหมด
ให้แน่ใจว่า sm-jumpstart-flan-bot-endpoint ไม่มีเหมือนภาพหน้าจอด้านล่าง

นักปราชญ์ทำความสะอาด

ข้อควรพิจารณาในการผลิต

การปรับใช้ตัวแทน LLM ในการผลิตจำเป็นต้องมีขั้นตอนเพิ่มเติมเพื่อให้มั่นใจในความน่าเชื่อถือ ประสิทธิภาพ และการบำรุงรักษา ข้อควรพิจารณาบางประการก่อนที่จะปรับใช้ตัวแทนในการผลิต:

การเลือกโมเดล LLM เพื่อขับเคลื่อนลูปเอเจนต์: สำหรับวิธีแก้ปัญหาที่กล่าวถึงในโพสต์นี้ เราใช้ Flan-UL2 โดยไม่ต้องปรับแต่งอย่างละเอียดเพื่อดำเนินการวางแผนงานหรือเลือกเครื่องมือ ในทางปฏิบัติ การใช้ LLM ที่ได้รับการปรับแต่งอย่างละเอียดเพื่อส่งออกเครื่องมือหรือคำขอ API โดยตรงจะสามารถเพิ่มความน่าเชื่อถือและประสิทธิภาพได้ รวมถึงทำให้การพัฒนาง่ายขึ้น เราสามารถปรับแต่ง LLM ในงานการเลือกเครื่องมือ หรือใช้โมเดลที่ถอดรหัสโทเค็นเครื่องมือโดยตรง เช่น Toolformer
- การใช้โมเดลที่ได้รับการปรับแต่งยังช่วยลดความยุ่งยากในการเพิ่ม ลบ และอัปเดตเครื่องมือที่ตัวแทนใช้งานได้ ด้วยแนวทางที่ใช้เฉพาะพรอมต์เท่านั้น การอัพเดตเครื่องมือจำเป็นต้องแก้ไขทุกพร้อมต์ภายในตัวจัดการเอเจนต์ เช่น สำหรับการวางแผนงาน การแยกวิเคราะห์เครื่องมือ และการจัดส่งเครื่องมือ นี่อาจเป็นเรื่องยุ่งยาก และประสิทธิภาพอาจลดลงหากมีเครื่องมือมากเกินไปในบริบทของ LLM
ความน่าเชื่อถือและประสิทธิภาพ: เอเจนต์ LLM อาจไม่น่าเชื่อถือ โดยเฉพาะสำหรับงานที่ซับซ้อนซึ่งไม่สามารถทำได้ภายในไม่กี่ลูป การเพิ่มการตรวจสอบความถูกต้องของเอาต์พุต การลองใหม่ การสร้างโครงสร้างเอาต์พุตจาก LLM ลงใน JSON หรือ yaml และการบังคับใช้การหมดเวลาเพื่อให้ Escape Hates สำหรับ LLM ที่ติดอยู่ในลูปจะช่วยเพิ่มความน่าเชื่อถือได้

สรุป

ในโพสต์นี้ เราได้สำรวจวิธีสร้างตัวแทน LLM ที่สามารถใช้เครื่องมือหลายอย่างตั้งแต่ต้นจนจบ โดยใช้วิศวกรรมพร้อมต์ระดับต่ำ ฟังก์ชัน AWS Lambda และ SageMaker JumpStart เป็นส่วนประกอบ เราได้พูดคุยถึงสถาปัตยกรรมของตัวแทน LLM และลูปตัวแทนโดยละเอียด แนวคิดและสถาปัตยกรรมโซลูชันที่แนะนำในบล็อกโพสต์นี้อาจเหมาะสมสำหรับตัวแทนที่ใช้ชุดเครื่องมือที่กำหนดไว้ล่วงหน้าจำนวนเล็กน้อย นอกจากนี้เรายังได้กล่าวถึงกลยุทธ์หลายประการสำหรับการใช้ตัวแทนในการผลิต ตัวแทนสำหรับ Bedrock ซึ่งอยู่ในการแสดงตัวอย่าง ยังมอบประสบการณ์ที่มีการจัดการสำหรับการสร้างเอเจนต์ด้วยการสนับสนุนดั้งเดิมสำหรับการเรียกใช้เครื่องมือเอเจนต์

เกี่ยวกับผู้เขียน

จอห์น ฮวาง เป็นสถาปนิก Generative AI ที่ AWS โดยมุ่งเน้นเป็นพิเศษในแอปพลิเคชัน Large Language Model (LLM) ฐานข้อมูลเวกเตอร์ และกลยุทธ์ผลิตภัณฑ์ AI เชิงสร้างสรรค์ เขามีความกระตือรือร้นในการช่วยเหลือบริษัทในการพัฒนาผลิตภัณฑ์ AI/ML และอนาคตของตัวแทน LLM และนักบินร่วม ก่อนที่จะมาร่วมงานกับ AWS เขาเป็นผู้จัดการผลิตภัณฑ์ที่ Alexa โดยเขาได้ช่วยนำ AI แบบสนทนามาสู่อุปกรณ์มือถือ รวมถึงเป็นผู้ค้าอนุพันธ์ที่ Morgan Stanley เขาสำเร็จการศึกษาระดับปริญญาตรีสาขาวิทยาการคอมพิวเตอร์จากมหาวิทยาลัยสแตนฟอร์ด

เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
PlatoData.Network Vertical Generative Ai เพิ่มพลังให้กับตัวเอง เข้าถึงได้ที่นี่.
เพลโตไอสตรีม. Web3 อัจฉริยะ ขยายความรู้ เข้าถึงได้ที่นี่.
เพลโตESG. ยานยนต์ / EVs, คาร์บอน, คลีนเทค, พลังงาน, สิ่งแวดล้อม แสงอาทิตย์, การจัดการของเสีย. เข้าถึงได้ที่นี่.
เพลโตสุขภาพ เทคโนโลยีชีวภาพและข่าวกรองการทดลองทางคลินิก เข้าถึงได้ที่นี่.
ChartPrime. ยกระดับเกมการซื้อขายของคุณด้วย ChartPrime เข้าถึงได้ที่นี่.
BlockOffsets การปรับปรุงการเป็นเจ้าของออฟเซ็ตด้านสิ่งแวดล้อมให้ทันสมัย เข้าถึงได้ที่นี่.
ที่มา: https://aws.amazon.com/blogs/machine-learning/learn-how-to-build-and-deploy-tool-using-llm-agents-using-aws-sagemaker-jumpstart-foundation-models/

ประทับเวลา: September 15, 2023

ประทับเวลา: พฤศจิกายน 16, 2023

เรียนรู้วิธีสร้างและปรับใช้เอเจนต์ LLM โดยใช้เครื่องมือโดยใช้ AWS SageMaker JumpStart Foundation Models | อเมซอนเว็บเซอร์วิส

เผยแพร่ซ้ำโดยเพลโต

ภาพรวมโดยย่อของสถาปัตยกรรมตัวแทน LLM

ภาพรวมโซลูชัน

ตัวแทนผู้เรียบเรียง

ผู้วางแผนงาน (การทำนายเครื่องมือ)

ผู้มอบหมายงานเครื่องมือ

ปรับใช้โซลูชัน

ทดสอบวิธีแก้ปัญหา

ทำความสะอาด

ข้อควรพิจารณาในการผลิต

สรุป

เกี่ยวกับผู้เขียน

เพิ่มเติมจาก AWS Machine Learning AWS

Amp บน Amazon ใช้ข้อมูลเพื่อเพิ่มการมีส่วนร่วมของลูกค้าอย่างไร ส่วนที่ 1: การสร้างแพลตฟอร์มการวิเคราะห์ข้อมูล

กำหนดค่าสล็อต DTMF และพร้อมท์ให้ลองใหม่ตามคำสั่งด้วย Amazon Lex

ปรับแต่งการออกเสียงโดยใช้ Amazon Polly

เรียกใช้และเพิ่มประสิทธิภาพการอนุมานหลายรุ่นด้วยตำแหน่งข้อมูลหลายรุ่นของ Amazon SageMaker

เชื่อมต่อ Amazon EMR และ RStudio บน Amazon SageMaker

หลักสูตรเจาะลึกทางเทคนิคใหม่: Generative AI Foundations บน AWS | บริการเว็บอเมซอน

สร้างไปป์ไลน์การอนุมาน AI เกี่ยวกับภาพทางการแพทย์ด้วย MONAI Deploy บน AWS | อเมซอนเว็บเซอร์วิส

ปรับแต่งโมเดล Whisper บน Amazon SageMaker พร้อม LoRA | อเมซอนเว็บเซอร์วิส

เกี่ยวกับเรา

การค้นหาแนวตั้ง & Ai

ระบบปฏิบัติการ

การติดต่อ

ลงชื่อเข้าใช้