เมล็ดพันธุ์ของการเปลี่ยนแปลงกระบวนทัศน์ของแมชชีนเลิร์นนิง (ML) มีมานานหลายทศวรรษแล้ว แต่ด้วยความพร้อมใช้งานของความสามารถในการประมวลผลที่แทบจะไม่มีที่สิ้นสุด การแพร่กระจายของข้อมูลจำนวนมหาศาล และความก้าวหน้าอย่างรวดเร็วของเทคโนโลยี ML ทำให้ลูกค้าในอุตสาหกรรมต่าง ๆ ต่างยอมรับและใช้ ML อย่างรวดเร็ว เทคโนโลยีเพื่อพลิกโฉมธุรกิจของพวกเขา
เมื่อเร็วๆ นี้ แอปพลิเคชั่น AI กำเนิดได้ดึงดูดความสนใจและจินตนาการของทุกคน เราอยู่ในจุดเปลี่ยนที่น่าตื่นเต้นอย่างแท้จริงในการนำ ML มาใช้อย่างแพร่หลาย และเราเชื่อว่าทุกประสบการณ์ของลูกค้าและแอปพลิเคชันจะได้รับการคิดค้นขึ้นใหม่ด้วย AI กำเนิด
Generative AI คือ AI ประเภทหนึ่งที่สามารถสร้างเนื้อหาและแนวคิดใหม่ๆ รวมถึงบทสนทนา เรื่องราว รูปภาพ วิดีโอ และเพลง เช่นเดียวกับ AI ทั้งหมด AI เชิงกำเนิดนั้นขับเคลื่อนโดยโมเดล ML ซึ่งเป็นโมเดลขนาดใหญ่มากที่ได้รับการฝึกอบรมล่วงหน้าจากกลุ่มข้อมูลจำนวนมหาศาล และเรียกกันทั่วไปว่าโมเดลพื้นฐาน (FMs)
ขนาดและลักษณะวัตถุประสงค์ทั่วไปของ FM ทำให้แตกต่างจากโมเดล ML แบบดั้งเดิม ซึ่งโดยทั่วไปจะทำงานเฉพาะ เช่น การวิเคราะห์ข้อความสำหรับความรู้สึก การจัดประเภทรูปภาพ และการคาดการณ์แนวโน้ม
ด้วยโมเดล ML ดั้งเดิม เพื่อให้บรรลุงานเฉพาะแต่ละอย่าง คุณต้องรวบรวมข้อมูลที่มีป้ายกำกับ ฝึกโมเดล และนำโมเดลนั้นไปใช้จริง ด้วยโมเดลพื้นฐาน แทนที่จะรวบรวมข้อมูลที่มีป้ายกำกับสำหรับแต่ละโมเดลและฝึกหลายๆ โมเดล คุณสามารถใช้ FM ที่ได้รับการฝึกอบรมล่วงหน้าชุดเดียวกันเพื่อปรับงานต่างๆ ได้ คุณยังสามารถปรับแต่ง FM เพื่อทำหน้าที่เฉพาะโดเมนที่สร้างความแตกต่างให้กับธุรกิจของคุณ โดยใช้ข้อมูลเพียงเล็กน้อยและการคำนวณที่จำเป็นในการฝึกโมเดลตั้งแต่เริ่มต้น
Generative AI มีศักยภาพในการพลิกโฉมอุตสาหกรรมต่างๆ ด้วยการปฏิวัติวิธีการสร้างและบริโภคเนื้อหา การผลิตเนื้อหาต้นฉบับ การสร้างโค้ด การปรับปรุงการบริการลูกค้า และการสรุปเอกสารเป็นกรณีการใช้งานทั่วไปของ AI เชิงกำเนิด
Amazon SageMaker JumpStart ให้โมเดลโอเพ่นซอร์สที่ผ่านการฝึกอบรมล่วงหน้าสำหรับประเภทปัญหาที่หลากหลายเพื่อช่วยให้คุณเริ่มต้นใช้งาน ML คุณสามารถฝึกและปรับแต่งโมเดลเหล่านี้แบบค่อยเป็นค่อยไปก่อนที่จะปรับใช้ JumpStart ยังมีเทมเพลตโซลูชันที่ตั้งค่าโครงสร้างพื้นฐานสำหรับกรณีการใช้งานทั่วไป และโน้ตบุ๊กตัวอย่างที่สามารถดำเนินการได้สำหรับ ML ด้วย อเมซอน SageMaker.
ด้วยแบบจำลองที่ผ่านการฝึกอบรมล่วงหน้ากว่า 600 แบบที่มีอยู่และเติบโตขึ้นทุกวัน JumpStart ช่วยให้นักพัฒนาสามารถรวมเทคนิค ML ที่ทันสมัยเข้ากับเวิร์กโฟลว์การผลิตของตนได้อย่างรวดเร็วและง่ายดาย คุณสามารถเข้าถึงโมเดลที่ผ่านการฝึกอบรมล่วงหน้า เทมเพลตโซลูชัน และตัวอย่างผ่านหน้า Landing Page ของ JumpStart ใน สตูดิโอ Amazon SageMaker. คุณยังสามารถเข้าถึงโมเดล JumpStart โดยใช้ SageMaker Python SDK สำหรับข้อมูลเกี่ยวกับวิธีการใช้โมเดล JumpStart โดยทางโปรแกรม โปรดดูที่ ใช้อัลกอริทึม SageMaker JumpStart กับโมเดลที่ฝึกไว้ล่วงหน้า.
ในเดือนเมษายน 2023 AWS ได้เปิดตัว อเมซอน เบดร็อคซึ่งมอบวิธีการสร้างแอปที่ขับเคลื่อนด้วย AI ผ่านโมเดลที่ได้รับการฝึกอบรมล่วงหน้าจากสตาร์ทอัพ ได้แก่ AI21 แล็บ, มานุษยวิทยาและ ความเสถียร AI. Amazon Bedrock ยังเสนอการเข้าถึงโมเดลพื้นฐาน Titan ซึ่งเป็นตระกูลโมเดลที่ได้รับการฝึกฝนภายในโดย AWS ด้วยประสบการณ์แบบไร้เซิร์ฟเวอร์ของ Amazon Bedrock คุณสามารถค้นหาโมเดลที่เหมาะกับความต้องการของคุณ เริ่มต้นอย่างรวดเร็ว ปรับแต่ง FM แบบส่วนตัวด้วยข้อมูลของคุณเอง และรวมและปรับใช้เข้ากับแอปพลิเคชันของคุณได้อย่างง่ายดายโดยใช้เครื่องมือและความสามารถ AWS ที่คุณคุ้นเคย ด้วย (รวมถึงการผสานรวมกับคุณสมบัติ SageMaker ML เช่น การทดลอง Amazon SageMaker เพื่อทดสอบรุ่นต่างๆและ ท่อส่ง Amazon SageMaker เพื่อจัดการ FM ของคุณตามขนาด) โดยไม่ต้องจัดการโครงสร้างพื้นฐานใดๆ
ในโพสต์นี้ เราจะแสดงวิธีการปรับใช้โมเดล AI ที่สร้างรูปภาพและข้อความจาก JumpStart โดยใช้ ชุดพัฒนา AWS Cloud (AWS CDK) AWS CDK เป็นเฟรมเวิร์กการพัฒนาซอฟต์แวร์แบบโอเพ่นซอร์สเพื่อกำหนดทรัพยากรแอปพลิเคชันระบบคลาวด์ของคุณโดยใช้ภาษาการเขียนโปรแกรมที่คุ้นเคย เช่น Python
เราใช้รุ่น Stable Diffusion สำหรับการสร้างภาพ และรุ่น FLAN-T5-XL สำหรับ ความเข้าใจภาษาธรรมชาติ (NLU) และการสร้างข้อความจาก กอดหน้า ใน JumpStart
ภาพรวมโซลูชัน
เว็บแอปพลิเคชันถูกสร้างขึ้นบน สตรีมไลท์ซึ่งเป็นไลบรารี Python แบบโอเพ่นซอร์สที่ช่วยให้สร้างและแชร์เว็บแอปที่สวยงามและกำหนดเองสำหรับ ML และวิทยาศาสตร์ข้อมูลได้อย่างง่ายดาย เราโฮสต์เว็บแอปพลิเคชันโดยใช้ บริการ Amazon Elastic Container (อเมซอน อีซีเอส) กับ AWS ฟาร์เกต และสามารถเข้าถึงได้ผ่าน Application Load Balancer Fargate เป็นเทคโนโลยีที่คุณสามารถใช้กับ Amazon ECS เพื่อเรียกใช้ ตู้คอนเทนเนอร์ โดยไม่ต้องจัดการเซิร์ฟเวอร์หรือคลัสเตอร์หรือเครื่องเสมือน จุดสิ้นสุดของโมเดล AI กำเนิดนั้นเปิดตัวจากอิมเมจ JumpStart ใน การลงทะเบียน Amazon Elastic Container (อีซีอาร์ของอเมซอน) ข้อมูลโมเดลถูกเก็บไว้ บริการจัดเก็บข้อมูลอย่างง่ายของ Amazon (Amazon S3) ในบัญชี JumpStart เว็บแอปพลิเคชันโต้ตอบกับโมเดลผ่านทาง Amazon API Gateway Amazon และ AWS แลมบ์ดา ทำหน้าที่ดังแผนภาพต่อไปนี้
API Gateway จัดเตรียมเว็บแอปพลิเคชันและไคลเอนต์อื่นๆ ด้วยอินเทอร์เฟซ RESTful มาตรฐาน ในขณะที่ป้องกันฟังก์ชัน Lambda ที่เชื่อมต่อกับโมเดล สิ่งนี้ทำให้รหัสแอปพลิเคชันไคลเอนต์ที่ใช้โมเดลง่ายขึ้น จุดสิ้นสุดของเกตเวย์ API สามารถเข้าถึงได้แบบสาธารณะในตัวอย่างนี้ ทำให้มีความเป็นไปได้ที่จะขยายสถาปัตยกรรมนี้เพื่อใช้งานที่แตกต่างกัน การควบคุมการเข้าถึง API และรวมเข้ากับแอพพลิเคชั่นอื่นๆ
ในโพสต์นี้ เราจะแนะนำคุณผ่านขั้นตอนต่อไปนี้:
- ติดตั้ง อินเทอร์เฟซบรรทัดคำสั่ง AWS AWS (AWS CLI) และ AWS CDK เวอร์ชัน 2 บนเครื่องท้องถิ่นของคุณ
- โคลนและตั้งค่าแอปพลิเคชัน AWS CDK
- ปรับใช้แอปพลิเคชัน AWS CDK
- ใช้โมเดล AI สร้างภาพ
- ใช้โมเดล AI ในการสร้างข้อความ
- ดูทรัพยากรที่ใช้งานบน คอนโซลการจัดการ AWS.
เราให้ภาพรวมของรหัสในโครงการนี้ในภาคผนวกที่ส่วนท้ายของโพสต์นี้
เบื้องต้น
คุณต้องมีข้อกำหนดเบื้องต้นดังต่อไปนี้:
คุณสามารถปรับใช้โครงสร้างพื้นฐานในบทช่วยสอนนี้จากเครื่องคอมพิวเตอร์ของคุณหรือคุณสามารถใช้ AWS Cloud9 เป็นเวิร์กสเตชันการปรับใช้ของคุณ AWS Cloud9 มาพร้อมกับ AWS CLI, AWS CDK และ Docker ที่โหลดไว้ล่วงหน้า หากคุณเลือกใช้ AWS Cloud9 สร้างสภาพแวดล้อม จาก คอนโซล AWS.
ค่าใช้จ่ายโดยประมาณในการโพสต์นี้คือ 50 ดอลลาร์ สมมติว่าคุณปล่อยให้ทรัพยากรทำงานเป็นเวลา 8 ชั่วโมง ตรวจสอบให้แน่ใจว่าคุณได้ลบทรัพยากรที่คุณสร้างในโพสต์นี้เพื่อหลีกเลี่ยงการเรียกเก็บเงินอย่างต่อเนื่อง
ติดตั้ง AWS CLI และ AWS CDK บนเครื่องของคุณ
หากคุณยังไม่มี AWS CLI ในเครื่องของคุณ โปรดดูที่ การติดตั้งหรืออัปเดตเวอร์ชันล่าสุดของ AWS CLI และ การกำหนดค่า AWS CLI.
ติดตั้ง AWS CDK Toolkit ทั่วโลกโดยใช้คำสั่ง node package manager ต่อไปนี้:
เรียกใช้คำสั่งต่อไปนี้เพื่อตรวจสอบการติดตั้งที่ถูกต้องและพิมพ์หมายเลขเวอร์ชันของ AWS CDK:
ตรวจสอบให้แน่ใจว่าคุณได้ติดตั้ง Docker ไว้ในเครื่องของคุณ ใช้คำสั่งต่อไปนี้เพื่อตรวจสอบเวอร์ชัน:
โคลนและตั้งค่าแอปพลิเคชัน AWS CDK
ในเครื่องของคุณ ให้โคลนแอปพลิเคชัน AWS CDK ด้วยคำสั่งต่อไปนี้:
นำทางไปยังโฟลเดอร์โครงการ:
ก่อนที่เราจะปรับใช้แอปพลิเคชัน เรามาทบทวนโครงสร้างไดเร็กทอรีกัน:
พื้นที่ stack
โฟลเดอร์มีโค้ดสำหรับแต่ละสแต็กในแอปพลิเคชัน AWS CDK เดอะ code
โฟลเดอร์มีโค้ดสำหรับฟังก์ชันแลมบ์ดา ที่เก็บยังมีเว็บแอปพลิเคชันที่อยู่ภายใต้โฟลเดอร์ web-app
.
พื้นที่ cdk.json
ไฟล์จะบอก AWS CDK Toolkit ถึงวิธีการเรียกใช้แอปพลิเคชันของคุณ
แอปพลิเคชันนี้ได้รับการทดสอบใน us-east-1
ภูมิภาค แต่ควรทำงานในภูมิภาคใดก็ได้ที่มีบริการที่จำเป็นและประเภทอินสแตนซ์การอนุมาน ml.g4dn.4xlarge
ระบุไว้ใน app.py
.
ตั้งค่าสภาพแวดล้อมเสมือนจริง
โครงการนี้ตั้งค่าเหมือนโครงการ Python มาตรฐาน สร้างสภาพแวดล้อมเสมือน Python โดยใช้รหัสต่อไปนี้:
ใช้คำสั่งต่อไปนี้เพื่อเปิดใช้งานสภาพแวดล้อมเสมือน:
หากคุณอยู่บนแพลตฟอร์ม Windows ให้เปิดใช้งานสภาพแวดล้อมเสมือนจริงดังต่อไปนี้:
หลังจากเปิดใช้งานสภาพแวดล้อมเสมือนแล้ว ให้อัปเกรด pip เป็นเวอร์ชันล่าสุด:
ติดตั้งการพึ่งพาที่จำเป็น:
ก่อนที่คุณจะปรับใช้แอปพลิเคชัน AWS CDK คุณต้องบูตช่องว่างในบัญชีของคุณและภูมิภาคที่คุณปรับใช้ หากต้องการบู๊ตสแตรปในภูมิภาคเริ่มต้นของคุณ ให้ออกคำสั่งต่อไปนี้:
หากคุณต้องการปรับใช้ในบัญชีและภูมิภาคเฉพาะ ให้ออกคำสั่งต่อไปนี้:
สำหรับข้อมูลเพิ่มเติมเกี่ยวกับการตั้งค่านี้ โปรดไปที่ เริ่มต้นใช้งาน AWS CDK.
โครงสร้างสแต็กแอปพลิเคชัน AWS CDK
แอปพลิเคชัน AWS CDK มีหลายสแต็ก ดังแสดงในไดอะแกรมต่อไปนี้
คุณสามารถแสดงรายการสแต็กในแอปพลิเคชัน AWS CDK ของคุณโดยใช้คำสั่งต่อไปนี้:
ต่อไปนี้คือคำสั่ง AWS CDK อื่นๆ ที่มีประโยชน์:
- ซีดีเค แอลเอส - แสดงสแต็กทั้งหมดในแอป
- cdk ซินธ์ – เปล่งเสียงสังเคราะห์ การก่อตัวของ AWS Cloud เทมเพลต
- cdk ปรับใช้ – ปรับใช้สแต็กนี้กับบัญชี AWS และภูมิภาคเริ่มต้นของคุณ
- ความแตกต่างของ cdk – เปรียบเทียบกองปรับใช้กับสถานะปัจจุบัน
- เอกสาร cdk – เปิดเอกสาร AWS CDK
ส่วนถัดไปแสดงวิธีการปรับใช้แอปพลิเคชัน AWS CDK
ปรับใช้แอปพลิเคชัน AWS CDK
แอปพลิเคชัน AWS CDK จะปรับใช้ในภูมิภาคเริ่มต้นตามการกำหนดค่าเวิร์กสเตชันของคุณ หากคุณต้องการบังคับให้ปรับใช้ในภูมิภาคใดภูมิภาคหนึ่ง ให้ตั้งค่าของคุณ AWS_DEFAULT_REGION
ตัวแปรสภาพแวดล้อมตามนั้น
ณ จุดนี้ คุณสามารถปรับใช้แอปพลิเคชัน AWS CDK ได้ ขั้นแรก ให้คุณเปิดสแต็กเครือข่าย VPC:
หากคุณได้รับพร้อมท์ ให้ป้อน y
เพื่อดำเนินการปรับใช้ คุณควรเห็นรายการทรัพยากร AWS ที่กำลังจัดเตรียมอยู่ในสแต็ก ขั้นตอนนี้ใช้เวลาประมาณ 3 นาทีจึงจะเสร็จสมบูรณ์
จากนั้นคุณเปิดเว็บแอ็พพลิเคชันสแต็ก:
หลังจากวิเคราะห์สแต็กแล้ว AWS CDK จะแสดงรายการทรัพยากรในสแต็ก ป้อน y เพื่อดำเนินการปรับใช้ ขั้นตอนนี้ใช้เวลาประมาณ 5 นาที
จดบันทึก WebApplicationServiceURL
จากผลผลิตไปใช้ในภายหลัง คุณยังสามารถเรียกคืนได้บนคอนโซล AWS CloudFormation ภายใต้ GenerativeAiDemoWebStack
เอาต์พุตสแต็ก
ตอนนี้ เรียกใช้สแต็กจุดสิ้นสุดโมเดล AI ในการสร้างรูปภาพ:
ขั้นตอนนี้ใช้เวลาประมาณ 8 นาที จุดสิ้นสุดแบบจำลองการสร้างอิมเมจถูกปรับใช้ ตอนนี้เราสามารถใช้งานได้แล้ว
ใช้โมเดล AI สร้างภาพ
ตัวอย่างแรกสาธิตวิธีการใช้ Stable Diffusion ซึ่งเป็นเทคนิคการสร้างแบบจำลองเชิงกำเนิดที่มีประสิทธิภาพซึ่งช่วยให้สามารถสร้างภาพคุณภาพสูงจากข้อความแจ้งได้
- เข้าถึงเว็บแอปพลิเคชันโดยใช้
WebApplicationServiceURL
จากผลลัพธ์ของGenerativeAiDemoWebStack
ในเบราว์เซอร์ของคุณ - ในบานหน้าต่างนำทาง เลือก การสร้างภาพ.
- พื้นที่ ชื่อจุดสิ้นสุดของ SageMaker และ API GW URL ช่องต่างๆ จะถูกเติมข้อมูลไว้ล่วงหน้า แต่คุณสามารถเปลี่ยนข้อความแจ้งสำหรับคำอธิบายรูปภาพได้หากต้องการ
- Choose สร้างภาพ.
- แอปพลิเคชันจะทำการเรียกไปยังปลายทาง SageMaker ใช้เวลาไม่กี่วินาที ภาพที่มีลักษณะเฉพาะในคำอธิบายภาพของคุณจะปรากฏขึ้น
ใช้โมเดล AI ในการสร้างข้อความ
ตัวอย่างที่สองมุ่งเน้นไปที่การใช้โมเดล FLAN-T5-XL ซึ่งเป็นโมเดลพื้นฐานหรือโมเดลภาษาขนาดใหญ่ (LLM) เพื่อให้เกิดการเรียนรู้ในบริบทสำหรับการสร้างข้อความ ในขณะเดียวกันก็จัดการกับงานความเข้าใจภาษาธรรมชาติ (NLU) และการสร้างภาษาธรรมชาติ (NLG) ที่หลากหลาย
สภาพแวดล้อมบางอย่างอาจจำกัดจำนวนปลายทางที่คุณสามารถเปิดใช้งานได้ในแต่ละครั้ง หากเป็นกรณีนี้ คุณสามารถเปิดใช้งานตำแหน่งข้อมูล SageMaker ได้ครั้งละหนึ่งจุด หากต้องการหยุดตำแหน่งข้อมูล SageMaker ในแอป AWS CDK คุณต้องทำลายสแต็กตำแหน่งข้อมูลที่ใช้งานจริงและก่อนที่จะเปิดใช้งานสแต็กตำแหน่งข้อมูลอื่น หากต้องการลดจุดสิ้นสุดของโมเดล AI ในการสร้างอิมเมจ ให้ออกคำสั่งต่อไปนี้:
จากนั้นเปิดสแต็กเอนด์พอยต์โมเดล AI ในการสร้างข้อความ:
ป้อน y ที่พรอมต์
หลังจากเปิดใช้งาน endpoint stack ของโมเดลการสร้างข้อความแล้ว ให้ทำตามขั้นตอนต่อไปนี้:
- กลับไปที่เว็บแอปพลิเคชันแล้วเลือก การสร้างข้อความ ในบานหน้าต่างนำทาง
- พื้นที่ บริบทการป้อนข้อมูล ช่องนี้มีการเติมข้อมูลล่วงหน้าด้วยการสนทนาระหว่างลูกค้าและตัวแทนเกี่ยวกับปัญหาเกี่ยวกับโทรศัพท์ของลูกค้า แต่คุณสามารถป้อนบริบทของคุณเองได้หากต้องการ
- ใต้บริบท คุณจะพบข้อความค้นหาบางรายการที่กรอกไว้ล่วงหน้าในเมนูแบบเลื่อนลง เลือกแบบสอบถามและเลือก สร้างการตอบสนอง.
- คุณยังสามารถป้อนคำถามของคุณเองใน ป้อนแบบสอบถาม ฟิลด์แล้วเลือก สร้างการตอบสนอง.
ดูทรัพยากรที่ใช้งานบนคอนโซล
บนคอนโซล AWS CloudFormation ให้เลือก สแต็ค ในบานหน้าต่างนำทางเพื่อดูกองซ้อนที่ปรับใช้
บนคอนโซล Amazon ECS คุณสามารถดูคลัสเตอร์บน เครือข่ายวิสาหกิจ หน้า.
บน AWS Lambda Console คุณสามารถดูฟังก์ชันต่างๆ บน ฟังก์ชั่น หน้า.
บนคอนโซล API Gateway คุณสามารถดูจุดสิ้นสุดของ API Gateway บน APIs หน้า.
บนคอนโซล SageMaker คุณสามารถดูจุดสิ้นสุดของแบบจำลองที่ปรับใช้บน ปลายทาง หน้า.
เมื่อเปิดใช้งานสแต็ก พารามิเตอร์บางอย่างจะถูกสร้างขึ้น เหล่านี้จะถูกเก็บไว้ใน ที่เก็บพารามิเตอร์ AWS Systems Manager. หากต้องการดูให้เลือก ที่เก็บพารามิเตอร์ ในบานหน้าต่างนำทางบน ผู้จัดการระบบ AWS ปลอบใจ
ทำความสะอาด
เพื่อหลีกเลี่ยงค่าใช้จ่ายที่ไม่จำเป็น ให้ล้างโครงสร้างพื้นฐานทั้งหมดที่สร้างด้วยคำสั่งต่อไปนี้บนเวิร์กสเตชันของคุณ:
เข้าสู่ y
ที่พรอมต์ ขั้นตอนนี้ใช้เวลาประมาณ 10 นาที ตรวจสอบว่าทรัพยากรทั้งหมดถูกลบบนคอนโซลหรือไม่ ลบบัคเก็ต S3 ของสินทรัพย์ที่สร้างโดย AWS CDK บนคอนโซล Amazon S3 รวมถึงที่เก็บสินทรัพย์ใน Amazon ECR ด้วย
สรุป
ตามที่แสดงในโพสต์นี้ คุณสามารถใช้ AWS CDK เพื่อปรับใช้โมเดล AI เชิงกำเนิดใน JumpStart เราแสดงตัวอย่างการสร้างรูปภาพและตัวอย่างการสร้างข้อความโดยใช้อินเทอร์เฟซผู้ใช้ที่ขับเคลื่อนโดย Streamlit, Lambda และ API Gateway
ตอนนี้คุณสามารถสร้างโปรเจกต์ AI กำเนิดของคุณโดยใช้โมเดล AI ที่ผ่านการฝึกอบรมล่วงหน้าใน JumpStart คุณยังสามารถขยายโครงการนี้เพื่อปรับแต่งโมเดลพื้นฐานสำหรับกรณีการใช้งานของคุณและควบคุมการเข้าถึงจุดสิ้นสุดของ API Gateway
เราขอเชิญคุณทดสอบวิธีแก้ปัญหาและมีส่วนร่วมในโครงการ GitHub. แบ่งปันความคิดของคุณเกี่ยวกับบทช่วยสอนนี้ในความคิดเห็น!
สรุปใบอนุญาต
รหัสตัวอย่างนี้มีให้ใช้งานภายใต้ใบอนุญาต MIT ที่แก้ไขแล้ว ดู ใบอนุญาต ไฟล์สำหรับข้อมูลเพิ่มเติม ตรวจสอบใบอนุญาตที่เกี่ยวข้องสำหรับ การแพร่กระจายที่เสถียร และ แฟลน-t5-xl โมเดลบน Hugging Face
เกี่ยวกับผู้แต่ง
ฮันต์ซลีย์ เทาคัวร์ เป็นผู้นำด้านสถาปัตยกรรมโซลูชันคู่ค้าของ APJ ซึ่งตั้งอยู่ในสิงคโปร์ เขามีประสบการณ์ 20 ปีในอุตสาหกรรม ICT ที่ครอบคลุมการทำงานหลายด้าน รวมถึงสถาปัตยกรรมโซลูชัน การพัฒนาธุรกิจ กลยุทธ์การขาย การให้คำปรึกษา และความเป็นผู้นำ เขาเป็นผู้นำทีม Senior Solutions Architects ที่ช่วยให้คู่ค้าสามารถพัฒนาโซลูชันร่วมกัน สร้างความสามารถทางเทคนิค และควบคุมพวกเขาผ่านขั้นตอนการใช้งานในขณะที่ลูกค้าย้ายข้อมูลและปรับปรุงแอปพลิเคชันของตนให้ทันสมัยไปยัง AWS
ควอนยุล ชอย เป็นซีทีโอของ BABITALK แพลตฟอร์มการดูแลความงามของเกาหลีที่เริ่มต้นขึ้นในกรุงโซล ก่อนหน้านี้ Kownyul เคยทำงานเป็น Software Development Engineer ที่ AWS โดยเน้นไปที่ AWS CDK และ Amazon SageMaker
อรุณประศาสน์ เป็นสถาปนิกโซลูชันผู้เชี่ยวชาญด้าน AI/ML อาวุโสกับ AWS ซึ่งช่วยให้ลูกค้าทั่วโลกปรับขนาดโซลูชัน AI ของตนในระบบคลาวด์ได้อย่างมีประสิทธิภาพและประสิทธิผล ในเวลาว่าง อรุณชอบดูหนังไซไฟและฟังเพลงคลาสสิก
สาทิส อูเปรติ เป็น Migration Lead PSA และ Security SME ในองค์กรพันธมิตรใน APJ Satish มีประสบการณ์ 20 ปีในด้านเทคโนโลยีคลาวด์ส่วนตัวและคลาวด์สาธารณะในสถานที่ นับตั้งแต่เข้าร่วม AWS ในเดือนสิงหาคม 2020 ในฐานะผู้เชี่ยวชาญด้านการย้ายข้อมูล เขาได้ให้คำแนะนำด้านเทคนิคและการสนับสนุนอย่างครอบคลุมแก่คู่ค้า AWS เพื่อวางแผนและดำเนินการย้ายข้อมูลที่ซับซ้อน
ภาคผนวก: คำแนะนำแบบรหัส
ในส่วนนี้ เราจะให้ภาพรวมของรหัสในโครงการนี้
แอปพลิเคชัน AWS CDK
แอปพลิเคชัน AWS CDK หลักมีอยู่ใน app.py
ไฟล์ในไดเรกทอรีราก โครงการประกอบด้วยหลายสแต็ก ดังนั้นเราต้องนำเข้าสแต็ค:
เรากำหนดแบบจำลอง AI กำเนิดของเราและรับ URI ที่เกี่ยวข้องจาก SageMaker:
ฟังก์ชัน get_sagemaker_uris ดึงข้อมูลโมเดลทั้งหมดจาก JumpStart ดู script/sagemaker_uri.py
.
จากนั้นเราจะยกตัวอย่างสแต็ค:
สแต็กแรกที่จะเปิดตัวคือสแต็ก VPC, GenerativeAiVpcNetworkStack สแตกของเว็บแอปพลิเคชัน GenerativeAiDemoWebStack ขึ้นอยู่กับสแต็ก VPC การพึ่งพาทำได้ผ่านพารามิเตอร์ที่ส่ง vpc=network_stack.vpc
ดู app.py
สำหรับรหัสเต็ม
สแต็กเครือข่าย VPC
ในสแต็ก GenerativeAiVpcNetworkStack เราสร้าง VPC ด้วยซับเน็ตสาธารณะและซับเน็ตส่วนตัวที่ขยายข้าม Availability Zone สองโซน:
ดู /stack/generative_ai_vpc_network_stack.py
สำหรับรหัสเต็ม
สแต็คแอปพลิเคชันเว็บสาธิต
ในสแต็ก GenerativeAiDemoWebStack เราเปิดใช้ฟังก์ชัน Lambda และตำแหน่งข้อมูล API Gateway ตามลำดับ ซึ่งเว็บแอปพลิเคชันจะโต้ตอบกับตำแหน่งข้อมูลโมเดล SageMaker ดูข้อมูลโค้ดต่อไปนี้:
เว็บแอปพลิเคชันได้รับการบรรจุและโฮสต์บน Amazon ECS ด้วย Fargate ดูข้อมูลโค้ดต่อไปนี้:
ดู /stack/generative_ai_demo_web_stack.py
สำหรับรหัสเต็ม
สแต็กจุดสิ้นสุดโมเดล SageMaker การสร้างอิมเมจ
สแต็ก GenerativeAiTxt2imgSagemakerStack สร้างจุดสิ้นสุดแบบจำลองการสร้างอิมเมจจาก JumpStart และจัดเก็บชื่อจุดสิ้นสุดใน Systems Manager Parameter Store เว็บแอปพลิเคชันจะใช้พารามิเตอร์นี้ ดูรหัสต่อไปนี้:
ดู /stack/generative_ai_txt2img_sagemaker_stack.py
สำหรับรหัสเต็ม
สแต็กเอ็นพอยต์โมเดล SageMaker และการสร้างข้อความ
สแต็ค GenerativeAiTxt2nluSagemakerStack สร้าง NLU และจุดสิ้นสุดของแบบจำลองการสร้างข้อความจาก JumpStart และจัดเก็บชื่อจุดสิ้นสุดใน Systems Manager Parameter Store เว็บแอปพลิเคชันจะใช้พารามิเตอร์นี้ด้วย ดูรหัสต่อไปนี้:
ดู /stack/generative_ai_txt2nlu_sagemaker_stack.py
สำหรับรหัสเต็ม
โปรแกรมประยุกต์บนเว็บ
เว็บแอปพลิเคชันอยู่ใน /web-app
ไดเรกทอรี เป็นแอปพลิเคชั่น Streamlit ที่บรรจุตาม Dockerfile
:
หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับ Streamlit โปรดดู เอกสาร Streamlit.
- เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
- เพลโตไอสตรีม. ข้อมูลอัจฉริยะ Web3 ขยายความรู้ เข้าถึงได้ที่นี่.
- การสร้างอนาคตโดย Adryenn Ashley เข้าถึงได้ที่นี่.
- ซื้อและขายหุ้นในบริษัท PRE-IPO ด้วย PREIPO® เข้าถึงได้ที่นี่.
- ที่มา: https://aws.amazon.com/blogs/machine-learning/deploy-generative-ai-models-from-amazon-sagemaker-jumpstart-using-the-aws-cdk/
- :มี
- :เป็น
- $ ขึ้น
- 1
- 10
- 100
- 20
- 2020
- 2023
- 7
- 8
- 9
- a
- เกี่ยวกับเรา
- เข้า
- Accessed
- สามารถเข้าถึงได้
- ตาม
- ลงชื่อเข้าใช้
- บรรลุ
- ข้าม
- ปรับ
- ที่อยู่
- การนำ
- การนำมาใช้
- ความก้าวหน้า
- คำแนะนำ
- ตัวแทน
- AI
- ขับเคลื่อนด้วย AI
- AI / ML
- อัลกอริทึม
- ทั้งหมด
- การอนุญาต
- แล้ว
- ด้วย
- อเมซอน
- Amazon API Gateway Amazon
- อเมซอน SageMaker
- Amazon SageMaker JumpStart
- Amazon Web Services
- an
- วิเคราะห์
- และ
- ใด
- API
- app
- การใช้งาน
- การใช้งาน
- ปพลิเคชัน
- เมษายน
- สถาปัตยกรรม
- เป็น
- พื้นที่
- รอบ
- AS
- สินทรัพย์
- At
- ความสนใจ
- สิงหาคม
- ความพร้อมใช้งาน
- ใช้ได้
- หลีกเลี่ยง
- AWS
- AWS Cloud9
- การก่อตัวของ AWS Cloud
- AWS แลมบ์ดา
- กลับ
- แกว่ง
- ตาม
- ค้างคาว
- BE
- สวยงาม
- ร้านเสริมสวยเกาหลี
- ก่อน
- กำลัง
- เชื่อ
- ระหว่าง
- บูต
- กว้าง
- เบราว์เซอร์
- สร้าง
- สร้าง
- ธุรกิจ
- การพัฒนาธุรกิจ
- ธุรกิจ
- แต่
- by
- โทรศัพท์
- CAN
- ความสามารถในการ
- ความจุ
- ถูกจับกุม
- ซึ่ง
- กรณี
- กรณี
- CD
- ศูนย์
- เปลี่ยนแปลง
- ลักษณะ
- โหลด
- ตรวจสอบ
- Choose
- ไคลเอนต์
- ลูกค้า
- เมฆ
- Cloud9
- รหัส
- มา
- ร่วมกัน
- อย่างธรรมดา
- สมบูรณ์
- ซับซ้อน
- คำนวณ
- คอมพิวเตอร์
- องค์ประกอบ
- ปลอบใจ
- สร้าง
- การให้คำปรึกษา
- ถูกใช้
- ที่มีอยู่
- ภาชนะ
- มี
- เนื้อหา
- สิ่งแวดล้อม
- สนับสนุน
- ควบคุม
- การสนทนา
- การสนทนา
- แก้ไข
- ราคา
- สร้าง
- ที่สร้างขึ้น
- สร้าง
- การสร้าง
- CTO
- ปัจจุบัน
- ประเพณี
- ลูกค้า
- ประสบการณ์ของลูกค้า
- บริการลูกค้า
- ลูกค้า
- ปรับแต่ง
- ตัดขอบ
- ข้อมูล
- วิทยาศาสตร์ข้อมูล
- วัน
- ทศวรรษที่ผ่านมา
- ค่าเริ่มต้น
- กำหนด
- แสดงให้เห็นถึง
- แสดงให้เห็นถึง
- การอยู่ที่
- ขึ้นอยู่กับ
- ปรับใช้
- นำไปใช้
- ปรับใช้
- การใช้งาน
- Deploys
- ลักษณะ
- ทำลาย
- พัฒนา
- นักพัฒนา
- พัฒนาการ
- ต่าง
- การจัดจำหน่าย
- แสดง
- ทำลาย
- นักเทียบท่า
- เอกสาร
- ทำ
- Dont
- ลง
- แต่ละ
- อย่างง่ายดาย
- ง่าย
- มีประสิทธิภาพ
- อย่างมีประสิทธิภาพ
- ทำให้สามารถ
- ช่วยให้
- ปลาย
- ปลายทาง
- วิศวกร
- เข้าสู่
- สิ่งแวดล้อม
- สภาพแวดล้อม
- ประมาณ
- ทุกๆ
- ทุกวัน
- ทุกคน
- ตัวอย่าง
- ตัวอย่าง
- น่าตื่นเต้น
- ประสบการณ์
- ขยายออก
- กว้างขวาง
- ใบหน้า
- เท็จ
- คุ้นเคย
- ครอบครัว
- คุณสมบัติ
- สองสาม
- สนาม
- สาขา
- เนื้อไม่มีมัน
- หา
- ชื่อจริง
- โฟกัส
- ดังต่อไปนี้
- ดังต่อไปนี้
- สำหรับ
- บังคับ
- รากฐาน
- เศษ
- กรอบ
- ราคาเริ่มต้นที่
- เต็ม
- ฟังก์ชัน
- การทำงาน
- ฟังก์ชั่น
- เกตเวย์
- รวบรวม
- การรวบรวม
- จุดประสงค์ทั่วไป
- สร้าง
- รุ่น
- กำเนิด
- กำเนิด AI
- ได้รับ
- ไป
- เหตุการณ์ที่
- ทั่วโลก
- การเจริญเติบโต
- มี
- มี
- he
- ช่วย
- การช่วยเหลือ
- ที่มีคุณภาพสูง
- ของเขา
- หน้าแรก
- เจ้าภาพ
- เป็นเจ้าภาพ
- ชั่วโมง
- สรุป ความน่าเชื่อถือของ Olymp Trade?
- ทำอย่างไร
- HTML
- ที่ http
- HTTPS
- ไอซีที
- ความคิด
- if
- ภาพ
- ภาพ
- จินตนาการ
- การดำเนินการ
- การดำเนินงาน
- นำเข้า
- in
- รวมทั้ง
- รวมเข้าด้วยกัน
- อุตสาหกรรม
- อุตสาหกรรม
- อนันต์
- จุดสะท้อน
- ข้อมูล
- โครงสร้างพื้นฐาน
- ติดตั้ง
- การติดตั้ง
- การติดตั้ง
- ตัวอย่าง
- แทน
- รวบรวม
- การผสานรวม
- เชิงโต้ตอบ
- อินเตอร์เฟซ
- เข้าไป
- เชิญ
- ปัญหา
- IT
- การร่วม
- ร่วมกัน
- jpg
- JSON
- เกาหลี
- เชื่อมโยงไปถึง
- ภาษา
- ภาษา
- ใหญ่
- ต่อมา
- ล่าสุด
- เปิดตัว
- เปิดตัว
- การเปิดตัว
- นำ
- ผู้นำ
- ความเป็นผู้นำ
- นำไปสู่
- เรียนรู้
- การเรียนรู้
- ทิ้ง
- ห้องสมุด
- License
- ใบอนุญาต
- กดไลก์
- LIMIT
- Line
- รายการ
- การฟัง
- รายการ
- LLM
- โหลด
- ในประเทศ
- ที่ตั้งอยู่
- เครื่อง
- เรียนรู้เครื่อง
- เครื่อง
- ทำ
- หลัก
- ทำ
- ทำให้
- จัดการ
- การจัดการ
- ผู้จัดการ
- หลาย
- มาก
- เมนู
- อาจ
- อพยพ
- การโยกย้าย
- นาที
- เอ็มไอที
- ML
- แบบ
- โมเดล
- ทันสมัย
- การแก้ไข
- ข้อมูลเพิ่มเติม
- Movies
- หลาย
- ดนตรี
- ต้อง
- ชื่อ
- โดยธรรมชาติ
- ธรรมชาติ
- การเดินเรือ
- จำเป็นต้อง
- ความต้องการ
- เครือข่าย
- ใหม่
- ถัดไป
- ปม
- ตอนนี้
- จำนวน
- of
- เสนอ
- on
- ONE
- ต่อเนื่อง
- เพียง
- โอเพนซอร์ส
- ซอฟต์แวร์โอเพนซอร์ส
- เปิด
- or
- ใบสั่ง
- organizacja
- เป็นต้นฉบับ
- อื่นๆ
- ของเรา
- เอาท์พุต
- เกิน
- ภาพรวม
- ของตนเอง
- แพ็คเกจ
- หน้า
- บานหน้าต่าง
- ตัวอย่าง
- พารามิเตอร์
- พารามิเตอร์
- หุ้นส่วน
- พาร์ทเนอร์
- ที่ผ่านไป
- ดำเนินการ
- ระยะ
- โทรศัพท์
- ภาพ
- แผนการ
- เวที
- เพลโต
- เพลโตดาต้าอินเทลลิเจนซ์
- เพลโตดาต้า
- จุด
- ความเป็นไปได้
- โพสต์
- ที่มีศักยภาพ
- ขับเคลื่อน
- ที่มีประสิทธิภาพ
- ข้อกำหนดเบื้องต้น
- พิมพ์
- ก่อน
- ส่วนตัว
- ปัญหา
- การผลิต
- การเขียนโปรแกรม
- การเขียนโปรแกรมภาษา
- โครงการ
- โครงการ
- ให้
- ให้
- สาธารณะ
- คลาวด์สาธารณะ
- สาธารณชน
- หลาม
- คำสั่ง
- อย่างรวดเร็ว
- พิสัย
- รวดเร็ว
- อย่างรวดเร็ว
- พร้อม
- เมื่อเร็ว ๆ นี้
- เรียกว่า
- เกี่ยวกับ
- ภูมิภาค
- ที่เกี่ยวข้อง
- กรุ
- จำเป็นต้องใช้
- ความต้องการ
- ทรัพยากร
- แหล่งข้อมูล
- ว่า
- ทบทวน
- ปฏิวัติ
- ขวา
- บทบาท
- ราก
- วิ่ง
- วิ่ง
- sagemaker
- ขาย
- เดียวกัน
- ขนาด
- Sci-Fi
- วิทยาศาสตร์
- รอยขีดข่วน
- SDK
- ที่สอง
- วินาที
- Section
- ความปลอดภัย
- เห็น
- เมล็ด
- ตนเอง
- ระดับอาวุโส
- ความรู้สึก
- โซล
- serverless
- เซิร์ฟเวอร์
- บริการ
- บริการ
- ชุด
- การติดตั้ง
- Share
- เปลี่ยน
- น่า
- โชว์
- แสดงให้เห็นว่า
- แสดง
- แสดงให้เห็นว่า
- ง่าย
- ตั้งแต่
- สิงคโปร์
- ขนาด
- เล็ก
- EMS
- So
- ซอฟต์แวร์
- การพัฒนาซอฟต์แวร์
- ทางออก
- โซลูชัน
- บาง
- แหล่ง
- ช่องว่าง
- ผู้เชี่ยวชาญ
- โดยเฉพาะ
- ที่ระบุไว้
- มั่นคง
- กอง
- สแต็ค
- มาตรฐาน
- ข้อความที่เริ่ม
- การเริ่มต้น
- startups
- ขั้นตอน
- ขั้นตอน
- หยุด
- การเก็บรักษา
- จัดเก็บ
- เก็บไว้
- ร้านค้า
- จำนวนชั้น
- กลยุทธ์
- โครงสร้าง
- เครือข่ายย่อย
- สนับสนุน
- ระบบ
- ใช้เวลา
- งาน
- งาน
- ทีม
- วิชาการ
- เทคนิค
- เทคโนโลยี
- เทคโนโลยี
- บอก
- แม่แบบ
- ทดสอบ
- การทดสอบ
- ที่
- พื้นที่
- ของพวกเขา
- พวกเขา
- แล้วก็
- ล้อยางขัดเหล่านี้ติดตั้งบนแกน XNUMX (มม.) ผลิตภัณฑ์นี้ถูกผลิตในหลายรูปทรง และหลากหลายเบอร์ความแน่นหนาของปริมาณอนุภาคขัดของมัน จะทำให้ท่านได้รับประสิทธิภาพสูงในการขัดและการใช้งานที่ยาวนาน
- นี้
- ตลอด
- เวลา
- ยักษ์
- ไปยัง
- เครื่องมือ
- เครื่องมือ
- ประเพณี
- แบบดั้งเดิม
- รถไฟ
- ผ่านการฝึกอบรม
- การฝึกอบรม
- แปลง
- แนวโน้ม
- จริง
- อย่างแท้จริง
- กลับ
- เกี่ยวกับการสอน
- สอง
- ชนิด
- ชนิด
- ตามแบบฉบับ
- เป็นปกติ
- ภายใต้
- ความเข้าใจ
- เปิดตัว
- การปรับปรุง
- อัพเกรด
- ใช้
- ใช้กรณี
- มือสอง
- ผู้ใช้งาน
- ส่วนติดต่อผู้ใช้
- การใช้
- นำไปใช้
- ต่างๆ
- กว้างใหญ่
- ตรวจสอบ
- รุ่น
- ผ่านทาง
- วิดีโอ
- รายละเอียด
- เสมือน
- จวน
- เยี่ยมชมร้านค้า
- ต้องการ
- คือ
- ชม
- ทาง..
- we
- เว็บ
- โปรแกรมประยุกต์บนเว็บ
- บริการเว็บ
- ดี
- ที่
- ในขณะที่
- กว้าง
- ช่วงกว้าง
- แพร่หลาย
- วิกิพีเดีย
- จะ
- หน้าต่าง
- กับ
- ไม่มี
- งาน
- ทำงาน
- ขั้นตอนการทำงาน
- เวิร์กสเตชัน
- ปี
- คุณ
- ของคุณ
- ลมทะเล
- โซน