อเมซอน เบดร็อค นำเสนอโมเดลพื้นฐานประสิทธิภาพสูงที่หลากหลายจาก Amazon และบริษัท AI ชั้นนำอื่นๆ ซึ่งรวมถึง มานุษยวิทยา, AI21, Meta, รวมกันและ ความเสถียร AIและครอบคลุมกรณีการใช้งานที่หลากหลาย รวมถึงการสร้างข้อความและรูปภาพ การค้นหา แชท การใช้เหตุผลและการดำเนินการ และอื่นๆ ใหม่ โปรแกรมสร้างภาพ Amazon Titan โมเดลช่วยให้ผู้สร้างเนื้อหาสามารถสร้างภาพคุณภาพสูงและสมจริงได้อย่างรวดเร็วโดยใช้ข้อความแจ้งภาษาอังกฤษง่ายๆ โมเดล AI ขั้นสูงเข้าใจคำสั่งที่ซับซ้อนด้วยวัตถุหลายชิ้น และส่งคืนรูปภาพคุณภาพระดับสตูดิโอที่เหมาะสำหรับ การโฆษณาอีคอมเมิร์ซและ การบันเทิง. คุณสมบัติหลัก ได้แก่ ความสามารถในการปรับแต่งภาพโดยวนซ้ำตามข้อความแจ้ง การแก้ไขพื้นหลังอัตโนมัติ และสร้างฉากเดียวกันหลายรูปแบบ ครีเอเตอร์ยังปรับแต่งโมเดลด้วยข้อมูลของตนเองเพื่อแสดงรูปภาพของแบรนด์ในสไตล์เฉพาะเจาะจงได้ ที่สำคัญ Titan Image Generator มีระบบป้องกันในตัว เช่น ลายน้ำที่มองไม่เห็นบนรูปภาพที่สร้างโดย AI ทั้งหมด เพื่อส่งเสริม การใช้อย่างรับผิดชอบ และบรรเทาการแพร่กระจายของข้อมูลบิดเบือน เทคโนโลยีที่เป็นนวัตกรรมนี้ทำให้การผลิตภาพที่กำหนดเองในปริมาณมากสำหรับ อุตสาหกรรมใดๆ เข้าถึงได้และมีประสิทธิภาพมากขึ้น
ใหม่ การฝังหลายรูปแบบของ Amazon Titan โมเดลช่วยสร้างการค้นหาและคำแนะนำที่แม่นยำยิ่งขึ้นโดยการทำความเข้าใจข้อความ รูปภาพ หรือทั้งสองอย่าง โดยจะแปลงรูปภาพและข้อความภาษาอังกฤษเป็นเวกเตอร์ความหมาย โดยบันทึกความหมายและความสัมพันธ์ในข้อมูลของคุณ คุณสามารถรวมข้อความและรูปภาพ เช่น คำอธิบายผลิตภัณฑ์และรูปภาพ เพื่อระบุสินค้าได้อย่างมีประสิทธิภาพมากขึ้น เวกเตอร์ขับเคลื่อนประสบการณ์การค้นหาที่รวดเร็วและแม่นยำ Titan Multimodal Embeddings มีความยืดหยุ่นในมิติเวกเตอร์ ช่วยให้สามารถเพิ่มประสิทธิภาพตามความต้องการด้านประสิทธิภาพได้ API แบบอะซิงโครนัสและ บริการ Amazon OpenSearch ตัวเชื่อมต่อทำให้ง่ายต่อการรวมโมเดลเข้ากับแอปพลิเคชันการค้นหาทางประสาทของคุณ
ในโพสต์นี้ เราจะอธิบายวิธีใช้ Titan Image Generator และโมเดล Titan Multimodal Embeddings ผ่าน AWS Python SDK
การสร้างและแก้ไขภาพ
ในส่วนนี้ เราจะสาธิตรูปแบบการเข้ารหัสพื้นฐานสำหรับการใช้ AWS SDK เพื่อสร้างอิมเมจใหม่และดำเนินการแก้ไขที่ขับเคลื่อนโดย AI บนอิมเมจที่มีอยู่ ตัวอย่างโค้ดมีให้ใน Python และ JavaScript (Node.js) ก็มีให้ในนี้เช่นกัน พื้นที่เก็บข้อมูล GitHub.
ก่อนที่คุณจะสามารถเขียนสคริปต์ที่ใช้ Amazon Bedrock API ได้ คุณจะต้องติดตั้ง AWS SDK เวอร์ชันที่เหมาะสมในสภาพแวดล้อมของคุณ สำหรับสคริปต์ Python คุณสามารถใช้ไฟล์ AWS SDK สำหรับ Python (Boto3). ผู้ใช้ Python อาจต้องการติดตั้งไฟล์ โมดูลหมอนซึ่งอำนวยความสะดวกในการใช้งานรูปภาพ เช่น การโหลดและบันทึกรูปภาพ สำหรับคำแนะนำในการตั้งค่า โปรดดูที่ พื้นที่เก็บข้อมูล GitHub.
นอกจากนี้ เปิดใช้งานการเข้าถึง Amazon Titan Image Generator และโมเดล Titan Multimodal Embeddings สำหรับข้อมูลเพิ่มเติม โปรดดูที่ การเข้าถึงโมเดล.
ฟังก์ชั่นตัวช่วย
ฟังก์ชันต่อไปนี้จะตั้งค่ารันไทม์ไคลเอ็นต์ Amazon Bedrock Boto3 และสร้างอิมเมจโดยรับเพย์โหลดของการกำหนดค่าที่แตกต่างกัน (ซึ่งเราจะพูดถึงในโพสต์นี้ในภายหลัง):
สร้างภาพจากข้อความ
สคริปต์ที่สร้างรูปภาพใหม่จากข้อความแจ้งจะเป็นไปตามรูปแบบการใช้งานนี้:
- กำหนดค่าพรอมต์ข้อความและพรอมต์ข้อความเชิงลบที่เป็นตัวเลือก
- ใช้
BedrockRuntime
ไคลเอ็นต์เพื่อเรียกใช้โมเดล Titan Image Generator - แยกวิเคราะห์และถอดรหัสการตอบสนอง
- บันทึกภาพที่เป็นผลลงดิสก์
ข้อความเป็นรูปภาพ
ต่อไปนี้เป็นสคริปต์การสร้างภาพทั่วไปสำหรับรุ่น Titan Image Generator:
สิ่งนี้จะสร้างภาพที่คล้ายกับภาพต่อไปนี้
รูปภาพตอบกลับ 1 | รูปภาพตอบกลับ 2 |
รูปแบบรูปภาพ
รูปแบบรูปภาพเป็นวิธีหนึ่งในการสร้างรูปแบบย่อยของรูปภาพที่มีอยู่ ข้อมูลโค้ดต่อไปนี้ใช้รูปภาพใดรูปภาพหนึ่งที่สร้างขึ้นในตัวอย่างก่อนหน้านี้เพื่อสร้างรูปภาพรูปแบบต่างๆ:
สิ่งนี้จะสร้างภาพที่คล้ายกับภาพต่อไปนี้
ภาพต้นฉบับ | รูปภาพตอบกลับ 1 | รูปภาพตอบกลับ 2 |
แก้ไขภาพที่มีอยู่
โมเดล Titan Image Generator ช่วยให้คุณสามารถเพิ่ม ลบ หรือแทนที่องค์ประกอบหรือพื้นที่ภายในรูปภาพที่มีอยู่ได้ คุณระบุพื้นที่ที่จะได้รับผลกระทบโดยระบุอย่างใดอย่างหนึ่งต่อไปนี้:
- ภาพหน้ากาก – รูปภาพมาสก์คือรูปภาพไบนารีซึ่งพิกเซลค่า 0 แสดงถึงพื้นที่ที่คุณต้องการส่งผลกระทบ และพิกเซลค่า 255 เป็นตัวแทนของพื้นที่ที่ควรคงไว้ไม่เปลี่ยนแปลง
- พร้อมท์หน้ากาก – ข้อความแจ้งมาสก์คือคำอธิบายข้อความภาษาธรรมชาติขององค์ประกอบที่คุณต้องการส่งผลกระทบ ซึ่งใช้โมเดลการแบ่งส่วนข้อความภายในบริษัท
สำหรับข้อมูลเพิ่มเติมโปรดดูที่ แนวทางวิศวกรรมที่รวดเร็ว.
สคริปต์ที่ใช้การแก้ไขรูปภาพจะเป็นไปตามรูปแบบการใช้งานนี้:
- โหลดรูปภาพที่จะแก้ไขจากดิสก์
- แปลงรูปภาพเป็นสตริงที่เข้ารหัส base64
- กำหนดค่ามาสก์ด้วยวิธีใดวิธีหนึ่งต่อไปนี้:
- โหลดมาสก์อิมเมจจากดิสก์ เข้ารหัสเป็น base64 และตั้งค่าเป็น
maskImage
พารามิเตอร์. - ตั้ง
maskText
พารามิเตอร์เป็นคำอธิบายข้อความขององค์ประกอบที่จะได้รับผลกระทบ
- โหลดมาสก์อิมเมจจากดิสก์ เข้ารหัสเป็น base64 และตั้งค่าเป็น
- ระบุเนื้อหาใหม่ที่จะสร้างโดยใช้หนึ่งในตัวเลือกต่อไปนี้:
- หากต้องการเพิ่มหรือแทนที่องค์ประกอบ ให้ตั้งค่า
text
พารามิเตอร์สำหรับคำอธิบายของเนื้อหาใหม่ - หากต้องการลบองค์ประกอบ ให้ละเว้น
text
พารามิเตอร์อย่างสมบูรณ์
- หากต้องการเพิ่มหรือแทนที่องค์ประกอบ ให้ตั้งค่า
- ใช้
BedrockRuntime
ไคลเอ็นต์เพื่อเรียกใช้โมเดล Titan Image Generator - แยกวิเคราะห์และถอดรหัสการตอบสนอง
- บันทึกภาพที่เป็นผลลงดิสก์
การแก้ไขวัตถุ: การลงสีด้วยภาพมาส์ก
ต่อไปนี้เป็นสคริปต์แก้ไขภาพทั่วไปสำหรับรุ่น Titan Image Generator ที่ใช้ maskImage
. เรานำภาพหนึ่งภาพที่สร้างขึ้นก่อนหน้านี้มาจัดทำเป็นภาพมาส์ก โดยที่พิกเซลค่า 0 จะแสดงเป็นสีดำ และพิกเซลค่า 255 จะแสดงเป็นสีขาว นอกจากนี้เรายังแทนที่สุนัขตัวหนึ่งในภาพด้วยแมวโดยใช้ข้อความแจ้ง
สิ่งนี้จะสร้างภาพที่คล้ายกับภาพต่อไปนี้
ภาพต้นฉบับ | รูปภาพหน้ากาก | แก้ไขรูปภาพ |
การลบวัตถุ: การลงสีด้วยพรอมต์มาสก์
อีกตัวอย่างหนึ่ง เราใช้ maskPrompt
เพื่อระบุวัตถุในรูปภาพที่นำมาจากขั้นตอนก่อนหน้าเพื่อแก้ไข โดยการละเว้นข้อความ วัตถุจะถูกลบออก:
สิ่งนี้จะสร้างภาพที่คล้ายกับภาพต่อไปนี้
ภาพต้นฉบับ | รูปภาพตอบกลับ |
การแก้ไขพื้นหลัง: การทาสีภายนอก
การทาสีภายนอกมีประโยชน์เมื่อคุณต้องการแทนที่พื้นหลังของรูปภาพ คุณยังสามารถขยายขอบเขตของรูปภาพเพื่อให้ได้เอฟเฟกต์การซูมออกได้ ในสคริปต์ตัวอย่างต่อไปนี้ เราใช้ maskPrompt
เพื่อระบุวัตถุที่จะเก็บ คุณยังสามารถใช้ maskImage
. พารามิเตอร์ outPaintingMode
ระบุว่าจะอนุญาตให้แก้ไขพิกเซลภายในมาสก์หรือไม่ ถ้าตั้งเป็น DEFAULT
อนุญาตให้แก้ไขพิกเซลภายในมาสก์ได้ เพื่อให้รูปภาพที่สร้างขึ้นใหม่มีความสอดคล้องกันโดยรวม แนะนำให้ใช้ตัวเลือกนี้หาก maskImage
ที่ระบุไม่ได้เป็นตัวแทนของวัตถุที่มีความแม่นยำระดับพิกเซล ถ้าตั้งเป็น PRECISE
การปรับเปลี่ยนพิกเซลภายในมาสก์จะถูกป้องกัน แนะนำให้ใช้ตัวเลือกนี้หากใช้ maskPrompt
หรือ maskImage
ที่แสดงถึงวัตถุที่มีความแม่นยำระดับพิกเซล
สิ่งนี้จะสร้างภาพที่คล้ายกับภาพต่อไปนี้
ภาพต้นฉบับ | ข้อความ | รูปภาพตอบกลับ |
"ชายหาด" | ||
"ป่า" |
นอกจากนี้ผลของค่าต่าง ๆ สำหรับ outPaintingMode
ด้วย maskImage
ที่ไม่จัดเค้าร่างวัตถุด้วยความแม่นยำระดับพิกเซล มีดังต่อไปนี้
ส่วนนี้จะให้ภาพรวมของการดำเนินการที่คุณสามารถทำได้ด้วยโมเดล Titan Image Generator โดยเฉพาะอย่างยิ่ง สคริปต์เหล่านี้สาธิตการแปลงข้อความเป็นรูปภาพ การเปลี่ยนแปลงของรูปภาพ การลงสี และการลงสีภายนอก คุณควรจะสามารถปรับรูปแบบสำหรับแอปพลิเคชันของคุณเองได้โดยการอ้างอิงรายละเอียดพารามิเตอร์สำหรับประเภทงานเหล่านั้นซึ่งมีรายละเอียดอยู่ในนั้น เอกสารประกอบของ Amazon Titan Image Generator.
การฝังและการค้นหาหลายรูปแบบ
คุณสามารถใช้โมเดล Amazon Titan Multimodal Embeddings สำหรับงานระดับองค์กร เช่น การค้นหารูปภาพและการแนะนำตามความคล้ายคลึงกัน และมีการบรรเทาผลกระทบในตัวที่ช่วยลดอคติในผลการค้นหา มีขนาดมิติข้อมูลแบบฝังหลายขนาดเพื่อแลกกับเวลาแฝง/ความแม่นยำที่ดีที่สุดสำหรับความต้องการที่แตกต่างกัน และทั้งหมดนี้สามารถปรับแต่งได้ด้วย API แบบง่ายเพื่อปรับให้เข้ากับข้อมูลของคุณเอง ในขณะเดียวกันก็รักษาความปลอดภัยของข้อมูลและความเป็นส่วนตัวเอาไว้ Amazon Titan Multimodal Embeddings จัดทำเป็น API แบบง่ายสำหรับแอปพลิเคชันการค้นหาและการแนะนำการแปลงแบตช์แบบเรียลไทม์หรือแบบอะซิงโครนัส และสามารถเชื่อมต่อกับฐานข้อมูลเวกเตอร์ต่างๆ ได้ รวมถึง บริการ Amazon OpenSearch.
ฟังก์ชั่นตัวช่วย
ฟังก์ชันต่อไปนี้จะแปลงรูปภาพและข้อความเสริมเป็นการฝังหลายรูปแบบ:
ฟังก์ชันต่อไปนี้จะส่งคืนการฝังหลายรูปแบบที่คล้ายกันอันดับต้นๆ โดยพิจารณาจากการฝังหลายรูปแบบแบบสอบถาม โปรดทราบว่าในทางปฏิบัติ คุณสามารถใช้ฐานข้อมูลเวกเตอร์ที่มีการจัดการ เช่น OpenSearch Service ได้ ตัวอย่างต่อไปนี้มีวัตถุประสงค์เพื่อเป็นภาพประกอบ:
ชุดข้อมูลสังเคราะห์
เพื่อวัตถุประสงค์ในการอธิบาย เราใช้ โมเดล Claude 2.1 ของ Anthropic ใน Amazon Bedrock เพื่อสุ่มสร้างผลิตภัณฑ์ที่แตกต่างกัน 7 รายการ โดยแต่ละผลิตภัณฑ์มี 3 รูปแบบ โดยใช้ข้อความแจ้งต่อไปนี้:
Generate a list of 7 items description for an online e-commerce shop, each comes with 3 variants of color or type. All with separate full sentence description.
ต่อไปนี้เป็นรายการเอาต์พุตที่ส่งคืน:
กำหนดการตอบสนองข้างต้นให้กับตัวแปร response_cat
. จากนั้นเราใช้โมเดล Titan Image Generator เพื่อสร้างรูปภาพผลิตภัณฑ์สำหรับแต่ละรายการ:
รูปภาพที่สร้างขึ้นทั้งหมดสามารถพบได้ในภาคผนวกท้ายโพสต์นี้
การทำดัชนีชุดข้อมูลหลายรูปแบบ
ใช้รหัสต่อไปนี้สำหรับการจัดทำดัชนีชุดข้อมูลหลายรูปแบบ:
การค้นหาหลายรูปแบบ
ใช้รหัสต่อไปนี้สำหรับการค้นหาหลายรูปแบบ:
ต่อไปนี้เป็นผลการค้นหาบางส่วน
สรุป
โพสต์นี้จะแนะนำโมเดล Amazon Titan Image Generator และ Amazon Titan Multimodal Embeddings Titan Image Generator ช่วยให้คุณสร้างภาพคุณภาพสูงที่กำหนดเองได้จากข้อความแจ้ง คุณสมบัติที่สำคัญ ได้แก่ การวนซ้ำตามข้อความแจ้ง การแก้ไขพื้นหลังอัตโนมัติ และการปรับแต่งข้อมูล มีการป้องกันเช่นลายน้ำที่มองไม่เห็นเพื่อส่งเสริมการใช้งานอย่างมีความรับผิดชอบ Titan Multimodal Embeddings แปลงข้อความ รูปภาพ หรือทั้งสองอย่างให้เป็นเวกเตอร์ความหมายเพื่อขับเคลื่อนการค้นหาและคำแนะนำที่แม่นยำ จากนั้นเราได้จัดเตรียมตัวอย่างโค้ด Python สำหรับการใช้บริการเหล่านี้ และสาธิตการสร้างรูปภาพจากข้อความแจ้งและการวนซ้ำบนรูปภาพเหล่านั้น แก้ไขรูปภาพที่มีอยู่โดยการเพิ่ม ลบ หรือแทนที่องค์ประกอบที่ระบุโดยรูปภาพมาสก์หรือข้อความมาสก์ การสร้างการฝังหลายรูปแบบจากข้อความ รูปภาพ หรือทั้งสองอย่าง และการค้นหาการฝังหลายรูปแบบที่คล้ายกันกับข้อความค้นหา นอกจากนี้เรายังสาธิตการใช้ชุดข้อมูลอีคอมเมิร์ซสังเคราะห์ที่จัดทำดัชนีและค้นหาโดยใช้ Titan Multimodal Embeddings จุดมุ่งหมายของโพสต์นี้คือเพื่อให้นักพัฒนาสามารถเริ่มใช้บริการ AI ใหม่เหล่านี้ในแอปพลิเคชันของตนได้ รูปแบบโค้ดสามารถใช้เป็นเทมเพลตสำหรับการใช้งานแบบกำหนดเองได้
รหัสทั้งหมดมีอยู่ที่ พื้นที่เก็บข้อมูล GitHub. สำหรับข้อมูลเพิ่มเติม โปรดดูที่ คู่มือผู้ใช้ Amazon Bedrock.
เกี่ยวกับผู้เขียน
โรหิต มิททัล เป็นผู้จัดการผลิตภัณฑ์หลักที่ Amazon AI ที่สร้างโมเดลพื้นฐานหลายรูปแบบ เขาเพิ่งเป็นผู้นำการเปิดตัวโมเดล Amazon Titan Image Generator โดยเป็นส่วนหนึ่งของบริการ Amazon Bedrock มีประสบการณ์ในด้าน AI/ML, NLP และการค้นหา เขาสนใจในการสร้างผลิตภัณฑ์ที่ช่วยแก้ไขปัญหาของลูกค้าด้วยเทคโนโลยีที่เป็นนวัตกรรม
ดร.อัชวิน สวามินาธาน เป็นนักวิจัย วิศวกร และผู้จัดการด้านคอมพิวเตอร์วิทัศน์และแมชชีนเลิร์นนิงที่มีประสบการณ์ในอุตสาหกรรมมากกว่า 12 ปี และประสบการณ์การวิจัยเชิงวิชาการมากกว่า 5 ปี พื้นฐานที่แข็งแกร่งและความสามารถที่ได้รับการพิสูจน์แล้วในการรับความรู้อย่างรวดเร็วและมีส่วนร่วมในพื้นที่ใหม่และที่เกิดขึ้นใหม่
ดร.หยูเซิง เสีย เป็นนักวิทยาศาสตร์ประยุกต์หลักที่ Amazon AGI งานของเขามุ่งเน้นไปที่การสร้างแบบจำลองรากฐานหลายรูปแบบ ก่อนที่จะมาร่วมงานกับ AGI เขาเคยเป็นผู้นำการพัฒนา AI แบบหลายรูปแบบที่ AWS เช่น Amazon Titan Image Generator และ Amazon Textract Queries
ดร.เฮาหยาง เป็นนักวิทยาศาสตร์ประยุกต์หลักที่ Amazon งานวิจัยที่เขาสนใจคือการตรวจจับวัตถุและการเรียนรู้โดยมีคำอธิบายประกอบจำกัด ภายนอกงาน เฮาชอบดูหนัง ภาพถ่าย และกิจกรรมกลางแจ้ง
ดร.ดาวิเด โมโดโล เป็นผู้จัดการวิทยาศาสตร์ประยุกต์ที่ Amazon AGI ซึ่งทำงานเกี่ยวกับการสร้างแบบจำลองพื้นฐานหลายรูปแบบขนาดใหญ่ ก่อนที่จะมาร่วมงานกับ Amazon AGI เขาเป็นผู้จัดการ/หัวหน้าเป็นเวลา 7 ปีใน AWS AI Labs (Amazon Bedrock และ Amazon Rekognition) นอกเหนือจากการทำงาน เขาชอบท่องเที่ยวและเล่นกีฬาทุกประเภท โดยเฉพาะฟุตบอล
ดร. ไป่ฉวน ซุน ปัจจุบันดำรงตำแหน่งสถาปนิกอาวุโสด้านโซลูชัน AI/ML ที่ AWS โดยมุ่งเน้นที่ AI เชิงสร้างสรรค์ และใช้ความรู้ของเขาในด้านวิทยาศาสตร์ข้อมูลและการเรียนรู้ของเครื่องจักรเพื่อมอบโซลูชันธุรกิจบนระบบคลาวด์ที่ใช้งานได้จริง ด้วยประสบการณ์ในการให้คำปรึกษาด้านการจัดการและสถาปัตยกรรมโซลูชัน AI เขาจัดการกับความท้าทายที่ซับซ้อนมากมาย รวมถึงคอมพิวเตอร์วิทัศน์ด้านหุ่นยนต์ การคาดการณ์อนุกรมเวลา และการบำรุงรักษาเชิงคาดการณ์ และอื่นๆ อีกมากมาย งานของเขามีพื้นฐานมาจากการบริหารโครงการ การวิจัยและพัฒนาซอฟต์แวร์ และงานด้านวิชาการ นอกเหนือจากการทำงาน ดร. ซันยังสนุกกับความสมดุลระหว่างการเดินทางและการใช้เวลาร่วมกับครอบครัวและเพื่อนฝูง
ดร.ไค จู ปัจจุบันทำงานเป็นวิศวกรสนับสนุนระบบคลาวด์ที่ AWS ช่วยเหลือลูกค้าที่มีปัญหาในบริการที่เกี่ยวข้องกับ AI/ML เช่น SageMaker, Bedrock ฯลฯ เขาเป็นผู้เชี่ยวชาญเฉพาะเรื่องของ SageMaker มีประสบการณ์ในด้านวิทยาศาสตร์ข้อมูลและวิศวกรรมข้อมูล เขาสนใจที่จะสร้างโครงการที่ขับเคลื่อนด้วย AI แบบสร้างสรรค์
คริส ชูลท์ซ ใช้เวลากว่า 25 ปีในการนำประสบการณ์ผู้ใช้ที่น่าดึงดูดมาสู่ชีวิตด้วยการผสมผสานเทคโนโลยีเกิดใหม่เข้ากับการออกแบบระดับโลก ในบทบาทของเขาในฐานะผู้จัดการผลิตภัณฑ์อาวุโส Kris ช่วยออกแบบและสร้างบริการของ AWS เพื่อขับเคลื่อนสื่อและความบันเทิง เกม และคอมพิวเตอร์เชิงพื้นที่
ภาคผนวก
ในส่วนต่อไปนี้ เราจะสาธิตกรณีการใช้งานตัวอย่างที่ท้าทาย เช่น การแทรกข้อความ เข็มนาฬิกา และการสะท้อน เพื่อเน้นความสามารถของโมเดล Titan Image Generator นอกจากนี้เรายังรวมภาพผลลัพธ์ตัวอย่างที่สร้างขึ้นในตัวอย่างก่อนหน้านี้ด้วย
ข้อความ
โมเดล Titan Image Generator เป็นเลิศในขั้นตอนการทำงานที่ซับซ้อน เช่น การแทรกข้อความที่อ่านได้ลงในรูปภาพ ตัวอย่างนี้แสดงให้เห็นถึงความสามารถของ Titan ในการแสดงตัวอักษรตัวพิมพ์ใหญ่และตัวพิมพ์เล็กอย่างชัดเจนในรูปแบบที่สอดคล้องกันภายในรูปภาพ
คอร์กี้สวมหมวกเบสบอลพร้อมข้อความ "เกไน" | เด็กชายผู้มีความสุขยกนิ้วโป้งให้สวมเสื้อยืดที่มีข้อความว่า “Generative AI” |
มือ
โมเดล Titan Image Generator ยังมีความสามารถในการสร้างภาพ AI ที่มีรายละเอียดอีกด้วย รูปภาพแสดงมือและนิ้วที่สมจริงพร้อมรายละเอียดที่มองเห็นได้ นอกเหนือไปจากการสร้างภาพ AI ขั้นพื้นฐานที่อาจขาดความเฉพาะเจาะจงดังกล่าว ในตัวอย่างต่อไปนี้ ให้สังเกตการแสดงท่าทางและกายวิภาคที่แม่นยำ
มือของบุคคลเมื่อมองจากด้านบน | มองมือคนถือแก้วกาแฟอย่างใกล้ชิด |
กระจกเงา
รูปภาพที่สร้างโดยโมเดล Titan Image Generator จะจัดเรียงวัตถุเชิงพื้นที่และสะท้อนเอฟเฟกต์กระจกอย่างแม่นยำ ดังแสดงในตัวอย่างต่อไปนี้
แมวสีขาวขนฟูน่ารักยืนบนขาหลัง มองเข้าไปในกระจกสีทองหรูหราอย่างอยากรู้อยากเห็น ในเงาสะท้อนที่แมวมองเห็นตัวเอง | ทะเลสาบท้องฟ้าที่สวยงามพร้อมเงาสะท้อนบนน้ำ |
รูปภาพผลิตภัณฑ์สังเคราะห์
ต่อไปนี้คือรูปภาพผลิตภัณฑ์ที่สร้างขึ้นก่อนหน้าในโพสต์นี้สำหรับโมเดล Titan Multimodal Embeddings
- เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
- PlatoData.Network Vertical Generative Ai เพิ่มพลังให้กับตัวเอง เข้าถึงได้ที่นี่.
- เพลโตไอสตรีม. Web3 อัจฉริยะ ขยายความรู้ เข้าถึงได้ที่นี่.
- เพลโตESG. คาร์บอน, คลีนเทค, พลังงาน, สิ่งแวดล้อม แสงอาทิตย์, การจัดการของเสีย. เข้าถึงได้ที่นี่.
- เพลโตสุขภาพ เทคโนโลยีชีวภาพและข่าวกรองการทดลองทางคลินิก เข้าถึงได้ที่นี่.
- ที่มา: https://aws.amazon.com/blogs/machine-learning/use-amazon-titan-models-for-image-generation-editing-and-searching/
- :มี
- :เป็น
- :ไม่
- :ที่ไหน
- $ ขึ้น
- 1
- 10
- 100
- 12
- 125
- 14
- 15%
- 16
- 17
- 19
- 24
- 25
- 300
- 31
- 7
- a
- ความสามารถ
- สามารถ
- ข้างบน
- นักวิชาการ
- การวิจัยทางวิชาการ
- เข้า
- สามารถเข้าถึงได้
- ถูกต้อง
- แม่นยำ
- การแสดง
- กิจกรรม
- อยากทำกิจกรรม
- ปรับ
- เพิ่ม
- เพิ่ม
- นอกจากนี้
- ที่อยู่
- ปรับ
- สูง
- มีผลต่อ
- ตัวแทน
- AGI
- AI
- บริการ AI
- ขับเคลื่อนด้วย AI
- AI / ML
- จุดมุ่งหมาย
- ทั้งหมด
- อนุญาต
- อนุญาตให้
- ช่วยให้
- ด้วย
- อเมซอน
- ความหมายของ Amazon
- Amazon Text
- Amazon Web Services
- ในหมู่
- an
- การวิเคราะห์
- กายวิภาคศาสตร์
- และ
- อื่น
- ใด
- API
- APIs
- การใช้งาน
- ประยุกต์
- มีผลบังคับใช้
- ใช้
- เหมาะสม
- สถาปัตยกรรม
- เป็น
- AREA
- พื้นที่
- แถว
- AS
- At
- รถยนต์
- อัตโนมัติ
- ใช้ได้
- AWS
- พื้นหลัง
- ไม่ดี
- ยอดคงเหลือ
- กีฬาเบสบอล
- ขั้นพื้นฐาน
- BE
- ชายหาด
- ก่อน
- ที่ดีที่สุด
- เกิน
- อคติ
- Black
- สีน้ำเงิน
- ร่างกาย
- ทั้งสอง
- ขอบเขต
- การนำ
- กว้าง
- สีน้ำตาล
- สร้าง
- การก่อสร้าง
- built-in
- ธุรกิจ
- by
- ปฏิทิน
- ห้อง
- CAN
- ผ้าใบ
- ฝาครอบ
- ความสามารถในการ
- จับ
- พกพา
- การปฏิบัติ
- รถยนต์
- กรณี
- แมว
- ความท้าทาย
- ท้าทาย
- พูดคุย
- ชั้น
- คลาสสิก
- อย่างเห็นได้ชัด
- ไคลเอนต์
- ปิดหน้านี้
- การปิด
- เมฆ
- รหัส
- การเข้ารหัส
- กาแฟ
- สี
- รวมกัน
- การรวมกัน
- มา
- กะทัดรัด
- บริษัท
- อย่างสมบูรณ์
- ซับซ้อน
- คอมพิวเตอร์
- วิสัยทัศน์คอมพิวเตอร์
- การคำนวณ
- งานที่เชื่อมต่อ
- คงเส้นคงวา
- การให้คำปรึกษา
- เนื้อหา
- ผู้สร้างเนื้อหา
- สนับสนุน
- การควบคุม
- ตอบโต้
- หน้าปก
- ครอบคลุม
- สร้าง
- การสร้าง
- ผู้สร้าง
- พวกลูกเรือ
- ขณะนี้
- ประเพณี
- ลูกค้า
- ลูกค้า
- ปรับแต่งได้
- การปรับแต่ง
- ปรับแต่ง
- การปรับแต่ง
- ข้อมูล
- วิทยาศาสตร์ข้อมูล
- ความปลอดภัยของข้อมูล
- ความปลอดภัยของข้อมูลและความเป็นส่วนตัว
- ฐานข้อมูล
- ฐานข้อมูล
- ค่าเริ่มต้น
- สาธิต
- แสดงให้เห็นถึง
- แสดงให้เห็นถึง
- กางเกงยีนส์
- ลักษณะ
- ออกแบบ
- รายละเอียด
- รายละเอียด
- รายละเอียด
- การตรวจพบ
- นักพัฒนา
- พัฒนาการ
- Dict
- ต่าง
- Dimension
- มิติ
- สนทนา
- บิดเบือน
- ระยะทาง
- ไม่
- สุนัข
- สวม
- ลง
- dr
- E-commerce
- แต่ละ
- ก่อน
- ง่าย
- เป็นมิตรกับสิ่งแวดล้อม
- อีคอมเมิร์ซ
- ผล
- มีประสิทธิภาพ
- ผลกระทบ
- ที่มีประสิทธิภาพ
- ทั้ง
- ธาตุ
- องค์ประกอบ
- อื่น
- การฝัง
- กากกะรุน
- เทคโนโลยีใหม่
- ทำให้สามารถ
- ช่วยให้
- การเปิดใช้งาน
- การเข้ารหัส
- ส่งเสริม
- ปลาย
- น่าสนใจ
- วิศวกร
- ชั้นเยี่ยม
- ภาษาอังกฤษ
- Enterprise
- ความบันเทิง
- สิ่งแวดล้อม
- โดยเฉพาะอย่างยิ่ง
- ฯลฯ
- ตัวอย่าง
- ตัวอย่าง
- พิเศษ
- ที่มีอยู่
- ประสบการณ์
- มีประสบการณ์
- ประสบการณ์
- ชำนาญ
- ขยายออก
- ใบหน้า
- อำนวยความสะดวก
- หันหน้าไปทาง
- ครอบครัว
- ลักษณะ
- คุณสมบัติ
- ภาพยนตร์
- พอดี
- มีความยืดหยุ่น
- ลอย
- มุ่งเน้นไปที่
- โดยมุ่งเน้น
- ปฏิบัติตาม
- ดังต่อไปนี้
- ดังต่อไปนี้
- สำหรับ
- ป่า
- พบ
- รากฐาน
- พื้นฐาน
- เพื่อน
- ราคาเริ่มต้นที่
- ด้านหน้า
- เต็ม
- ฟังก์ชัน
- ความรู้พื้นฐาน
- ได้รับ
- การเล่นเกม
- สร้าง
- สร้าง
- สร้าง
- การสร้าง
- รุ่น
- กำเนิด
- กำเนิด AI
- เครื่องกำเนิดไฟฟ้า
- กำหนด
- ให้
- กระจก
- ไป
- ทองคำ
- โกลเด้น
- จีพีเอส
- สีเทา
- สีเขียว
- สายดิน
- คำแนะนำ
- ให้คำแนะนำ
- มือ
- จัดการ
- มือ
- มีความสุข
- he
- หัวใจสำคัญ
- ความสูง
- การช่วยเหลือ
- จะช่วยให้
- ที่มีประสิทธิภาพสูง
- ที่มีคุณภาพสูง
- เน้น
- ของเขา
- โฮลดิ้ง
- สรุป ความน่าเชื่อถือของ Olymp Trade?
- ทำอย่างไร
- HTML
- HTTPS
- แยกแยะ
- if
- ภาพ
- ค้นหารูปภาพ
- ภาพ
- การดำเนินงาน
- การใช้งาน
- นำเข้า
- ที่สำคัญ
- in
- ประกอบด้วย
- รวม
- รวมทั้ง
- การจัดทำดัชนี
- ดัชนี
- อุตสาหกรรม
- ข้อมูล
- นวัตกรรม
- เทคโนโลยีที่ทันสมัย
- อินพุต
- ภายใน
- ติดตั้ง
- คำแนะนำการใช้
- รวบรวม
- แบบบูรณาการ
- สนใจ
- ผลประโยชน์
- ภายใน
- เข้าไป
- เปิดตัว
- มองไม่เห็น
- ปัญหา
- IT
- รายการ
- วนซ้ำ
- ITS
- JavaScript
- กางเกงยีนส์
- การร่วม
- jpg
- JSON
- เก็บ
- คีย์
- ชนิด
- ความรู้
- ห้องปฏิบัติการ
- ไม่มี
- ทะเลสาบ
- ภาษา
- แล็ปท็อป
- ใหญ่
- ต่อมา
- เปิดตัว
- ชั้นนำ
- การเรียนรู้
- นำ
- ขา
- ชีวิต
- กดไลก์
- ถูก จำกัด
- รายการ
- โหลด
- ดู
- ต่ำ
- เครื่อง
- เรียนรู้เครื่อง
- ทำ
- หลัก
- การบำรุงรักษา
- ทำ
- เครื่องชง
- ทำให้
- การจัดการ
- การจัดการ
- ผู้จัดการ
- หน้ากาก
- การจับคู่
- ที่ตรงกัน
- วัสดุ
- ด้าน
- เรื่อง
- แม็กซ์
- สูงสุด
- อาจ..
- ความหมาย
- ภาพบรรยากาศ
- ตาข่าย
- วิธีการ
- กระจก
- บรรเทา
- การบรรเทา
- แบบ
- โมเดล
- การแก้ไข
- การตรวจสอบ
- ข้อมูลเพิ่มเติม
- หลาย
- ดนตรี
- โดยธรรมชาติ
- จำเป็นต้อง
- ความต้องการ
- เชิงลบ
- ธาตุนีอ็อน
- เกี่ยวกับประสาท
- ใหม่
- ใหม่
- NLP
- ปม
- Node.js
- ไม่มี
- หมายเหตุ
- สังเกต..
- การแจ้งเตือน
- จำนวน
- มึน
- วัตถุ
- การตรวจจับวัตถุ
- วัตถุ
- of
- on
- ONE
- ออนไลน์
- เพียง
- การดำเนินการ
- การเพิ่มประสิทธิภาพ
- ตัวเลือกเสริม (Option)
- Options
- or
- อื่นๆ
- ผลิตภัณฑ์อื่นๆ
- เค้าโครง
- เอาท์พุต
- เอาท์พุท
- ด้านนอก
- เกิน
- ทั้งหมด
- ภาพรวม
- ของตนเอง
- อาการเจ็บปวด
- พารามิเตอร์
- ส่วนหนึ่ง
- แบบแผน
- รูปแบบ
- ดำเนินการ
- การปฏิบัติ
- โทรศัพท์
- การถ่ายภาพ
- ภาพถ่าย
- เพลโต
- เพลโตดาต้าอินเทลลิเจนซ์
- เพลโตดาต้า
- เล่น
- กรุณา
- กระเป๋า
- จุด
- ท่าทาง
- โพสต์
- อำนาจ
- ขับเคลื่อน
- ประยุกต์
- การปฏิบัติ
- จำเป็นต้อง
- ความแม่นยำ
- Premium
- ป้องกันไม่ให้เกิด
- ก่อน
- หลัก
- ความเป็นส่วนตัว
- ก่อ
- ผลิต
- การผลิต
- ผลิตภัณฑ์
- ผู้จัดการผลิตภัณฑ์
- ผลิตภัณฑ์
- โปรแกรมได้
- โครงการ
- การบริหารจัดการโครงการ
- โครงการ
- แจ้ง
- ที่พิสูจน์แล้ว
- ให้
- ให้
- ให้
- การให้
- วัตถุประสงค์
- หลาม
- คุณภาพ
- คำสั่ง
- การสอบถาม
- อย่างรวดเร็ว
- R
- วิจัยและพัฒนา
- สุ่ม
- พิสัย
- คะแนน
- RE
- เรียลไทม์
- เหมือนจริง
- เมื่อเร็ว ๆ นี้
- แนะนำ
- แนะนำ
- แนะนำ
- สีแดง
- ลด
- อ้างอิง
- อ้างอิง
- ปรับแต่ง
- สะท้อน
- สะท้อน
- ที่เกี่ยวข้อง
- ความสัมพันธ์
- ผ่อนคลาย
- ยังคง
- การกำจัด
- เอาออก
- ลบออก
- ลบ
- ผล
- การแสดงผล
- แทนที่
- แสดง
- การแสดง
- แสดงให้เห็นถึง
- จำเป็นต้องใช้
- การวิจัย
- นักวิจัย
- คำตอบ
- รับผิดชอบ
- ส่งผลให้
- ผลสอบ
- กลับ
- รับคืน
- ฉีก
- หุ่นยนต์
- บทบาท
- ROSE
- ปัดเศษ
- รันไทม์
- s
- การป้องกัน
- sagemaker
- เดียวกัน
- ตัวอย่าง
- ประหยัด
- ขนาด
- ฉาก
- วิทยาศาสตร์
- นักวิทยาศาสตร์
- ตัก
- ต้นฉบับ
- สคริปต์
- SDK
- ค้นหา
- ค้นหา
- Section
- ส่วน
- ความปลอดภัย
- เมล็ดพันธุ์
- เห็น
- ความหมาย
- ระดับอาวุโส
- ประโยค
- แยก
- ชุด
- ให้บริการ
- บริการ
- บริการ
- การให้บริการ
- ชุด
- ชุดอุปกรณ์
- การตั้งค่า
- การติดตั้ง
- เจ็ด
- Shop
- สั้น
- น่า
- แสดงให้เห็นว่า
- ด้าน
- เงิน
- คล้ายคลึงกัน
- ง่าย
- เดียว
- ขนาด
- ขนาด
- ท้องฟ้า
- นอนหลับ
- รองเท้าผ้าใบ
- เศษเล็กเศษน้อย
- So
- ฟุตบอล
- ซอฟต์แวร์
- ของแข็ง
- ทางออก
- โซลูชัน
- แก้ปัญหา
- บาง
- ช่องว่าง
- เกี่ยวกับอวกาศ
- การคำนวณเชิงพื้นที่
- โดยเฉพาะ
- เฉพาะ
- ความจำเพาะ
- ที่ระบุไว้
- การใช้จ่าย
- การใช้จ่าย
- กีฬา
- กระจาย
- มาตรฐาน
- ยืน
- เริ่มต้น
- ขั้นตอน
- ขั้นตอน
- ตรง
- ถนน
- เชือก
- แข็งแรง
- พื้นฐานที่แข็งแกร่ง
- สไตล์
- หรือ
- อย่างเช่น
- เหมาะสม
- ดวงอาทิตย์
- สนับสนุน
- ที่สนับสนุน
- สังเคราะห์
- เอา
- นำ
- การ
- ถัง
- งาน
- งาน
- เทคโนโลยี
- เทคโนโลยี
- แม่แบบ
- ข้อความ
- ที่
- พื้นที่
- พื้นที่
- ของพวกเขา
- แล้วก็
- ที่นั่น
- ล้อยางขัดเหล่านี้ติดตั้งบนแกน XNUMX (มม.) ผลิตภัณฑ์นี้ถูกผลิตในหลายรูปทรง และหลากหลายเบอร์ความแน่นหนาของปริมาณอนุภาคขัดของมัน จะทำให้ท่านได้รับประสิทธิภาพสูงในการขัดและการใช้งานที่ยาวนาน
- นี้
- เหล่านั้น
- สาม
- ตลอด
- เวลา
- อนุกรมเวลา
- ยักษ์
- ชื่อหนังสือ
- ชื่อ
- ไปยัง
- ราชสกุล
- ด้านบน
- ติดตาม
- การติดตาม
- แปลง
- การเดินทาง
- การเดินทาง
- ต้นไม้
- สอง
- ชนิด
- ชนิด
- ตามแบบฉบับ
- ความเข้าใจ
- เข้าใจ
- ในเมือง
- ใช้
- มือสอง
- มีประโยชน์
- ผู้ใช้งาน
- ผู้ใช้
- ใช้
- การใช้
- ความคุ้มค่า
- ตัวแปร
- ตัวแปร
- รูปแบบ
- ต่างๆ
- รุ่น
- ผ่านทาง
- มองเห็นได้
- วิสัยทัศน์
- ปริมาณ
- เดิน
- ที่เดิน
- ต้องการ
- ผู้สมัครที่รู้จักเรา
- คือ
- นาฬิกา
- ชม
- น้ำดื่ม
- ลายน้ำ
- ทาง..
- we
- เว็บ
- บริการเว็บ
- อะไร
- เมื่อ
- ว่า
- ที่
- ในขณะที่
- ขาว
- กว้าง
- ช่วงกว้าง
- ความกว้าง
- จะ
- กับ
- ภายใน
- งาน
- ขั้นตอนการทำงาน
- การทำงาน
- โรงงาน
- โลก
- เขียน
- X
- ปี
- โยคะ
- คุณ
- ของคุณ
- ลมทะเล