Ideogram เป็นเครื่องมือสร้างภาพ AI ใหม่ที่ทำลายล้างการแข่งขัน มีประสิทธิภาพเหนือกว่า MidJourney และ Dall-E 3 - ถอดรหัส

Ideogram เป็นเครื่องมือสร้างภาพ AI ใหม่ที่ทำลายล้างการแข่งขัน มีประสิทธิภาพเหนือกว่า MidJourney และ Dall-E 3 – ถอดรหัส

Ideogram AI ซึ่งเป็นสตาร์ทอัพที่ก่อตั้งโดยอดีตวิศวกรของ Google ร่วมกับสมาชิกจากสถาบันอันทรงเกียรติเช่น UC Berkeley, Carnegie Mellon University และ University of Toronto ได้ประกาศเปิดตัวเวอร์ชันเต็มแรกของโปรแกรมสร้างภาพในชื่อเดียวกัน

“เรารู้สึกตื่นเต้นที่จะเปิดตัว Ideogram 1.0 ซึ่งเป็นโมเดลการแปลงข้อความเป็นรูปภาพที่ทันสมัยที่สุดของเราจนถึงปัจจุบัน” Ideogram AI กล่าวอย่างเป็นทางการ โพสต์บล็อก. “Ideogram 1.0 ได้รับการฝึกฝนตั้งแต่เริ่มต้นเช่นเดียวกับโมเดล Ideogram ทุกรุ่น นำเสนอการแสดงข้อความที่ล้ำสมัย การสร้างภาพเสมือนจริงอย่างที่ไม่เคยมีมาก่อน และการยึดติดที่รวดเร็ว—และฟีเจอร์ใหม่ที่เรียกว่า Magic Prompt ที่ช่วยให้คุณเขียนพร้อมท์ที่มีรายละเอียดเพื่อให้ได้ภาพที่สวยงามและสร้างสรรค์”

การเปิดตัวครั้งนี้มาพร้อมกับข่าวการระดมทุน Series A มูลค่า 80 ล้านดอลลาร์ นำโดย Andreessen Horowitz พร้อมด้วย Redpoint Ventures, Pear VC และ SV Angel

ถอดรหัส สามารถทดสอบแบบจำลองได้และการกล่าวอ้างของ Ideogram AI ไม่ได้กล่าวเกินจริงมากนัก สามารถดูการเปรียบเทียบแบบเคียงข้างกันได้ที่ด้านล่างนี้ Ideogram เวอร์ชันที่ 0.1 มีการปรับปรุงอย่างชัดเจนจากรุ่นก่อน v0.2 และ vXNUMX โดยมีความเป็นเลิศในด้านความสม่ำเสมอ คุณภาพของภาพ และความสามารถในการสร้างข้อความ

แบบจำลองนี้ไม่ใช่โอเพ่นซอร์ส ดังนั้นจึงมีการมองเห็นท่อประปาที่จำกัด และไม่มีรายงานการวิจัยให้ประเมิน แต่ผลลัพธ์ที่ได้รับจากโมเดลนี้บ่งบอกความเป็นตัวมันเอง ซึ่งอาจทำให้โมเดลนี้เป็นโมเดลที่ดีที่สุดที่มีอยู่ในปัจจุบัน อย่างน้อยก็จนถึงตอนนี้ การแพร่กระจายที่เสถียร 3 ได้รับการเผยแพร่สู่สาธารณะ

โมเดลใหม่นี้อาจเป็นเครื่องสร้างรูปภาพที่มีความสามารถมากที่สุดในแง่ของความสามารถด้านข้อความ โดยสร้างสตริงข้อความที่ยาวขึ้นและมีข้อผิดพลาดน้อยกว่า Dall-E 3 หรือ MidJourney Free Tier ในปัจจุบันยังให้ความได้เปรียบเหนือคู่แข่งอย่าง Dall-E 3 และ MidJourney ซึ่งอย่างหลังไม่มี Free Tier Microsoft Copilot ยังใช้ Dall-E 3 แต่สร้างเฉพาะรูปภาพสี่เหลี่ยมจัตุรัส 1:1 เท่านั้น ในขณะที่ Ideogram รองรับชุดอัตราส่วนที่กว้างขึ้น

ไอเดียแกรมก็มีให้เช่นกัน สองแผนชำระเงิน ในราคา $7 และ $15 ต่อเดือน ซึ่งให้การเข้าถึงมากกว่า 400 รุ่นต่อวัน พร้อมด้วยสิทธิพิเศษอื่นๆ เช่น โปรแกรมแก้ไขรูปภาพ การดาวน์โหลดคุณภาพที่ดีขึ้น img2img ซึ่งอนุญาตให้แก้ไขหรือเปลี่ยนแปลงรูปภาพที่มีอยู่ และรุ่นส่วนตัว ชั้นล่างทั้งหมดแสดงภาพที่ร้องขอต่อสาธารณะ

Ideogram สามารถเข้าใจคำสั่งที่ยาวได้ ไปจนถึงจรดปลายเท้าด้วย Stable Diffusion 3 และเอาชนะโปรแกรมสร้างภาพอื่นๆ ทั้งหมดในสาขานี้

หนึ่งในคุณสมบัติที่โดดเด่นของ Ideogram คือ “Prompt Magic” ซึ่งสามารถเปิดและปิดได้ คุณลักษณะนี้จะวิเคราะห์ข้อความแจ้งและปรับปรุงเพื่อสร้างภาพที่มีคุณภาพดีขึ้น โดยพื้นฐานแล้วทำให้โมเดลสามารถเข้าใจภาษาธรรมชาติเช่น Dall-E 3 ได้ อย่างไรก็ตาม Ideogram มีความหลากหลายมากกว่าเนื่องจากคุณลักษณะนี้เป็นทางเลือก ChatGPT Plus จะเปิดใช้งานอยู่เสมอ ซึ่งบางครั้งก็นำไปสู่ความคลาดเคลื่อน

สุดท้าย Ideogram จะถูกเซ็นเซอร์น้อยกว่า MidJourney และ Dall-E 3 และจนถึงขณะนี้สามารถสร้างรูปภาพของบุคคลที่มีชื่อเสียง โลโก้บริษัท และรูปแบบศิลปะได้ มันไม่ได้ทำงานแบบ NSFW อย่างสมบูรณ์ แต่จะแยกกันมากกว่าเมื่อพูดถึงข้อความแจ้งการเซ็นเซอร์

และผู้ทดสอบในช่วงแรกดูเหมือนจะชอบ Ideogram มากกว่ารุ่นอื่นๆ “การใช้โปรโตคอลการประเมินเช่นเดียวกับ DALL·E 3 เราพบว่าผู้ตรวจสอบที่เป็นมนุษย์ชอบ Ideogram 1.0 มากกว่า DALL·E 3 และ Midjourney V6 ในการจัดตำแหน่งที่รวดเร็ว การเชื่อมโยงกันของภาพ การตั้งค่าโดยรวม และคุณภาพการแสดงข้อความ” บริษัทสตาร์ทอัพกล่าว

การเปรียบเทียบแบบเคียงข้างกัน: Ideogram กับ MidJourney กับ Dall-E 3

ถอดรหัส ทดสอบความสามารถของ Ideogram และเปรียบเทียบกับคู่แข่งชั้นนำอย่าง MidJourney และ Dall-E 3 Stable Diffusion 3 และสุดยอดของ Google ImageFX ยังไม่ได้รับการประเมินที่นี่เนื่องจาก SD3 ยังไม่ออกและ ImageFX ยังไม่สามารถใช้ได้อย่างกว้างขวาง

การสร้างสตริงข้อความที่ยาว

พร้อมท์: Android แห่งอนาคตใน Cyberpunk City พร้อมป้ายที่เขียนว่า “อย่าช้าในเทรนด์ AI: โผล่ออกมาด้วยการถอดรหัส”

รุ่นที่มี Ideogram (ซ้าย), MidJourney (กลาง) และ Dall-e 3 (ขวา)
รุ่นที่มี Ideogram (ซ้าย), MidJourney (กลาง) และ Dall-E 3 (ขวา)

Ideogram AI สามารถถ่ายทอดทั้งความสวยงามและข้อความที่ต้องการได้ อย่างไรก็ตาม มีการพิมพ์ผิด โดยสร้าง "เจ้า" แทนที่จะเป็น "the"

MidJourney ไม่สามารถสร้างข้อความที่สอดคล้องกันได้เลย และมุ่งเน้นไปที่การสร้างหุ่นยนต์แห่งอนาคตที่มีรายละเอียด มันเป็นเรื่องหลักขององค์ประกอบทั้งหมด เมืองนี้ไม่ใช่ไซเบอร์พังค์เลย

Dall-E 3 อยู่ตรงกลาง มันสามารถสร้างหุ่นยนต์แห่งอนาคตได้ เมืองนี้เป็นไซเบอร์พังค์ แต่ป้ายไม่มีคำว่า "Emerge"

สิ่งที่น่าสนใจคือ Ideogram เข้าใจว่าหุ่นยนต์อยู่ในเมืองและเกี่ยวข้องกับป้ายดังกล่าว ในขณะที่ Dall-E สันนิษฐานว่าป้ายดังกล่าวเป็นส่วนหนึ่งของทิวทัศน์ของเมือง

พร้อมท์ยาวและความสามารถเชิงพื้นที่

พร้อมท์: ฉากเหนือจริงและน่าทึ่งที่มีแมวเกาะอยู่บนโทรทัศน์ข้างป้ายที่เขียนว่า "Emerge" ในเบื้องหลัง มีหุ่นยนต์แห่งอนาคตยืนอยู่ด้านหนึ่งและมีนักบินอวกาศอยู่อีกด้านหนึ่ง ผนังห้องตกแต่งด้วยภาพโมเลกุลและสายโซ่ดีเอ็นเออันโดดเด่น

Ideogram เป็นเครื่องมือสร้างภาพ AI ใหม่ที่ทำลายล้างการแข่งขัน มีประสิทธิภาพเหนือกว่า MidJourney และ Dall-E 3 - ถอดรหัสข้อมูลอัจฉริยะของ PlatoBlockchain ค้นหาแนวตั้ง AI.
รุ่นที่มี Ideogram (บนสุด), MidJourney (ซ้ายล่าง) และ Dall-e 3 (ล่างขวา)

Ideogram เป็นตัวสร้างโดยรวมที่ดีที่สุด ระบบเข้าใจข้อความแจ้งทุกส่วนของข้อความ สร้างข้อความโดยไม่มีการพิมพ์ผิด เข้าใจตำแหน่งของแต่ละองค์ประกอบโดยมีแมวอยู่บนทีวี ป้ายข้างๆ หุ่นยนต์และนักบินอวกาศในแต่ละด้าน และยังเข้าใจอีกด้วยว่า จะต้องมีโมเลกุลและสายโซ่ดีเอ็นเออยู่ด้านหลัง

สุนทรียศาสตร์ของ MidJourney ไม่ได้เหนือจริง แต่ค่อนข้างสมจริงมาก มันสร้างคำว่า "Emerge" แต่วางไว้บนทีวี และไม่ทำให้เกิดสัญญาณ แมวยังอยู่ข้างทีวีและไม่ได้อยู่ด้านบน มันไม่ได้สร้างหุ่นยนต์ขึ้นมาและล้มเหลวในการปฏิบัติตามข้อความแจ้งสำหรับพื้นหลัง โดยสร้างหุ่นยนต์ที่เหมาะกับความสวยงามขององค์ประกอบภาพมากกว่า โดยให้ความสำคัญกับตัวแบบ (แมว) มากกว่าฉากโดยรวม

Dall-E 3 ยังคงรูปแบบการ์ตูนที่เป็นเอกลักษณ์และไม่สามารถปฏิบัติตามคำแนะนำได้อย่างเต็มที่ มีความเข้าใจเชิงพื้นที่และการยึดมั่นที่รวดเร็วกว่า MidJourney แต่น้อยกว่า Ideogram มาก แต่ก็แพ้ในแง่ของสไตล์ มันทำให้มีแมวอยู่ด้านบนของทีวี แต่ไม่สามารถสร้างป้าย Emerge ข้างๆ แมวได้ มันไม่ได้สร้าง Android และไม่ปฏิบัติตามคำแนะนำเมื่อสร้างพื้นหลัง

เซ็นเซอร์

Prompt: สาวฮอตและเซ็กซี่

รุ่นที่มี Ideogram (ซ้าย), MidJourney (กลาง) และ Dall-e 3 (ขวา)
รุ่นที่มี Ideogram (ซ้าย), MidJourney (กลาง) และ Dall-e 3 (ขวา)

ข้อความแจ้งไม่รวมถึงภาษาที่อาจตีความได้ว่าเป็นคำพูดแสดงความเกลียดชังหรือคำสบถ นับประสาอะไรกับเรื่องเพศโดยเฉพาะ ท้ายที่สุดแล้ว “สาวเซ็กซี่สุดฮอต” สามารถแต่งตัวได้เต็มที่และไม่ล่วงละเมิดทางเพศ

Ideogram AI เข้าใจข้อความแจ้ง และสร้างภาพที่สอดคล้องกับคำแนะนำ Ideogram มีตัวควบคุม AI ซึ่งจะถูกกระตุ้นเมื่อมีการใช้คำที่ชัดเจนมากขึ้นซึ่งนำไปสู่การสร้างที่ถูกเซ็นเซอร์ทันที (เช่น คำสแลงสำหรับอวัยวะเพศหรือแท็ก เช่น เปลือย เปลือย ฯลฯ)

ในขณะเดียวกัน ทั้ง MidJourney และ Dall-E 3 ล้มเหลวในการสร้างภาพและห้ามคำต่างๆ แม้ว่าคำเหล่านั้นจะไม่นำไปสู่การสร้าง NSFW ก็ตาม

ดูเหมือนว่า Ideogram จะถูกกำหนดเป้าหมายด้วยการเซ็นเซอร์มากกว่า และเป็นไปได้ที่จะเห็นภาพที่สร้างขึ้น —NSFW หรือน่าสงสัย—ก่อนที่แอปพลิเคชันจะดึงมันออกมา

บุคคลที่มีชื่อเสียงและภาพที่มีลิขสิทธิ์

ข้อความแจ้ง: Joe Biden และ Vladimir Putin ที่มีความสุขอยู่หน้ากำแพงพร้อมข้อความ "ถอดรหัส" จับมือกัน

รุ่นที่มี Ideogram (บนสุด), Dall-e 3 (ซ้ายล่าง) และ MidJourney (ล่างขวา)
รุ่นที่มี Ideogram (บนสุด), Dall-e 3 (ซ้ายล่าง) และ MidJourney (ล่างขวา)

Ideogram AI สร้างภาพ ข้อความถูกต้อง สถานการณ์มีความสมจริง และสามารถระบุตัวละครได้ง่าย (แม้ว่าจะไม่ถูกต้อง 100% ก็ตาม)

Dall-E 3 สร้างภาพขึ้นมา แต่ Biden ไม่สามารถระบุตัวตนได้ง่าย และสามารถระบุทรัมป์ได้ก็เพราะทรงผมที่มีลักษณะเฉพาะของเขาเท่านั้น ข้อความไม่ถูกต้อง และทิวทัศน์ไม่สมจริง แต่กลับกลายเป็นการ์ตูน

MidJourney ปฏิเสธที่จะสร้างภาพ

สรุป

ฟรีและเข้าถึงได้อย่างกว้างขวางนอกประตู Ideogram อาจเป็นโปรแกรมสร้างภาพที่ดีที่สุดในตลาดปัจจุบัน สามารถเข้าใจภาษาธรรมชาติได้ดี และมีความสามารถด้านพื้นที่ที่โดดเด่นและการยึดมั่นในทันที นอกจากนี้ยังเป็นเครื่องมือสร้างข้อความที่ดีที่สุดในปัจจุบันอีกด้วย

หากความสวยงามคือการพิจารณาที่สำคัญที่สุด จนถึงจุดที่การยึดเกาะและข้อความมีความสำคัญน้อยกว่า MidJourney อาจยังคงเป็นคู่แข่งที่แข็งแกร่งสำหรับกรณีการใช้งานเฉพาะ แม้ว่าจะไม่ได้แข็งแกร่งเป็นพิเศษและถูกเซ็นเซอร์อย่างเข้มงวด แต่ Dall-E 3 ก็อาจยังคงสมเหตุสมผลในฐานะส่วนหนึ่งของการสมัครสมาชิก ChatGPT Plus

Ideogram AI ครองมงกุฎในกล่องเครื่องมือสร้างภาพของเรา — ในตอนนี้

แก้ไขโดย ไรอัน โอซาว่า.

ติดตามข่าวสาร crypto รับการอัปเดตทุกวันในกล่องจดหมายของคุณ

ประทับเวลา:

เพิ่มเติมจาก ถอดรหัส