آئیڈیوگرام ایک نیا AI امیج جنریٹر ہے جو مسابقت کو ختم کرتا ہے، مڈ جرنی اور Dall-E 3 کو بہتر بناتا ہے۔

آئیڈیوگرام ایک نیا AI امیج جنریٹر ہے جو مسابقت کو ختم کر دیتا ہے، مڈ جرنی اور Dall-E 3 کو بہتر بناتا ہے - ڈیکرپٹ

Ideogram AI — ایک سٹارٹ اپ جسے گوگل کے سابق انجینئرز نے UC برکلے، کارنیگی میلن یونیورسٹی، اور یونیورسٹی آف ٹورنٹو جیسے معزز اداروں کے ممبروں کے ساتھ مل کر قائم کیا تھا — نے اپنے نامی امیج جنریٹر کا پہلا مکمل ورژن جاری کرنے کا اعلان کیا ہے۔

"ہم Ideogram 1.0 کو جاری کرنے کے لیے پرجوش ہیں، جو آج تک کا ہمارا سب سے جدید ٹیکسٹ ٹو امیج ماڈل ہے،" Ideogram AI نے ایک اہلکار میں کہا۔ بلاگ پوسٹ. "تمام Ideogram ماڈلز کی طرح شروع سے تربیت یافتہ، Ideogram 1.0 جدید ترین ٹیکسٹ رینڈرنگ، بے مثال فوٹو ریئلزم، اور فوری عمل کی پیشکش کرتا ہے — اور Magic Prompt نامی ایک نئی خصوصیت جو آپ کو خوبصورت، تخلیقی تصاویر کے لیے تفصیلی اشارے لکھنے میں مدد کرتی ہے۔"

ریلیز ریڈ پوائنٹ وینچرز، پیئر وی سی، اور ایس وی اینجل کے ساتھ، اینڈریسن ہورووٹز کی قیادت میں $80 ملین سیریز A فنڈ ریز کی خبروں کے ساتھ سامنے آئی ہے۔

خرابی ماڈل کی جانچ کرنے کے قابل تھا اور Ideogram AI کے دعوے بے حد بڑھا چڑھا کر پیش نہیں کیے گئے ہیں۔ آئیڈیوگرام کا ایک ورژن اس کے v0.1 اور v0.2 کے پیشرووں کے مقابلے میں واضح بہتری ہے: یہ فوری طور پر عمل کرنے، تصویر کے معیار اور متن کی تخلیق کی صلاحیتوں میں سبقت رکھتا ہے۔

ماڈل اوپن سورس نہیں ہے، اس لیے اس کے پلمبنگ میں محدود مرئیت ہے اور جانچنے کے لیے کوئی تحقیقی مقالہ نہیں ہے۔ لیکن ماڈل کے ساتھ حاصل کردہ نتائج نے خود ہی بات کی، ممکنہ طور پر اسے فی الحال دستیاب بہترین ماڈل بنا دیا ہے - کم از کم اس وقت تک مستحکم بازی 3 عوامی طور پر جاری کیا جاتا ہے۔

نیا ماڈل متنی صلاحیتوں کے لحاظ سے سب سے زیادہ قابل امیج جنریٹر ہے، جو Dall-E 3 یا MidJourney کے مقابلے میں کم غلطیوں کے ساتھ لمبے ٹیکسٹ سٹرنگز تیار کرتا ہے۔ موجودہ مفت درجے نے اسے Dall-E 3 اور MidJourney جیسے حریفوں پر برتری بھی دی ہے، جن میں سے بعد میں کوئی مفت درجے نہیں ہے۔ Microsoft Copilot Dall-E 3 بھی استعمال کرتا ہے، لیکن یہ صرف مربع 1:1 امیجز تیار کرتا ہے، جبکہ Ideogram پہلو کے تناسب کے وسیع سیٹ کو سپورٹ کرتا ہے۔

آئیڈیوگرام بھی پیش کرتا ہے۔ دو ادا شدہ منصوبے $7 اور $15 فی مہینہ، جو کہ تصویری ایڈیٹر، بہتر معیار کے ڈاؤن لوڈز، img400img- جو کہ موجودہ تصویر میں ترمیم یا تغیرات کی اجازت دیتا ہے- اور نجی نسلوں جیسے دیگر فوائد کے ساتھ فی دن 2 سے زیادہ نسلوں تک رسائی فراہم کرتا ہے۔ تمام نچلے درجے کی درخواست کردہ تصاویر کو عوامی طور پر ڈسپلے کرتے ہیں۔

آئیڈیوگرام طویل اشارے کو سمجھنے، اسٹیبل ڈفیوژن 3 کے ساتھ پیر سے پیر تک جانے اور اس فیلڈ میں دیگر تمام امیج جنریٹرز کو شکست دینے کی صلاحیت رکھتا ہے۔

Ideogram کی نمایاں خصوصیات میں سے ایک "Prompt Magic" ہے، جسے آن اور آف کیا جا سکتا ہے۔ یہ فیچر پرامپٹ کا تجزیہ کرتا ہے اور اسے بہتر معیار کی تصاویر بنانے کے لیے بڑھاتا ہے، بنیادی طور پر ماڈل کو قدرتی زبان جیسے Dall-E 3 کو سمجھنے کی صلاحیت فراہم کرتا ہے۔ تاہم، Ideogram زیادہ ورسٹائل ہے کیونکہ یہ خصوصیت اختیاری ہے۔ یہ ہمیشہ چیٹ جی پی ٹی پلس کے ساتھ آن ہوتا ہے، جو بعض اوقات غلطیاں پیدا کرتا ہے۔

آخر میں، Ideogram کو MidJourney اور Dall-E 3 کے مقابلے میں کم جارحانہ طور پر سنسر کیا گیا ہے، اور یہ اب تک مشہور لوگوں، کمپنی کے لوگو اور آرٹ کے انداز کی تصاویر بنانے کے قابل ہے۔ یہ مکمل طور پر NSFW پر نہیں جاتا، لیکن جب بات سنسر کرنے کے اشارے کی ہو تو یہ زیادہ مجرد ہے۔

اور ابتدائی ٹیسٹرز دوسرے ماڈلز پر آئیڈیوگرام کو ترجیح دیتے ہیں۔ "DALL·E 3 کی طرح ایک تشخیصی پروٹوکول کا استعمال کرتے ہوئے، ہمیں معلوم ہوتا ہے کہ انسانی درجہ بندی کرنے والے Ideogram 1.0 کو DALL·E 3 اور Midjourney V6 پر فوری سیدھ، تصویری ہم آہنگی، مجموعی ترجیح، اور ٹیکسٹ رینڈرنگ کے معیار میں ترجیح دیتے ہیں،" اسٹارٹ اپ نے کہا۔

شانہ بہ شانہ موازنہ: آئیڈیوگرام بمقابلہ مڈ جورنی بمقابلہ ڈیل ای 3

خرابی Ideogram کی صلاحیتوں کا تجربہ کیا اور اس کا موازنہ اس کے سرفہرست حریفوں، MidJourney اور Dall-E 3 سے کیا۔ مستحکم ڈفیوژن 3 اور گوگل کا ٹاپ آف دی لائن امیج ایف ایکس یہاں جائزہ نہیں لیا جا رہا ہے کیونکہ SD3 ابھی تک جاری نہیں ہوا ہے اور ImageFX وسیع پیمانے پر دستیاب نہیں ہے۔

متن کی لمبی تاریں تیار کرنا

پرامپٹ: سائبرپنک سٹی میں ایک مستقبل کا اینڈرائیڈ جس میں ایک نشانی ہے جس میں لکھا ہے، "AI رجحان میں دیر نہ کریں: Decrypt کے ذریعے ابھریں"

Ideogram (بائیں)، MidJourney (درمیان) اور Dall-e 3 (دائیں) کے ساتھ نسلیں
Ideogram (بائیں)، MidJourney (درمیان) اور Dall-E 3 (دائیں) کے ساتھ جنریشنز۔

Ideogram AI درخواست کردہ جمالیات اور متن دونوں کو پیش کرنے کے قابل تھا۔ اس میں ٹائپنگ کی غلطی تھی، تاہم، "the" کی بجائے "you" پیدا کر رہا تھا۔

MidJourney بالکل بھی کوئی مربوط متن پیدا کرنے کے قابل نہیں تھا، اور تفصیل کے ساتھ مستقبل کے android کو بنانے پر توجہ مرکوز کی۔ یہ پوری ترکیب کا بنیادی موضوع ہے۔ یہ شہر بالکل بھی سائبر پنک نہیں ہے۔

Dall-E 3 درمیان میں ہے۔ یہ مستقبل کا روبوٹ بنانے کے قابل تھا، یہ شہر سائبر پنک ہے، لیکن اس نشان میں لفظ "Emerge" نہیں تھا۔

دلچسپ بات یہ ہے کہ آئیڈیوگرام نے سمجھا کہ روبوٹ شہر میں ہے اور اس نشان سے منسلک ہے، جبکہ ڈیل-ای نے فرض کیا کہ یہ نشان شہر کے منظر کا حصہ ہے۔

طویل اشارے اور مقامی صلاحیتیں۔

پرامپٹ: ایک حقیقی اور دلچسپ منظر جس میں ایک بلی کو دکھایا گیا ہے جس میں ٹیلی ویژن کے اوپر ایک نشان کے ساتھ بیٹھا ہے جس پر لکھا ہے "ابھرے۔" پس منظر میں، ایک طرف مستقبل کا اینڈرائیڈ کھڑا ہے اور دوسری طرف ایک خلاباز۔ کمرے کی دیواریں ایک مالیکیول اور ڈی این اے چین کی شاندار تصویر سے مزین ہیں۔

Ideogram Is A New AI Image Generator That Obliterates the Competition, Outperforming MidJourney and Dall-E 3 - Decrypt PlatoBlockchain Data Intelligence. Vertical Search. Ai.
Ideogram (اوپر)، MidJourney (نیچے بائیں) اور Dall-e 3 (نیچے دائیں) کے ساتھ جنریشنز

آئیڈیوگرام مجموعی طور پر اب تک کا بہترین جنریٹر تھا۔ اس نے پرامپٹ کے ہر ایک حصے کو سمجھا، بغیر کسی ٹائپوز کے متن کو بنایا، ٹی وی کے اوپر بلی کے ساتھ ہر عنصر کے مقام، اس کے ساتھ والے نشان، ہر طرف اینڈرائیڈ اور خلاباز کو سمجھا، اور یہاں تک کہ سمجھا کہ پس منظر میں ایک مالیکیول اور ڈی این اے کا سلسلہ ہونا چاہیے۔

MidJourney کی جمالیاتی حقیقت نہیں تھی، بلکہ انتہائی حقیقت پسندانہ تھی۔ اس نے لفظ "Emerge" پیدا کیا، لیکن اسے TV پر ڈال دیا، اور نشان نہیں بنایا۔ بلی بھی ٹی وی کے ساتھ ہے اور اس کے اوپر نہیں۔ اس نے android پیدا نہیں کیا اور بیک گراؤنڈ کے لیے پرامپٹ کی پیروی کرنے میں ناکام رہا، اس کے بجائے ایک ایسا تخلیق کیا جو کمپوزیشن کے جمالیاتی لحاظ سے بہتر ہو، اور مجموعی منظر کے مقابلے میں موضوع (بلی) کو زیادہ اہمیت دی۔

Dall-E 3 نے اپنا خاص کارٹونی انداز برقرار رکھا اور فوری طور پر اس پر عمل نہیں کر سکا۔ اس میں MidJourney سے زیادہ مقامی سمجھ اور فوری عمل ہے، لیکن Ideogram سے کم ہے۔ تاہم، یہ سٹائل کے لحاظ سے کھو دیتا ہے. اس نے ٹی وی کے اوپر بلی تیار کی، لیکن بلی کے آگے ایمرج سائن بنانے میں ناکام رہا۔ اس نے اینڈرائیڈ نہیں بنایا، اور بیک گراؤنڈ تیار کرتے وقت پرامپٹ پر عمل نہیں کیا۔

سنسر شپ

فوری: ایک گرم، شہوت انگیز لڑکی۔

Ideogram (بائیں)، MidJourney (درمیان) اور Dall-e 3 (دائیں) کے ساتھ نسلیں
Ideogram (بائیں)، MidJourney (درمیان) اور Dall-e 3 (دائیں) کے ساتھ نسلیں

اس پرامپٹ میں ایسی زبان شامل نہیں ہے جسے نفرت انگیز تقریر یا گالی گلوچ سے تعبیر کیا جا سکتا ہے، خاص طور پر جنسی کو چھوڑ دیں۔ سب کے بعد، ایک "گرم، سیکسی لڑکی" مکمل طور پر کپڑے پہن سکتی ہے اور جارحانہ طور پر جنسی نہیں ہوسکتی ہے.

Ideogram AI نے پرامپٹ کو سمجھا، اور ایک ایسی تصویر بنائی جو ہدایات کے مطابق ہو۔ آئیڈیوگرام میں ایک AI ماڈریٹر ہوتا ہے، تاہم، یہ اس وقت متحرک ہوتا ہے جب زیادہ واضح الفاظ استعمال کیے جاتے ہیں جو فوری طور پر سنسر شدہ نسل کی طرف لے جاتے ہیں (کہیں، جننانگ کے لیے بول چال کے الفاظ یا ٹیگز جیسے عریاں، ننگے، وغیرہ)۔

MidJourney اور Dall-E 3 دونوں، اس دوران، تصویر بنانے میں ناکام رہے اور الفاظ پر پابندی لگا دی یہاں تک کہ اگر وہ NSFW نسل کا باعث نہ بنتے۔

ایسا لگتا ہے کہ آئیڈیوگرام کو سنسرشپ کے ساتھ زیادہ نشانہ بنایا گیا ہے، اور ایپلیکیشن کے ذریعے ینک کیے جانے سے پہلے تخلیق شدہ تصویر — NSFW یا دوسری صورت میں قابل اعتراض — دیکھنا ممکن ہے۔

مشہور لوگ اور کاپی رائٹ والی تصاویر

پرامپٹ: ایک خوش جو بائیڈن اور ولادیمیر پوتن ایک دیوار کے سامنے "ڈیکرپٹ" کے متن کے ساتھ ہاتھ پکڑے ہوئے ہیں۔

Ideogram (اوپر)، Dall-e 3 (نیچے بائیں) اور MidJourney (نیچے دائیں) کے ساتھ جنریشنز
Ideogram (اوپر)، Dall-e 3 (نیچے بائیں) اور MidJourney (نیچے دائیں) کے ساتھ جنریشنز

Ideogram AI نے تصویر بنائی، متن درست ہے، منظر نامہ حقیقت پسندانہ ہے، اور کردار آسانی سے پہچانے جا سکتے ہیں (چاہے 100% درست نہ ہوں۔

Dall-E 3 نے تصویر تیار کی، لیکن بائیڈن آسانی سے قابل شناخت نہیں ہیں، اور ٹرمپ کو صرف ان کے مخصوص بالوں کے انداز کی وجہ سے پہچانا جا سکتا ہے۔ متن درست نہیں ہے، اور مناظر حقیقت پسندانہ نہیں ہیں اور اس کی بجائے کارٹونی ہے۔

MidJourney نے تصویر بنانے سے انکار کر دیا۔

نتیجہ

گیٹ سے باہر مفت اور وسیع پیمانے پر دستیاب، آئیڈیوگرام اس وقت مارکیٹ میں موجود بہترین امیج جنریٹر ہو سکتا ہے۔ یہ فطری زبان کی سمجھ میں بہت اچھا ہے اور اس میں شاندار مقامی صلاحیتیں اور فوری عمل ہے۔ یہ فی الحال دستیاب بہترین ٹیکسٹ جنریٹر بھی ہے۔

اگر جمالیات سب سے اہم غور و فکر ہے — اس مقام تک جہاں پر عمل اور متن کم اہم ہے — تو مڈ جرنی مخصوص استعمال کے معاملات کے لیے ایک ٹھوس مدمقابل رہ سکتا ہے۔ اگرچہ خاص طور پر مضبوط اور بہت زیادہ سنسر نہیں ہے، Dall-E 3 اب بھی ChatGPT Plus سبسکرپشن کے حصے کے طور پر معنی رکھتا ہے۔

Ideogram AI ہمارے امیج جنریٹرز کے ٹول باکس میں - ابھی کے لیے تاج رکھتا ہے۔

کی طرف سے ترمیم ریان اوزاوا.

کرپٹو خبروں سے باخبر رہیں، اپنے ان باکس میں روزانہ کی تازہ ترین معلومات حاصل کریں۔

ٹائم اسٹیمپ:

سے زیادہ خرابی