আইডিওগ্রাম হল একটি নতুন এআই ইমেজ জেনারেটর যা প্রতিযোগিতাকে বিলুপ্ত করে, মিডজার্নিকে ছাড়িয়ে যায় এবং ডাল-ই 3 - ডিক্রিপ্ট

আইডিওগ্রাম হল একটি নতুন এআই ইমেজ জেনারেটর যা প্রতিযোগিতাকে বিলুপ্ত করে, মিডজার্নিকে ছাড়িয়ে যায় এবং ডাল-ই 3 - ডিক্রিপ্ট করে

Ideogram AI—প্রাক্তন Google প্রকৌশলীদের দ্বারা প্রতিষ্ঠিত একটি স্টার্টআপ যা UC বার্কলে, কার্নেগি মেলন ইউনিভার্সিটি এবং টরন্টো বিশ্ববিদ্যালয়ের মতো মর্যাদাপূর্ণ প্রতিষ্ঠানের সদস্যদের সাথে মিলেছে—তার নামীয় ইমেজ জেনারেটরের প্রথম পূর্ণ সংস্করণ প্রকাশের ঘোষণা দিয়েছে।

"আমরা Ideogram 1.0 প্রকাশ করতে পেরে উচ্ছ্বসিত, এখন পর্যন্ত আমাদের সবচেয়ে উন্নত টেক্সট-টু-ইমেজ মডেল," Ideogram AI একজন কর্মকর্তা বলেছেন ব্লগ পোস্ট. "সমস্ত আইডিওগ্রাম মডেলের মতো স্ক্র্যাচ থেকে প্রশিক্ষিত, আইডিওগ্রাম 1.0 অত্যাধুনিক টেক্সট রেন্ডারিং, অভূতপূর্ব ফটোরিয়ালিজম এবং প্রম্পট আনুগত্য প্রদান করে—এবং ম্যাজিক প্রম্পট নামে একটি নতুন বৈশিষ্ট্য যা আপনাকে সুন্দর, সৃজনশীল চিত্রগুলির জন্য বিস্তারিত প্রম্পট লিখতে সাহায্য করে।"

রেডপয়েন্ট ভেঞ্চারস, পিয়ার ভিসি এবং এসভি অ্যাঞ্জেলের সাথে অ্যান্ড্রেসেন হোরোভিটজের নেতৃত্বে $80 মিলিয়ন সিরিজ এ তহবিল সংগ্রহের খবরের সাথে রিলিজটি আসে।

ডিক্রিপ্ট করুন মডেলটি পরীক্ষা করতে সক্ষম হয়েছিল এবং আইডিওগ্রাম এআই-এর দাবিগুলি অত্যধিকভাবে প্রকাশ করা হয়নি—একটি পাশাপাশি তুলনা নীচে পাওয়া যাবে। Ideogram-এর একটি সংস্করণ এটির v0.1 এবং v0.2 পূর্বসূরীদের তুলনায় একটি সুস্পষ্ট উন্নতি: এটি দ্রুত আনুগত্য, চিত্রের গুণমান এবং টেক্সট তৈরির ক্ষমতার ক্ষেত্রে শ্রেষ্ঠ।

মডেলটি ওপেন সোর্স নয়, তাই এর প্লাম্বিংয়ে সীমিত দৃশ্যমানতা রয়েছে এবং মূল্যায়ন করার জন্য কোনো গবেষণাপত্র নেই। কিন্তু মডেলের সাথে প্রাপ্ত ফলাফলগুলি নিজেদের জন্য কথা বলেছিল, সম্ভাব্যভাবে এটিকে বর্তমানে উপলব্ধ সেরা মডেল বানিয়েছে-অন্তত পর্যন্ত স্থিতিশীল বিস্তার 3 প্রকাশ্যে মুক্তি পায়।

নতুন মডেলটি যুক্তিযুক্তভাবে টেক্সট ক্ষমতার দিক থেকে সবচেয়ে সক্ষম ইমেজ জেনারেটর, যা Dall-E 3 বা MidJourney-এর চেয়ে কম ত্রুটি সহ দীর্ঘ টেক্সট স্ট্রিং তৈরি করে। বর্তমান মুক্ত স্তরটি এটিকে Dall-E 3 এবং MidJourney-এর মতো প্রতিযোগীদের উপরে একটি অগ্রগতি দেয়, যার শেষেরটির কোন মুক্ত স্তর নেই। Microsoft Copilot এছাড়াও Dall-E 3 ব্যবহার করে, কিন্তু এটি শুধুমাত্র বর্গাকার 1:1 ইমেজ তৈরি করে, যেখানে Ideogram আকৃতির অনুপাতের একটি বিস্তৃত সেট সমর্থন করে।

আইডিওগ্রামও অফার করে দুটি অর্থপ্রদানের পরিকল্পনা প্রতি মাসে $7 এবং $15, যা একটি ইমেজ এডিটর, আরও ভালো মানের ডাউনলোড, img400img-এবং ব্যক্তিগত জেনারেশন-এ পরিবর্তন বা পরিবর্তনের অনুমতি দেয়-এর মতো অন্যান্য সুবিধা সহ প্রতিদিন 2 টিরও বেশি প্রজন্মকে অ্যাক্সেস দেয়। সমস্ত নিম্ন স্তরের অনুরোধ করা ছবি সর্বজনীনভাবে প্রদর্শন করে।

Ideogram দীর্ঘ প্রম্পট বুঝতে সক্ষম, স্টেবল ডিফিউশন 3 এর সাথে পায়ের আঙুলে যেতে এবং এই ক্ষেত্রে অন্যান্য সমস্ত ইমেজ জেনারেটরকে মারতে সক্ষম।

আইডিওগ্রামের একটি স্ট্যান্ডআউট বৈশিষ্ট্য হল "প্রম্পট ম্যাজিক", যা চালু এবং বন্ধ করা যেতে পারে। এই বৈশিষ্ট্যটি প্রম্পটকে বিশ্লেষণ করে এবং উন্নত মানের ছবি তৈরি করতে এটিকে উন্নত করে, মূলত মডেলটিকে ডাল-ই 3-এর মতো প্রাকৃতিক ভাষা বোঝার ক্ষমতা দেয়। তবে, আইডিওগ্রামটি আরও বহুমুখী কারণ এই বৈশিষ্ট্যটি ঐচ্ছিক। এটি সবসময় ChatGPT প্লাসের সাথে চালু থাকে, যা কখনও কখনও ভুলের দিকে নিয়ে যায়।

অবশেষে, Ideogram মিডজার্নি এবং ডাল-ই 3 এর তুলনায় কম আক্রমনাত্মকভাবে সেন্সর করা হয়েছে এবং এটি এখন পর্যন্ত বিখ্যাত ব্যক্তিদের ছবি, কোম্পানির লোগো এবং শিল্প শৈলী তৈরি করতে সক্ষম। এটি সম্পূর্ণরূপে NSFW-তে যায় না, তবে প্রম্পট সেন্সর করার ক্ষেত্রে এটি আরও বিচ্ছিন্ন।

এবং প্রাথমিক পরীক্ষকরা অন্যান্য মডেলের তুলনায় আইডিওগ্রাম পছন্দ করে বলে মনে হচ্ছে। "DALL·E 3-এর মতো একটি মূল্যায়ন প্রোটোকল ব্যবহার করে, আমরা দেখতে পাই যে মানব রেটাররা DALL·E 1.0 এবং Midjourney V3-এর তুলনায় Ideogram 6 কে প্রম্পট অ্যালাইনমেন্ট, ইমেজ কোহেরেন্স, সামগ্রিক পছন্দ এবং টেক্সট রেন্ডারিং কোয়ালিটি পছন্দ করে," স্টার্টআপ বলেছে।

পাশাপাশি তুলনা: আইডিওগ্রাম বনাম মিডজার্নি বনাম ডাল-ই 3

ডিক্রিপ্ট করুন Ideogram এর ক্ষমতা পরীক্ষা করেছে এবং এটিকে তার শীর্ষ প্রতিযোগী, MidJourney এবং Dall-E 3 এর সাথে তুলনা করেছে। স্টেবল ডিফিউশন 3 এবং Google-এর টপ-অফ-দ্য-লাইন ইমেজএফএক্স এখানে মূল্যায়ন করা হচ্ছে না কারণ SD3 এখনও প্রকাশিত হয়নি এবং ImageFX ব্যাপকভাবে উপলব্ধ নয়৷

লেখার দীর্ঘ স্ট্রিং তৈরি করা হচ্ছে

প্রম্পট: সাইবারপাঙ্ক সিটিতে একটি ভবিষ্যত অ্যান্ড্রয়েড একটি চিহ্ন সহ যেটিতে লেখা আছে, "এআই ট্রেন্ডে দেরি করবেন না: ডিক্রিপ্টের মাধ্যমে আবির্ভূত হবেন"

আইডিওগ্রাম (বামে), মিডজার্নি (মাঝে) এবং ডাল-ই 3 (ডান) সহ প্রজন্ম
আইডিওগ্রাম (বামে), মিডজার্নি (মাঝে) এবং ডাল-ই 3 (ডানদিকে) সহ প্রজন্ম।

আইডিওগ্রাম এআই অনুরোধকৃত নান্দনিকতা এবং পাঠ্য উভয়ই চিত্রিত করতে সক্ষম হয়েছিল। এটিতে একটি টাইপো ছিল, তবে, "the" এর পরিবর্তে "তুমি" তৈরি করেছে।

MidJourney মোটেও কোনো সুসংগত টেক্সট তৈরি করতে সক্ষম ছিল না, এবং বিস্তারিত সহ একটি ভবিষ্যত অ্যান্ড্রয়েড তৈরি করার দিকে মনোনিবেশ করেছিল। এটি সমগ্র রচনার প্রধান বিষয়। শহরটি মোটেও সাইবারপাঙ্ক নয়।

ডাল-ই 3 মাঝখানে। এটি ভবিষ্যত রোবট তৈরি করতে সক্ষম হয়েছিল, শহরটি সাইবারপাঙ্ক, কিন্তু চিহ্নটিতে "ইমার্জ" শব্দটি ছিল না।

মজার ব্যাপার হল, আইডিওগ্রাম বুঝতে পেরেছিল যে রোবটটি শহরে ছিল এবং চিহ্নটির সাথে যুক্ত ছিল, যেখানে ডাল-ই ধরে নিয়েছিল যে সাইনটি শহরের দৃশ্যের অংশ ছিল।

দীর্ঘ প্রম্পট এবং স্থানিক ক্ষমতা

প্রম্পট: একটি পরাবাস্তব এবং কৌতূহলী দৃশ্য যেখানে একটি টেলিভিশনের উপরে একটি চিহ্নের পাশে একটি বিড়াল রয়েছে যা লেখা আছে "উত্থান।" ব্যাকগ্রাউন্ডে, একটি ভবিষ্যত অ্যান্ড্রয়েড একদিকে দাঁড়িয়ে আছে এবং অন্য দিকে একজন মহাকাশচারী। ঘরের দেয়াল একটি অণু এবং একটি DNA চেইন এর একটি আকর্ষণীয় ছবি দিয়ে শোভা পাচ্ছে।

আইডিওগ্রাম হল একটি নতুন এআই ইমেজ জেনারেটর যা প্রতিযোগিতাকে বাদ দেয়, মিডজার্নিকে ছাড়িয়ে যায় এবং ডাল-ই 3 - ডিক্রিপ্ট প্লেটোব্লকচেন ডেটা ইন্টেলিজেন্স। উল্লম্ব অনুসন্ধান. আ.
আইডিওগ্রাম (উপরে), মিডজার্নি (নীচে বাম), এবং ডাল-ই 3 (নীচে ডানদিকে) সহ প্রজন্ম

আইডিওগ্রাম এখন পর্যন্ত সেরা সামগ্রিক জেনারেটর ছিল। এটি প্রম্পটের প্রতিটি অংশ বুঝতে পেরেছে, কোনো টাইপ ছাড়াই পাঠ্য তৈরি করেছে, একটি টিভির উপরে বিড়ালের সাথে প্রতিটি উপাদানের অবস্থান, তার পাশের চিহ্ন, প্রতিটি পাশে অ্যান্ড্রয়েড এবং মহাকাশচারী বুঝতে পেরেছে এবং এমনকি বুঝতে পেরেছে যে ব্যাকগ্রাউন্ডে অবশ্যই একটি অণু এবং একটি ডিএনএ চেইন থাকতে হবে।

মিডজার্নির নান্দনিকতা পরাবাস্তব ছিল না, বরং অতি বাস্তববাদী ছিল। এটি "Emerge" শব্দটি তৈরি করেছে, কিন্তু এটি টিভিতে রেখেছিল এবং চিহ্নটি তৈরি করেনি৷ বিড়ালটিও টিভির পাশে এবং তার উপরে নয়। এটি অ্যান্ড্রয়েড জেনারেট করেনি এবং ব্যাকগ্রাউন্ডের জন্য প্রম্পট অনুসরণ করতে ব্যর্থ হয়েছে, এর পরিবর্তে এমন একটি তৈরি করেছে যা রচনাটির নান্দনিকতার সাথে মানানসই, সামগ্রিক দৃশ্যের উপর বিষয় (বিড়াল) কে বেশি গুরুত্ব দেয়।

ডাল-ই 3 তার বৈশিষ্ট্যযুক্ত কার্টুনি শৈলী ধরে রেখেছে এবং প্রম্পটটিকে পুরোপুরি অনুসরণ করতে পারেনি। মিডজার্নির তুলনায় এটির স্থানিক বোঝাপড়া এবং দ্রুত আনুগত্য রয়েছে, তবে আইডিওগ্রামের চেয়ে কম। এটি অবশ্য শৈলীর দিক থেকে হারায়। এটি টিভির উপরে বিড়াল তৈরি করেছে, কিন্তু বিড়ালের পাশে ইমারজ চিহ্ন তৈরি করতে ব্যর্থ হয়েছে। এটি অ্যান্ড্রয়েড তৈরি করেনি এবং পটভূমি তৈরি করার সময় প্রম্পট অনুসরণ করেনি।

বিবাচন

প্রম্পট: একটি হট, সেক্সি মেয়ে।

আইডিওগ্রাম (বামে), মিডজার্নি (মাঝে) এবং ডাল-ই 3 (ডান) সহ প্রজন্ম
আইডিওগ্রাম (বামে), মিডজার্নি (মাঝে) এবং ডাল-ই 3 (ডান) সহ প্রজন্ম

প্রম্পটে এমন ভাষা অন্তর্ভুক্ত করা হয় না যা ঘৃণাত্মক বক্তৃতা বা অপবাদ হিসাবে ব্যাখ্যা করা যেতে পারে, বিশেষ করে যৌনতাকে ছেড়ে দিন। সর্বোপরি, একটি "গরম, সেক্সি মেয়ে" সম্পূর্ণরূপে পরিহিত হতে পারে এবং আক্রমণাত্মকভাবে যৌন হয় না।

আইডিওগ্রাম এআই প্রম্পটটি বুঝতে পেরেছে এবং নির্দেশাবলীর সাথে মানানসই একটি চিত্র তৈরি করেছে। আইডিওগ্রামের একটি এআই মডারেটর আছে, তবে, এটি ট্রিগার হয় যখন আরও স্পষ্ট শব্দ ব্যবহার করা হয় যা অবিলম্বে একটি সেন্সরড প্রজন্মের দিকে নিয়ে যায় (বলুন, যৌনাঙ্গের জন্য অশ্লীল শব্দ বা নগ্ন, নগ্ন ইত্যাদি ট্যাগ)।

ইতিমধ্যে মিডজার্নি এবং ডাল-ই 3 উভয়ই ইমেজ তৈরি করতে ব্যর্থ হয়েছে এবং শব্দ নিষিদ্ধ করেছে এমনকি যদি তারা একটি NSFW প্রজন্মের দিকে পরিচালিত না করে।

আইডিওগ্রামকে সেন্সরশিপ দিয়ে আরও বেশি টার্গেট করা হয়েছে বলে মনে হচ্ছে, এবং অ্যাপ্লিকেশন দ্বারা ঝাঁকুনি দেওয়ার আগে জেনারেট করা ছবি—NSFW বা অন্যথায় সন্দেহজনক—দেখা সম্ভব।

বিখ্যাত ব্যক্তি এবং কপিরাইটযুক্ত ছবি

প্রম্পট: খুশি জো বিডেন এবং ভ্লাদিমির পুতিন একটি দেয়ালের সামনে "ডিক্রিপ্ট" লেখার হাত ধরে।

আইডিওগ্রাম (উপরে), ডাল-ই 3 (নীচে বাম), এবং মিডজার্নি (নীচে ডানদিকে) সহ প্রজন্ম
আইডিওগ্রাম (উপরে), ডাল-ই 3 (নীচে বাম), এবং মিডজার্নি (নীচে ডানদিকে) সহ প্রজন্ম

আইডিওগ্রাম এআই ছবিটি তৈরি করেছে, পাঠ্যটি সঠিক, দৃশ্যকল্প বাস্তবসম্মত এবং অক্ষরগুলি সহজেই শনাক্তযোগ্য (এমনকি 100% সঠিক না হলেও।

ডাল-ই 3 ছবিটি তৈরি করেছে, কিন্তু বিডেনকে সহজে শনাক্ত করা যায় না এবং ট্রাম্পকে শুধুমাত্র তার চরিত্রগত হেয়ারস্টাইলের কারণে সনাক্ত করা যায়। পাঠ্যটি সঠিক নয়, এবং দৃশ্যাবলী বাস্তবসম্মত নয় এবং পরিবর্তে কার্টুনি।

মিডজার্নি ছবিটি তৈরি করতে অস্বীকার করেছে।

উপসংহার

গেটের বাইরে বিনামূল্যে এবং ব্যাপকভাবে উপলব্ধ, আইডিওগ্রাম বর্তমানে বাজারে সেরা ইমেজ জেনারেটর হতে পারে। এটি প্রাকৃতিক ভাষা বোঝার ক্ষেত্রে দুর্দান্ত এবং এর অসামান্য স্থানিক ক্ষমতা এবং তাত্ক্ষণিক আনুগত্য রয়েছে। এটি বর্তমানে উপলব্ধ সেরা পাঠ্য জেনারেটর।

যদি নান্দনিকতা সবচেয়ে গুরুত্বপূর্ণ বিবেচ্য হয় - যেখানে আনুগত্য এবং পাঠ্য কম গুরুত্বপূর্ণ - তাহলে মিডজার্নি নির্দিষ্ট ব্যবহারের ক্ষেত্রে একটি শক্ত প্রতিযোগী হতে পারে। যদিও বিশেষভাবে শক্তিশালী এবং ভারীভাবে সেন্সর করা হয়নি, Dall-E 3 এখনও একটি ChatGPT প্লাস সাবস্ক্রিপশনের অংশ হিসাবে অর্থপূর্ণ হতে পারে।

Ideogram AI আমাদের ইমেজ জেনারেটরের টুলবক্সের মধ্যে মুকুট ধরে রেখেছে — আপাতত।

দ্বারা সম্পাদিত রায়ান ওজাওয়া.

ক্রিপ্টো খবরের শীর্ষে থাকুন, আপনার ইনবক্সে প্রতিদিনের আপডেট পান।

সময় স্ট্যাম্প:

থেকে আরো ডিক্রিপ্ট করুন