কৃত্রিম বুদ্ধিমত্তা ব্যবহার করে 3D মডেল ডিজাইন প্লাটোব্লকচেন ডেটা ইন্টেলিজেন্স তৈরি করা। উল্লম্ব অনুসন্ধান. আ.

3D মডেল ডিজাইন তৈরি করতে কৃত্রিম বুদ্ধিমত্তা ব্যবহার করে

অনেক ডিজিটাল শিল্পী, স্থপতি, প্রকৌশলী এবং গেম ডেভেলপাররা আজ 3D মডেলের উপর নির্ভর করে। যাইহোক, এই ডিজিটাল বস্তুগুলি তৈরি করা প্রায়শই একটি সময়সাপেক্ষ, জড়িত প্রক্রিয়া। নতুন কৃত্রিম বুদ্ধিমত্তা (AI) মডেল একটি সমাধান প্রদান করতে পারে.

AI-উত্পাদিত শিল্প ইদানীং অনেক কুখ্যাতি অর্জন করেছে, যদিও বেশিরভাগই 2D চিত্রের আকারে। এখন, বেশ কয়েকটি কোম্পানি মেশিন লার্নিং সফ্টওয়্যার ঘোষণা করেছে যা আরও এক ধাপ এগিয়ে যেতে পারে, রেফারেন্স টেক্সট বা ছবিকে 3D ডিজাইনে পরিণত করতে পারে।

জেনারেটিভ এআই টুডে

2022 সালের সেপ্টেম্বরে, Google একটি টেক্সট-টু-3ডি মডেল উন্মোচন করেছে ড্রিমফিউশন বলা হয়। এই অ্যালগরিদমটি 2021 সালে প্রকাশিত ড্রিম ফিল্ডস নামক আগের একটির উপর তৈরি করা হয়েছে, যেখানে গবেষকরা পাঠ্য লেবেল সহ 3D মডেলের একটি লাইব্রেরিতে প্রশিক্ষণ নিয়েছেন। ড্রিমফিউশন, যাইহোক, আপনার অনুরোধগুলি বোঝার জন্য বিদ্যমান 3D মডেলের প্রয়োজন নেই, এটিকে অনেক বেশি ব্যবহারিক করে তোলে।

দুই মাস পরে, গ্রাফিক্স কার্ড জায়ান্ট এনভিডিয়া একটি অনুরূপ মডেল প্রকাশ করেছে। তাদের সফ্টওয়্যার, ডাব ম্যাজিক 3ডি, বাইরের দৃষ্টিকোণ থেকে প্রায় অভিন্ন। আপনি যে 3D মডেল চান তার বিবরণ টাইপ করুন এবং অ্যালগরিদম একটি রেন্ডার করবে। যাইহোক, এনভিডিয়ার সমাধান দ্বিগুণ দ্রুত বলে দাবি করে।

তৃতীয় প্রধান 3D জেনারেটিভ AI যা আপনি আজ পাবেন তা OpenAI থেকে এসেছে, ChatGPT এবং Dall-E এর নির্মাতা। এই মডেল, পয়েন্ট-ই, টেক্সট থেকে 3D রেন্ডারিংও তৈরি করে কিন্তু যতটা কম তা করতে পারে এক থেকে দুই মিনিট একটি একক GPU-তে।

"পয়েন্ট-ই একটি জিপিইউতে এক থেকে দুই মিনিটের মধ্যে একটি পাঠ্য থেকে 3D রেন্ডারিং তৈরি করে।" 

কিভাবে 3D জেনারেটিভ মডেল কাজ করে

যদিও তিনটি বড় 3D মডেল-উৎপাদনকারী AI সমাধানগুলির আজ অনন্য সুবিধা এবং নির্দিষ্ট পদ্ধতি রয়েছে, তারা একই সাধারণ প্রক্রিয়া অনুসরণ করে। এই অ্যালগরিদমগুলি কীভাবে কাজ করে তা এখানে একটি ঘনিষ্ঠভাবে দেখুন।

রেফারেন্সের উপর AI প্রশিক্ষণ

ড্রিম ফিল্ডের মতো এই ধরনের AI-র প্রাথমিক পন্থাগুলি তাদের 3D মডেল এবং তাদের পাঠ্য লেবেলগুলিতে প্রশিক্ষণ দিয়েছিল। যাইহোক, এটি তাদের পরিধিকে সীমিত করে, অনেক প্রশিক্ষণের তথ্য দেয় না। এই কারণেই নতুন মডেলগুলি পরিবর্তে লেবেলযুক্ত 3D চিত্রগুলি থেকে 2D মডেল তৈরি করতে শেখে৷

আজকের 3D মডেল-উৎপাদনকারী AI টেক্সট-টু-ইমেজ অ্যালগরিদম হিসাবে শুরু হয়। ফলস্বরূপ, প্রশিক্ষণের প্রথম পর্যায়ে এটিকে 2D চিত্র লেবেল করা হয়, যেমন একটি কুকুরের ছবি সহ পাঠ্য "কুকুর"। ইমেজনেট একা হোস্টিং সহ এই ডেটা অনেক বেশি অ্যাক্সেসযোগ্য অধিক 14 মিলিয়ন লেবেলযুক্ত ছবি, তাই এটি AI প্রশিক্ষণের একটি ভাল উপায়।

অনেক আগেই, আপনার এমন একটি মডেল থাকা উচিত যা পাঠ্য বিবরণের সাথে মোটামুটি নির্ভুলভাবে 2D চিত্রগুলিকে সংযুক্ত করতে পারে। তারপরে আপনি সেগুলিকে 3D রেন্ডারিংয়ে পরিণত করার জন্য এটি শেখানোর দিকে এগিয়ে যেতে পারেন।

"3D মডেল-উৎপাদনকারী AI টেক্সট-টু-ইমেজ অ্যালগরিদম হিসাবে শুরু হয়।" 

ক্ষেপক

AI দিয়ে 3D মডেল তৈরির পরবর্তী ধাপ হল একটি ইন্টারপোলেশন। এটি একটি 2D সংস্করণ তৈরি করতে বিভিন্ন কোণ থেকে একই বিষয়ের একাধিক 3D চিত্রকে একত্রিত করার প্রক্রিয়া।

অন্তর্নিহিত প্রযুক্তি যা এই প্রক্রিয়াটিকে সক্ষম করে তা হল একটি নিউরাল রেডিয়েন্স ফিল্ড (NeRF)। NeRF হল নিউরাল নেটওয়ার্ক যা একটি বস্তুর একাধিক দৃশ্য দেখে এবং নির্ধারণ করে যে প্রতিটি দেখার কোণ স্থানটিতে কোথায় বিদ্যমান। তারপরে তারা সেগুলিকে একত্রিত করতে পারে, একটি সমন্বিত 3D মডেল তৈরি করতে বিভিন্ন দৃষ্টিভঙ্গি ওভারল্যাপ করার জায়গাগুলিকে মসৃণ করে।

ঐতিহ্যগতভাবে, NeRF একাধিক কোণ থেকে একটি বস্তুর ফটো ব্যবহার করে কাজ করে। একটি টেক্সট-টু-3ডি মডেলে, তবে, তারা তাদের একত্রিত করার আগে বিভিন্ন কোণ থেকে তাদের নিজস্ব 2D ছবি তৈরি করে। আপনি আশা করতে পারেন, এটি একটি অসাধারণ জটিল প্রক্রিয়া, কিন্তু সাম্প্রতিক অগ্রগতি এটিকে অনেক দ্রুত করে তুলেছে।

3D মডেল অপ্টিমাইজ করা

আপনি এই NeRFগুলির মধ্যে একটির মাধ্যমে একটি পাস থেকে যে পণ্যটি পাবেন তা সম্ভবত কম-রেজোলিউশনের হবে এবং এতে ত্রুটি থাকতে পারে। ফলস্বরূপ, ইন্টারপোলেশন প্রক্রিয়ার পরে যে কোনও 3D মডেলগুলি পরিষ্কার করা এবং অপ্টিমাইজ করা গুরুত্বপূর্ণ।

আজকের কিছু এআই সমাধান, যেমন গুগলের ড্রিমফিউশন, গোলমাল অপসারণ করতে এবং রেজোলিউশন উন্নত করতে বিভিন্ন ইন্টারপোলেশন প্রক্রিয়ার মাধ্যমে রেন্ডারিং পাস করবে। Nvidia এর Magic3D ব্যবহার করে একটি দ্বিতীয় প্রসারিত মডেল যা শব্দ কমায় এবং এর রেজোলিউশন বাড়াতে মূল 2D অনুযায়ী এটিকে পরিমার্জিত করে।

এমনকি এই অপ্টিমাইজেশনের পরেও, আপনাকে মডেলগুলি পরিষ্কার করতে হতে পারে। এই কারণেই এই সমাধানগুলি এগুলিকে একটি সামঞ্জস্যযোগ্য ফাইল হিসাবে উপস্থাপন করে যা আপনি তাদের রেজোলিউশন, আকৃতি, রঙ, আলো এবং অন্যান্য বিষয়গুলি পরিবর্তন করতে সম্পাদনা করতে পারেন৷

সীমাবদ্ধতা এবং সম্ভাবনা

হোম অটোমেশন সিস্টেম যেমন নিরাপত্তাকে আরও সুবিধাজনক এবং অ্যাক্সেসযোগ্য করে তোলে, তেমনই স্বয়ংক্রিয় 3D ইমেজ জেনারেশন অনেক কর্মপ্রবাহকে স্ট্রিমলাইন করতে পারে। শিল্পীরা গেম বা বিকাশ করতে পারে অনেক দ্রুত ডিজিটাল দৃশ্য তৈরি করুন যখন সিনেমার কথা আসে, কারণ তারা মডেল তৈরিতে ততটা সময় ব্যয় করবে না। স্থপতিরা কম সময়ে 3D ব্লুপ্রিন্ট তৈরি করার কারণে নির্মাণের সময়সীমাও ছোট হতে পারে।

যাইহোক, এই অ্যালগরিদমগুলি এখনও কিছু উদ্বেগ বহন করে। সামগ্রিকভাবে এআই-উত্পাদিত শিল্প আগুনের মুখে পড়েছে কারণ কিছু শিল্পীর কাজ তাদের অনুমতি ছাড়াই প্রশিক্ষণ ডেটাসেটে উপস্থিত হয়েছে, যা কপিরাইট এবং নৈতিক জটিলতার দরজা খুলে দিয়েছে। অন্যরা ভয় পায় যে এই সরঞ্জামগুলি মানব শিল্পীদের কর্মসংস্থান এবং অর্থ প্রদানের হুমকি দিতে পারে।

AI শিল্প বৃদ্ধির সাথে সাথে যে সংস্থাগুলি এটি তৈরি করে এবং ব্যবহার করে তাদের এই জটিলতাগুলি বিবেচনা করতে হবে। চিন্তাশীল, মানব-কেন্দ্রিক পদ্ধতির সাথে, যদিও, এই মডেলগুলি শিল্পীদের কাজ করতে সাহায্য করার জন্য বিপ্লবী হাতিয়ার হতে পারে, তাদের প্রতিস্থাপন নয়।

"স্বয়ংক্রিয় 3D ইমেজ জেনারেশন অনেক কর্মপ্রবাহকে প্রবাহিত করতে পারে।" 

কৃত্রিম বুদ্ধিমত্তা 3D রেন্ডারিংকে বিপ্লব করতে পারে

AI অপেক্ষাকৃত অল্প সময়ের মধ্যে 2D ইমেজ তৈরি করা থেকে 3D মডেল রেন্ডার করার দিকে চলে গেছে। এই পদক্ষেপটি সম্ভাবনার একটি চিত্তাকর্ষক পরিসরের দরজা খুলে দেয় যতক্ষণ না ডেটা বিজ্ঞানী এবং শেষ ব্যবহারকারীরা প্রযুক্তির সাথে সাবধানতার সাথে যোগাযোগ করেন।

এখনও প্রাথমিক পর্যায়ে থাকা অবস্থায়, AI 3D মডেল জেনারেশন ডিজিটাল আর্ট এবং ডিজাইনে বিপ্লব ঘটাতে পারে। স্থাপত্য থেকে চলচ্চিত্র নির্মাণের শিল্পগুলি ফলস্বরূপ আরও দক্ষ হয়ে উঠতে পারে।

এছাড়াও, পড়ুন যন্ত্রগুলো মানুষের চেয়ে বেশি শৈল্পিক হয়ে উঠবে

সময় স্ট্যাম্প:

থেকে আরো এআইআইওটি প্রযুক্তি