استفاده از هوش مصنوعی برای تولید مدل های سه بعدی

استفاده از هوش مصنوعی برای تولید مدل های سه بعدی

استفاده از هوش مصنوعی برای تولید طرح‌های مدل سه‌بعدی، هوش داده پلاتوبلاکچین. جستجوی عمودی Ai.

امروزه بسیاری از هنرمندان دیجیتال، معماران، مهندسان و توسعه دهندگان بازی به مدل های سه بعدی متکی هستند. با این حال، ایجاد این اشیاء دیجیتال اغلب یک فرآیند زمان بر و درگیر است. مدل های جدید هوش مصنوعی (AI) ممکن است راه حلی ارائه دهند.

هنر تولید شده توسط هوش مصنوعی اخیراً شهرت زیادی پیدا کرده است، اگرچه بیشتر در قالب تصاویر دو بعدی است. اکنون، چندین شرکت نرم‌افزار یادگیری ماشینی را معرفی کرده‌اند که می‌تواند یک قدم فراتر رفته و متن یا تصاویر مرجع را به طرح‌های سه بعدی تبدیل کند.

هوش مصنوعی مولد امروز

در سپتامبر 2022، گوگل از مدل تبدیل متن به سه بعدی رونمایی کرد DreamFusion نام دارد. این الگوریتم مبتنی بر الگوریتم قبلی به نام Dream Fields است که در سال 2021 منتشر شد و در آن محققان بر روی کتابخانه ای از مدل های سه بعدی با برچسب های متنی آموزش دیدند. با این حال، DreamFusion برای درک درخواست های شما نیازی به مدل های سه بعدی موجود ندارد، و آن را بسیار کاربردی تر می کند.

دو ماه بعد، غول کارت گرافیک Nvidia مدل مشابهی را عرضه کرد. نرم افزار آنها که Magic3D نام دارد، از منظر بیرونی تقریباً یکسان است. شما توضیحی از مدل سه بعدی مورد نظر خود را تایپ می کنید و الگوریتم یکی را ارائه می دهد. با این حال، راه حل Nvidia ادعا می کند که دو برابر سریعتر است.

سومین هوش مصنوعی مولد سه بعدی بزرگی که امروز خواهید یافت، از OpenAI، سازندگان ChatGPT و Dall-E می آید. این مدل، Point-E، همچنین رندرهای سه بعدی را از متن ایجاد می کند، اما می تواند این کار را در کمترین زمان ممکن انجام دهد. یک تا دو دقیقه روی یک GPU واحد

"Point-E رندرهای سه بعدی از یک متن را در کمتر از یک تا دو دقیقه در یک GPU ایجاد می کند." 

مدل های مولد سه بعدی چگونه کار می کنند

در حالی که هر سه راه‌حل بزرگ هوش مصنوعی تولید کننده مدل سه‌بعدی امروزه دارای مزایای منحصربه‌فرد و رویکردهای خاص هستند، اما از روند کلی یکسانی پیروی می‌کنند. در اینجا نگاهی دقیق تر به نحوه عملکرد این الگوریتم ها داریم.

آموزش هوش مصنوعی در مورد مراجع

رویکردهای اولیه به این نوع هوش مصنوعی، مانند Dream Fields، آنها را بر روی مدل های سه بعدی و برچسب های متنی آنها آموزش می داد. با این حال، این اطلاعات آموزشی زیادی برای آنها باقی نمی گذارد و دامنه آنها را محدود می کند. به همین دلیل است که مدل‌های جدیدتر یاد می‌گیرند که مدل‌های سه‌بعدی را از تصاویر دوبعدی برچسب‌دار تولید کنند.

هوش مصنوعی تولید مدل سه بعدی امروزی به عنوان الگوریتم های متن به تصویر شروع می شود. در نتیجه، اولین مرحله در آموزش، دادن تصاویر دوبعدی با برچسب، مانند تصویر یک سگ با متن همراه آن «سگ» است. این داده ها با میزبانی ImageNet به تنهایی بسیار در دسترس هستند بیش از 14 میلیون تصاویر برچسب گذاری شده، بنابراین راه بهتری برای آموزش هوش مصنوعی است.

خیلی زود، باید مدلی داشته باشید که بتواند تصاویر دوبعدی را با توضیحات متنی نسبتاً دقیق مرتبط کند. سپس می توانید به آموزش آن بپردازید تا آن ها را به رندرهای سه بعدی تبدیل کنید.

"هوش مصنوعی تولید مدل سه بعدی به عنوان الگوریتم های متن به تصویر شروع می شود." 

درون یابی

مرحله بعدی در تولید مدل های سه بعدی با هوش مصنوعی، درون یابی است. این فرآیند ترکیب چندین تصویر دو بعدی از یک سوژه از زوایای مختلف برای تولید یک نسخه سه بعدی است.

فناوری زیربنایی که این فرآیند را فعال می‌کند، یک میدان تابشی عصبی (NeRF) است. NeRF ها شبکه های عصبی هستند که به چندین نما از یک شی نگاه می کنند و تعیین می کنند که هر زاویه دید در کجا در فضا وجود دارد. سپس می‌توانند آن‌ها را به هم بچسبانند و مناطقی را که نماهای مختلف با هم تداخل دارند صاف کنند تا یک مدل سه بعدی منسجم تولید کنند.

به طور سنتی، NeRF ها با استفاده از عکس های یک شی از زوایای مختلف کار می کنند. با این حال، در یک مدل متن به سه بعدی، آنها تصاویر دو بعدی خود را از زوایای مختلف قبل از ترکیب آنها تولید می کنند. همانطور که ممکن است انتظار داشته باشید، این یک فرآیند بسیار پیچیده است، اما پیشرفت های اخیر آن را بسیار سریعتر کرده است.

بهینه سازی مدل های سه بعدی

محصولی که با یک بار عبور از یکی از این NeRF ها دریافت می کنید احتمالاً وضوح پایینی دارد و ممکن است حاوی خطا باشد. در نتیجه، پاکسازی و بهینه سازی هر مدل سه بعدی که پس از فرآیند درونیابی بیرون می آید، مهم است.

برخی از راه حل های هوش مصنوعی امروزی، مانند DreamFusion گوگل، رندر را از طریق چندین فرآیند درون یابی برای حذف نویز و بهبود وضوح عبور می دهند. از Magic3D انویدیا استفاده می کند مدل انتشار دوم که نویز را کاهش می دهد و آن را مطابق با 2D اصلی اصلاح می کند تا وضوح آن را افزایش دهد.

حتی پس از این بهینه سازی، ممکن است مجبور شوید مدل ها را پاکسازی کنید. به همین دلیل است که این راه حل ها آنها را به عنوان یک فایل قابل تنظیم ارائه می کنند که می توانید برای تغییر وضوح، شکل، رنگ، نور و سایر عوامل آن ها را ویرایش کنید.

محدودیت ها و امکانات

همانطور که سیستم‌های اتوماسیون خانگی امنیت را راحت‌تر و در دسترس‌تر می‌کنند، خودکارسازی تولید تصاویر سه بعدی می‌تواند بسیاری از گردش‌های کاری را ساده‌تر کند. هنرمندان می توانند بازی ها یا صحنه های دیجیتال را بسیار سریعتر ایجاد کنید وقتی صحبت از فیلم می شود، زیرا آنها زمان زیادی را برای ساخت مدل صرف نمی کنند. جدول زمانی ساخت و ساز همچنین می تواند کوتاه شود زیرا معماران طرح های سه بعدی را در زمان کمتری تولید می کنند.

با این حال، این الگوریتم ها هنوز هم نگرانی هایی دارند. هنر تولید شده توسط هوش مصنوعی به عنوان یک کل مورد انتقاد قرار گرفته است زیرا آثار برخی از هنرمندان بدون اجازه آنها در مجموعه داده های آموزشی ظاهر شده است و دری را برای کپی رایت و عوارض اخلاقی باز می کند. برخی دیگر از این بیم دارند که این ابزارها ممکن است اشتغال و پرداخت برای هنرمندان انسانی را تهدید کند.

همانطور که هنر هوش مصنوعی رشد می کند، شرکت هایی که آن را می سازند و استفاده می کنند باید این عوارض را در نظر بگیرند. با این حال، با رویکردی متفکرانه و انسان محور، این مدل‌ها می‌توانند ابزارهای انقلابی برای کمک به هنرمندان باشند، نه جایگزین آن‌ها.

"تولید خودکار تصویر سه بعدی می تواند بسیاری از گردش کارها را ساده کند." 

هوش مصنوعی می تواند رندر سه بعدی را متحول کند

هوش مصنوعی از تولید تصاویر دو بعدی به رندر مدل های سه بعدی در یک دوره نسبتا کوتاه حرکت کرد. تا زمانی که دانشمندان داده و کاربران نهایی با دقت به این فناوری نزدیک شوند، این گام رو به جلو درها را به روی طیف قابل توجهی از احتمالات باز می کند.

در حالی که هنوز در مراحل اولیه خود است، تولید مدل سه بعدی هوش مصنوعی می تواند هنر و طراحی دیجیتال را متحول کند. در نتیجه صنایع از معماری گرفته تا فیلمسازی می توانند کارآمدتر شوند.

همچنین ، بخوانید آیا ماشین‌ها هنرمندانه‌تر از انسان‌ها خواهند شد؟

تمبر زمان:

بیشتر از فناوری AIIOT