কম্পিউটার গ্রাফিক্সে একটি বিপ্লব জনসাধারণের কাছে 3D বাস্তবতা ক্যাপচার নিয়ে আসছে

কম্পিউটার গ্রাফিক্সে একটি বিপ্লব জনসাধারণের কাছে 3D বাস্তবতা ক্যাপচার নিয়ে আসছে

কম্পিউটার গ্রাফিক্সে একটি বিপ্লব 3D বাস্তবতা ক্যাপচার নিয়ে আসছে প্লাটোব্লকচেন ডেটা ইন্টেলিজেন্সে। উল্লম্ব অনুসন্ধান. আ.

যুদ্ধের অস্ত্র হিসেবে সাংস্কৃতিক ঐতিহ্যের স্থান ধ্বংস করা ক সাধারণ পদ্ধতি একটি সম্প্রদায়কে তাদের স্বতন্ত্র পরিচয় থেকে বঞ্চিত করার জন্য সশস্ত্র আক্রমণকারীরা। 2022 সালের ফেব্রুয়ারিতে যখন রাশিয়ান সৈন্যরা ইউক্রেনে প্রবেশ করেছিল, তখন এটি কোনও আশ্চর্যের বিষয় ছিল না যে ইতিহাসবিদ এবং সাংস্কৃতিক ঐতিহ্য বিশেষজ্ঞরা আসন্ন ধ্বংসের জন্য প্রস্তুত ছিলেন। এ পর্যন্ত রাশিয়া-ইউক্রেন যুদ্ধে ইউনেস্কোর ড নিশ্চিত শত শত ধর্মীয় ও ঐতিহাসিক ভবন এবং কয়েক ডজন পাবলিক স্মৃতিস্তম্ভ, লাইব্রেরি এবং জাদুঘরের ক্ষতি।

যদিও নতুন প্রযুক্তি পছন্দ করে কম দামের ড্রোন, 3D প্রিন্টিং, এবং ব্যক্তিগত স্যাটেলাইট ইন্টারনেট প্রথাগত সেনাবাহিনীর কাছে অপরিচিত একটি স্বতন্ত্রভাবে 21 শতকের যুদ্ধক্ষেত্র তৈরি করা হতে পারে, প্রযুক্তির আরেকটি সেট ইউক্রেনীয় ঐতিহ্যবাহী স্থানগুলিকে রক্ষা করার জন্য প্রথম সারিতে থাকা নাগরিক আর্কিভিস্টদের জন্য নতুন সম্ভাবনা তৈরি করছে।

ব্যাকআপ ইউক্রেন, ডেনিশ ইউনেস্কো ন্যাশনাল কমিশন এবং পলিক্যামের মধ্যে একটি সহযোগিতামূলক প্রকল্প, একটি 3D তৈরির সরঞ্জাম, শুধুমাত্র একটি ফোন দিয়ে সজ্জিত যে কেউ হেরিটেজ সাইটগুলির উচ্চ-মানের, বিশদ, এবং ফটোরিয়ালিস্টিক 3D মডেলগুলি স্ক্যান করতে এবং ক্যাপচার করতে সক্ষম করে, যা শুধুমাত্র ব্যয়বহুল এবং ভারসাম্যের সাথে সম্ভব। সরঞ্জাম মাত্র কয়েক বছর আগে।

বিলাওয়াল সিধু, একজন প্রযুক্তিবিদ, দেবদূত বিনিয়োগকারী এবং 3D মানচিত্র এবং AR/VR-তে কাজ করা সাবেক Google পণ্য ব্যবস্থাপক, বিলাওয়াল সিধুর মতে, ব্যাকআপ ইউক্রেন হল অত্যাশ্চর্য গতির একটি উল্লেখযোগ্য অভিব্যক্তি যার সাথে 3D ক্যাপচার এবং গ্রাফিক্স প্রযুক্তিগুলি এগিয়ে চলেছে৷

"বাস্তবতা ক্যাপচার প্রযুক্তিগুলি গণতন্ত্রীকরণের একটি বিস্ময়কর সূচকীয় বক্ররেখায় রয়েছে," তিনি আমাকে একটি সাক্ষাত্কারে ব্যাখ্যা করেছিলেন এককতা হাব.

সিধুর মতে, 3D সম্পদ তৈরি করা সম্ভব হয়েছিল, তবে শুধুমাত্র ডিএসএলআর ক্যামেরা, লিডার স্ক্যানার এবং দামী সফ্টওয়্যার লাইসেন্সের মতো ব্যয়বহুল সরঞ্জাম দিয়ে। উদাহরণ হিসেবে তিনি এর কাজের কথা উল্লেখ করেছেন সাইআর্ক, বিশ্বজুড়ে সাংস্কৃতিক ঐতিহ্য সংরক্ষণের জন্য পেশাদার গ্রেড 3D ক্যাপচার প্রযুক্তি ব্যবহার করার লক্ষ্যে দুই দশক আগে প্রতিষ্ঠিত একটি অলাভজনক।

"কি পাগলামি, এবং কি পরিবর্তিত হয়েছে, আজ আমি আপনার পকেটে আইফোন দিয়ে যে সব করতে পারি," তিনি বলেছেন।

আমাদের আলোচনায়, সিধু তিনটি স্বতন্ত্র অথচ আন্তঃসম্পর্কিত প্রযুক্তির প্রবণতা তুলে ধরেছেন যা এই অগ্রগতিকে চালিত করছে। প্রথমত ক্যামেরা এবং সেন্সর যে ধরনের বস্তু বা স্থান ক্যাপচার করতে পারে তার খরচ কমে যায়। দ্বিতীয়টি হল নতুন কৌশলগুলির একটি ক্যাসকেড যা কৃত্রিম বুদ্ধিমত্তা ব্যবহার করে সমাপ্ত 3D সম্পদ তৈরি করে। এবং তৃতীয় হল কম্পিউটিং শক্তির বিস্তার, যা মূলত GPU দ্বারা চালিত, ভোক্তাদের কাছে ব্যাপকভাবে উপলব্ধ ডিভাইসগুলিতে গ্রাফিক্স-নিবিড় বস্তু রেন্ডার করতে সক্ষম।

লিডার স্ক্যানারগুলি সেন্সরগুলির মূল্য-কর্মক্ষমতা উন্নতির একটি উদাহরণ। স্বায়ত্তশাসিত যানবাহনের উপরে বিশাল স্পিনিং সেন্সর হিসাবে প্রথম জনপ্রিয়, এবং দাম হাজার হাজার ডলার, lidar 12 সালে iPhone 2020 Pro এবং Pro Max-এ তার ভোক্তা-প্রযুক্তিগত আত্মপ্রকাশ করেছিল। চালকবিহীন গাড়ি যেভাবে বিশ্বকে দেখে সেইভাবে একটি স্থান স্ক্যান করার ক্ষমতার মানে হল যে কেউ হঠাৎ করে দ্রুত এবং সস্তায় বিস্তারিত 3D সম্পদ তৈরি করুন। যদিও এটি এখনও শুধুমাত্র ধনী অ্যাপল গ্রাহকদের জন্য উপলব্ধ ছিল।

ইন্ডাস্ট্রির সবচেয়ে ফলপ্রসূ বাঁকগুলির মধ্যে একটি সেই বছরই ঘটেছিল যখন গুগলের গবেষকরা উপস্থাপিত নিউরাল রেডিয়েন্স ক্ষেত্র, সাধারণত NeRF হিসাবে উল্লেখ করা হয়।

এই পদ্ধতিটি মেশিন লার্নিং ব্যবহার করে 3D ছবি বা ভিডিও থেকে একটি বস্তু বা স্থানের একটি বিশ্বাসযোগ্য 2D মডেল তৈরি করুন. সিধুর মতে, নিউরাল নেটওয়ার্ক কীভাবে একটি পূর্ণ 3D দৃশ্য দেখাবে তা "হ্যালুসিনেশন" করে। এটি "ভিউ সংশ্লেষণ" এর একটি সমাধান, একটি কম্পিউটার গ্রাফিক্স চ্যালেঞ্জ যা কাউকে শুধুমাত্র কয়েকটি উৎসের ছবি থেকে যেকোন দৃষ্টিকোণ থেকে একটি স্থান দেখতে দেয়।

“সুতরাং সেই জিনিসটি বেরিয়ে এসেছে এবং সবাই বুঝতে পেরেছে যে আমরা এখন অত্যাধুনিক ভিউ সংশ্লেষণ পেয়েছি যা সমস্ত স্টাফ ফটোগ্রামমেট্রির জন্য স্বচ্ছতা, স্বচ্ছতা এবং প্রতিফলিততার মতো কঠিন সময় পার করেছে। এটা একটা পাগলামি,” তিনি যোগ করেন।

কম্পিউটার ভিশন সম্প্রদায় তাদের উত্তেজনাকে বাণিজ্যিক অ্যাপ্লিকেশনে পরিণত করেছে। গুগলে, সিধু এবং তার দল এর জন্য প্রযুক্তি ব্যবহার করে অন্বেষণ করেছে৷ নিমগ্ন দৃশ্য, Google মানচিত্রের একটি 3D সংস্করণ৷ গড় ব্যবহারকারীর জন্য, যেমন ভোক্তা-বান্ধব অ্যাপ্লিকেশনের বিস্তার লুমা এআই এবং অন্যরা মানে যে যে কেউ শুধুমাত্র একটি স্মার্টফোন ক্যামেরা সহ ফটোরিয়ালিস্টিক 3D সম্পদ তৈরি করতে পারে। উচ্চ-মানের 3D সামগ্রী তৈরি করা আর অ্যাপলের লিডার-অভিজাতদের মধ্যে সীমাবদ্ধ ছিল না।

এখন, ভিউ সংশ্লেষণ সমাধানের আরেকটি সম্ভাব্য আরও প্রতিশ্রুতিশীল পদ্ধতি হল সেই প্রারম্ভিক NeRF উত্তেজনাকে প্রতিদ্বন্দ্বিতা করে মনোযোগ দেওয়া। গাউসিয়ান স্প্ল্যাটিং একটি রেন্ডারিং কৌশল যা উপায় অনুকরণ করে ত্রিভুজ ঐতিহ্যগত 3D সম্পদের জন্য ব্যবহৃত হয়, কিন্তু ত্রিভুজের পরিবর্তে, এটি একটি গাণিতিক ফাংশনের মাধ্যমে প্রকাশ করা রঙের একটি "স্প্ল্যাট" যা গাউসিয়ান নামে পরিচিত। যেহেতু আরো গাউসিয়ানদের একত্রে স্তরিত করা হয়, একটি অত্যন্ত বিস্তারিত এবং টেক্সচারযুক্ত 3D সম্পদ দৃশ্যমান হয়৷ স্প্ল্যাটিং এর জন্য গ্রহণের গতি দেখতে অত্যাশ্চর্য৷

মাত্র কয়েক মাস হয়েছে কিন্তু গণদেবতা এক্স প্লাবিত করছে, এবং লুমা এআই এবং পলিক্যাম উভয়ই গাউসিয়ান স্প্ল্যাট তৈরি করার জন্য টুল অফার করছে। অন্যান্য বিকাশকারীরা ইতিমধ্যেই ইউনিটি এবং অবাস্তব মত ঐতিহ্যগত গেম ইঞ্জিনগুলিতে তাদের সংহত করার উপায় নিয়ে কাজ করছে। স্প্ল্যাটগুলি ঐতিহ্যগত কম্পিউটার গ্রাফিক্স শিল্প থেকেও মনোযোগ আকর্ষণ করছে কারণ তাদের রেন্ডারিং গতি NeRF-এর তুলনায় দ্রুততর, এবং 3D শিল্পীদের কাছে ইতিমধ্যে পরিচিত উপায়ে সেগুলি সম্পাদনা করা যেতে পারে। (NeRFs এটিকে অনুমতি দেয় না কারণ তারা একটি অনির্বচনীয় নিউরাল নেট দ্বারা তৈরি হয়েছে।)

গাউসিয়ান স্প্ল্যাটিং কীভাবে কাজ করে এবং কেন এটি গুঞ্জন তৈরি করছে তার একটি দুর্দান্ত ব্যাখ্যার জন্য, সিধুর এই ভিডিওটি দেখুন৷

[এম্বেড করা সামগ্রী]

বিস্তারিত নির্বিশেষে, ভোক্তাদের জন্য, আমরা এমন একটি মুহুর্তে স্থিরভাবে রয়েছি যেখানে একটি ফোন হলিউড-ক্যালিবার 3D সম্পদ তৈরি করতে পারে যা খুব বেশিদিন আগে শুধুমাত্র সুসজ্জিত উৎপাদন দলগুলিই তৈরি করতে পারে।

কিন্তু কেন 3D নির্মাণ এমনকি সব ব্যাপার?

3D বিষয়বস্তুর দিকে পরিবর্তনের প্রশংসা করার জন্য, প্রযুক্তির ল্যান্ডস্কেপ "স্পেশিয়াল কম্পিউটিং" এর ভবিষ্যতের দিকে লক্ষ্য করা উচিত। যদিও মেটাভার্সের মতো অত্যধিক ব্যবহার করা শব্দগুলি চোখের রোলগুলি আঁকতে পারে, অন্তর্নিহিত স্পিরিট হল একটি স্বীকৃতি যে 3D পরিবেশগুলি, যেমন ভিডিও গেম, ভার্চুয়াল ওয়ার্ল্ড এবং ডিজিটাল টুইনগুলিতে ব্যবহৃত হয় আমাদের ভবিষ্যতে একটি বড় ভূমিকা পালন করতে পারে৷ NeRF এবং স্প্ল্যাটিং দ্বারা উত্পাদিত 3D সম্পদগুলি ভবিষ্যতে আমরা যে বিষয়বস্তুর সাথে জড়িত থাকব তাতে পরিণত হওয়ার জন্য প্রস্তুত৷

এই প্রেক্ষাপটের মধ্যে, একটি বড় মাপের উচ্চাকাঙ্ক্ষা একটি বাস্তব সময়ের জন্য আশা বিশ্বের 3D মানচিত্র. স্থির 3D মানচিত্র তৈরির জন্য সরঞ্জামগুলি উপলব্ধ থাকলেও, একটি চির-পরিবর্তনশীল বিশ্বের সাথে সেই মানচিত্রগুলিকে বর্তমান রাখার উপায়গুলি খুঁজে বের করাই চ্যালেঞ্জ।

“এখানে বিশ্বের মডেলের বিল্ডিং আছে, এবং তারপর বিশ্বের সেই মডেল বজায় রাখা আছে। এই পদ্ধতিগুলির সাথে আমরা কথা বলছি, আমি মনে করি ক্রাউডসোর্সিংয়ের মাধ্যমে 'মডেল বজায় রাখার' সমস্যা সমাধান করার প্রযুক্তি আমাদের কাছে থাকতে পারে,” বলেছেন সিধু।

Google-এর ইমারসিভ ভিউ-এর মতো প্রকল্পগুলি এর ভোক্তাদের প্রভাবের ভাল প্রাথমিক উদাহরণ। শেষ পর্যন্ত কখন এটি সম্ভব হতে পারে তা তিনি অনুমান করতে না পারলেও, সিধু সম্মত হন যে কোনও সময়ে, এমন প্রযুক্তি বিদ্যমান থাকবে যা ভিআর-এর ব্যবহারকারীকে সেখানে যা ঘটছে তার একটি বাস্তব-সময়, নিমগ্ন অভিজ্ঞতা সহ পৃথিবীর যে কোনও জায়গায় ঘুরে বেড়াতে দেবে। . এই ধরনের প্রযুক্তিও প্রচেষ্টার মধ্যে ছড়িয়ে পড়বে অবতার-ভিত্তিক "টেলিপোর্টেশন,” দূরবর্তী মিটিং, এবং অন্যান্য সামাজিক জমায়েত।

উত্তেজিত হওয়ার আরেকটি কারণ, সিধু বলেছেন, 3D মেমরি ক্যাপচার। উদাহরণস্বরূপ, অ্যাপল খুব বেশি ঝুঁকে পড়েছে 3D ফটো এবং ভিডিও তাদের ভিশন প্রো মিশ্র বাস্তবতা হেডসেটের জন্য। উদাহরণ হিসেবে, সিধু আমাকে বলেছিলেন যে তিনি সম্প্রতি তার বাবা-মায়ের বাড়ির বাইরে যাওয়ার আগে একটি উচ্চ মানের প্রতিরূপ তৈরি করেছেন। তিনি তখন তাদের ভার্চুয়াল বাস্তবতা ব্যবহার করে এর ভিতরে হাঁটার অভিজ্ঞতা দিতে পারেন।

“সেখানে ফিরে আসার সেই ভিসারাল অনুভূতি থাকাটা খুব শক্তিশালী। এই কারণেই আমি অ্যাপলের প্রতি খুব উৎসাহী, কারণ তারা যদি এই 3D মিডিয়া ফর্ম্যাটটি পেরেক দেয়, সেখানেই জিনিসগুলি নিয়মিত লোকেদের জন্য উত্তেজনাপূর্ণ হতে পারে।"

গুহা শিল্প থেকে তৈলচিত্র পর্যন্ত, আমাদের সংবেদনশীল অভিজ্ঞতার দিকগুলিকে সংরক্ষণ করার প্রেরণা গভীরভাবে মানবিক। ফটোগ্রাফি যেমন সংরক্ষণের একটি উপায় হিসাবে স্থির জীবনকে পেশীবদ্ধ করে, ঠিক তেমনি 3D তৈরির সরঞ্জামগুলি 2D চিত্র এবং ভিডিওর সাথে আমাদের দীর্ঘস্থায়ী ব্যাপারটিকে স্থানচ্যুত করতে প্রস্তুত বলে মনে হয়।

তবুও যেমন ফটোগ্রাফি শুধুমাত্র সময়ের একটি মুহুর্তের একটি ভগ্নাংশ ক্যাপচার করার আশা করতে পারে, 3D মডেলগুলি ভৌত ​​জগতের সাথে আমাদের সম্পর্ককে সম্পূর্ণরূপে প্রতিস্থাপন করতে পারে না। তারপরও, যারা ইউক্রেনে যুদ্ধের ভয়াবহতার সম্মুখীন হচ্ছেন, তাদের জন্য সম্ভবত এগুলি স্বাগত উন্নয়ন যা কখনোই সত্যিকার অর্থে প্রতিস্থাপন করা যায় না তা সংরক্ষণের আরও নিমগ্ন উপায় প্রদান করে।

চিত্র ক্রেডিট: উইম টরবেইনস / Unsplash 

সময় স্ট্যাম্প:

থেকে আরো এককতা হাব