AI-চালিত সৃজনশীলতা অত্যধিক ক্ষমতাসম্পন্ন পিসিগুলিকে কিছু করার জন্য উপযুক্ত কিছু দেয়, শেষ পর্যন্ত PlatoBlockchain ডেটা ইন্টেলিজেন্স। উল্লম্ব অনুসন্ধান. আ.

এআই-চালিত সৃজনশীলতা অত্যধিক ক্ষমতাপ্রাপ্ত পিসিগুলিকে শেষ পর্যন্ত কিছু করার জন্য উপযুক্ত কিছু দেয়

স্তম্ভ সম্প্রতি অবধি, ব্যক্তিগত কম্পিউটার হার্ডওয়্যার সম্ভবত এটির উপর স্থাপন করতে পারে এমন কোনও চাহিদা সফ্টওয়্যার অতিক্রম করেছে বলে মনে হচ্ছে। এমনকি হাই-এন্ড গেমস - ঐতিহ্যগতভাবে ব্যবহারকারীর কর্মক্ষমতার চাহিদার শীর্ষস্থানীয় প্রান্ত - সবেমাত্র ব্যাপকভাবে অপ্রতিরোধ্য, টপ-এন্ড সিলিকন উপলব্ধ। তারপর এআই আর্ট আসে।

অ্যাপলের M1 আল্ট্রা মাইক্রোপ্রসেসর 100 বিলিয়নের উত্তরে একটি ট্রানজিস্টর খেলা করে। এনভিডিয়া সবেমাত্র এটি প্রকাশ করেছে ফ্ল্যাগশিপ RTX 4090 GPU, 76 বিলিয়ন ট্রানজিস্টর সহ - পূর্ববর্তী প্রজন্মের তুলনায় তিনগুণ বৃদ্ধি, সর্বশেষ প্রক্রিয়া নোডের পণ্য, এবং শক্তি খরচের প্রতি শয়তান-মে-যত্ন মনোভাব। প্রায় 500W TDP? এটি ক্র্যাঙ্ক করুন এবং এই শীতে আপনার ঘর গরম করুন।

কিন্তু কি উদ্দেশ্যে? একটি 300fps Fortnite যুদ্ধ রয়্যাল? এপ্রিলে আমি লিখেছিলাম: "এই দানবদের নিয়ন্ত্রণ করা, প্রশিক্ষিত করা এবং কাজ করা দরকার।" প্রযুক্তি একটি শূন্যতাকে ঘৃণা করে - চার দশকের ক্ষেত্র আমাকে তা শিখিয়েছে। যেখানে সক্ষমতা আছে, সেখানে কিছু না কিছু কাজে লাগবে।

যে অন্য জুতা ড্রপ সেপ্টেম্বরের শুরুতে, যখন HuggingFace AI – একটি প্রাইভেট ফার্ম সফটওয়্যার টুল তৈরি করে যা অত্যাধুনিক কৃত্রিম বুদ্ধিমত্তার কৌশল ব্যবহার করে – প্রকাশ করেছে স্থিতিশীল বিস্তার.

সিস্টেমের অনুরূপ যেমন DALL•E এবং মিডজার্নি, স্থিতিশীল ডিফিউশন হুভার আপ করে তারপর বিলিয়ন ইমেজকে প্রতীকীভাবে ওজনযুক্ত টোকেনে পরিণত করে যা যথাযথভাবে তৈরি করা টেক্সট প্রম্পট দিয়ে দৃশ্যমানতায় ফিরিয়ে আনা যায়। পুরো জিনিসটি জাদুবিদ্যার এই দিকে বসে - তবুও এটি অসাধারণভাবে কাজ করে।

DALL•E বা মিডজার্নির বিপরীতে, স্টেবল ডিফিউশন উভয়ই সম্পূর্ণ স্বয়ংসম্পূর্ণ – যে কোনও শক্তিশালী-পর্যাপ্ত মেশিনে চালাতে সক্ষম – এবং বিশুদ্ধ FOSS। এর অর্থ হল যদিও প্রাথমিক প্রকাশের জন্য Nvidia-এর কিছু সর্বোচ্চ-শেষের GPU-র প্রয়োজন ছিল, এক সপ্তাহের মধ্যে প্রকল্পের অবদানকারীদের তার কোড ফিরে ছিনতাই এবং এর হার্ডওয়্যার প্রয়োজনীয়তা হ্রাস করেছে। বর্তমান সংস্করণটি ভার্চুয়াল রিয়েলিটির নতুন পুনর্জন্ম জগত অন্বেষণ করার জন্য ছয় বছর আগে কেনা গরুর পিসিতে বেশ স্বাচ্ছন্দ্যে চলতে পারে – সেইসাথে যেকোনও M1-ভিত্তিক ম্যাকে। অনেক গেমিং পিসি এবং ল্যাপটপ প্রজেক্ট-ভিত্তিক সৃজনশীল প্রয়োজন - বা শুধুমাত্র মজার জন্য এটি ব্যবহার করার জন্য যথেষ্ট ভালভাবে স্থিতিশীল ডিফিউশন চালাতে পারে।

তারপর একদল গবেষক একটি কাগজ প্রকাশিত তারা ড্রিমফিউশন নামক কিছুতে – টেক্সট প্রম্পট থেকে সম্পূর্ণরূপে উপলব্ধি করা 3D মডেলের একটি অসীম সিরিজকে জাদু করতে সক্ষম। টাইপ করুন pineapple, এবং কম্পিউটারের একটি চিন্তা থাকবে, তারপর সেই মডেলটি কেমন হওয়া উচিত তার সেরা অনুমান তৈরি করবে৷ যদিও সেই গোষ্ঠীটি এখনও তার কোড প্রকাশ করেনি, কাগজটি একটি উচ্চাভিলাষী কোডারকে স্থিতিশীল ডিফিউশন কোডবেস তৈরি করার জন্য মানিয়ে নেওয়ার জন্য যথেষ্ট একটি ব্লুপ্রিন্ট সরবরাহ করেছিল। স্থিতিশীল ড্রিমফিউশন - যা আবার, মোটামুটি শক্তিশালী হার্ডওয়্যার প্রয়োজন।

টেক্সট প্রম্পট থেকে স্টেবল ডিফিউশন দ্বারা উত্পাদিত একটি চিত্র

ছাড়িয়ে যাবেন না, তেল আবিব ইউনিভার্সিটির আরেকটি গ্রুপ বিশ্বকে চমকে দিয়েছে হিউম্যান মোশন ডিফিউশন মডেল. এই গবেষণাপত্রটি দেখিয়েছে যে কীভাবে গবেষকরা প্রম্পটকে রূপান্তর করতে ডিফিউশন-ভিত্তিক এআই কৌশলগুলি ব্যবহার করেছিলেন যেমন "the person walks forward two steps and does a cartwheelএকটি মানবিক অ্যানিমেশনে। এক সপ্তাহ পর গবেষকরা খোদ ড তাদের কোড প্রকাশ করেছে FOSS হিসাবে।

আমরা এখনও AI ক্ষমতার এই সূচকীয় বৃদ্ধির একটু আগেভাগেই জানতে পেরেছি যে এর কোনটি কোথায় নিয়ে যাবে। ইতিমধ্যে, ক্যানভা এবং মাইক্রোসফ্ট উভয়ই তাদের সৃজনশীল সরঞ্জামগুলির মধ্যে প্রম্পট-ভিত্তিক ইমেজ জেনারেটরগুলিকে একীভূত করেছে। মেটা, গুগল, এবং অন্যরা মালিকানাধীন প্রম্পট-টু-ভিডিও জেনারেটর প্রদর্শন করেছে। বর্তমান প্রবণতায়, আমাদের সাথে খেলার জন্য FOSS সমতুল্য না হওয়া পর্যন্ত আমাদের বেশিক্ষণ অপেক্ষা করতে হবে না।

ভিজ্যুয়াল আর্টগুলিতে শক্তিশালী নতুন সরঞ্জাম রয়েছে যা Google বা OpenAI-এর মতো জায়ান্টদের একচেটিয়া ডোমেন নয় - পরবর্তী একটি ফার্ম যেটি AI এর ভিত্তিতে গণতান্ত্রিক করার প্রতিশ্রুতি দিয়েছিল, কিন্তু বিকৃতভাবে মনে হচ্ছে মাইক্রোসফ্টের সাথে তার নিজস্ব মালিকানা সাম্রাজ্য তৈরির দিকে মনোনিবেশ করেছে। অনানুষ্ঠানিক মালিক।

জন্য আমার প্রথম কলাম এক নিবন্ধনকর্মী ইশারা করলাম সমাপ্তি পিসির জন্য অফুরন্ত আপগ্রেড চক্রের। আর কোন ট্রেডমিল নেই: যথেষ্ট ভালো, তারা যখন ফুরিয়ে যাবে তখনই প্রতিস্থাপন করা হবে। মিটমাট আপগ্রেড একটি ঝাঁকুনি বাদ দিয়ে মহামারী-চালিত ভিডিও কনফারেন্সিং যে ভবিষ্যদ্বাণী সঠিক প্রমাণিত হয়েছে.

কিন্তু পার্সোনাল কম্পিউটার তার চামড়া ফেলে দিয়েছে, একটি সৃজনশীল সুপার কম্পিউটার হিসাবে তার চটকদার নতুন রূপ প্রকাশ করেছে: ডিফিউশন-চালিত, এবং সৃজনশীলভাবে এমনভাবে সক্ষম যেভাবে পুরানো পিসি কাছে যেতে শুরু করতে পারেনি। অন্য একটি নতুন স্টাইলাস বা পেইন্টব্রাশ দেওয়ার পরিবর্তে, এই গুণগতভাবে ভিন্ন সরঞ্জামগুলি একটি নতুন ধরনের সৃজনশীল অংশীদারিত্ব তৈরি করে৷

জুন মাসে আমি একটি হাই-স্পেক পিসি ল্যাপটপ কিনেছিলাম - এবং অবিলম্বে এটির জন্য দোষী বোধ করি, ভেবেছিলাম যে আমি এটিকে কখনই কাজে লাগাব না। আজ, আমি এমন একটি মেশিনের সম্পূর্ণ ব্যবহার করি যা কোটিডিয়ান এবং অবিশ্বাস্য উভয়ই করতে পারে। পূর্ববর্তী দৃষ্টিতে, সেই ক্রয়টি একটি চতুর দর কষাকষির মতো দেখায় - একটি সত্যিকারের নবজাগরণের অগ্রদূত - পিসি, পুনর্জন্ম, কাজ করে। ®

সময় স্ট্যাম্প:

থেকে আরো নিবন্ধনকর্মী