কিভাবে জেনারেটিভ আইএ বর্তমান দশকে সবকিছুকে ব্যাহত করবে

অনেকেই অবাক হবেন

স্ট্যাবল ডিফিউশন সহ লেখকের ছবি

In সাম্প্রতিক মাসগুলোতে, AI সিস্টেম যেমন Midjourney, DALL-E, Stable Diffusion, LaMDA এবং PaLM ডোমেনে বড় অগ্রগতি করেছে দৃশ্যত ইমেজ এবং টেক্সট জেনারেশনের মত বৈচিত্র্যময়। এই সিস্টেমগুলির ক্ষমতাগুলি চিত্তাকর্ষক: এগুলি অত্যন্ত ইঙ্গিতপূর্ণ চিত্র তৈরি করে, বিজ্ঞাপনের জন্য কার্যকর বিক্রয় অনুলিপি তৈরি করে এবং আরও অনেক কিছু - সবই কেবলমাত্র "প্রম্পট" থেকে যা ব্যবহারকারী কী পেতে চায় তা বর্ণনা করে।

এই সব করা হয় Generative AI দিয়ে।

"জেনারেটিভ এআই" দ্বারা চালিত সিস্টেমগুলিকে বোঝায় গভীর নিউরাল নেটওয়ার্ক যে বাস্তবায়ন বড় ভাষার মডেল (LLM) করার জন্য সৃষ্টি কিছু ধরণের বিষয়বস্তু। এখানে আমি বলি "তৈরি করুন", যার অর্থ এটি ইতিমধ্যে বিদ্যমান কিছুর অনুলিপি নয়, দার্শনিক অর্থে নয় (যাইহোক একটি "সৃষ্টি" কী?)।

এই সাহসী নতুন বিশ্বের মত বড় নতুন কোম্পানির উদয় হচ্ছে জ্যাসপার, যা বিজ্ঞাপনের জন্য বিক্রি কপি এবং ছবি উভয় প্রজন্মের অফার করে: Jasper এখন এক বিলিয়ন ডলারেরও বেশি মূল্যায়ন করেছে, রাতারাতি ইউনিকর্নে পরিণত হয়েছে।

প্রথম জেনারেটিভ এআই প্ল্যাটফর্ম যা সত্যিই একটি ডেন্ট তৈরি করে তা ছিল GPT-3 - মাত্র কয়েক বছর আগে প্রকাশিত হয়েছিল! এর পরে, মাঠের বেশ কিছু খেলোয়াড়ের (ওপেনএআই, গুগল, স্টেবলডিফিউশন, গুগল, ডিপমাইন্ড এবং অন্যান্য) ধারাবাহিকভাবে রিলিজ হয়েছে এমন গতিতে, এতটাই যে বর্তমান থাকা কঠিন।

কিন্তু আমাদের প্রম্পট থেকে ইমেজ তৈরি করার জন্য মিডজার্নির সাথে কিছু সময় কাটানো কতটা মজাদার এবং চমত্কার, তার বাইরেও অনেক প্রযুক্তি উত্সাহী এই জেনারেটিভ IA তরঙ্গ বোঝার জন্য লড়াই করে।

জেনারেটিভ আইএ কি একটি কঠিন প্রবণতা, নাকি এটি কেবল একটি ফ্যাড?

আমি যাবো"কঠিন প্রবণতাকারণ এটি এই দশকের সুযোগে হাজার হাজার পেশাদার এবং অবসর কার্যক্রমকে রূপান্তরিত করবে। আমাকে একটি উদাহরণ দিয়ে শুরু করা যাক.

আমি একজন বিশাল টেনিস ভক্ত (অন্তত টিভি অর্থে)। কিন্তু লাইভ টেনিস ম্যাচগুলি শেষ হতে কয়েক ঘন্টা সময় নেয় এবং আমার অন্যান্য ক্রিয়াকলাপ এবং আগ্রহ রয়েছে, তাই আমি সাধারণত রিপ্লে দেখতে অবলম্বন করি বা শুধুমাত্র একটি ম্যাচ থেকে সবচেয়ে বিনোদনমূলক 4 মিনিট বা তার বেশি ভিডিও হাইলাইট করি।

কিন্তু যদি 4 মিনিটের ভিডিওর পরিবর্তে আমি 10 বা 15 মিনিটের একটি ভিডিও চাই? নাকি আমি টাই ব্রেকের প্রতিটি পয়েন্ট অন্তর্ভুক্ত করতে চাই? আমি বর্তমানে ভাগ্যের বাইরে আছি।

এখন আপনার জেনারেটিভ-আইএ টুপিটি কাজে লাগান: একটি জেনারেটিভ আইএ স্পোর্টস ভিডিও জেনারেটর একটি ভিডিও তৈরি করবে শুধু তোমার জন্য স্পেসিফিকেশন অনুযায়ী আপনি অনানুষ্ঠানিকভাবে নিম্নলিখিত মত একটি টেক্সট প্রম্পটে রাখেন:

"প্যারিস বার্সি 15-এ রাফা নাদাল বনাম টমি পল ম্যাচের সবচেয়ে বিনোদনমূলক পয়েন্ট সহ প্রায় 2022 মিনিটের ভিডিও, সম্পূর্ণ টাইব্রেক সহ, যদি থাকে তবে প্রতিটি ব্রেকপয়েন্ট রূপান্তরিত"

এটাই. আপনি আপনার ব্যক্তিগতকৃত ভিডিওর সাথে একটি লিঙ্ক পাবেন, যা বিশ্বের অন্য কারো দ্বারা দেখা ভিডিও থেকে আলাদা৷ এবং এই ভিডিও পরিষেবাটি অর্থনৈতিকভাবে DALL-E এবং মিডজার্নির মতোই সম্ভব হবে৷

গবেষণা উদ্ভাবন থেকে ভিন্ন। প্রথমটি প্রকাশিত মূল ফলাফলের সাথে সম্পর্কিত, এবং পরবর্তীটির সাথে সেই ফলাফলগুলি থেকে কীভাবে একটি ব্যবসা তৈরি করা যায় তা খুঁজে বের করার সাথে আরও কিছু করার আছে: উদ্ভাবন মৌলিকতাকে গুরুত্ব দেয় না বরং বৃদ্ধি, প্রতিরক্ষাযোগ্যতা, বিনিয়োগের রিটার্ন ইত্যাদি সম্পর্কে।

প্রায়শই জিনিসগুলি বিভ্রান্তিকর হয়ে ওঠে কারণ Google এর মতো কোম্পানিগুলি দ্বারা গবেষণা করা হয়, যা নীতিগতভাবে লাভ করার জন্য রয়েছে - কিন্তু তারা বুঝতে পারে যে তাদের ব্যবসা উচ্চ প্রযুক্তির, এবং গবেষণা ছাড়া প্রযুক্তি উচ্চ নয়. তাই তারা গবেষণার অর্থায়নে জড়িত হয়, সেইসাথে একাডেমিয়ার কাছাকাছি - তাদের অনেক শীর্ষ গবেষককে একাডেমিয়া থেকে নিয়োগ করা হয়েছিল। আমি নিজে একজন গবেষক হিসেবে, আমি কয়েক বছর আগে মাউন্টেন ভিউতে তাদের সদর দফতরে একটি ফ্যাকাল্টি সামিটে আমন্ত্রণ পেয়েছিলাম, এবং তারা আমাকে ফোর সিজন হোটেলের একটি স্যুটে রেখেছিল – যা-ই হোক না কেন একাডেমিক সম্প্রদায়ের উপর ভালো প্রভাব ফেলতে!

তবে গবেষণা এবং উদ্ভাবনের মধ্যে একটি পরিষ্কার কাটছাঁট করা কঠিন – এমনকি কৃত্রিমও হতে পারে, তবুও পার্থক্য এখানে অত্যন্ত গুরুত্বপূর্ণ কারণ, জেনারেটিভ এআই-এর ক্ষেত্রে, দুটি ভিন্ন অভিনেতাদের দ্বারা বিকশিত হবে, এবং তারা যুক্ত হবে সফ্টওয়্যার স্ট্যাকের দুটি ভিন্ন স্তর সহ J. Currier দ্বারা নির্দেশিত:

  1. নীচের সফ্টওয়্যার স্তর হল গভীর শিক্ষার মডেল, লার্জ ল্যাঙ্গুয়েজ মডেল (LLM) বা সমতুল্য অভ্যন্তরীণ উপস্থাপনা বাস্তবায়নের চারপাশে নির্মিত। মডেলগুলি বেস বিল্ডিং ব্লক প্রদান করে যেখান থেকে অ্যাপ্লিকেশনগুলি তৈরি করা যেতে পারে।
  2. শীর্ষ সফ্টওয়্যার স্তর হল আবেদন একটি, যা একটি নির্দিষ্ট কাজ সম্পন্ন করার জন্য ডিপ লার্নিং মডেলের উপরে তৈরি করে, উদাহরণস্বরূপ, একটি পাঠ্য প্রম্পট থেকে একটি চিত্র আউটপুট করতে।

এই দ্বি-স্তর স্থাপত্যটি ত্বরান্বিত উদ্ভাবনের একটি নতুন যুগের ইন্ধন জোগাবে কারণ Google, OpenAI এবং অন্যান্যদের মতো অনেক বড় কোম্পানির দ্বারা একবার নীচের স্তরটি তৈরি করা হলে, ছোট কোম্পানিগুলি অ্যাপ্লিকেশন স্তর প্রদান করবে - অবশ্যই, তাদের লাভের একটি কাটা। নীচের স্তর প্রদানকারীর কাছে।

বর্তমানে, নীচের স্তরটি দ্রুত উন্নত হয়েছে - এবং প্রায়শই, এটি উপরে একটি অ্যাপ্লিকেশন সহ বিতরণ করা হয়েছে। উদাহরণস্বরূপ, LaMDA এবং PaLM বক্সের বাইরে ডায়ালগ ক্ষমতা অফার করে, যখন DALL-E এবং Midjourney প্রম্পট-টু-ইমেজ পরিষেবা অফার করে। কিন্তু শীঘ্রই, নীচের স্তরের জন্য ওপেন-সোর্স বিকল্পগুলির প্রসারণ শুধুমাত্র উপরের অ্যাপ্লিকেশন স্তরটি বিকাশ করা এবং এটিকে ইতিমধ্যে উপলব্ধ নীচের স্তরে প্লাগ করা সম্ভব করবে৷ করা থেকে সহজ বলা, অবশ্যই, কিন্তু বাস্তবতা হল যে নীচের স্তরটি উপরের স্তরের চেয়ে আরও জটিল।

আমি তর্ক করব যে জেনারেটিভ আইএ প্রায় প্রতিটি একক জ্ঞান কাজ এবং অবসর কার্যকলাপ পরিবেষ্টিত হবে কারণ এটি আগের কঠিন ক্রিয়াকলাপগুলি থেকে জটিলতা দূর করার জন্য সরঞ্জাম সরবরাহ করবে এবং কারণ এটি ব্যক্তিগতকরণের সম্পূর্ণ নতুন স্তর সরবরাহ করতে পারে যাকে আমি "উৎপাদনশীল ব্যক্তিগতকরণ" বলব।

উপরের স্পোর্টস ভিডিওর উদাহরণ থেকে আপনি "জেনারেটিভ পার্সোনালাইজেশন" কী তা দেখতে পারেন: প্রতিটি ব্যবহারকারীকে দুটি বা তিনটি বিকল্পের মধ্যে একটি নির্বাচনের পরিবর্তে একটি একেবারে নতুন এবং অনন্য হাইলাইট ভিডিও দেওয়া হয়৷

সমস্ত জেনারেটিভ আইএ অ্যাপ্লিকেশনের ক্রমবর্ধমান প্রভাব অতিরঞ্জিত করা কঠিন:

  1. DALL-E, Midjourney এবং Stable Diffusion-এর মতো টুল সহ অ-পেশাদারদের নাগালের মধ্যেই সহজ গ্রাফিক তৈরি, অন্তত এই পোস্টের জন্য হেডার ইমেজ পাওয়ার মতো সহজ উপযোগী উদ্দেশ্যে। এই বছরের আগে, আমি আমার নিজের ছবি আঁকতে পুরোপুরি অক্ষম ছিলাম, এবং ব্লগ বিশেষজ্ঞরা আপনার নিজের গল্পের জন্য গ্রাফিক ডিজাইনে সময় নষ্ট করার বিরুদ্ধে পরামর্শ দিয়েছিলেন।
  2. ফটো এডিটিং ব্যবহারকারীদের ফটোশপ বা অ্যাফিনিটি ফটোর জটিল টুলের সেটটি আয়ত্ত করার জন্য একটি কঠিন শেখার বক্ররেখা সহ্য করতে হবে না (আমি পরবর্তীটি ব্যবহার করি এবং এটি এত জটিল যে আমাকে কীভাবে সর্বাধিক সমন্বয় করতে হয় তা শিখতে YouTube টিউটোরিয়ালের সাথে পরামর্শ করতে হবে)। জেনারেটিভ এআই-এর সাথে, ব্যবহারকারীরা সফ্টওয়্যারটিকে একটি প্রদত্ত রূপান্তর করতে বলবে এবং ভয়েলা! ছবি ঠিক হয়ে যাবে। যদি Adobe তাদের টুলস দিয়ে জেনারেটিভ AI সরবরাহ করতে ব্যর্থ হয়, তাহলে নতুন স্টার্টআপগুলি তাদের অফার করার ফলে তারা ব্যাহত হবে এবং ব্লকবাস্টারের পথে যাবে।
  3. পাওয়ারপয়েন্টের মতো প্রেজেন্টেশন টুল, এখনকার মতো টেমপ্লেট দেওয়ার পরিবর্তে, রূপরেখা ধারণা থেকে সম্পূর্ণ পেশাদার-স্তরের উপস্থাপনা তৈরি করবে এবং সূক্ষ্ম-টিউন করবে। বর্তমানে, পেশাদার এবং অপেশাদার উপস্থাপনার মধ্যে পার্থক্য বিশাল -এটি আর হবে না।
  4. টেক্সট রাইটিং একটি প্রক্রিয়া হবে যা জেনারেটিভ এআই টুলস দ্বারা অত্যন্ত উন্নত। লেখার অনেক ফর্ম ইতিমধ্যেই গ্রামারলির মতো অত্যাধুনিক সরঞ্জাম থেকে সাহায্য পাচ্ছে, কিন্তু জেনারেটিভ এআই লেখকদের একটি গুণগতভাবে নতুন স্তরের সাহায্য দেবে, উদাহরণস্বরূপ, একটি ব্লগের একটি সম্পূর্ণ প্রথম সংস্করণ তৈরি করে৷ লেখা মানুষের এবং এআই টুলের মধ্যে একটি সহযোগিতামূলক প্রক্রিয়া হবে।
  5. চূড়ান্ত ব্যবহারকারীর জন্য উদ্দিষ্ট যেকোন সফ্টওয়্যার পাঠ্য বা ভয়েস প্রম্পট সহ ব্যবহার করা সহজ হতে হবে। ব্যবহারকারীর ম্যানুয়াল এবং নির্দেশমূলক ভিডিওগুলি অতীতের জিনিস হবে এবং ব্যবহারকারীরা সফ্টওয়্যার ব্যবহার করার নতুন সহজ উপায়ে অভ্যস্ত হওয়ার সাথে সাথে প্রাসঙ্গিক থাকার জন্য সবকিছুকে এটি অফার করতে হবে।
  6. ভাষা শিক্ষা প্রধানত ভয়েস সহকারীর সাহায্যে করা হবে, যা দ্বারা চালিত হবে – আপনি ঠিক অনুমান করেছেন – জেনারেটিভ এআই। ভয়েস অ্যাসিস্ট্যান্ট, যা ব্যক্তিগত ভাষার প্রশিক্ষকের মতো কাজ করবে, তাদের আশ্চর্যজনক প্রাকৃতিক ভাষা সংলাপ ক্ষমতা ব্যবহার করবে, যা Google-এর LaMDA-এর মতো সিস্টেমে প্রথম দেখা যায়, মানব ভাষা শিক্ষার মানুষকে শব্দভাণ্ডার এবং অভিব্যক্তি অর্জন করতে, উচ্চারণ উন্নত করতে, ইত্যাদির জন্য গাইড করতে। ভাষা-শিক্ষা। ভয়েস অ্যাসিস্ট্যান্ট কোনও ভবিষ্যত কল্পনা নয় -এটি এখনই অর্থনৈতিকভাবে বোঝায়।
  7. এমনকি হার্ডওয়্যার পণ্যগুলিতে (যেমন গাড়ি) জেনারেটিভ এআই ডায়ালগ-ভিত্তিক সহায়তা সিস্টেম থাকবে। আপনি কি আধুনিক গাড়িতে ডিসপ্লে সামঞ্জস্য করার মতো একটি জটিল অপারেশন করার চেষ্টা করেছেন? সহজ নয়, আমি আপনাকে বলতে পারি। জটিল ম্যানুয়ালগুলিতে খনন করার পরিবর্তে, আপনি কেবল ভয়েস সহকারীকে নির্দেশাবলী পেতে বা সরাসরি সমন্বয়গুলি করতে বলবেন।

অনেক পেশা স্বীকৃতির বাইরে রূপান্তরিত হবে। গ্রাফিক ডিজাইনাররা ইতিমধ্যে এই ব্যাঘাতের হুল অনুভব করছেন। সমস্ত পেশাগুলি অদৃশ্য হয়ে যাবে, এবং অন্যান্যগুলি তৈরি হবে। শক্তিশালী কোম্পানিগুলি দেউলিয়া হয়ে যাবে, এবং নতুনগুলি প্রভাবশালী হয়ে উঠবে, তারা জেনারেটিভ এআই দ্বারা আনা প্রযুক্তিগত ব্যাঘাতকে কতটা ভালভাবে পরিচালনা করে তার উপর নির্ভর করে।

আর এসবই হবে এই দশকের মধ্যেই।

আমি ভুল হতে পারি, কিন্তু এটা আমার কাছে মনে হয় যে পাকা প্রযুক্তিবিদদের জন্যও বর্তমান ইমেজ এবং টেক্সট জেনারেটরের বিশাল ক্ষমতার পূর্বাভাস দেওয়া কঠিন ছিল: এটি কয়েক বছর আগে স্পষ্ট ছিল না যে বিশাল মডেল এবং প্রশিক্ষণ সেটগুলি গুণগতভাবে বিভিন্ন ক্ষমতার দিকে পরিচালিত করে।

আমি এতদূর যেতে চাই যে এটি একটি ভাগ্যবান, প্রায় এলোমেলো অনুসন্ধান ছিল। কিন্তু এখন যেহেতু আমাদের কাছে জেনারেটিভ টুলস আছে, গেটগুলি উদ্ভাবনকারী সংস্থাগুলির জন্য উন্মুক্ত যেগুলি দ্রুত গতিতে অ্যাপ্লিকেশনের পরে অ্যাপ্লিকেশন বিকাশ করবে: এটি বেশিরভাগ ক্ষেত্রে কী আমূল উন্নত করা যেতে পারে তা খুঁজে বের করা এবং ব্যবসা করার জন্য উপযুক্ত ব্যবসায়িক মডেল খুঁজে নেওয়ার বিষয়। একটি জেনারেটিভ আইএ ধারণা।

কয়েক বছর আগে, এটি স্ব-চালিত গাড়ি, ভিআর বা ব্লকচেইনের মতো অন্যান্য প্রযুক্তিগত প্রবণতাগুলির মতো দেখাচ্ছিল, তবে শীঘ্রই স্ব-ড্রাইভিং প্রযুক্তি আইনী বাধাগুলির দ্বারা সীমিত হয়েছে, ব্লকচেইন অর্থনৈতিক মন্দার দ্বারা ক্ষতিগ্রস্ত হয়েছে এবং ভিআর গ্রহণ হার্ডওয়্যার উচ্চ খরচ দ্বারা সীমিত. পরিবর্তে, জেনারেটিভ এআই এখনও আইন দ্বারা সীমাবদ্ধ নয় (আরে, একটি পাওয়ারপয়েন্ট উপস্থাপনা পালিশ করা বা একটি স্পোর্টস ভিডিও তৈরি করা জীবন বা মৃত্যুর বিষয় নয়) এবং ব্যবহারকারীর দ্বারা কেনার জন্য ব্যয়বহুল হার্ডওয়্যারের প্রয়োজন নেই৷

এবং আমরা ভাবিনি যে সৃজনশীল কার্যক্রম এত তাড়াতাড়ি ব্যাহত হবে। কিন্তু তারা ছিল.

আমরা নতুন এবং কখনও কখনও অদ্ভুত সময়ে প্রবেশ করছি, যেখানে মানুষের সৃজনশীলতা মেশিনের নতুন ক্ষমতার সাথে মিশ্রিত হয় যে তাদের মধ্যে পার্থক্য করা কঠিন। হিসাবে জে. কুরিয়ার পয়েন্ট আউট:

“আজ এবং আগামী কয়েক বছরের জন্য, এটি আশ্চর্যজনক এবং বিভিন্ন উপায়ে ভীতিকর মনে হবে। কারণ সেই সৃজনশীল মুহূর্তগুলি যেখানে আপনি শূন্য থেকে প্রাথমিক-ধারণার দিকে যান সবসময় তাই অনন্যভাবে মানবিক অনুভব করেছেন, কারণ এটি এত রহস্যময়।"

কিভাবে জেনারেটিভ আইএ বর্তমান দশকে সবকিছুকে ব্যাহত করবে উৎস থেকে পুনঃপ্রকাশিত https://towardsdatascience.com/how-generative-ia-will-disrupt-everything-in-the-current-decade-b4e8ce7dd4f1?source=rss—-7f60cf5620c9— 4 https://towardsdatascience.com/feed এর মাধ্যমে

<!–

->

সময় স্ট্যাম্প:

থেকে আরো ব্লকচেইন পরামর্শদাতা

থাইল্যান্ড ক্রিপ্টো তদারকি কঠোর করার পরিকল্পনা করেছে, ডিজিটাল সম্পদ পরিচালনার জন্য কেন্দ্রীয় ব্যাংককে আরও ক্ষমতা দিয়েছে

উত্স নোড: 1617826
সময় স্ট্যাম্প: আগস্ট 10, 2022