মেটার মেগা ভাষা মডেল ফাঁস হিসাবে LLaMA নাটক

মেটার মেগা ভাষা মডেল ফাঁস হিসাবে LLaMA নাটক

মেটার মেগা ল্যাঙ্গুয়েজ মডেল হিসাবে LLaMA নাটক প্লেটোব্লকচেন ডেটা ইন্টেলিজেন্স ফাঁস করে৷ উল্লম্ব অনুসন্ধান. আ.

LLaMA, মেটার সর্বশেষ বড় ভাষা মডেল, অনলাইনে ফাঁস হয়েছে এবং শুধুমাত্র গবেষণার উদ্দেশ্যে অ্যাক্সেস সীমিত করার আপাত প্রচেষ্টা সত্ত্বেও ডাউনলোডের জন্য উপলব্ধ।

ফেসবুকের মালিক ঘোষিত ফেব্রুয়ারিতে এটি সীমিত আকারে মডেলটি প্রকাশ করছিল শিক্ষাবিদ, সরকারী প্রকার এবং কোম্পানিগুলিকে ভয়ের মধ্যে খেলতে বেছে নেওয়ার জন্য এলএলএএমএ অপব্যবহার হতে পারে। কিন্তু তথ্য বিনামূল্যে হতে চায়, বা অন্তত কিছু মানুষ এটি হতে চায়, এবং Meta এর সৃষ্টি যেভাবেই হোক অনলাইনে তার পথ খুঁজে পেয়েছে, একটি টরেন্ট লিক থেকে শুরু করে।

বাক্য-ভবিষ্যদ্বাণী করা বৃহৎ ভাষার মডেল, যা ইনপুট প্রম্পট থেকে পাঠ্যের প্যাসেজ তৈরি করে, স্বাভাবিক ভাষা ব্যবহার করে তা করতে বলা হলে নিজের লেখা স্বয়ংক্রিয়ভাবে সম্পূর্ণ করা থেকে শুরু করে চ্যাটবট পর্যন্ত কাজ সম্পাদন করতে সক্ষম হয়।

বিশেষজ্ঞরা সতর্ক করেছেন যে এই প্রযুক্তিটি আগামী বছরের জন্য প্রচুর পরিমাণে ভুয়া খবর, স্প্যাম, ফিশিং ইমেল, বিভ্রান্তি, উস্কানি, আপনি এটির নাম তৈরি করতে স্বয়ংক্রিয়ভাবে ব্যবহার করা যেতে পারে। এই মডেলগুলি তৈরি করা সংস্থাগুলি প্রায়শই সফ্টওয়্যারটিকে মোড়ানো অবস্থায়, APIগুলির পিছনে রাখে বা সীমিত সংস্করণ বা ডেমো প্রকাশ করে। 

মেটা বলেছেন গত সপ্তাহে.

"অন্যান্য মডেলের মতো, LLaMA এই চ্যালেঞ্জগুলি ভাগ করে নেয়৷ একটি ফাউন্ডেশন মডেল হিসাবে, LLaMA বহুমুখী হওয়ার জন্য ডিজাইন করা হয়েছে এবং এটি বিভিন্ন ব্যবহারের ক্ষেত্রে প্রয়োগ করা যেতে পারে, বনাম একটি সূক্ষ্ম সুর করা মডেল যা একটি নির্দিষ্ট কাজের জন্য ডিজাইন করা হয়েছে।

“সততা বজায় রাখতে এবং অপব্যবহার রোধ করতে, আমরা গবেষণা ব্যবহারের ক্ষেত্রে ফোকাস করে একটি অবাণিজ্যিক লাইসেন্সের অধীনে আমাদের মডেলটি প্রকাশ করছি। মডেলটিতে অ্যাক্সেস একাডেমিক গবেষকদের কেস-বাই-কেস ভিত্তিতে দেওয়া হবে; যারা সরকার, সুশীল সমাজ এবং একাডেমিয়ায় সংগঠনের সাথে যুক্ত; এবং বিশ্বজুড়ে শিল্প গবেষণা গবেষণাগারগুলি।"

কিভাবে গাইড

কিন্তু LLaMA-তে অ্যাক্সেস নিয়ন্ত্রণ করার জন্য মেটার প্রচেষ্টা নিরর্থক বলে মনে হচ্ছে, বা তাই দেখা যাচ্ছে। নির্বাচিত বফিন এবং শিল্প ও সুশীল সমাজের সাথে মডেলটি ভাগ করার কিছুক্ষণ পরে, 4Chan-এ কেউ পিয়ার-টু-পিয়ার ফাইল ভাগ করে নেওয়ার মাধ্যমে কীভাবে পুরো মডেলটি পেতে হয় তার বিশদ পোস্ট করেছেন এবং অবশেষে কিভাবে এটি সব ডাউনলোড করতে নির্দেশাবলী GitHub এ প্রকাশিত হয়েছিল।

বরাবরের মতো, টরেন্ট থেকে এই ধরনের জিনিস আনার সময় সতর্কতা অবলম্বন করুন যদি কেউ সেখানে কোনো খারাপ কিছু লুকিয়ে রাখে। 65-বিলিয়ন-প্যারামিটার মডেলটি প্রায় 220GB ডিস্ক স্পেস নেয়, আমাদের বলা হয়েছে।

GitHub এর মাধ্যমে উপলব্ধ LLaMA এর অনুলিপিগুলি বৈধ বলে মনে হয়, আমরা নোট করি। শন প্রেসার, একটি এআই ইঞ্জিনিয়ার যিনি Microsoft-এর কোড-শেয়ারিং সাইটে ডাউনলোড নির্দেশাবলী লিখেছেন, তিনি মডেল থেকে সফলভাবে পাঠ্য তৈরি করার স্ক্রিনশট আমাদের দেখিয়েছেন। তিনি বিশ্বাস করেন যে একজন গবেষক যাকে মেটা থেকে মডেলটিতে অ্যাক্সেস দেওয়া হয়েছিল তিনি এটি ফাঁস করেছেন, যার ফলে এটি সম্ভবত প্রত্যাশিত-প্রত্যাশিত বিতরণের দিকে পরিচালিত হয়েছে।

আপনার ষড়যন্ত্র তত্ত্ব ইঞ্জিন শুরু করুন.

প্রেসার মনে করেন কোন সতর্কতা ছাড়াই মডেলটিকে অবাধে প্রকাশ করা শুধুমাত্র অনুমোদিত শিক্ষাবিদদের মধ্যে সীমাবদ্ধ রাখার চেয়ে ভাল। “আমি মনে করি ভাল খারাপকে ছাড়িয়ে যাবে, অন্তত দশগুণ। সম্ভবত 100x এর কাছাকাছি," তিনি বলেছিলেন নিবন্ধনকর্মী

অত্যাধুনিক বৃহৎ ভাষার মডেল প্রশিক্ষণ এবং চালানো ব্যয়বহুল, সাধারণভাবে বলতে গেলে; শুধুমাত্র যেসব প্রতিষ্ঠানের জিপিইউ এবং অন্যান্য অবকাঠামোর স্তূপ অ্যাক্সেস আছে তারাই সেগুলি তৈরি, পরিবর্তন এবং পরীক্ষা করার অবস্থানে রয়েছে। মেটার এআই গবেষকরা নির্মিত LLaMA ছোট হতে, এটিকে আজকের বাণিজ্যিক মডেলের তুলনায় আরও কমপ্যাক্ট করে তোলে এবং এইভাবে অ-তুচ্ছ আইটি বাজেট ছাড়াই শিক্ষাবিদ এবং বিকাশকারীদের কাছে আরও অ্যাক্সেসযোগ্য। 

মেটার মেশিন-লার্নিং গুরুরা দাবি করেছেন যে তাদের সিস্টেমটি OpenAI-এর GPT-3-কে ছাড়িয়ে গেছে এবং অন্যান্য বৃহৎ ভাষার মডেলের মতোই ভাল, যেমন Google-এর 540-বিলিয়ন-প্যারামিটার PaLM বা DeepMind-এর 70-বিলিয়ন-প্যারামিটার চিনচিলা৷ ছোট আকারের মানে হল যে বিজ্ঞানীদের কম কম্পিউটেশনাল রিসোর্স আছে তাদের জন্য এটি ব্যবহার করা সহজ হওয়া উচিত। এবং হ্যাঁ, সমস্ত আকার এবং আকারের ভাষার মডেলের আধিক্য রয়েছে; এটা শুধু OpenAI এবং Facebook এর চেয়ে বেশি।

LLaMA এর এখনও শত শত গিগাবাইট স্টোরেজ এবং এটি চালানোর জন্য একটি শালীন পরিমাণ গণনার প্রয়োজন। মডেল তৈরি করা এবং চালানোও সোজা নয়, যদি না আপনি এই ধরণের সিস্টেমগুলি পরিচালনা করতে অভ্যস্ত হন এবং আরও খারাপ কার্যকলাপের জন্য এটিকে পুনরুদ্ধার করার জন্য আরও প্রযুক্তিগত দক্ষতার প্রয়োজন হবে। মডেলটি ফাঁস হওয়া সত্ত্বেও, মেটা বলেছে যে এটি শুধুমাত্র নির্বাচিত গবেষকদের সাথে LLaMA শেয়ার করতে থাকবে। 

আমরা বিশ্বাস করি যে বর্তমান রিলিজ কৌশল আমাদের দায়িত্ব এবং খোলামেলা ভারসাম্য বজায় রাখতে দেয়

একজন মুখপাত্র বলেছেন, "মেটার লক্ষ্য হল অত্যাধুনিক এআই মডেলগুলিকে গবেষণা সম্প্রদায়ের সদস্যদের সাথে ভাগ করে নেওয়া যা আমাদেরকে সেই মডেলগুলিকে মূল্যায়ন করতে এবং উন্নত করতে সহায়তা করে" নিবন্ধনকর্মী.

“এলএলএএমএ গবেষণার উদ্দেশ্যে ভাগ করা হয়েছিল, আমরা আগের বড় ভাষার মডেলগুলি কীভাবে ভাগ করেছি তার সাথে সামঞ্জস্যপূর্ণ। যদিও মডেলটি সকলের কাছে অ্যাক্সেসযোগ্য নয়, এবং কেউ কেউ অনুমোদনের প্রক্রিয়াটি এড়াতে চেষ্টা করেছে, আমরা বিশ্বাস করি বর্তমান রিলিজ কৌশল আমাদের দায়িত্ব এবং খোলামেলা ভারসাম্য বজায় রাখতে দেয়।"

অন্য কথায়, Facebook গ্রুপটি তার প্রযুক্তি বিতরণের জন্য তার পদ্ধতির পাশে দাঁড়িয়েছে।

বৃহৎ ভাষার মডেলগুলি প্রকাশ করার জন্য মেটার সাম্প্রতিক প্রচেষ্টাগুলি মসৃণভাবে যায়নি। গত বছর এর চ্যাটি ব্লেন্ডারবট ছিল সমালোচনা ভুল তথ্য এবং ইহুদি-বিরোধী মতামত ছড়ানোর জন্য। গ্যালাকটিকা, বৈজ্ঞানিক জ্ঞানের সংক্ষিপ্তসারের জন্য ডিজাইন করা হয়েছিল অপসারিত জাল এবং বর্ণবাদী বিষয়বস্তু তৈরির জন্য এটি চালু হওয়ার তিন দিন পর। ®

সময় স্ট্যাম্প:

থেকে আরো নিবন্ধনকর্মী