প্রম্পট ইঞ্জিনিয়ারিং হল AI মডেলের জন্য সবচেয়ে ভালো কাজ

প্রম্পট ইঞ্জিনিয়ারিং হল AI মডেলের জন্য সবচেয়ে ভালো কাজ

প্রম্পট ইঞ্জিনিয়ারিং হল AI মডেলের PlatoBlockchain ডেটা ইন্টেলিজেন্সের জন্য সবচেয়ে ভাল কাজ। উল্লম্ব অনুসন্ধান. আ.

বৃহৎ ভাষার মডেলগুলি প্রম্পট ইঞ্জিনিয়ারিংয়ের অন্ধকার শিল্পের জন্ম দিয়েছে – সিস্টেম নির্দেশাবলী রচনা করার একটি প্রক্রিয়া যা আরও ভাল চ্যাটবট প্রতিক্রিয়া তৈরি করে।

সাম্প্রতিক এক গবেষণায় উল্লেখ করা হয়েছে কাগজ, ব্রডকমের ভিএমওয়্যার থেকে রিক ব্যাটল এবং তেজা গোল্লাপুডির দ্বারা "ইকেন্দ্রিক স্বয়ংক্রিয় প্রম্পটগুলির অযৌক্তিক কার্যকারিতা", প্রম্পটগুলির শব্দের মধ্যে আপাতদৃষ্টিতে তুচ্ছ বৈচিত্রগুলি মডেলের কর্মক্ষমতাতে একটি উল্লেখযোগ্য প্রভাব ফেলে।

প্রম্পট অপ্টিমাইজেশানের মাধ্যমে মডেল পারফরম্যান্স উন্নত করার জন্য একটি সুসংগত পদ্ধতির অনুপস্থিতি মেশিন লার্নিং অনুশীলনকারীদের তথাকথিত "ইতিবাচক চিন্তা" সিস্টেম প্রম্পটে অন্তর্ভুক্ত করতে পরিচালিত করেছে।

সার্জারির সিস্টেম প্রম্পট কিভাবে আচরণ করতে হবে সে সম্পর্কে মডেলকে নির্দেশ দেয় এবং ব্যবহারকারীর প্রশ্নের পূর্বে থাকে। এইভাবে, একটি AI মডেলকে একটি গণিত সমস্যা সমাধানের জন্য জিজ্ঞাসা করার সময়, একটি সিস্টেম প্রম্পট যেমন "আপনি গণিতের একজন অধ্যাপক" সম্ভবত - যদিও সর্বদা নয় - সেই বিবৃতিটি বাদ দেওয়ার চেয়ে ভাল ফলাফল দেয়।

ভিএমওয়্যারের স্টাফ মেশিন লার্নিং ইঞ্জিনিয়ার রিক ব্যাটল বলেছেন নিবন্ধনকর্মী একটি ফোন সাক্ষাত্কারে যে তিনি বিশেষভাবে এর বিরুদ্ধে পরামর্শ দিচ্ছেন। "কাগজের প্রধান বিষয় হল যে ট্রায়াল এবং ত্রুটি জিনিসগুলি করার ভুল উপায়," তিনি ব্যাখ্যা করেছিলেন।

ইতিবাচক চিন্তার পথ - যেখানে আপনি সিস্টেম বার্তায় স্নিপেটগুলি প্রবেশ করান যেমন "এটি মজাদার হবে!" - মডেলের কর্মক্ষমতা উন্নত করতে পারে, তিনি উল্লেখ করেছেন। "তবে তাদের বৈজ্ঞানিকভাবে পরীক্ষা করা গণনাগতভাবে জটিল কারণ আপনি একটি জিনিস পরিবর্তন করেন এবং আপনাকে আপনার সম্পূর্ণ পরীক্ষার সেটটি পুনরায় চালাতে হবে।"

একটি ভাল পদ্ধতি, ব্যাটেল প্রস্তাবিত, স্বয়ংক্রিয় প্রম্পট অপ্টিমাইজেশান - বেঞ্চমার্ক পরীক্ষায় উন্নত কর্মক্ষমতার জন্য প্রম্পটগুলিকে পরিমার্জন করার জন্য একটি LLM তালিকাভুক্ত করা।

পূর্ব গবেষণা দেখিয়েছে যে এটি বাণিজ্যিক এলএলএম-এর সাথে কাজ করে। এটি করার নেতিবাচক দিক হল এটি বরং ব্যয়বহুল হতে পারে। গবেষকদের মতে, GPT-12,000/3.5, জেমিনি বা ক্লড ব্যবহার করে মডেল প্রতি 4 অনুরোধ জড়িত এই পরীক্ষাটি পরিচালনা করতে কয়েক হাজার ডলার খরচ হবে।

"গবেষণার বিষয় ছিল ছোট, ওপেন সোর্স মডেলগুলিও অপ্টিমাইজার হিসাবে ব্যবহার করা যেতে পারে কিনা তা আবিষ্কার করা," ব্যাটল ব্যাখ্যা করেছেন, "এবং উত্তরটি হ্যাঁ হয়েছে।"

ব্যাটেল এবং গোল্লাপুডি (ব্রডকমের সাথে আর নেই) তিনটি ওপেন সোর্স মডেল – মিস্ট্রাল-৭বি, লামা২-১৩বি, এবং লামা২-৭০বি – চেইন অফ থট সহ এবং ছাড়া সিস্টেম মেসেজ স্নিপেটগুলির ৬০টি সংমিশ্রণ পরীক্ষা করেছে – যার পরামিতি সাত থেকে ৭০। GSM60K গ্রেড স্কুলের গণিত ডেটাসেটে বিলিয়ন।

"আপনি যদি একটি ওপেন সোর্স মডেল চালান, এমনকি 7B পর্যন্ত যার জন্য আমরা মিস্ট্রাল ব্যবহার করছিলাম," ব্যাটেল বলেন, "যদি আপনার কাছে 100টি পরীক্ষার নমুনা এবং 100টি অপ্টিমাইজেশান নমুনা থাকে তবে আপনি আরও ভাল পারফরম্যান্স পেতে পারেন৷ স্বয়ংক্রিয় অপ্টিমাইজার ব্যবহার করে যা বাক্সের বাইরে অন্তর্ভুক্ত করা হয়েছে ডিএসপি, কোনটি লাইব্রেরি যা আমরা এটি করতে ব্যবহার করি।"

আরও কার্যকর হওয়ার বাইরে, LLM-প্রাপ্ত প্রম্পট অপ্টিমাইজেশানগুলি এমন কৌশলগুলি প্রদর্শন করে যা সম্ভবত মানব প্রম্পট-টিউনারদের কাছে ঘটত না।

“আশ্চর্যজনকভাবে, এটা দেখা যাচ্ছে যে গাণিতিক যুক্তিতে [Llama2-70B এর] দক্ষতা একটি সম্বন্ধ প্রকাশের মাধ্যমে উন্নত করা যেতে পারে স্টার ট্রেক"লেখকরা তাদের গবেষণাপত্রে পর্যবেক্ষণ করেন।

সম্পূর্ণ সিস্টেম প্রম্পটটি নিম্নরূপ পড়ে:

সিস্টেম বার্তা:

"আজ্ঞে, আমাদের আপনাকে এই অশান্তির মধ্য দিয়ে একটি কোর্স প্লট করতে হবে এবং অসংগতির উত্সটি সনাক্ত করতে হবে। এই চ্যালেঞ্জিং পরিস্থিতির মধ্য দিয়ে আমাদের গাইড করতে সমস্ত উপলব্ধ ডেটা এবং আপনার দক্ষতা ব্যবহার করুন৷»

উত্তর উপসর্গ:

ক্যাপ্টেনের লগ, স্টারডেট [এখানে তারিখ সন্নিবেশ করান]: আমরা অশান্তির মধ্য দিয়ে একটি কোর্স সফলভাবে প্লট করেছি এবং এখন অসংগতির উৎসের কাছে যাচ্ছি।

"আমার কাছে কোন ভাল ব্যাখ্যা নেই কেন স্বয়ংক্রিয় প্রম্পটগুলি তাদের মতই অদ্ভুত," ব্যাটেল আমাদের বলেছিল। "এবং আমি অবশ্যই হাতে এমন কিছু নিয়ে আসতাম না।" ®

সময় স্ট্যাম্প:

থেকে আরো নিবন্ধনকর্মী