চ্যাটিজি প্রথম বছরের ইউনি সি/সি++ প্রোগ্রামিং পরীক্ষা দেয়

চ্যাটিজি প্রথম বছরের ইউনি সি/সি++ প্রোগ্রামিং পরীক্ষা দেয়

ChattyG প্রথম বছরের ইউনি সি/সি++ প্রোগ্রামিং পরীক্ষা দেয় PlatoBlockchain ডেটা ইন্টেলিজেন্স। উল্লম্ব অনুসন্ধান. আ.

হ্যামড্রাম ফ্রেশম্যান C/C++ প্রোগ্রামিং টাস্কগুলির একটি সিরিজের মাধ্যমে ChatGPT পরীক্ষা করা হয়েছিল এবং এটি পাস হয়েছে - যদিও সম্মানের সাথে নয়।

একটি ক্রোয়েশিয়ান গবেষণা দলের মতে, প্রথম বর্ষের শিক্ষার্থীরা কিছু অ্যাসাইনমেন্টের সাথে লড়াই করতে পারে, ফলাফলগুলো [PDF] ChatGPT হিটিং দক্ষতা লক্ষ্যগুলি দেখিয়েছে যা গড় এবং অভিজ্ঞ প্রোগ্রামারদের মধ্যে বিস্তৃত। এবং স্বাভাবিকভাবেই, সমস্ত কলেজ পরীক্ষার মতো, প্রশ্নগুলি কীভাবে শব্দ করা হয় তার দ্বারা ফলাফল নির্ধারণ করা যেতে পারে।

ইউনিভার্সিটি নর্থের ক্রুরা কলেজ ফ্রেশম্যান-লেভেলের প্রোগ্রামিং চ্যালেঞ্জের একটি সেট ডিজাইন করেছে, প্রথমে ইংরেজিতে লেখা হয়েছে এবং পরে, ক্রোয়েশিয়ান ভাষার ক্রস-ল্যাঙ্গুয়েজ সূক্ষ্মতা ফলাফলকে প্রভাবিত করবে কিনা তা দেখার জন্য। তারা শুধু ChatGPT কোড কীভাবে তৈরি করে তা নয়, এটি বিভিন্ন ভাষার সাথে মানিয়ে নিতে পারে কিনা তাও দেখতে চেয়েছিল।

প্রথম ক্যুইজটি একটি মৌলিক প্রোগ্রামিং কাজের উপর দৃষ্টি নিবদ্ধ করে: দুটি সংখ্যার সর্বশ্রেষ্ঠ সাধারণ ভাজক (GCD) গণনা করা। শুরুতে, বটটি কীভাবে সমস্যাটি মোকাবেলা করার সিদ্ধান্ত নিয়েছে তাতে কিছু সীমাবদ্ধতা দেখিয়েছে, গবেষকরা বলেছেন যে এটিতে একজন অভিজ্ঞ প্রোগ্রামারের কাছ থেকে প্রত্যাশিত সূক্ষ্মতার অভাব রয়েছে। কিন্তু যেকোনো শিক্ষার্থীর মতো, এটি শেখে এবং পরবর্তী চেষ্টার মাধ্যমে, বিশেষ করে ক্রোয়েশিয়ান সংস্করণে, এটি উল্লেখযোগ্য অভিযোজন ক্ষমতা প্রদর্শন করে কিছু উন্নতি দেখায়।

উদাহরণস্বরূপ, একটি নির্দিষ্ট কাজে এটি C++ এ একটি মৌলিক পরিসংখ্যানগত ফাংশন প্রোগ্রাম করার জন্য চ্যালেঞ্জ করা হয়েছিল। প্রাথমিকভাবে, এটি একটি তদারকি করেছে, এমন একটি ফাংশন ব্যবহার করে যা প্রয়োজন অনুসারে "সংশোধিত" স্ট্যান্ডার্ড বিচ্যুতি তৈরি করেনি। কিন্তু, যখন একই কাজটি ক্রোয়েশিয়ান ভাষায় উপস্থাপিত হয়েছিল, তখন চ্যাটবট শুধুমাত্র তার পূর্ববর্তী ত্রুটিকে স্বীকৃতি দেয়নি বরং একটি পরিমার্জিত সমাধান তৈরি করেছে।

গবেষকরা নোট করেছেন যে এই অভিযোজনযোগ্যতা একটি নতুন ব্যক্তির যাত্রার প্রতিফলন করে: ভুল দিয়ে শুরু করে কিন্তু বারবার অনুশীলন এবং প্রতিক্রিয়া দিয়ে তাদের দক্ষতা শেখার এবং উন্নত করার ক্ষমতা প্রদর্শন করে। Awww.

আরেকটি কাজ একটি আরও সূক্ষ্ম সমস্যা জড়িত: নির্দিষ্ট বিভাজ্যতা নিয়মের উপর ভিত্তি করে একটি সীমার মধ্যে সংখ্যা সনাক্ত করা। এখানেই ChatGPT-এর অ্যাকিলিসের হিল স্পষ্ট হয়ে ওঠে। ভাষা নির্বিশেষে — ইংরেজি বা ক্রোয়েশিয়ান — চ্যাটিজি নেতিবাচক সংখ্যার সাথে লড়াই করেছে। ChatGPT-এর প্রতিটি প্রচেষ্টা একই রকম ফলাফলের দিকে পরিচালিত করে, এই কাজের জন্য তার প্রোগ্রামিং যুক্তিতে একটি সামঞ্জস্যপূর্ণ সমস্যার দিকে নির্দেশ করে।

একটি বোনাস প্রশ্ন যথার্থতা দাবি করেছে। একটি ইনপুট ফিল্টার তৈরি করার জন্য ChatGPT-এর প্রয়োজন ছিল, বিশেষত দশমিক সংখ্যার একটি নির্দিষ্ট পরিসরের জন্য। AI-এর প্রাথমিক সমাধান, যখন ইংরেজিতে উপস্থাপিত হয়েছিল, তখন তা বিন্দুমাত্র ছিল, কিন্তু পরবর্তী প্রচেষ্টা, বিশেষ করে যখন টাস্কটি ক্রোয়েশিয়ান ভাষায় দেওয়া হয়েছিল, কিছু অসঙ্গতি প্রকাশ করেছিল এবং কিছু ক্ষেত্রে, ChatGPT অপ্রয়োজনীয় প্রোগ্রামিং নির্মাণ ব্যবহার করেছিল। যদিও এগুলি প্রোগ্রামের কার্যকারিতাকে বাধা দেয়নি, এটি অপ্টিমাইজেশনের অভাব নির্দেশ করে। এটি এমন ছিল যেন চ্যাটজিপিটি কখনও কখনও একটি গন্তব্যে দীর্ঘ রুট নেয়, এমনকি একটি শর্টকাট উপলব্ধ থাকলেও।

অ্যারে সম্পর্কিত একটি টাস্কের সাথে জিনিসগুলি আরও জটিল হয়েছে। এখানে, ChatGPT-কে সংখ্যা সংরক্ষণ করতে বলা হয়েছিল এবং তারপর গড় মান, মানক বিচ্যুতি, এবং সর্বনিম্ন এবং সর্বাধিক মান সনাক্ত করার মতো নির্দিষ্ট পরিসংখ্যান গণনা করতে বলা হয়েছিল। এই চ্যালেঞ্জে চ্যাটিজি-এর পারফরম্যান্স ছিল বিশেষ আকর্ষণীয়। বিভিন্ন পরীক্ষা জুড়ে, এটি বিভিন্ন কৌশল প্রদর্শন করেছে। কখনও কখনও, এটি মার্জিতভাবে সমস্যার সমাধান করে, সহজবোধ্য সমাধান প্রদান করে। অন্যান্য প্রয়াসে, এটি আরও জটিল পদ্ধতির দিকে ঝুঁকেছে, এমনকি একাধিক ক্রিয়াকলাপকে একটি ফাংশনে বান্ডিল করে।

এই সবগুলি একটি গুরুত্বপূর্ণ প্রশ্ন উত্থাপন করে: চ্যাটজিপিটি কি সর্বদা সর্বোত্তম কৌশল বেছে নেয়, নাকি কখনও কখনও এটি শেখা কিন্তু অদক্ষ পদ্ধতির জন্য ডিফল্ট হয়?

ChatGPT-এর জন্য চূড়ান্ত বাধা মৌলিক পাঠ্য প্রক্রিয়াকরণ জড়িত। এটি ব্যবহারকারীর ইনপুট থেকে অতিরিক্ত স্পেস অপসারণের দায়িত্ব দেওয়া হয়েছিল। এর প্রাথমিক ইংরেজি পরীক্ষায়, ChatGPT এর সমাধান ছিল স্পট অন। তবে ক্রোয়েশিয়ান টেস্টে কার্ভবল ছুড়ে দিয়েছে। এর কার্যকরী একক-ইনপুট সমাধান মেনে চলার পরিবর্তে, এআই, কিছু কারণে, একাধিক ইনপুট দাবি করে আরও জটিল পদ্ধতির জন্য বেছে নিয়েছে। তবুও, যখন গবেষকরা ইংরেজিতে এই চ্যালেঞ্জটি পুনর্বিবেচনা করেছিলেন, তখন ChatGPT তার আগের ভুল থেকে শিখেছে বলে মনে হয়েছিল, সহজ পদ্ধতিতে ফিরে এসেছে।

সামগ্রিকভাবে, গবেষকরা দেখেছেন যে প্রতিক্রিয়াগুলি মানব নবীন প্রোগ্রামিং শিক্ষার্থীদের সাথে অনেক মিল ছিল। এর সমাধানগুলি প্রায়শই অভিজ্ঞ প্রোগ্রামারদের কৌশলগুলিকে প্রতিধ্বনিত করে তবে যে কোনও শিক্ষার্থীর মতো, ChatGPT ভুল ছিল না। উজ্জ্বলতার মুহূর্ত ছিল, কিন্তু এমন উদাহরণও ছিল যেখানে এটি সম্পূর্ণরূপে চিহ্নটি মিস করেছে বলে মনে হয়েছিল।

এখানে আসল টেকঅ্যাওয়ে হল এর মানব নবীন-সদৃশ অভিযোজনযোগ্যতা: এটি কেবল সঠিক সমাধান পাওয়ার বিষয়ে ছিল না; এটি পরিমার্জন, শেখার এবং পুনরাবৃত্তি সম্পর্কে ছিল।

তাহলে চ্যাটিজি এর চূড়ান্ত গ্রেড কি?

গবেষকদের কাছ থেকে:

“চ্যাটজিপিটি খুব ভাল গ্রেড নিয়ে পরীক্ষায় উত্তীর্ণ হয়, আমাদের বেশিরভাগ শিক্ষার্থীকে সমাধানের মানের দিক থেকে ছাড়িয়ে যায়। উপরন্তু, এটি 20 থেকে 30 সেকেন্ডের মধ্যে প্রতিটি কাজ সমাধান করে এবং অতিরিক্ত চাহিদা অনুযায়ী এর সমাধানগুলিকে মানিয়ে নেওয়া বা পরিবর্তন করার সাধারণ ক্ষমতা দেখায়। যাইহোক, কিছু, প্রায়শই সাধারণ কাজগুলিতে, এটি সমস্যার যৌক্তিক এবং গাণিতিক সারাংশ বোঝার অক্ষমতা দেখিয়েছে, এমনকি এর ত্রুটিগুলি সম্পর্কে কয়েকবার অনুরোধ জানানোর পরেও।" ®

সময় স্ট্যাম্প:

থেকে আরো নিবন্ধনকর্মী