ChattyG در آزمون برنامه نویسی C/C++ سال اول دانشگاه شرکت می کند

ChattyG در آزمون برنامه نویسی C/C++ سال اول دانشگاه شرکت می کند

ChattyG در اولین سال آزمون برنامه نویسی C/C++ دانشگاه PlatoBlockchain Data Intelligence شرکت می کند. جستجوی عمودی Ai.

ChatGPT از طریق یک سری وظایف برنامه نویسی C/C++ دانشجوی سال اول در آزمون قرار گرفت و موفق شد – البته نه با افتخار.

به گفته یک تیم تحقیقاتی کرواسی، در حالی که دانش آموزان سال اول می توانند با برخی از تکالیف مشکل داشته باشند، نتایج [PDF] ChatGPT را نشان داد که به اهداف مهارتی دست می‌یابد که بین میانگین و برنامه‌نویسان باتجربه متغیر است. و طبیعتاً، مانند تمام امتحانات کالج، نتایج را می توان با نحوه بیان سؤالات تعیین کرد.

خدمه دانشگاه شمال مجموعه‌ای از چالش‌های برنامه‌نویسی در سطح دانشجوی سال اول کالج را طراحی کردند که ابتدا به زبان انگلیسی و بعداً نوشتند تا ببینند آیا تفاوت‌های بین زبانی بر نتایج تأثیر می‌گذارد، کرواتی. آنها می خواستند نه تنها نحوه کدهای ChatGPT را ببینند، بلکه همچنین می خواستند ببینند که آیا می تواند با زبان های مختلف سازگار شود.

اولین مسابقه بر روی یک کار اصلی برنامه نویسی متمرکز بود: محاسبه بزرگترین مقسوم علیه مشترک (GCD) دو عدد. در ابتدا، ربات محدودیت‌هایی را در نحوه تصمیم‌گیری برای مقابله با این مشکل نشان داد و محققان گفتند که فاقد ظرافت مورد انتظار یک برنامه‌نویس باتجربه است. اما مانند هر دانش آموزی، یاد می گیرد و از طریق تلاش های بعدی، به خصوص در نسخه کرواتی، پیشرفت هایی را نشان می دهد که سازگاری قابل توجهی را نشان می دهد.

برای مثال، در یک کار خاص، برنامه‌ریزی یک تابع آماری پایه در C++ به چالش کشیده شد. در ابتدا، با استفاده از تابعی که انحراف استاندارد "تصحیح شده" را در صورت لزوم ایجاد نمی کرد، یک نظارت انجام داد. اما، زمانی که همان کار به زبان کرواتی ارائه شد، ربات چت نه تنها خطای قبلی خود را تشخیص داد، بلکه یک راه حل اصلاح شده نیز ارائه کرد.

محققان خاطرنشان می کنند که این سازگاری آینه سفر یک دانشجوی سال اول است: شروع با اشتباهات اما نشان دادن توانایی در یادگیری و افزایش مهارت های خود با تمرین و بازخورد مکرر. اووو

کار دیگر شامل یک مشکل ظریف تر است: شناسایی اعداد در یک محدوده بر اساس قوانین بخش پذیری خاص. اینجا بود که پاشنه آشیل ChatGPT آشکار شد. صرف نظر از زبان - انگلیسی یا کرواتی - ChattyG با اعداد منفی دست و پنجه نرم کرد. هر تلاش ChatGPT به نتایج مشابهی منجر شد که به یک مسئله ثابت در منطق برنامه‌نویسی آن برای این کار اشاره می‌کرد.

یک سوال پاداش نیاز به دقت داشت. ChatGPT برای ایجاد یک فیلتر ورودی، به‌ویژه برای محدوده مشخصی از اعداد اعشاری، مورد نیاز بود. راه‌حل اولیه هوش مصنوعی، زمانی که به زبان انگلیسی ارائه شد، درست بود، اما تلاش‌های بعدی، به‌ویژه زمانی که وظیفه به زبان کرواتی داده شد، برخی ناسازگاری‌ها را آشکار کرد و در برخی موارد، ChatGPT از ساختارهای برنامه‌نویسی غیرضروری استفاده کرد. در حالی که این موارد مانع از عملکرد برنامه نشد، اما نشان دهنده عدم بهینه سازی بود. گویی ChatGPT گاهی مسیر طولانی‌تری را به مقصد می‌پیوندد، حتی زمانی که یک میانبر در دسترس بود.

همه چیز با یک کار مرتبط با آرایه ها پیچیده تر شد. در اینجا، از ChatGPT خواسته شد تا اعداد را ذخیره کند و سپس آمارهای خاصی مانند مقدار میانگین، انحراف استاندارد، و مقادیر حداقل و حداکثر را محاسبه کند. عملکرد ChattyG در این چالش بسیار جالب بود. در آزمون‌های مختلف، استراتژی‌های مختلفی را به نمایش گذاشت. گاهی اوقات، با ارائه راه حل های ساده، مشکل را حل می کرد. در تلاش‌های دیگر، به سمت روش‌های پیچیده‌تر متمایل شد، حتی چندین عملیات را در یک تابع ترکیب کرد.

همه اینها یک سوال مهم را ایجاد می کند: آیا ChatGPT همیشه بهترین استراتژی را انتخاب می کند یا گاهی اوقات به طور پیش فرض روش های آموخته شده اما ناکارآمد را انتخاب می کند؟

آخرین مانع برای ChatGPT شامل پردازش متن اولیه بود. وظیفه آن حذف فضاهای اضافی از ورودی کاربر بود. در آزمون اولیه زبان انگلیسی، راه حل ChatGPT به درستی انجام شد. با این حال، آزمون کرواسی یک توپ منحنی پرتاب کرد. به‌جای پایبندی به راه‌حل مؤثر تک ورودی، هوش مصنوعی به دلایلی رویکرد پیچیده‌تری را انتخاب کرد که نیاز به ورودی‌های متعدد داشت. با این حال، زمانی که محققان دوباره این چالش را به زبان انگلیسی بررسی کردند، ChatGPT به نظر می‌رسید که از گام اشتباه قبلی خود درس گرفته و به روش ساده‌تر بازگشته است.

به طور کلی، محققان دریافتند که این پاسخ ها شباهت زیادی با پاسخ های دانشجویان برنامه نویسی سال اول انسانی دارد. راه حل های آن اغلب بازتاب استراتژی های برنامه نویسان با تجربه بود، اما مانند هر دانش آموزی، ChatGPT خطاناپذیر نبود. لحظاتی از درخشش وجود داشت، اما مواردی نیز وجود داشت که به نظر می‌رسید به‌طور کامل از نقطه‌نظر خارج شده بود.

نکته اصلی در اینجا، انطباق پذیری شبیه به دانشجوی سال اول انسانی است: این فقط به دنبال یافتن راه حل مناسب نبود. این در مورد پالایش، یادگیری، و تکرار بود.

بنابراین نمره نهایی ChattyG چیست؟

از محققان:

"ChatGPT امتحان را با نمرات بسیار خوب پشت سر می گذارد و از نظر کیفیت راه حل ها از اکثر دانش آموزان ما بهتر عمل می کند. علاوه بر این، هر کار را در 20 تا 30 ثانیه حل می کند و توانایی کلی برای انطباق یا تغییر راه حل های خود را با توجه به نیازهای اضافی نشان می دهد. با این حال، در برخی از کارها، اغلب ساده، ناتوانی در درک ماهیت منطقی و ریاضی مسئله را نشان داد، حتی پس از اینکه چندین بار در مورد خطاهای آن درخواست شد. ®

تمبر زمان:

بیشتر از ثبت نام