ChattyG پہلے سال کا uni C/C++ پروگرامنگ امتحان لیتا ہے۔

ChattyG پہلے سال کا uni C/C++ پروگرامنگ امتحان لیتا ہے۔

ChattyG پہلے سال کا uni C/C++ پروگرامنگ امتحان PlatoBlockchain Data Intelligence لیتا ہے۔ عمودی تلاش۔ عی

چیٹ جی پی ٹی کو ہمڈرم فریش مین C/C++ پروگرامنگ ٹاسکس کی ایک سیریز کے ذریعے آزمائش میں ڈالا گیا اور یہ پاس ہو گیا – حالانکہ اعزاز کے ساتھ نہیں۔

کروشین ریسرچ ٹیم کے مطابق، جبکہ پہلے سال کے طلباء کچھ اسائنمنٹس کے ساتھ جدوجہد کر سکتے ہیں، نتائج [PDF] نے ChatGPT کو مہارت کے اہداف کو نشانہ بنایا جو اوسط اور تجربہ کار پروگرامرز کے درمیان تھا۔ اور قدرتی طور پر، کالج کے تمام امتحانات کی طرح، نتائج کا تعین اس بات سے کیا جا سکتا ہے کہ سوالات کیسے لکھے جاتے ہیں۔

یونیورسٹی نارتھ کے عملے نے کالج کے نئے آدمی کی سطح کے پروگرامنگ چیلنجز کا ایک سیٹ ڈیزائن کیا، جو پہلے انگریزی میں لکھا گیا اور بعد میں، یہ دیکھنے کے لیے کہ آیا زبان کی مختلف باریکیاں نتائج کو متاثر کرتی ہیں، کروشین۔ وہ نہ صرف یہ دیکھنا چاہتے تھے کہ چیٹ جی پی ٹی کوڈ کیسے بنتے ہیں، بلکہ یہ بھی دیکھنا چاہتے تھے کہ کیا یہ مختلف زبانوں میں ڈھل سکتا ہے۔

پہلا کوئز ایک بنیادی پروگرامنگ ٹاسک پر مرکوز تھا: دو نمبروں کے سب سے بڑے مشترکہ تقسیم (GCD) کا حساب لگانا۔ شروع میں، بوٹ نے کچھ حدود ظاہر کیں کہ اس نے کس طرح اس مسئلے سے نمٹنے کا فیصلہ کیا، محققین کا کہنا ہے کہ اس میں ایک تجربہ کار پروگرامر سے توقع کی گئی نفاست کی کمی ہے۔ لیکن کسی بھی طالب علم کی طرح، یہ سیکھتا ہے اور اس کے بعد کی کوششوں کے ذریعے، خاص طور پر کروشین ورژن میں، اس نے قابل ذکر موافقت ظاہر کرتے ہوئے کچھ بہتری کا مظاہرہ کیا۔

مثال کے طور پر، ایک خاص کام میں اسے C++ میں بنیادی شماریاتی فنکشن پروگرام کرنے کا چیلنج دیا گیا تھا۔ ابتدائی طور پر، اس نے ایک ایسے فنکشن کا استعمال کرتے ہوئے ایک نگرانی کی جس نے ضرورت کے مطابق "درست" معیاری انحراف پیدا نہیں کیا۔ لیکن، جب یہی کام کروشین زبان میں پیش کیا گیا تو چیٹ بوٹ نے نہ صرف اپنی پچھلی غلطی کو تسلیم کیا بلکہ ایک بہتر حل نکالا۔

محققین نوٹ کرتے ہیں کہ یہ موافقت ایک نئے آدمی کے سفر کی عکاسی کرتی ہے: غلطیوں سے شروع ہوتا ہے لیکن بار بار مشق اور آراء کے ساتھ اپنی صلاحیتوں کو سیکھنے اور بڑھانے کی صلاحیت دکھاتا ہے۔ اوہ

ایک اور کام میں ایک زیادہ اہم مسئلہ شامل ہے: مخصوص تقسیم کے اصولوں کی بنیاد پر ایک رینج کے اندر نمبروں کی شناخت کرنا۔ یہ وہ جگہ تھی جہاں ChatGPT کی اچیلز کی ہیل واضح ہوئی۔ زبان سے قطع نظر — انگریزی یا کروشین — چیٹی جی نے منفی نمبروں کے ساتھ جدوجہد کی۔ ChatGPT کی ہر کوشش اسی طرح کے نتائج کا باعث بنی، اس کام کے لیے اس کی پروگرامنگ منطق میں ایک مستقل مسئلہ کی طرف اشارہ کیا۔

ایک بونس سوال نے درستگی کا مطالبہ کیا۔ ChatGPT کو ایک ان پٹ فلٹر تیار کرنے کی ضرورت تھی، خاص طور پر اعشاریہ نمبروں کی ایک متعین حد کے لیے۔ AI کا ابتدائی حل، جب انگریزی میں پیش کیا گیا، نقطہ پر تھا، لیکن اگلی کوششوں، خاص طور پر جب یہ کام کروشین زبان میں دیا گیا تھا، نے کچھ تضادات کا انکشاف کیا اور بعض صورتوں میں، ChatGPT نے غیر ضروری پروگرامنگ کنسٹرکٹس کا استعمال کیا۔ اگرچہ یہ پروگرام کی فعالیت میں رکاوٹ نہیں بنتے تھے، لیکن اس نے اصلاح کی کمی کی نشاندہی کی۔ یہ ایسا ہی تھا جیسے ChatGPT بعض اوقات کسی منزل تک لمبا راستہ اختیار کرتا ہے، یہاں تک کہ جب کوئی شارٹ کٹ دستیاب ہو۔

صفوں سے متعلق کام کے ساتھ چیزیں مزید پیچیدہ ہوگئیں۔ یہاں، ChatGPT سے نمبروں کو ذخیرہ کرنے اور پھر کچھ اعدادوشمار کی گنتی کرنے کو کہا گیا جیسے کہ اوسط قدر، معیاری انحراف، اور کم سے کم اور زیادہ سے زیادہ قدروں کی نشاندہی کریں۔ اس چیلنج پر چیٹی جی کی کارکردگی خاصی دلچسپ رہی۔ مختلف ٹیسٹوں میں، اس نے مختلف حکمت عملیوں کی نمائش کی۔ بعض اوقات، اس نے سیدھے سادے حل پیش کرتے ہوئے اس مسئلے کو خوبصورتی سے حل کیا۔ دوسری کوششوں میں، یہ زیادہ پیچیدہ طریقوں کی طرف جھکتا ہے، یہاں تک کہ ایک فنکشن میں متعدد آپریشنز کو بنڈل کرتا ہے۔

یہ سب ایک اہم سوال پیدا کرتا ہے: کیا ChatGPT ہمیشہ بہترین حکمت عملی کا انتخاب کرتا ہے، یا کیا یہ بعض اوقات سیکھے ہوئے لیکن غیر موثر طریقوں سے طے ہوتا ہے؟

ChatGPT کے لیے آخری رکاوٹ میں بنیادی ٹیکسٹ پروسیسنگ شامل ہے۔ اسے صارف کے ان پٹ سے اضافی خالی جگہوں کو ہٹانے کا کام سونپا گیا تھا۔ اس کے ابتدائی انگریزی ٹیسٹ میں، ChatGPT کا حل نمایاں تھا۔ تاہم، کروشین ٹیسٹ نے ایک کریو بال پھینک دیا۔ اپنے موثر سنگل ان پٹ حل پر عمل کرنے کے بجائے، AI نے، کسی وجہ سے، ایک سے زیادہ ان پٹ کا مطالبہ کرتے ہوئے، زیادہ پیچیدہ نقطہ نظر کا انتخاب کیا۔ پھر بھی، جب محققین نے انگریزی میں اس چیلنج پر نظرثانی کی، تو ایسا لگتا ہے کہ ChatGPT نے اپنی سابقہ ​​غلطی سے سیکھا ہے، آسان طریقہ پر واپس آ گیا ہے۔

مجموعی طور پر، محققین نے محسوس کیا کہ جوابات انسانی تازہ پروگرامنگ کے طلباء کے ساتھ بہت زیادہ مشترک ہیں۔ اس کے حل اکثر تجربہ کار پروگرامرز کی حکمت عملیوں کی بازگشت کرتے ہیں لیکن کسی بھی طالب علم کی طرح، ChatGPT بے عیب نہیں تھا۔ پرتیبھا کے لمحات تھے، لیکن ایسی مثالیں بھی تھیں جہاں ایسا لگتا تھا کہ یہ نشان پوری طرح سے چھوٹ گیا ہے۔

یہاں اصل ٹیک وے اس کی انسانی تازہ انسان کی طرح موافقت ہے: یہ صرف صحیح حل حاصل کرنے کے بارے میں نہیں تھا۔ یہ تطہیر، سیکھنے، اور تکرار کے بارے میں تھا۔

تو ChattyG کا آخری درجہ کیا ہے؟

محققین سے:

"ChatGPT بہت اچھے نمبروں کے ساتھ امتحان پاس کرتا ہے، ہمارے زیادہ تر طلباء کو حل کے معیار میں پیچھے چھوڑتا ہے۔ مزید برآں، یہ ہر کام کو 20 سے 30 سیکنڈ میں حل کرتا ہے اور اضافی مطالبات کے مطابق اس کے حل کو ڈھالنے یا تبدیل کرنے کی عمومی صلاحیت کو ظاہر کرتا ہے۔ تاہم، بعض، اکثر آسان کاموں میں، اس نے مسئلہ کے منطقی اور ریاضیاتی جوہر کو سمجھنے میں ناکامی ظاہر کی، یہاں تک کہ اس کی غلطیوں کے بارے میں کئی بار اشارہ کرنے کے بعد بھی۔" ®

ٹائم اسٹیمپ:

سے زیادہ رجسٹر