تم اختبار ChatGPT من خلال سلسلة من المهام الرتيبة لبرمجة C/C++ للطلاب الجدد وتم اجتيازه - ولكن ليس بمرتبة الشرف.
وفقا لفريق بحث كرواتي، بينما يمكن لطلاب السنة الأولى أن يواجهوا صعوبة في أداء بعض الواجبات، النتائج أظهر [PDF] أن ChatGPT حقق أهداف الكفاءة التي تراوحت بين المتوسط وأهداف المبرمجين ذوي الخبرة. وبطبيعة الحال، كما هو الحال مع جميع امتحانات الكليات، يمكن تحديد النتائج من خلال كيفية صياغة الأسئلة.
صمم طاقم جامعة نورث مجموعة من تحديات البرمجة على مستوى الطلاب الجدد في الكلية، تمت كتابتها أولاً باللغة الإنجليزية ثم لاحقًا، لمعرفة ما إذا كانت الفروق الدقيقة بين اللغات ستؤثر على النتائج، باللغة الكرواتية. لقد أرادوا ليس فقط معرفة كيفية تشفير ChatGPT، ولكن أيضًا ما إذا كان بإمكانه التكيف مع لغات مختلفة.
ركز الاختبار الأول على مهمة برمجة أساسية: حساب القاسم المشترك الأكبر (GCD) لعددين. في البداية، أظهر الروبوت بعض القيود في كيفية اتخاذ القرار لمعالجة المشكلة، حيث قال الباحثون إنه يفتقر إلى الجودة المتوقعة من مبرمج متمرس. ولكن مثل أي طالب، فإنه يتعلم ومن خلال المحاولات اللاحقة، خاصة في النسخة الكرواتية، أظهر بعض التحسينات، وأظهر قدرة ملحوظة على التكيف.
على سبيل المثال، في إحدى المهام المحددة، تم تحدي برمجة وظيفة إحصائية أساسية بلغة C++. في البداية، قامت بعملية مراقبة باستخدام دالة لم تنتج الانحراف المعياري "المصحح" كما هو مطلوب. ولكن عندما تم تقديم نفس المهمة باللغة الكرواتية، لم يتعرف برنامج الدردشة الآلي على خطأه السابق فحسب، بل توصل إلى حل محسّن.
لاحظ الباحثون أن هذه القدرة على التكيف تعكس رحلة الطلاب الجدد: البدء بالأخطاء ولكن إظهار القدرة على التعلم وتعزيز مهاراتهم من خلال الممارسة المتكررة والتغذية الراجعة. أووه.
تضمنت مهمة أخرى مشكلة أكثر دقة: تحديد الأرقام ضمن نطاق بناءً على قواعد محددة للقسمة. كان هذا هو المكان الذي أصبح فيه كعب أخيل في ChatGPT واضحًا. بغض النظر عن اللغة - الإنجليزية أو الكرواتية - عانى موقع ChattyG من الأرقام السالبة. أدت كل محاولة قام بها ChatGPT إلى نتائج مماثلة، مما يشير إلى وجود مشكلة ثابتة في منطق البرمجة الخاص به لهذه المهمة.
سؤال إضافي يتطلب الدقة. كان ChatGPT مطلوبًا لإنشاء مرشح إدخال، خصيصًا لنطاق محدد من الأرقام العشرية. كان الحل الأولي للذكاء الاصطناعي، عند تقديمه باللغة الإنجليزية، في محله، لكن المحاولات التالية، خاصة عندما تم إعطاء المهمة باللغة الكرواتية، كشفت عن بعض التناقضات، وفي بعض الحالات، استخدم ChatGPT بنيات برمجة غير ضرورية. في حين أن هذه لم تعيق وظائف البرنامج، إلا أنها تشير إلى عدم وجود التحسين. كان الأمر كما لو أن ChatGPT يسلك أحيانًا الطريق الأطول إلى الوجهة، حتى عندما يكون الاختصار متاحًا.
أصبحت الأمور أكثر تعقيدًا مع المهام المتعلقة بالمصفوفات. هنا، طُلب من ChatGPT تخزين الأرقام ثم حساب إحصائيات معينة مثل القيمة المتوسطة والانحراف المعياري وتحديد القيم الدنيا والقصوى. كان أداء ChattyG في هذا التحدي مثيرًا للاهتمام بشكل خاص. ومن خلال اختبارات مختلفة، عرضت استراتيجيات مختلفة. وفي بعض الأحيان، كان يحل المشكلة بشكل رائع، ويقدم حلولاً مباشرة. وفي محاولات أخرى، اتجه نحو أساليب أكثر تعقيدًا، حتى أنه قام بتجميع عمليات متعددة في وظيفة واحدة.
كل هذا يثير سؤالا مهما: هل يختار ChatGPT دائما أفضل استراتيجية، أم أنه يلجأ في بعض الأحيان إلى الأساليب المستفادة ولكن غير الفعالة؟
كانت العقبة الأخيرة أمام ChatGPT تتضمن معالجة النصوص الأساسية. تم تكليفه بإزالة المسافات الإضافية من إدخال المستخدم. في اختبار اللغة الإنجليزية الأولي، كان حل ChatGPT دقيقًا. ومع ذلك، ألقى الاختبار الكرواتي كرة منحنى. بدلاً من الالتزام بحل المدخلات الفردية الفعال، اختار الذكاء الاصطناعي، لسبب ما، نهجًا أكثر تعقيدًا، يتطلب مدخلات متعددة. ومع ذلك، عندما أعاد الباحثون النظر في هذا التحدي باللغة الإنجليزية، بدا أن ChatGPT قد تعلم من خطأه السابق، حيث عاد إلى الطريقة الأبسط.
بشكل عام، وجد الباحثون أن إجابات طلاب البرمجة الجدد لديها الكثير من القواسم المشتركة. غالبًا ما كانت حلولها تعكس استراتيجيات المبرمجين ذوي الخبرة، ولكن مثل أي طالب، لم يكن ChatGPT معصومًا من الخطأ. كانت هناك لحظات من التألق، ولكن أيضًا حالات بدا فيها أنها أخطأت الهدف تمامًا.
إن الوجبات الجاهزة الحقيقية هنا هي قدرتها على التكيف الشبيهة بالبشر الجدد: لم يكن الأمر يتعلق فقط بالحصول على الحل الصحيح؛ كان الأمر يتعلق بالصقل والتعلم والتكرار.
إذن ما هي الدرجة النهائية لـ ChattyG؟
من الباحثين:
"يجتاز ChatGPT الاختبار بدرجات جيدة جدًا، ويتفوق على معظم طلابنا في جودة الحلول. علاوة على ذلك، فهو يحل كل مهمة خلال 20 إلى 30 ثانية ويظهر القدرة العامة على التكيف أو تغيير حلولها وفقًا للمتطلبات الإضافية. إلا أنه في بعض المهام، التي غالباً ما تكون بسيطة، أظهر عدم القدرة على فهم الجوهر المنطقي والرياضي للمشكلة، حتى بعد أن تم سؤاله عن أخطائها عدة مرات. ®
- محتوى مدعوم من تحسين محركات البحث وتوزيع العلاقات العامة. تضخيم اليوم.
- PlatoData.Network Vertical Generative Ai. تمكين نفسك. الوصول هنا.
- أفلاطونايستريم. ذكاء Web3. تضخيم المعرفة. الوصول هنا.
- أفلاطون كربون، كلينتك ، الطاقة، بيئة، شمسي، إدارة المخلفات. الوصول هنا.
- أفلاطون هيلث. التكنولوجيا الحيوية وذكاء التجارب السريرية. الوصول هنا.
- المصدر https://go.theregister.com/feed/www.theregister.com/2023/10/03/chatgpt_code_college/
- :يكون
- :ليس
- :أين
- 20
- 30
- 7
- a
- القدرة
- من نحن
- وفقا
- أخيل
- في
- تكيف
- إضافي
- الانضمام
- تؤثر
- بعد
- AI
- الكل
- أيضا
- دائما
- an
- و
- أي وقت
- نهج
- هي
- AS
- At
- محاولة
- محاولات
- متاح
- المتوسط
- على أساس
- الأساسية
- BE
- وأصبح
- يجري
- أفضل
- ما بين
- علاوة
- أحذية طويلة
- لكن
- by
- C + +
- حساب
- CAN
- معين
- تحدى
- تحدى
- التحديات
- تغيير
- chatbot
- شات جي بي تي
- اختار
- CO
- رموز
- كلية
- مشترك
- مجمع
- فهم
- إحصاء
- ثابتة
- تصحيح
- استطاع
- حرفة
- قررت
- الترتيب
- تعريف
- طالب
- يطالب
- مطالب
- تظاهر
- تصميم
- افضل الرحلات السياحية
- مصمم
- الانحراف
- فعل
- ديدن
- مختلف
- هل
- كل
- وردد
- الطُرق الفعّالة
- انجليزي
- تعزيز
- تماما
- خطأ
- أخطاء
- خاصة
- جوهر
- حتى
- واضح
- امتحان
- مثال
- متوقع
- تمكنت
- احتفل على
- ردود الفعل
- تصفية
- نهائي
- براعة
- الاسم الأول
- ركز
- في حالة
- وجدت
- تبدأ من
- وظيفة
- وظيفة
- علاوة على ذلك
- العلاجات العامة
- الحصول على
- معطى
- خير
- حصلت
- درجة
- أعظم
- كان
- يملك
- هنا
- منع
- ضرب
- بتقدير امتياز
- كيفية
- لكن
- HTTPS
- الانسان
- رتابة
- تحديد
- تحديد
- if
- أهمية
- تحسينات
- in
- في أخرى
- عجز
- تشير
- غير فعال
- في البداية
- في البداية
- إدخال
- المدخلات
- بدلًا من ذلك
- وكتابة مواضيع مثيرة للاهتمام
- إلى
- المشاركة
- قضية
- IT
- انها
- رحلة
- JPG
- م
- نقص
- لغة
- اللغات
- الى وقت لاحق
- تعلم
- تعلم
- تعلم
- ليد
- مثل
- القيود
- منطق
- منطقي
- يعد
- الكثير
- صنع
- علامة
- رياضي
- أقصى
- تعني
- طريقة
- طرق
- الحد الأدنى
- الأخطاء
- لحظات
- الأكثر من ذلك
- أكثر
- متعدد
- سلبي
- التالي
- شمال
- جدير بالذكر
- أرقام
- of
- الوهب
- غالبا
- on
- ONE
- فقط
- عمليات
- التحسين
- or
- أخرى
- لنا
- خارج
- النتائج
- التفوق على
- مراقبة
- خاص
- خاصة
- مرت
- يمر
- أداء
- أفلاطون
- الذكاء افلاطون البيانات
- أفلاطون داتا
- البوينت
- ممارسة
- دقة
- قدم
- سابق
- المشكلة
- معالجة
- إنتاج
- البرنامج
- مبرمج
- المبرمجين
- برمجة وتطوير
- وضع
- جودة
- سؤال
- الأسئلة المتكررة
- يثير
- نطاق
- حقيقي
- سبب
- المعترف بها
- مكرر
- تنقية
- بغض النظر
- ذات صلة
- إزالة
- متكرر
- مطلوب
- بحث
- الباحثين
- ردود
- النتائج
- عودة
- أظهرت
- حق
- طريق
- القواعد
- s
- نفسه
- قول
- المخضرمين
- ثواني
- انظر تعريف
- بدت
- مسلسلات
- طقم
- عدة
- عرضت
- أظهرت
- يظهر
- مماثل
- الاشارات
- بساطة
- مهارات
- حل
- الحلول
- يحل
- بعض
- المساحات
- محدد
- على وجه التحديد
- بقعة
- معيار
- ابتداء
- إحصائي
- إحصائيات
- متجر
- صريح
- استراتيجيات
- الإستراتيجيات
- النضال
- طالب
- عدد الطلبة
- لاحق
- معالجة
- يأخذ
- الأهداف
- مهمة
- المهام
- فريق
- تجربه بالعربي
- اختبارات
- نص
- أن
- •
- من مشاركة
- then
- هناك.
- تشبه
- هم
- هؤلاء
- على الرغم من؟
- عبر
- مرات
- إلى
- استغرق
- نحو
- اثنان
- UNI
- جامعة
- غير ضروري
- مستعمل
- مستخدم
- استخدام
- قيمنا
- القيم
- متفاوتة
- الإصدار
- جدا
- بواسطة
- مطلوب
- وكان
- لم يكن
- كان
- ابحث عن
- متى
- في حين
- مع
- في غضون
- عمل
- سوف
- عام
- حتى الآن
- زفيرنت