إدخال تحسينات على واجهة برمجة التطبيقات (API) للضبط الدقيق وتوسيع برنامج النماذج المخصصة لدينا

إدخال تحسينات على واجهة برمجة التطبيقات (API) للضبط الدقيق وتوسيع برنامج النماذج المخصصة لدينا

إدخال تحسينات على واجهة برمجة التطبيقات (API) للضبط الدقيق وتوسيع برنامج النماذج المخصصة الخاص بنا PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.

مساعدة في الضبط الدقيق

في DevDay في نوفمبر الماضي، قمنا أعلن برنامج نموذج مخصص مصمم لتدريب النماذج وتحسينها لمجال معين، بالشراكة مع مجموعة مخصصة من باحثي OpenAI. منذ ذلك الحين، التقينا بالعشرات من العملاء لتقييم احتياجاتهم من النماذج المخصصة وقمنا بتطوير برنامجنا لتحقيق أقصى قدر من الأداء.

اليوم، نعلن رسميًا عن عرض الضبط الدقيق المساعد الخاص بنا كجزء من برنامج النموذج المخصص. إن الضبط الدقيق المدعوم عبارة عن جهد تعاوني مع فرقنا الفنية للاستفادة من التقنيات التي تتجاوز واجهة برمجة التطبيقات (API) للضبط الدقيق، مثل المعلمات الفائقة الإضافية وطرق الضبط الدقيق الفعالة للمعلمات (PEFT) على نطاق أوسع. إنه مفيد بشكل خاص للمؤسسات التي تحتاج إلى دعم في إعداد خطوط بيانات التدريب الفعالة وأنظمة التقييم والمعلمات والأساليب المخصصة لتحقيق أقصى قدر من أداء النموذج لحالة الاستخدام أو المهمة الخاصة بهم.

على سبيل المثال، SK للاتصالات، وهي شركة اتصالات تخدم أكثر من 30 مليون مشترك في كوريا الجنوبية، أرادت تخصيص نموذج ليكون خبيرًا في مجال الاتصالات مع التركيز الأولي على خدمة العملاء. لقد عملوا مع OpenAI لضبط GPT-4 لتحسين أدائه في المحادثات المتعلقة بالاتصالات باللغة الكورية. على مدار عدة أسابيع، حققت SKT وOpenAI تحسنًا كبيرًا في الأداء في مهام خدمة عملاء الاتصالات - زيادة بنسبة 35% في جودة تلخيص المحادثة، وزيادة بنسبة 33% في دقة التعرف على النوايا، وزيادة في درجات الرضا من 3.6 إلى 4.5 (خارج من 5) عند مقارنة النموذج المضبوط بـ GPT-4. 

نموذج مدرب حسب الطلب

في بعض الحالات، تحتاج المؤسسات إلى تدريب نموذج مصمم خصيصًا لهذا الغرض من البداية بحيث يفهم أعمالها أو صناعتها أو مجالها. تكتسب النماذج المدربة خصيصًا معرفة جديدة من مجال معين عن طريق تعديل الخطوات الأساسية لعملية التدريب النموذجي باستخدام تقنيات جديدة في منتصف التدريب وما بعد التدريب. غالبًا ما تمتلك المؤسسات التي تشهد نجاحًا باستخدام نموذج مُدرب خصيصًا بشكل كامل كميات كبيرة من البيانات الخاصة - ملايين الأمثلة أو مليارات الرموز المميزة - التي ترغب في استخدامها لتعليم النموذج معرفة جديدة أو سلوكيات معقدة وفريدة من نوعها لحالات استخدام محددة للغاية. 

على سبيل المثال، هارفي، أداة قانونية أصلية تعتمد على الذكاء الاصطناعي للمحامين، بالشراكة مع OpenAI من أجل إنشاء نموذج لغة كبير مدرب خصيصًا للسوابق القضائية. في حين أن النماذج التأسيسية كانت قوية في الاستدلال، إلا أنها كانت تفتقر إلى المعرفة الواسعة بتاريخ القضايا القانونية والمعرفة الأخرى المطلوبة للعمل القانوني. بعد اختبار الهندسة السريعة وRAG والضبط الدقيق، عمل Harvey مع فريقنا لإضافة عمق السياق المطلوب إلى النموذج - أي ما يعادل 10 مليار رمز مميز من البيانات. قام فريقنا بتعديل كل خطوة من خطوات عملية التدريب النموذجية، بدءًا من التدريب المتوسط ​​الخاص بالمجال وحتى تخصيص عمليات ما بعد التدريب ودمج تعليقات المحامين الخبراء. حقق النموذج الناتج زيادة بنسبة 83% في الاستجابات الواقعية وفضل المحامون مخرجات النموذج المخصص بنسبة 97% من الوقت على GPT-4.

الطابع الزمني:

اكثر من OpenAI