כוחה של למידה מתמשכת

כוחה של למידה מתמשכת

הכוח של למידה מתמשכת של PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

במהלך 2.5 השנים הראשונות שלי ב-OpenAI, עבדתי בצוות הרובוטיקה על רעיון של צילום ירח: רצינו ללמד יד רובוט יחידה דמוית אדם לפתור את הקובייה של רוביק. זו הייתה חוויה מרגשת, מאתגרת ומרגשת. אָנוּ נפתר האתגר עם למידה מעמיקה של חיזוקים (RL), כמויות מטורפות של אקראי תחום, וללא נתוני אימון מהעולם האמיתי. חשוב מכך, כבשנו את האתגר כצוות.

מסימולציה ואימון RL ועד תפיסת ראייה וקושחת חומרה, שיתפנו פעולה באופן הדוק ומלוכד כל כך. זה היה ניסוי מדהים ובמהלך הזמן הזה, חשבתי לעתים קרובות על סטיב ג'ובס שדה עיוות המציאות: כשאתה מאמין במשהו כל כך חזק וממשיך לדחוף אותו כל כך בהתמדה, איכשהו אתה יכול להפוך את הבלתי אפשרי לאפשרי.

מתחילת 2021 התחלתי להוביל את צוות מחקר בינה מלאכותית יישומית. ניהול צוות מציג סט אחר של אתגרים ודורש שינויים בסגנון העבודה. אני הכי גאה במספר פרויקטים הקשורים לבטיחות מודלים של שפה בתוך AI יישומי:

  1. תכננו ובנו קבוצה של נתוני הערכה ומשימות כדי להעריך את הנטייה של מודלים של שפה שהוכשרו מראש ליצור תוכן שנאה, מיני או אלים.
  2. יצרנו טקסונומיה מפורטת ובנינו מסווג חזק ל לזהות תוכן לא רצוי כמו גם הסיבה לכך שהתוכן אינו הולם.
  3. אנו עובדים על טכניקות שונות כדי להפחית את הסיכוי שהמודל יפיק פלטים לא בטוחים.

בזמן שצוות הבינה המלאכותית היישומית מתרגלת את הדרך הטובה ביותר לפרוס טכניקות בינה מלאכותית מתקדמות, כגון מודלים גדולים של שפה מאומנים מראש, אנו רואים עד כמה הם חזקים ושימושיים עבור משימות בעולם האמיתי. אנו גם מודעים לחשיבות של פריסה בטוחה של הטכניקות, כפי שהודגש ב האמנה שלנו.

בול זמן:

עוד מ OpenAI