قدرت یادگیری مستمر

بازنشر افلاطون

دنبال: 0

قدرت یادگیری مداوم هوش داده PlatoBlockchain. جستجوی عمودی Ai.

در طول 2.5 سال اولم در OpenAI، من روی یک ایده مهتابی روی تیم Robotics کار کردم: می‌خواستیم به یک دست رباتی شبیه به انسان آموزش دهیم تا مکعب روبیک را حل کند. این یک تجربه فوق العاده هیجان انگیز، چالش برانگیز و احساسی بود. ما حل شد چالش با یادگیری تقویتی عمیق (RL)، مقادیر دیوانه کننده تصادفی سازی دامنه، و بدون داده های آموزشی در دنیای واقعی. مهمتر از آن، ما به عنوان یک تیم این چالش را فتح کردیم.

از شبیه سازی و آموزش RL گرفته تا درک بینایی و سیستم عامل سخت افزار، ما بسیار نزدیک و منسجم با هم همکاری کردیم. این یک آزمایش شگفت‌انگیز بود و در آن زمان، اغلب به استیو جابز فکر می‌کردم. میدان تحریف واقعیت: وقتی به چیزی خیلی باور داشته باشی و آنقدر پیگیرانه به آن فشار بیاوری، به نوعی می توانی غیرممکن ها را ممکن کنی.

از ابتدای سال 2021، من رهبری تیم تحقیقاتی کاربردی هوش مصنوعی را آغاز کردم. مدیریت یک تیم مجموعه‌ای از چالش‌ها را به همراه دارد و نیاز به تغییر سبک کار دارد. من به چندین پروژه مرتبط با ایمنی مدل زبان در هوش مصنوعی کاربردی افتخار می کنم:

مجموعه‌ای از داده‌ها و وظایف ارزیابی را برای ارزیابی تمایل مدل‌های زبانی از پیش آموزش‌دیده برای تولید محتوای نفرت‌آمیز، جنسی یا خشونت‌آمیز طراحی و ساخته‌ایم.
ما یک طبقه بندی دقیق ایجاد کردیم و یک طبقه بندی قوی برای آن ساختیم شناسایی محتوای ناخواسته و همچنین دلیل نامناسب بودن محتوا.
ما روی تکنیک‌های مختلفی کار می‌کنیم تا مدل کمتر احتمال تولید خروجی‌های ناامن را داشته باشد.

از آنجایی که تیم هوش مصنوعی کاربردی بهترین راه را برای به کارگیری تکنیک‌های پیشرفته هوش مصنوعی، مانند مدل‌های بزرگ زبان از پیش آموزش‌دیده، تمرین می‌کند، می‌بینیم که چقدر برای کارهای دنیای واقعی قدرتمند و مفید هستند. ما همچنین از اهمیت به کارگیری ایمن تکنیک ها آگاه هستیم، همانطور که در اینجا تاکید شده است منشور ما.