DeepMind دوباره این کار را انجام داده است.
پس از حل یک چالش اساسی در زیست شناسی -پیش بینی ساختار پروتئینو گره گشایی از ریاضیات نظریه گره، هدف آن یک فرآیند محاسباتی اساسی است که در هزاران برنامه روزانه تعبیه شده است. از تجزیه تصاویر به مدل سازی آب و هوا یا حتی با بررسی عملکرد داخلی شبکههای عصبی مصنوعی، هوش مصنوعی میتواند از نظر تئوری محاسبات را در طیف وسیعی از زمینهها سرعت ببخشد و کارایی را افزایش دهد و در عین حال مصرف انرژی و هزینهها را کاهش دهد.
اما تاثیرگذارتر است چگونه آنها انجام دادند. الگوریتم رکوردشکنی که AlphaTensor نامیده می شود، فرعی از آن است الفازرو، که معروف است بازیکنان انسان را در شطرنج و گو شکست داد.
هزاران سال است که الگوریتمها در سراسر تمدنهای جهان برای انجام عملیاتهای اساسی مورد استفاده قرار گرفتهاند. نوشت نویسندگان همکار Drs. متی بالوگ و الحسین فوزی در DeepMind. با این حال، کشف الگوریتم ها بسیار چالش برانگیز است.
AlphaTensor مسیری را برای دنیای جدیدی ایجاد میکند که در آن هوش مصنوعی برنامههایی را طراحی میکند که از هر چیزی که انسانها مهندسی میکنند بهتر عمل میکند، در حالی که به طور همزمان «مغز» ماشین خودش را بهبود میبخشد.
دکتر فدریکو لوی، یکی از ویراستاران ارشد در می گوید: «این کار با استفاده از هوش مصنوعی برای یک مسئله بهینه سازی که مردم دهه ها روی آن کار کرده اند، به قلمروی ناشناخته پیش می رود... راه حل هایی که پیدا می کند را می توان بلافاصله برای بهبود زمان اجرای محاسباتی توسعه داد. طبیعت، که منتشر شده مطالعه.
ضرب ماتریس را وارد کنید
مشکلی که AlphaTensor با آن مواجه است ضرب ماتریس است. اگر به طور ناگهانی سطرها و ستون هایی از اعداد سبز را تصور می کنید که به پایین صفحه نمایش شما می روند، شما تنها نیستید. به طور کلی، یک ماتریس به نوعی شبیه به آن است - شبکه ای از اعداد که به صورت دیجیتالی داده های انتخابی شما را نشان می دهد. این می تواند پیکسل ها در یک تصویر، فرکانس های یک کلیپ صوتی، یا ظاهر و عملکرد شخصیت ها در بازی های ویدیویی باشد.
ضرب ماتریسی دو شبکه اعداد را می گیرد و یکی در دیگری ضرب می کند. این یک محاسبه است که اغلب در دبیرستان تدریس می شود، اما برای سیستم های محاسباتی نیز حیاتی است. در اینجا، ردیفهایی از اعداد در یک ماتریس با ستونهایی در ماتریس دیگر ضرب میشوند. نتایج یک نتیجه را ایجاد می کند - برای مثال، دستوری برای بزرگنمایی یا کج کردن نمای شما از یک صحنه بازی ویدیویی. اگرچه این محاسبات در زیر کاپوت انجام می شود، هر کسی که از تلفن یا رایانه استفاده می کند به نتایج روزانه خود بستگی دارد.
می توانید ببینید که چگونه مشکل می تواند بسیار دشوار، بسیار سریع شود. ضرب ماتریس های بزرگ به شدت انرژی و زمان زیادی دارد. هر جفت عدد باید به صورت جداگانه ضرب شود تا یک ماتریس جدید ساخته شود. همانطور که ماتریس ها رشد می کنند، مشکل به سرعت غیرقابل دفاع می شود - حتی بیشتر از پیش بینی بهترین حرکات شطرنج یا Go. برخی کارشناسان تخمین می زنند که وجود دارد راه های بیشتر برای حل ضرب ماتریس از تعداد اتم های جهان.
در سال 1969، فولکر استراسن، ریاضیدان آلمانی، نشان داد که راههایی برای برش وجود دارد و یک دور از ضرب ماتریس دو در دو را کاهش داد. در مجموع هشت تا هفت. ممکن است چشمگیر به نظر نرسد، اما روش استراسن نشان داد که میتوان استانداردهای طولانی مدت عملیات - یعنی الگوریتمها - را برای ضرب ماتریس شکست داد. رویکرد او، الگوریتم Strassen، به عنوان کارآمدترین رویکرد برای بیش از 50 سال سلطنت کرده است.
اما اگر روشهای کارآمدتری هم وجود داشته باشد چه؟ دکتر فرانسوا لو گال در دانشگاه ناگویا در ژاپن که در این کار دخالتی نداشت، "هیچ کس بهترین الگوریتم را برای حل آن نمی داند." گفته شده فناوری MIT را نقد کنید. "این یکی از بزرگترین مشکلات باز در علوم کامپیوتر است."
الگوریتم های تعقیب هوش مصنوعی
اگر شهود انسان در حال تزلزل است، چرا به ذهن مکانیکی دست نزنید؟
در مطالعه جدید، تیم DeepMind ضرب ماتریس را به یک بازی تبدیل کرد. مشابه AlphaZero قبلی خود، AlphaTensor از یادگیری تقویتی عمیق استفاده می کند، یک روش یادگیری ماشینی که از روش یادگیری مغزهای بیولوژیکی الهام گرفته شده است. در اینجا، یک عامل هوش مصنوعی (اغلب یک شبکه عصبی مصنوعی) با محیط خود تعامل می کند تا یک مشکل چند مرحله ای را حل کند. اگر موفق شود، "پاداش" به دست می آورد - یعنی پارامترهای شبکه هوش مصنوعی به روز می شوند، بنابراین احتمال موفقیت مجدد در آینده بیشتر می شود.
مثل این است که یاد بگیریم پنکیک را برگردانیم. مقدار زیادی در ابتدا روی زمین می افتد، اما در نهایت شبکه های عصبی شما حرکات بازو و دست را برای یک تلنگر کامل یاد می گیرند.
زمین تمرین AlphaTensor نوعی بازی رومیزی سه بعدی است. این در اصل یک پازل تک نفره است که تقریباً شبیه سودوکو است. هوش مصنوعی باید شبکه های اعداد را در کمترین گام ممکن ضرب کند، در حالی که از بین هزاران حرکت مجاز – بیش از یک تریلیون حرکت انتخاب می کند.
این حرکات مجاز به دقت در AlphaTensor طراحی شده بودند. در یک کنفرانس مطبوعاتی، دکتر حسین فوزی، یکی از نویسندگان این مقاله توضیح داد: "فرمول بندی فضای کشف الگوریتمی بسیار پیچیده است... حتی سخت تر این است که چگونه می توانیم در این فضا حرکت کنیم."
به عبارت دیگر، وقتی با مجموعهای از گزینهها مواجه میشویم، چگونه میتوانیم آنها را محدود کنیم تا شانس خود را برای یافتن سوزن در انبار کاه افزایش دهیم؟ و چگونه می توانیم بهترین استراتژی را برای رسیدن به سوزن بدون کندن کل انبار کاه داشته باشیم؟
یکی از ترفندهایی که تیم در AlphaTensor گنجانده است، روشی به نام جستجوی درختی است. بهجای استعاره، در اینجا هوش مصنوعی «جادههایی» را بررسی میکند که میتواند به نتیجه بهتری منجر شود. سپس یادگیری های متوسط به هوش مصنوعی کمک می کند تا حرکت بعدی خود را برای افزایش شانس موفقیت برنامه ریزی کند. این تیم همچنین نمونههای الگوریتم بازیهای موفق را نشان داد، مانند آموزش حرکات آغازین شطرنج به کودک. در نهایت، هنگامی که هوش مصنوعی حرکات ارزشمندی را کشف کرد، تیم به آن اجازه داد تا برای یادگیری مناسبتر در جستجوی نتیجه بهتر، آن عملیات را دوباره ترتیب دهد.
شکستن زمین جدید
AlphaTensor خوب بازی کرد. در یک سری آزمایش، تیم هوش مصنوعی را به چالش کشید تا مؤثرترین راهحلها را برای ماتریسهای پنج در پنج بیابد، یعنی هر کدام با پنج عدد در یک ردیف یا ستون.
این الگوریتم به سرعت هک اصلی Strassen را دوباره کشف کرد، اما سپس از تمام راه حل هایی که قبلا توسط ذهن انسان ابداع شده بود، پیشی گرفت. با آزمایش هوش مصنوعی با اندازههای مختلف ماتریس، AlphaTensor راهحلهای کارآمدتری برای بیش از ۷۰ مورد پیدا کرد. تیم گفت: «در واقع، AlphaTensor معمولاً هزاران الگوریتم را برای هر اندازه ماتریس کشف میکند. "این گیج کننده است."
در یک مورد، با ضرب یک ماتریس پنج در پنج با یک ماتریس چهار در پنج، هوش مصنوعی رکورد قبلی 80 ضرب منفرد را تنها به 76 کاهش داد. همچنین در ماتریس های بزرگتر درخشید و تعداد محاسبات مورد نیاز برای دو را کاهش داد. ماتریس یازده در یازده از 919 تا 896.
اثبات مفهوم در دست، تیم به استفاده عملی روی آورد. تراشههای کامپیوتری اغلب برای بهینهسازی محاسبات مختلف طراحی میشوند - مثلاً GPU برای گرافیک یا تراشه های هوش مصنوعی برای یادگیری ماشین- و تطبیق یک الگوریتم با بهترین سخت افزار مناسب، کارایی را افزایش می دهد.
در اینجا، تیم از AlphaTensor برای یافتن الگوریتمهایی برای دو تراشه محبوب در یادگیری ماشین استفاده کرد: GPU NVIDIA V100 و Google TPU. در مجموع، الگوریتم های توسعه یافته توسط هوش مصنوعی سرعت محاسبات را تا 20 درصد افزایش دادند.
سخت است بگوییم که آیا هوش مصنوعی میتواند سرعت گوشیهای هوشمند، لپتاپها یا دیگر دستگاههای روزمره را نیز افزایش دهد. با این حال، دکتر ویرجینیا ویلیامز از MIT گفت: «اگر بتوان از آن در عمل استفاده کرد، این پیشرفت بسیار هیجان انگیز خواهد بود. افزایش عملکرد، بسیاری از برنامه ها را بهبود می بخشد.
ذهن یک هوش مصنوعی
علیرغم اینکه AlphaTensor آخرین رکورد انسانی را برای ضرب ماتریس شکست داده است، تیم DeepMind هنوز نمی تواند دلیل آن را توضیح دهد.
دکتر پوشمیت کوهلی، دانشمند و یکی از نویسندگان DeepMind در یک نشست مطبوعاتی گفت: «این شهود شگفت انگیز را با انجام این بازی ها به دست آورده است.
الگوریتمهای در حال تکامل نیز لازم نیست انسان در مقابل ماشینها باشند.
در حالی که AlphaTensor پلهای به سوی الگوریتمهای سریعتر است، حتی میتوانند الگوریتمهای سریعتری نیز وجود داشته باشند. بالوگ و فوزی نوشتند: «از آنجایی که باید جستجوی خود را به الگوریتمهایی با فرم خاص محدود کند، ممکن است انواع دیگر الگوریتمهایی را که ممکن است کارآمدتر باشند، از دست بدهد».
شاید یک مسیر حتی جذاب تر، شهود انسان و ماشین را با هم ترکیب کند. "خوب است که بفهمیم آیا این روش جدید واقعاً همه روش های قبلی را در بر می گیرد یا اینکه می توانید آنها را ترکیب کنید و چیز بهتری بدست آورید." گفت: ویلیامز سایر کارشناسان نیز موافق هستند. با انبوهی از الگوریتمها، دانشمندان میتوانند برای یافتن سرنخهایی در مورد آنچه که راهحلهای AlphaTensor را نشان میدهد، کالبد شکافی آنها را آغاز کنند و راه را برای پیشرفت بعدی هموار کنند.
اعتبار تصویر: DeepMind