در یک مطالعه پیشگام، تیمی از دانشگاه کارولینای شمالی، چپل هیل، موضوع مبرم حفظ داده ها در مدل های زبان بزرگ (LLM) مانند ChatGPT در OpenAI و Bard گوگل را روشن کرده است.
علیرغم تلاشهای حذف، پیچیدگیهای این مدلهای هوش مصنوعی همچنان رو به افزایش است اطلاعات حساس، گفتگوی جدی را در مورد امنیت اطلاعات و اخلاق هوش مصنوعی برانگیخت.
معمای داده «حذف نشدنی».
محققان تلاشی را برای بررسی ریشه کنی اطلاعات حساس از LLM آغاز کردند. با این حال، آنها به طور تصادفی به یک وحی رسیدند. حذف چنین دادههایی دشوار است، اما تأیید حذف، چالشی برابر ایجاد میکند. این غولهای هوش مصنوعی پس از آموزش بر روی مجموعه دادههای گسترده، دادهها را در پیچ و خم پیچیده پارامترها و وزن خود ذخیره میکنند.
این مخمصه زمانی بد می شود که مدل های هوش مصنوعی ناخواسته دادههای حساس مانند شناسههای شخصی یا سوابق مالی منتشر میشود که به طور بالقوه زمینهای برای استفادههای شوم فراهم میکند.
محققان دریافتند LLM هایی مانند ChatGPT داده های حساس را حتی پس از "حذف" خروجی می دهند - https://t.co/P5QG8eGxwE
— ⚡️John The Collector⚡️ (@JohnTheCollectr) اکتبر 2، 2023
علاوه بر این، هسته اصلی این موضوع در طرح اولیه طراحی این مدل ها قرار دارد. مرحله مقدماتی شامل آموزش در پایگاه داده های وسیع و تنظیم دقیق برای اطمینان از خروجی های منسجم است. اصطلاح "ترانسفورماتور از پیش آموزش داده شده تولیدی" که در GPT محصور شده است، نگاهی اجمالی به این مکانیسم ارائه می دهد.
محققان UNC یک سناریوی فرضی را توضیح دادند که در آن یک LLM با استفاده از مجموعه ای از داده های بانکی حساس، به یک تهدید بالقوه تبدیل می شود. نردههای محافظ امروزی که توسعهدهندگان هوش مصنوعی به کار میگیرند، نمیتوانند این نگرانی را برطرف کنند.
این اقدامات حفاظتی، مانند اعلانهای کدگذاری سخت یا پارادایم معروف به یادگیری تقویتی از بازخورد انسانی (RLHF)، نقش حیاتی در مهار خروجیهای نامطلوب ایفا میکنند. با این حال، آنها هنوز دادهها را در ورطه مدل کمین میکنند و آماده احضار شدن با بازنویسی مجدد یک درخواست هستند.
پل زدن شکاف امنیتی
علیرغم به کارگیری روشهای پیشرفته ویرایش مدل مانند ویرایش مدل رتبه یک، تیم UNC کشف کرد که اطلاعات واقعی قابل توجهی در دسترس هستند. یافتههای آنها نشان داد که حقایق را میتوان در حدود 38 و 29 درصد مواقع از طریق حملات جعبه سفید و جعبه سیاه احیا کرد.
در جستجوی خود، محققان از مدلی به نام GPT-J استفاده کردند. با 6 میلیارد پارامتر خود، در مقایسه با GPT-3.5 بسیار کوتوله است. مدل پایه برای ChatGPT با 170 میلیارد پارامتر این تضاد آشکار به چالش بزرگ پاکسازی مدلهای بزرگتر مانند GPT-3.5 از دادههای غیرمجاز اشاره دارد.
علاوه بر این، محققان UNC روشهای دفاعی جدیدی را برای محافظت از LLM در برابر «حملات استخراج» خاص ایجاد کردند. این طرحهای پلید از نردههای محافظ مدل برای استخراج دادههای حساس سوء استفاده میکنند. با این وجود، این مقاله به طرز شومی به یک بازی همیشگی موش و گربه اشاره کرد، جایی که استراتژیهای دفاعی برای همیشه تاکتیکهای تهاجمی در حال تکامل را تعقیب میکنند.
مایکروسافت یک تیم هسته ای را برای تقویت هوش مصنوعی اعزام می کند
در یک یادداشت مرتبط، قلمرو در حال رشد هوش مصنوعی، غولهای فناوری مانند مایکروسافت را به سمت سرزمینهای ناشناخته سوق داده است. تشکیل اخیر مایکروسافت از یک تیم انرژی هسته ای برای تقویت ابتکارات هوش مصنوعی بر افزایش تقاضاها و آینده درهم تنیده هوش مصنوعی و منابع انرژی تاکید می کند. با تکامل مدلهای هوش مصنوعی، اشتهای آنها برای انرژی افزایش مییابد و راه را برای راهحلهای نوآورانه برای برآوردن این تقاضای فزاینده هموار میکند.
مایکروسافت تیم انرژی هسته ای برای پشتیبانی از هوش مصنوعی تشکیل می دهد: گزارشhttps://t.co/OvAGclfMnt#اخبار #crypto # بیت کوین #فراگیری ماشین # مایکروسافت #اخبار #فن آوری https://t.co/OvAGclfMnt
- اخبار مهم کریپتو: آخرین اخبار کریپتو و بیت کوین (@CryptoBreakNews) اکتبر 1، 2023
گفتمان پیرامون حفظ و حذف داده ها در LLM ها از دالان های دانشگاهی فراتر می رود. این یک بررسی کامل و یک گفتگوی گسترده در صنعت را برای ایجاد یک چارچوب قوی که امنیت داده ها را تضمین می کند و در عین حال رشد و پتانسیل هوش مصنوعی را تقویت می کند، فرا می خواند.
این سرمایه گذاری توسط محققان UNC گامی قابل توجه به سمت درک و در نهایت حل مشکل داده های "غیرقابل حذف" است، که گامی نزدیک تر به تبدیل هوش مصنوعی به ابزار ایمن تر در عصر دیجیتال است.
- محتوای مبتنی بر SEO و توزیع روابط عمومی. امروز تقویت شوید.
- PlatoData.Network Vertical Generative Ai. به خودت قدرت بده دسترسی به اینجا.
- PlatoAiStream. هوش وب 3 دانش تقویت شده دسترسی به اینجا.
- PlatoESG. کربن ، CleanTech، انرژی، محیط، خورشیدی، مدیریت پسماند دسترسی به اینجا.
- PlatoHealth. هوش بیوتکنولوژی و آزمایشات بالینی. دسترسی به اینجا.
- منبع: https://metanews.com/llms-like-chatgpt-persistently-leak-sensitive-data-despite-deletion-efforts/
- : دارد
- :است
- :جایی که
- 1
- 7
- a
- دانشگاهی
- در دسترس
- پس از
- سن
- AI
- مدل های هوش مصنوعی
- an
- و
- اشتها
- دور و بر
- AS
- At
- حمله
- تلاشها
- بانکداری
- BE
- شود
- بوده
- غول ها
- بیلیون
- بیت کوین
- اخبار بیت کوین
- طرح
- تقویت کنید
- شکستن
- آخرین اخبار
- جوانه زدن
- اما
- by
- CAT
- به چالش
- تعقیب
- GPT چت
- نزدیک
- منسجم
- مقایسه
- پیچیده
- نگرانی
- معاصر
- ادامه دادن
- کنتراست
- گفتگو
- هسته
- میتوانست
- طراحی شده
- عضو سازمانهای سری ومخفی
- ممانعت
- داده ها
- امنیت داده ها
- پایگاه های داده
- مجموعه داده ها
- دفاع
- دفاعی
- نمایندگان
- تقاضا
- خواسته
- استقرار
- طرح
- توسعه دهندگان
- گفتگو
- دیجیتال
- عصر دیجیتال
- گفتگو
- کشف
- سوار شد
- به کار گرفته شده
- بسته بندی شده
- انرژی
- اطمینان حاصل شود
- تضمین می کند
- برابر
- اصول اخلاق
- حتی
- در نهایت
- تکامل یابد
- در حال تحول
- گستردگی
- بهره برداری
- حقایق
- سقوط
- باز خورد
- مالی
- پیدا کردن
- یافته ها
- ماهی
- برای
- برای همیشه
- فرم
- تشکیل
- پرورش دادن
- چارچوب
- از جانب
- آینده
- بازی
- نظر اجمالی
- گوگل
- زمینه سازی
- در حال رشد
- رشد
- بندرگاه
- داشتن
- نکات
- اما
- HTTPS
- انسان
- شناسه ها
- in
- ناخواسته
- اطلاعات
- امنیت اطلاعات
- ابتکارات
- ابتکاری
- در هم تنیده
- به
- پیچیدگی ها
- بررسی
- موضوع
- IT
- ITS
- شناخته شده
- زبان
- بزرگ
- بزرگتر
- آخرین
- نشت
- یادگیری
- ترک کردن
- سبک
- پسندیدن
- LLM
- ساخت
- معیارهای
- مکانیزم
- تولید گزارشات تاریخی
- روش
- مایکروسافت
- مدل
- مدل
- بسیار بزرگ و مهم
- جدید
- اخبار
- شمال
- کارولینای شمالی
- هستهای
- قدرت هسته ای
- پرورش دادن
- of
- توهین آمیز
- پیشنهادات
- on
- یک بار
- or
- خارج
- تولید
- مقاله
- نمونه
- پارامترهای
- سنگفرش
- همیشگی
- با پشتکار
- شخصی
- فاز
- پیشگام
- افلاطون
- هوش داده افلاطون
- PlatoData
- بازی
- به شمار
- پتانسیل
- بالقوه
- قدرت
- فشار
- مشکل
- پیشران
- محافظ
- جستجو
- اماده
- قلمرو
- اخیر
- سوابق
- مربوط
- باقی مانده است
- محققان
- منابع
- به ترتیب
- نگهداری
- نشان داد
- وحی
- تنومند
- نقش
- امن تر
- سناریو
- طرح ها
- عالمان
- تیم امنیت لاتاری
- حساس
- شدید
- ریختن
- سپر
- کوتاه
- قابل توجه
- مزایا
- حل کردن
- خاص
- کامل
- وضعیت هنر
- گام
- هنوز
- استراتژی ها
- گام های بلند برداشتن
- مهاجرت تحصیلی
- قابل توجه
- چنین
- پشتیبانی
- تاکتیک
- تیم
- فن آوری
- واژه شناسی
- سرزمین
- که
- La
- شان
- اینها
- آنها
- این
- تهدید
- از طریق
- زمان
- به
- ابزار
- طرف
- آموزش دیده
- آموزش
- فراتر می رود
- ترانسفورماتور
- درست
- تبدیل
- ثبت نشده
- تأکید
- درک
- دانشگاه
- بر
- استفاده
- استفاده
- وسیع
- ریسک
- تایید
- حیاتی
- مسیر..
- چه زمانی
- در حین
- با
- در داخل
- خواهد بود
- زفیرنت