קוד פתוח של גוגל מזהה קובץ Magika AI

קוד פתוח של גוגל מזהה קובץ Magika AI

קוד פתוח של גוגל מזהה קבצים מדגם Magika AI PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

גוגל יצרה את Magika בקוד פתוח, מזהה קבצים המופעל על ידי למידה חישובית, כחלק מיוזמת הגנת AI Cyber ​​Defense, שמטרתה לתת למגיני רשתות IT ואחרים כלים אוטומטיים טובים יותר.

לבחון את התוכן האמיתי של קובץ שנשלח על ידי המשתמש הוא אולי קשה יותר ממה שהוא נראה. זה לא בטוח להניח את סוג הקובץ מהסיומת שלו, נגיד, ובהסתמך על היוריסטיות וחוקים שנעשו על ידי אדם - כמו אלה בשימוש נרחב ליבמגית - לזהות את הטבע הממשי של מסמך מהנתונים שלו הוא, לדעת גוגל, "גוזל זמן ונוטה לשגיאות".

בעצם, אם מישהו מעלה קובץ JPG לשירות המקוון שלך, אתה רוצה להיות בטוח שזו תמונת JPEG ולא איזה סקריפט שמתחזה לכזה, שעלול לנשוך אותך מאוחר יותר בתחת. כנסו ל-Magika, שמשתמשת במודל מאומן כדי לזהות במהירות סוגי קבצים מנתוני קבצים, וזו גישה שלדעת Big G עובדת מספיק טוב כדי להשתמש בה בייצור. מגיקה משמשת, כך נאמר, את Gmail, Google Drive, הגלישה הבטוחה של Chrome ו-VirusTotal כדי לזהות ולנתב נתונים כראוי לעיבוד נוסף.

הקילומטראז' שלך עשוי להשתנות. Libmagic, למשל, עשוי לעבוד מספיק טוב בשבילך. בכל מקרה, Magika היא דוגמה לכך שגוגל משתמשת באופן פנימי בבינה מלאכותית כדי לחזק את האבטחה שלה, ומקווה שגם אחרים יוכלו להפיק תועלת מהטכנולוגיה הזו. דוגמה נוספת תהיה RETVec, שהוא מודל רב שפות לעיבוד טקסט המשמש לאיתור דואר זבל. זה מגיע בזמן שכולנו מוזהרים שככל הנראה הטוענים עושים שימוש רב יותר בתוכנות למידת מכונה כדי להפוך פריצות ומחקר פגיעות לאוטומטי.

לקובעי מדיניות, לאנשי אבטחה ולחברה האזרחית יש הזדמנות להטות סוף סוף את מאזן אבטחת הסייבר מתוקפים למגני סייבר

"AI נמצאת בצומת דרכים מוחלטת - כזו שבה לקובעי מדיניות, למומחי אבטחה ולחברה האזרחית יש הזדמנות להטות סוף סוף את מאזן אבטחת הסייבר מתוקפים למגיני סייבר", פיל ונבלס, קצין אבטחת מידע ראשי ב-Google Cloud, ורויאל הנסן, מספר הנדסה לפרטיות, בטיחות ואבטחה, אמר ביום שישי. 

"ברגע שבו שחקנים זדוניים מתנסים ב-AI, אנחנו צריכים פעולה נועזת ובזמן כדי לעצב את הכיוון של הטכנולוגיה הזו."

בני הזוג מאמינים מגיקה יכולים לשמש מגיני רשת כדי לזהות, במהירות ובקנה מידה, את התוכן האמיתי של קבצים, המהווה שלב ראשון בניתוח תוכנות זדוניות וזיהוי פריצות. למען האמת, מודל למידה עמוקה זה יכול להיות שימושי עבור כל מי שצריך לסרוק מסמכים שסופקו על ידי המשתמש: סרטונים שהם למעשה קובצי הפעלה, למשל, צריכים להפעיל אזעקה כלשהי ודורשים בדיקה מדוקדקת יותר. יש להכניס להסגר קבצים מצורפים לאימייל שאינם מה שהם אומרים. קלטת את הרעיון.

באופן כללי יותר, בהקשר של אבטחת סייבר, מודלים של AI יכולים לא רק לבדוק קבצים לאיתור תוכן חשוד וקוד מקור לאיתור פגיעויות, הם יכולים גם ליצור תיקונים לתיקון באגים, טענו אנשי גוגל. המהנדסים של המגה קורפ התנסו מזל תאומים כדי לשפר גם את הטיוב האוטומטי של פרויקטי קוד פתוח.

גוגל טוענת ש-Magika מדויקת ב-50% יותר בזיהוי סוגי קבצים מאשר מערכת הכללים הקודמת של ה-Biz של Biz, לוקחת אלפיות שנייה לזהות סוג קובץ, ונאמר שיש לה דיוק של לפחות 99% בבדיקות. עם זאת, הוא אינו מושלם ואינו מצליח לסווג סוגי קבצים כשלושה אחוזים מהמקרים. זה מורשה תחת Apache 2.0, הקוד הוא כאן, והדגם שלו שוקל 1MB.

בהתרחקות מ-Magika, מפעל השוקולד גם, כחלק מיוזמת הגנת הסייבר של AI החדשה, ישתף פעולה עם 17 סטארט-אפים בבריטניה, ארה"ב ואירופה, ויכשיר אותם להשתמש בכלים אוטומטיים מסוג זה כדי לשפר את האבטחה שלהם. 

היא גם תרחיב את תוכנית סמינרי אבטחת הסייבר שלה בסך 15 מיליון דולר כדי לעזור לאוניברסיטאות להכשיר יותר סטודנטים אירופאים באבטחה. קרוב יותר לבית, היא התחייבה במענקים של 2 מיליון דולר למימון מחקר בנושא עבירות סייבר וכן מודלים של שפות גדולות לתמיכה באקדמאים באוניברסיטת שיקגו, קרנגי מלון וסטנפורד.

"מהפכת הבינה המלאכותית כבר בעיצומה. בעוד שאנשים מברכים בצדק על ההבטחה של תרופות חדשות ופריצות דרך מדעיות, אנחנו גם נרגשים מהפוטנציאל של בינה מלאכותית לפתור אתגרי אבטחה דוריים תוך קירוב לעולם הדיגיטלי הבטוח, המאובטח והאמין שמגיע לנו", סיכמו Venables והאנסן. ®

בול זמן:

עוד מ הקופה