איך ה-IA הגנרטיבי ישבש הכל בעשור הנוכחי

הועלה מחדש על ידי אפלטון

עוקב: 0

רבים יופתעו

In בחודשים האחרונים, מערכות בינה מלאכותית כמו Midjourney, DALL-E, Stable Diffusion, LaMDA ו-PaLM עשו צעדים גדולים בתחומים שכנראה מגוונים כמו יצירת תמונות וטקסט. היכולות של מערכות אלו מרשימות: הן מייצרות תמונות מרמזות ביותר, יוצרות עותק מכירה אפקטיבי לפרסום, ועוד הרבה הרבה יותר - הכל מ"הנחיות" בלבד שמתארות מה המשתמש רוצה לקבל.

כל זה נעשה עם AI Generative.

"AI גנרי" מתייחס למערכות המופעלות על ידי רשתות עצביות עמוקות שמיישמים דגמי שפה גדולים (LLM) על מנת לִיצוֹר סוג של תוכן. כאן אני אומר "צור", כלומר זה לא עותק של משהו שכבר קיים, לא במובן הפילוסופי (מהי בכלל "יצירה"?).

חברות חדשות גדולות צצות בעולם החדש והאמיץ הזה, כמו יָשׁפֵה, שמציע יצירת עותק מוכר וגם תמונות לפרסום: לג'ספר יש כעת שווי של יותר ממיליארד דולר, והופך לחד קרן בן לילה.

פלטפורמת הבינה המלאכותית הגנרטיבית הראשונה שבאמת עשתה חיל הייתה GPT-3 - שיצא רק לפני כמה שנים! לאחר מכן, רצף מהדורות של כמה שחקנים בתחום (OpenAI, Google, StableDiffusion, Google, DeepMind ואחרים) הופיעו בקצב שובר צוואר, עד כדי כך שקשה להישאר מעודכן.

אבל מעבר לכמה כיף ופנטסטי זה לבלות זמן מה עם Midjourney ליצירת תמונות מההנחיות שלנו, חובבי טכנולוגיה רבים מתקשים להבין את גל ה-IA Generative.

האם Generative IA הוא טרנד מוצק, או שזה רק אופנה?

אני אלך על "מגמה איתנהכי זה ישנה אלפי פעילויות מקצועיות ופנאי בהיקף העשור הזה. תן לי להתחיל עם דוגמה.

אני חובב טניס עצום (לפחות במובן הטלוויזיה). אבל משחקי טניס בשידור חי לוקחים שעות לסיום, ויש לי פעילויות ותחומי עניין אחרים, אז אני בדרך כלל פונה לצפייה בשידורים חוזרים או סתם מדגיש סרטונים עם 4 הדקות המשעשעות ביותר בערך מהמשחק.

אבל מה אם במקום סרטון של 4 דקות, אני רוצה סרטון של 10 או 15 דקות? או אם אני רוצה לכלול כל נקודה בשובר השוויון? כרגע אין לי מזל.

כעת הנח את כובע ה-Generative-IA שלך בעבודה: מחולל סרטוני ספורט Generative IA ייצור סרטון רק בשבילך לפי המפרטים שהכנסת באופן לא רשמי בהודעת טקסט כמו הבאה:

"סרטון של כ-15 דקות עם הנקודות הכי משעשעות במשחק רפא נדאל נגד טומי פול בפריז ברסי 2022, כולל שובר שוויון מלא אם בכלל, כמו גם כל נקודת שבירה שהומרת"

זהו זה. אתה מקבל קישור לסרטון המותאם אישית שלך, שונה מסרטון שצפה בו כל אחד אחר בעולם. ושירות הווידאו הזה יהיה כדאי כלכלית כמו DALL-E ו-Midjourney.

מחקר שונה מחדשנות. הראשון עוסק בתוצאות מקוריות שפורסמו, והאחרון קשור יותר למציאת איך לבנות עסק מהתוצאות האלה: לחדשנות לא אכפת ממקוריות אלא מצמיחה, הגנה, החזר השקעה וכו'.

לעתים קרובות דברים מתבלבלים כי מחקרים נעשים על ידי חברות כמו גוגל, שבאופן עקרוני נועדו להרוויח - אבל הם מבינים שהעסק שלהם הוא היי-טק, ו הטכנולוגיה אינה גבוהה ללא מחקר. אז הם מעורבים במימון מחקר, כמו גם בהתקרבות לאקדמיה - רבים מהחוקרים הבכירים שלהם נשכרו מהאקדמיה. בתור חוקר בעצמי, הוזמנתי לפסגת פקולטה במטה שלהם במאונטיין ויו לפני כמה שנים, והם שיכנו אותי בסוויטה במלון Four Seasons - מה שנדרש כדי לעשות רושם טוב על הקהילה האקדמית!

אבל גם אם זה יכול להיות קשה - ואפילו מלאכותי - לעשות חתך ברור בין מחקר לחדשנות, ההבדל הוא מכריע כאן מכיוון שבמקרה של Generative AI, השניים יפותחו על ידי שחקנים שונים, והם יהיו קשורים עם שתי שכבות שונות בערימת התוכנה -as ציין ג'יי קורייר:

שכבת התוכנה התחתונה היא מודל Deep Learning, בנוי סביב יישומים של מודלים של שפה גדולה (LLM) או ייצוג פנימי שווה ערך. מודלים מספקים את אבן הבניין הבסיסית ממנה ניתן לפתח יישומים.
שכבת התוכנה העליונה היא יישום האחד, שמתבסס על מודל Deep Learning כדי לבצע משימה ספציפית, למשל, פלט תמונה מהודעת טקסט.

ארכיטקטורה דו-שכבתית זו תתדלק עידן חדש של חדשנות מואצת, מכיוון שברגע שהשכבה התחתונה פותחה על ידי חברות גדולות מאוד כמו גוגל, OpenAI ואחרות, חברות קטנות יותר יספקו את שכבת האפליקציות - מה שייתן, כמובן, חתך מהרווח שלהן לספק השכבה התחתונה.

נכון לעכשיו, השכבה התחתונה שופרה במהירות - ולעתים קרובות, היא הופצה יחד עם יישום למעלה. לדוגמה, LaMDA ו-PaLM מציעות יכולות דיאלוג מחוץ לקופסה, בעוד ש-DALL-E ו-Midjourney מציעות שירותי הנחה לתמונה. אבל בקרוב, ריבוי חלופות הקוד הפתוח לשכבה התחתונה תאפשר לפתח רק את שכבת האפליקציה העליונה ולחבר אותה לשכבה תחתונה שכבר זמינה. קל לומר מאשר לעשות, כמובן, אבל העובדה היא שהשכבה התחתונה מורכבת בסדרי גודל יותר מהשכבה העליונה.

הייתי טוען ש-Generative IA יחלחל כמעט לכל עבודת ידע ופעילות פנאי מכיוון שהוא יספק כלים להרחקת מורכבות מפעילויות קשות בעבר ומכיוון שהוא יכול לספק רמה חדשה לגמרי של התאמה אישית שהייתי קורא לה "התאמה אישית יוצרת".

אתה יכול לראות מהי "התאמה אישית יוצרת" מדוגמה של סרטון הספורט למעלה: כל משתמש מקבל סרטון מדגיש חדש וייחודי במקום רק בחירה בין שתיים או שלוש אפשרויות.

קשה להגזים בהשפעה המצטברת מכל יישומי ה- Generative IA:

יצירה גרפית קלה כבר נמצאת בהישג ידם של אנשים שאינם אנשי מקצוע עם כלים כמו DALL-E, Midjourney ו-Stable Diffusion, לפחות למטרות תועלתניות פשוטות כמו קבלת תמונת כותרת לפוסט הזה. לפני השנה הזו, לגמרי לא הצלחתי לצייר תמונות משלי, ומומחי בלוג המליצו לא לבזבז זמן על עיצוב גרפי לסיפורים שלך.
משתמשי עריכת תמונות לא יצטרכו לסבול עקומת למידה קשה כדי לשלוט במערך הכלים המורכב של Photoshop או Affinity Photo (אני משתמש באחרונים, וזה כל כך מורכב שאני צריך להתייעץ עם מדריכי יוטיוב כדי ללמוד איך לבצע את רוב ההתאמות). עם AI Generative, המשתמשים פשוט יבקשו מהתוכנה לבצע טרנספורמציה נתונה, והרי! התמונה תתוקן. אם אדובי לא תצליח לספק AI Generative עם הכלים שלהם, הם יופרעו על ידי סטארט-אפים חדשים שיציעו להם וילכו בדרך של Blockbuster.
כלי מצגות כמו PowerPoint, במקום רק לספק תבניות כפי שהם עושים כעת, יפיקו ויכוונו מצגות שלמות ברמה המקצועית מתוך רעיונות מתאר. נכון לעכשיו, ההבדל בין מצגות מקצועיות לחובבות הוא עצום - זה לא יהיה כך יותר.
כתיבת טקסט תהיה תהליך משופר מאוד על ידי כלי AI Generative. צורות רבות של כתיבה כבר מקבלות עזרה מכלים מתוחכמים כמו Grammarly, אבל Generative AI יעניק לכותבים רמה חדשה של עזרה, למשל, על ידי יצירת גרסה ראשונה מלאה של בלוג. הכתיבה תהיה תהליך שיתופי בין בני אדם לכלי הבינה המלאכותית.
כל תוכנה המיועדת למשתמש סופי תצטרך להיות פשוטה לשימוש עם הודעות טקסט או קוליות. מדריכים למשתמש וסרטוני הדרכה יהיו נחלת העבר, וברגע שהמשתמשים יתרגלו לדרך הפשוטה החדשה של השימוש בתוכנה, הכל יצטרך להציע זאת כדי להישאר רלוונטי.
לימוד השפה ייעשה בעיקר בעזרת עוזרי קול, שיופעלו על ידי – ניחשתם נכון – AI Generative. עוזרי קול, שיפעלו כמו מאמני שפה אישיים, ישתמשו ביכולות הדיאלוג המדהימות של השפה הטבעית שלהם, שנראו לראשונה במערכות כמו LaMDA של גוגל, כדי להדריך את לומד השפה האנושית על מנת לרכוש אוצר מילים וביטויים, לשפר את ההגייה וכו'. הוראת שפה עוזרי קול הם לא פנטזיה עתידנית - זה פשוט הגיוני כלכלי נכון לעכשיו.
אפילו למוצרי חומרה (כמו מכוניות) יהיו מערכות עזרה מבוססות דיאלוג של AI Generative. ניסיתם לבצע פעולה מורכבת כמו התאמת התצוגה במכוניות מודרניות? לא קל, אני יכול להגיד לך. במקום לחפור במדריכים מורכבים, פשוט תבקש מהעוזרת הקולית לקבל הוראות או לבצע ישירות את ההתאמות.

מקצועות רבים ישתנו ללא הכר. מעצבים גרפיים כבר מרגישים את העוקץ של השיבוש הזה. מקצועות שלמים ייעלמו, וייווצרו אחרים. חברות חזקות יפשטו את הרגל, וחברות חדשות יהפכו לדומיננטיות, תלוי באיזו יעילות הן מתמודדות עם ההפרעה הטכנולוגית שהביאה ל-Generative AI.

וכל זה יקרה בתוך העשור הזה.

יכול להיות שאני טועה, אבל נראה לי שהיה קשה, אפילו לאנשי טכנולוגיה ותיקים, לחזות את היכולות העצומות של מחוללי התמונות והטקסט הנוכחיים: לא היה ברור לפני כמה שנים שדגמי ענק וערכות אימונים יצליחו להוביל ליכולות שונות מבחינה איכותית.

הייתי מרחיק לכת ואומר שזה היה ממצא בר מזל, כמעט אקראי. אבל עכשיו, כשיש לנו כלים מחוללים, השערים פתוחים לחברות חדשניות שיפתחו אפליקציה אחרי אפליקציה בקצב מהיר: זה בעיקר עניין של להבין מה אפשר לשפר באופן קיצוני ולמצוא את המודל העסקי המתאים לעשות ממנו עסק רעיון IA Generative.

לפני כמה שנים, נראה היה שמגמות טכנולוגיות אחרות, כמו מכוניות בנהיגה עצמית, VR או בלוקצ'יין, ישתלטו בקרוב, אבל טכנולוגיה לנהיגה עצמית הוגבלה על ידי מכשולים חקיקתיים, בלוקצ'יין נפגע מהשפל הכלכלי ו-VR האימוץ מוגבל על ידי עלויות גבוהות בחומרה. AI גנרטיבי, במקום זאת, עדיין לא מוגבל על ידי חקיקה (היי, ליטוש מצגת PowerPoint או יצירת סרטון ספורט זה לא עניין של חיים או מוות) ואינו מצריך חומרה יקרה כדי לקנות על ידי המשתמש.

ולא חשבנו שפעילות יצירתית תופרע כל כך מהר. אבל הם היו.

אנחנו נכנסים לזמנים חדשים ולפעמים מוזרים, שבהם היצירתיות האנושית מעורבת עם היכולות החדשות של המכונות עד שקשה להבחין ביניהן. כפי ש ג'יי קורייר מציין:

"היום ובמשך השנים הקרובות, זה ירגיש מפתיע ובהרבה מובנים מפחיד. כי הרגעים היצירתיים האלה שבהם אתה עובר מאפס לרעיונות-ראשוניים תמיד הרגישו אנושיים בצורה כל כך ייחודית, כי זה היה כל כך מסתורי".

כיצד IA גנרטיבי ישבש הכל בעשור הנוכחי פורסם מחדש ממקור https://towardsdatascience.com/how-generative-ia-will-disrupt-everything-in-the-current-decade-b4e8ce7dd4f1?source=rss—-7f60cf5620c9— 4 דרך https://towardsdatascience.com/feed

<!–

בול זמן: 10 בנובמבר 202211 בנובמבר 2022