كيف سيعطل الذكاء الاصطناعي التوليدي كل شيء في العقد الحالي

سوف يفاجأ الكثير

صورة للمؤلف مع انتشار مستقر

In في الأشهر الأخيرة، قطعت أنظمة الذكاء الاصطناعي مثل Midjourney، وDALL-E، وStable Diffusion، وLaMDA، وPaLM خطوات كبيرة في مجالات متنوعة مثل إنشاء الصور والنصوص. إن قدرات هذه الأنظمة مثيرة للإعجاب: فهي تنتج صورًا موحية للغاية، وتنشئ نسخة بيع فعالة للإعلانات، وأكثر من ذلك بكثير - كل ذلك من مجرد "مطالبات" تصف ما يريد المستخدم الحصول عليه.

كل هذا يتم باستخدام الذكاء الاصطناعي التوليدي.

يشير مصطلح "الذكاء الاصطناعي التوليدي" إلى الأنظمة التي يتم تشغيلها بواسطة الشبكات العصبية العميقة التي تنفذ نماذج اللغات الكبيرة (LLM) من أجل خلق نوع من المحتوى. هنا أقول "خلق"، بمعنى أنه ليس نسخة من شيء موجود بالفعل، وليس بالمعنى الفلسفي (ما هو "الخلق" على أي حال؟).

تظهر شركات جديدة كبيرة في هذا العالم الجديد الشجاع يشب، الذي يقدم إنشاء نسخ بيعية وأيضًا صور للإعلان: تبلغ قيمة Jasper الآن أكثر من مليار دولار، ليصبح وحيد القرن بين عشية وضحاها.

كانت منصة GPT-3 أول منصة توليدية للذكاء الاصطناعي تُحدِث تأثيرًا حقيقيًا، وتم إصدارها قبل عامين فقط! بعد ذلك، ظهرت سلسلة من الإصدارات من قبل العديد من اللاعبين في هذا المجال (OpenAI، وGoogle، وStableDiffusion، وGoogle، وDeepMind، وغيرها) بوتيرة مذهلة، لدرجة أنه أصبح من الصعب البقاء على اطلاع دائم.

ولكن بعيدًا عن مدى المتعة والروعة التي يتمتع بها قضاء بعض الوقت مع Midjourney لإنشاء صور من مطالباتنا، فإن العديد من المتحمسين للتكنولوجيا يكافحون لفهم موجة IA التوليدية هذه.

هل يعتبر IA التوليدي اتجاهًا قويًا أم أنه مجرد موضة؟

سأذهب ل"الاتجاه القوي"لأنه سيحول آلاف الأنشطة المهنية والترفيهية في نطاق هذا العقد. اسمحوا لي أن أبدأ بمثال.

أنا من أشد المعجبين بالتنس (على الأقل بالمعنى التلفزيوني). لكن مباريات التنس المباشرة تستغرق ساعات حتى تنتهي، ولدي أنشطة واهتمامات أخرى، لذلك عادةً ما ألجأ إلى مشاهدة الإعادة أو مجرد إلقاء الضوء على مقاطع الفيديو التي تحتوي على أكثر 4 دقائق مسلية أو نحو ذلك من المباراة.

ولكن ماذا لو كنت أريد 4 أو 10 دقيقة بدلاً من مقطع فيديو مدته 15 دقائق؟ أو إذا كنت أرغب في تضمين كل نقطة في فترات التعادل؟ أنا حاليا غير محظوظ.

الآن قم بتشغيل قبعة Geneative-IA الخاصة بك: سيقوم مولد الفيديو الرياضي Geneative IA بإنشاء مقطع فيديو فقط لك وفقًا للمواصفات التي وضعتها بشكل غير رسمي في رسالة نصية مثل ما يلي:

"فيديو مدته حوالي 15 دقيقة مع النقاط الأكثر إمتاعًا لمباراة رافا نادال ضد تومي بول في باريس بيرسي 2022، بما في ذلك الفواصل الفاصلة الكاملة إن وجدت، وكذلك كل نقطة توقف محولة"

هذا كل شيء. يمكنك الحصول على رابط للفيديو المخصص الخاص بك، والذي يختلف عن الفيديو الذي يشاهده أي شخص آخر في العالم. وستكون خدمة الفيديو هذه مجدية اقتصاديًا مثل DALL-E وMidjourney.

البحث يختلف عن الابتكار. الأول يهتم بالنتائج الأصلية المنشورة، والثاني له علاقة أكبر بإيجاد كيفية بناء مشروع تجاري من تلك النتائج: الابتكار لا يهتم بالأصالة بل بالنمو، وقابلية الدفاع، وعائد الاستثمار، وما إلى ذلك.

في كثير من الأحيان تصبح الأمور مربكة لأن البحث يتم من قبل شركات مثل جوجل، والتي من حيث المبدأ موجودة لتحقيق الربح - لكنهم يدركون أن أعمالهم تعتمد على التكنولوجيا المتقدمة، و التكنولوجيا ليست عالية دون البحث. لذا، فإنهم يشاركون في تمويل الأبحاث، فضلاً عن الاقتراب من الأوساط الأكاديمية - حيث تم تعيين العديد من كبار الباحثين لديهم من الأوساط الأكاديمية. باعتباري باحثًا، تلقيت دعوة لحضور قمة أعضاء هيئة التدريس في مقرهم الرئيسي في ماونتن فيو منذ عدة سنوات، وقد قاموا بإقامتي في جناح في فندق فور سيزونز - كل ما يلزم لترك انطباع جيد على المجتمع الأكاديمي!

ولكن حتى لو كان من الصعب – بل وحتى المصطنع – الفصل بشكل واضح بين البحث والابتكار، فإن الفرق مهم هنا لأنه، في حالة الذكاء الاصطناعي التوليدي، سيتم تطوير الاثنين من قبل جهات فاعلة مختلفة، وسوف يكونا مرتبطين ببعضهما البعض. مع طبقتين مختلفتين في حزمة البرامج – مثل أشار إليه جي كوريير:

  1. الطبقة السفلية من البرنامج هي نموذج التعلم العميقمبنية على تطبيقات نماذج اللغات الكبيرة (LLM) أو التمثيل الداخلي المعادل. توفر النماذج لبنة البناء الأساسية التي يمكن من خلالها تطوير التطبيقات.
  2. الطبقة العليا من البرمجيات هي استمارتنا واحد، والذي يعتمد على نموذج التعلم العميق لإنجاز مهمة محددة، على سبيل المثال، إخراج صورة من موجه نصي.

ستعمل هذه البنية المكونة من طبقتين على تغذية حقبة جديدة من الابتكار المتسارع لأنه بمجرد تطوير الطبقة السفلية بواسطة شركات كبيرة جدًا مثل Google وOpenAI وغيرهما، ستوفر الشركات الأصغر طبقة التطبيقات - مما يمنحها بالطبع جزءًا من أرباحها إلى موفر الطبقة السفلية.

حاليًا، تم تحسين الطبقة السفلية بسرعة - وغالبًا ما يتم توزيعها مع تطبيق في الأعلى. على سبيل المثال، توفر LaMDA وPaLM إمكانات الحوار خارج الصندوق، بينما تقدم DALL-E وMidjourney خدمات المطالبة بالصورة. ولكن قريبًا، سيؤدي انتشار البدائل مفتوحة المصدر للطبقة السفلية إلى تمكين تطوير طبقة التطبيق العليا فقط وربطها بالطبقة السفلية المتوفرة بالفعل. القول أسهل من الفعل بالطبع، لكن الحقيقة هي أن الطبقة السفلية أكثر تعقيدًا من الطبقة العليا.

أنا أزعم أن IA التوليدية سوف تتخلل تقريبًا كل عمل معرفي ونشاط ترفيهي لأنه سيوفر أدوات لإبعاد التعقيد عن الأنشطة الصعبة سابقًا ولأنه يمكن أن يوفر مستوى جديدًا تمامًا من التخصيص الذي أسميه "التخصيص التوليدي".

يمكنك معرفة ما هو "التخصيص التوليدي" من مثال الفيديو الرياضي أعلاه: يتم منح كل مستخدم مقطع فيديو مميزًا جديدًا وفريدًا من نوعه بدلاً من مجرد الاختيار بين خيارين أو ثلاثة خيارات.

من الصعب المبالغة في التأثير التراكمي لجميع تطبيقات IA التوليدية:

  1. أصبح إنشاء الرسومات السهلة بالفعل في متناول غير المحترفين باستخدام أدوات مثل DALL-E وMidjourney وStable Diffusion، على الأقل لأغراض نفعية بسيطة مثل الحصول على صورة رأسية لهذا المنشور. قبل هذا العام، لم أتمكن تمامًا من رسم صوري الخاصة، ونصح خبراء المدونات بعدم إضاعة الوقت في التصميم الجرافيكي لقصصك الخاصة.
  2. لن يحتاج مستخدمو تحرير الصور إلى تحمل منحنى تعليمي صعب لإتقان المجموعة المعقدة من أدوات Photoshop أو Affinity Photo (أنا أستخدم الأخير، وهو معقد جدًا لدرجة أنني يجب أن أراجع البرامج التعليمية على YouTube لمعرفة كيفية إجراء معظم التعديلات). باستخدام الذكاء الاصطناعي التوليدي، سيطلب المستخدمون فقط من البرنامج إجراء تحويل معين، وفويلا! سيتم إصلاح الصورة. إذا فشلت Adobe في تقديم الذكاء الاصطناعي التوليدي بأدواتها، فسوف يتم تعطيلها من خلال الشركات الناشئة الجديدة التي تعرضها، وسوف تسلك طريق Blockbuster.
  3. أدوات العرض التقديمي مثل PowerPoint، بدلاً من مجرد توفير القوالب كما تفعل الآن، ستقوم بإنشاء عروض تقديمية كاملة على المستوى الاحترافي وضبطها من أفكار المخطط التفصيلي. في الوقت الحالي، هناك فرق كبير بين العروض التقديمية الاحترافية وعروض الهواة، ولن يكون هذا هو الحال بعد الآن.
  4. ستكون كتابة النص عملية معززة بشكل كبير بواسطة أدوات الذكاء الاصطناعي التوليدي. العديد من أشكال الكتابة تحصل بالفعل على المساعدة من أدوات متطورة مثل Grammarly، لكن الذكاء الاصطناعي التوليدي سيمنح الكتّاب مستوى جديدًا نوعيًا من المساعدة، على سبيل المثال، إنشاء نسخة أولية كاملة من مدونة. ستكون الكتابة عملية تعاونية بين البشر وأداة الذكاء الاصطناعي.
  5. يجب أن يكون أي برنامج مخصص للمستخدم النهائي سهل الاستخدام مع الرسائل النصية أو الصوتية. ستصبح أدلة المستخدم ومقاطع الفيديو التعليمية شيئًا من الماضي، وبمجرد أن يعتاد المستخدمون على الطريقة البسيطة الجديدة لاستخدام البرامج، يجب أن يقدمها كل شيء حتى يظل ملائمًا.
  6. سيتم تعلم اللغة بشكل أساسي بمساعدة المساعدين الصوتيين، الذين سيتم تشغيلهم بواسطة الذكاء الاصطناعي التوليدي. سيستخدم المساعدون الصوتيون، الذين سيعملون مثل مدربي اللغة الشخصيين، قدراتهم المذهلة في الحوار باللغة الطبيعية، والتي شوهدت لأول مرة في أنظمة مثل LaMDA من Google، لتوجيه متعلم اللغة البشرية من أجل اكتساب المفردات والتعبيرات، وتحسين النطق، وما إلى ذلك. إن المساعدين الصوتيين ليس خيالًا مستقبليًا، بل إنه منطقي اقتصاديًا في الوقت الحالي.
  7. حتى منتجات الأجهزة (مثل السيارات) ستحتوي على أنظمة مساعدة تعتمد على حوار الذكاء الاصطناعي التوليدي. هل حاولت القيام بعملية معقدة مثل ضبط الشاشة في السيارات الحديثة؟ ليس سهلا، أستطيع أن أقول لك. بدلاً من البحث في أدلة معقدة، ستطلب فقط من المساعد الصوتي إما الحصول على التعليمات أو إجراء التعديلات مباشرة.

سيتم تحويل العديد من المهن إلى ما هو أبعد من الاعتراف. ويشعر مصممو الجرافيك بالفعل بوطأة هذا الاضطراب. ستختفي مهن بأكملها، وستنشأ مهن أخرى. ستفلس الشركات القوية، وستصبح شركات جديدة هي المهيمنة، اعتمادًا على مدى نجاحها في التعامل مع الاضطراب التكنولوجي الناجم عن الذكاء الاصطناعي التوليدي.

وكل هذا سيحدث خلال هذا العقد.

قد أكون مخطئا، ولكن يبدو لي أنه كان من الصعب، حتى بالنسبة للمتخصصين في مجال التكنولوجيا، التنبؤ بالقدرات الهائلة لمولدات الصور والنصوص الحالية: لم يكن من الواضح قبل بضع سنوات أن النماذج الضخمة ومجموعات التدريب سوف تكون قادرة على العمل. يؤدي إلى قدرات مختلفة نوعيا.

سأذهب إلى أبعد من ذلك لأقول إنها كانت نتيجة محظوظة وعشوائية تقريبًا. ولكن الآن بعد أن أصبح لدينا أدوات توليدية، أصبحت الأبواب مفتوحة أمام الشركات المبتكرة التي ستعمل على تطوير تطبيق تلو الآخر بوتيرة سريعة: يتعلق الأمر في الغالب بمعرفة ما يمكن تحسينه بشكل جذري وإيجاد نموذج العمل المناسب لبدء عمل تجاري من خلاله. فكرة IA التوليدية.

قبل بضع سنوات، بدا الأمر كما لو أن اتجاهات التكنولوجيا الأخرى، مثل السيارات ذاتية القيادة، أو الواقع الافتراضي، أو blockchain، سوف تتولى زمام الأمور قريبًا، ولكن تكنولوجيا القيادة الذاتية كانت محدودة بسبب العقبات التشريعية، وتضررت تقنية blockchain من الانكماش الاقتصادي، وأصبحت تقنية الواقع الافتراضي يقتصر الاعتماد على ارتفاع تكاليف الأجهزة. بدلاً من ذلك، فإن الذكاء الاصطناعي التوليدي ليس مقيدًا بعد بالتشريعات (مهلا، إن تحسين عرض PowerPoint التقديمي أو إنشاء مقطع فيديو رياضي ليس مسألة حياة أو موت) ولا يحتاج إلى شراء أجهزة باهظة الثمن من قبل المستخدم.

ولم نعتقد أن الأنشطة الإبداعية سوف تتعطل بهذه السرعة. لكنهم كانوا كذلك.

نحن ندخل زمناً جديداً وغريباً في بعض الأحيان، حيث يمتزج الإبداع البشري مع القدرات الجديدة للآلات لدرجة أنه يصعب التمييز بينهما. مثل جي كورير يشير الى:

"اليوم وفي السنوات القليلة المقبلة، سيكون هذا أمرًا مفاجئًا ومخيفًا من نواحٍ عديدة. لأن تلك اللحظات الإبداعية التي تنتقل فيها من الصفر إلى الأفكار الأولية كانت دائمًا تبدو إنسانية بشكل فريد، لأنها كانت غامضة للغاية.

كيف سيغير الذكاء الاصطناعي التوليدي كل شيء في العقد الحالي 4 عبر https://towardsdatascience.com/feed

<!–

->

الطابع الزمني:

اكثر من مستشارو Blockchain