جلب الذكاء الاصطناعي إلى الواقع

جلب الذكاء الاصطناعي إلى الواقع

جلب الذكاء الاصطناعي إلى الواقع PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.

ميزة دعائية هناك أداة جديدة حادة يتم استخدامها بشكل متزايد من قبل فرق تكنولوجيا المعلومات في المؤسسات الإبداعية وهي الذكاء الاصطناعي التوليدي، الذي لديه القدرة على تمكين التقدم الكبير في الطريقة التي تدير بها المؤسسة أعمالها. وذلك لأنه يمكن الاستفادة من قيمتها في العديد من التطبيقات والخدمات الداخلية والخارجية، بما في ذلك عناصر مثل روبوتات الدردشة الخاصة بالمبيعات، وعمليات الموارد البشرية، ومقاطع الفيديو التدريبية والتعليمية والتسويقية التي تعتمد على الصور الرمزية.

من خلال الجمع بين برنامج الذكاء الاصطناعي المثير هذا وأجهزة الخادم السريعة من الجيل الجديد، تقوم الشركات الناشئة المعروفة بتصميم وبناء وتقديم تطبيقات جديدة إلى السوق - قبل الموعد المحدد، في كثير من الحالات.

أحد هذه الشركات الناشئة هو ديب برين، متخصص في تكنولوجيا الذكاء الاصطناعي التي تركز على الإنسان. DeepBrain هو عضو في برنامج Lenovo AI Innovators، والذي يوفر للشركات الناشئة إمكانية الوصول إلى خبرات لينوفو ومواردها وأجهزة الخادم لمساعدتها على إنشاء المنتجات وتسريع نمو الشركة.

المنتج الرئيسي لشركة DeepBrain هو AI Avatar، والذي يمكن استخدامه لإنشاء مقاطع فيديو واقعية للغاية تعتمد على الصور الرمزية والتي يمكن استخدامها لأغراض مختلفة، بما في ذلك المبيعات والتدريب والتسويق. يستخدم AI Avatar تركيب فيديو الذكاء الاصطناعي التوليدي الخاص بشركة DeepBrain للجمع بين نماذج تحويل النص إلى كلام والنماذج اللغوية الكبيرة (LLMs) لإنشاء بشر ذكاء اصطناعي لا يمكن تمييزهم تقريبًا عن الأشخاص الحقيقيين.

يقول جو مورفي، مسؤول تطوير الأعمال في DeepBrain: "إن ما يميز الصور الرمزية لدينا هو ما نسميه بالواقعية المفرطة". "إذا أظهرت لك الشخص الحقيقي وقمت بإنشاء مقاطع فيديو جنبًا إلى جنب، فلن تتمكن من معرفة الفرق، ولدينا بيانات تدعم ذلك. لدينا مقياس يسمى مؤشر التشابه الهيكلي، حيث 100% تساوي 100% التشابه مع الشخص الحقيقي؛ نصل إلى 96.5 على هذا المقياس. وقال مورفي إن DeepBrain يستنسخ صوت الشخص الحقيقي في كل إنتاج.

تصدر مذيعو الأخبار الذين يعملون بتقنية الذكاء الاصطناعي عناوين الأخبار

كان أحد عملاء مورفي الأوائل هو MBN، وهي شبكة إخبارية في سيول، كوريا الجنوبية. وقال مورفي: "لقد أطلقوا أول مذيع أخبار يعمل بالذكاء الاصطناعي باستخدام تقنيتنا". "لقد حددوا ما يسمونه "وجه الامتياز" للشبكة - مثل أندرسون كوبر على شبكة سي إن إن أو شون هانيتي على قناة فوكس. كان اسمها كيم جو ها - وجه علامة تجارية موثوقة وصوت موثوق به. أحضرناها إلى الاستوديو وسجلنا موهبتها لمدة أربع ساعات تقريبًا في بيئة شاشة خضراء. هذه هي بيانات التدريب التي نستخدمها لبناء نموذجنا.

وقال مورفي إن الصورة الرمزية لـKim Joo Ha لا تُستخدم في برنامج أخبار MBN كل يوم. وبدلاً من ذلك، فإنها تحل محل الشخص الحقيقي في المظاهر الروتينية مثل الإعلانات الترويجية والإعلانية، بحيث تتمكن المذيعة نفسها من التركيز على ما تفعله بشكل أفضل - توصيل الأخبار. قال مورفي: "من الواضح أن هذا يمثل استخدامًا أفضل لوقتها".

وقال مورفي إنه على مر السنين، قامت شركة DeepBrain بتشديد عملية الإنتاج الخاصة بها وهي تتحسن باستمرار.

وقال: "لقد وصلنا الآن إلى حوالي أربع ساعات من الفيديو، تليها ثلاثة أسابيع من وقت التعلم الآلي". "ومن ثم النموذج جاهز. في الأساس، إنه نموذج إدخال النص/إخراج الفيديو. يمكنك إدخال أي نص تريده، ثم تضغط على "تصدير". يقوم النموذج بعد ذلك بإنشاء مقطع فيديو لهذا الشخص وهو يقوم بتسليم البرنامج النصي الذي كتبته. لذا فالأمر بسيط: إدخال النص وإخراج الفيديو."

كانت عملية تجميع ملفات الفيديو والصوت المثقلة بالبيانات - والتي غالبًا ما تستغرق ساعات لإنهائها وعرضها - بطيئة بالنسبة لشركات الذكاء الاصطناعي الرائدة. لقد حل DeepBrain هذه المشكلة.

وقال مورفي: "إن سرعة التوليف هي العامل الثاني الذي يميزنا". "وهذا ما يمكّننا من أن يكون لدينا بشر ذكاء اصطناعي قادرون على المحادثة؛ يمكننا تجميع الفيديو بأسرع ما يمكن في الوقت الحقيقي. وهذا يتيح لك إنشاء فيديو تفاعلي حيث يمكنك طرح سؤال ويمكن لإنسان الذكاء الاصطناعي الرد بعد ذلك. وهذا شيء طرحناه في 711 (المتاجر الصغيرة) في كوريا وفندق نوفوتيل في كوريا. هذه هي المواقف التي يمكن للعملاء فيها الذهاب إلى أحد الأكشاك، وطرح الأسئلة، ومن ثم يقوم إنسان الذكاء الاصطناعي بالإجابة على السؤال. إنها في الأساس تأخذ روبوت الدردشة وتضع الصورة الرمزية كوجه بشري.

وقال مورفي إن DeepBrain يستخدم "التخزين المؤقت الذكي" في هذه الأكشاك التفاعلية للتعامل مع الأسئلة المتكررة. "عندما يسأل الناس نفس الأسئلة، فإنه يتذكر تلك الإجابة. عندما يأتي هذا السؤال، يكون كل شيء جاهزًا للانطلاق”.

حالات الاستخدام الأخرى: Chatbots ومقاطع الفيديو التدريبية

وفي الآونة الأخيرة، تم ربط DeepBrain بنماذج لغوية كبيرة، مثل ChatGPT وLlama 2.

وقال مورفي: "لا يمكننا توقع ما ستقوله تلك النماذج، لذا فإننا نقوم ببثها بأسرع ما يمكن. يستغرق ذلك وقتًا للبدء لمدة ثانية واحدة، ثم تبدأ الإجابة في الظهور. يبدو الأمر كما لو كنت تتحدث إلى مكبر صوت ذكي مثل Siri أو Alexa، حيث يكون هناك قليل من التوقف. إنه نفس الشيء بالنسبة لنا، ولكننا الآن نقوم بتركيب الفيديو فوق الصوت.

يتم بث الصور الرمزية DeepBrain AI في الوقت الفعلي مع زمن وصول منخفض، مما يضمن قدرتها على تقديم إجابات تحادثية في الوقت المناسب على الأسئلة. وهذا يجعلها مثالية لمجموعة واسعة من التطبيقات، بما في ذلك خدمة العملاء والتعليم والتسويق.

بعض الأمثلة الأخرى لكيفية استخدام DeepBrain AI Avatars تتضمن مقاطع فيديو تدريبية، والتي بطبيعتها أكثر جاذبية وتفاعلية من مقاطع الفيديو القياسية، ومقاطع فيديو تعليمية أكثر متعة للمشاهدة من مقاطع الفيديو التقليدية. على سبيل المثال، يمكن استخدام الصورة الرمزية للذكاء الاصطناعي لتوفير إرشادات خطوة بخطوة حول كيفية استخدام برنامج جديد أو كيفية أداء مهمة معقدة، وربما إضافة بعض النكات على طول الطريق.

يمكن لمقاطع الفيديو التسويقية أن تأخذ خطوة إلى الأمام من خلال كونها أكثر تخصيصًا وجاذبية من مقاطع الفيديو التقليدية. على سبيل المثال، يمكن استخدام AI Avatar لإنشاء رسالة فيديو مخصصة لكل عميل أو لتزويد العملاء بالدعم والمساعدة في الوقت الفعلي.

كيف تقدم الأجهزة المناسبة جودة عالية

هذه الجودة الفائقة لا تحدث بدون دعم خلفي متميز. لقد ساعدت شركة DeepBrain من خلال تزويدها بإمكانية الوصول إلى حلول البنية التحتية الجاهزة للنشر استنادًا إلى خوادم Lenovo ThinkSystem SR675 V3 المتطورة للشركة. يعد هذا الجهاز ضروريًا لتشغيل دورات LLM المكثفة حسابيًا في DeepBrain.

تم تجهيز Think System SR675 V3 بما يصل إلى معالجين Intel Xeon Scalable من الجيل الرابع وما يصل إلى 4 تيرابايت من الذاكرة، وهو مثالي للتعامل مع نماذج اللغات الكبيرة (LLMs). لا تجد الكثير من الذاكرة المتوفرة في أي خادم.

ونتيجة لذلك، يعد هذا الخادم الجاهز للنشر مناسبًا تمامًا لتطبيقات الذكاء الاصطناعي مثل DeepBrain. بالإضافة إلى ذلك، فهو يتميز بمجموعة متنوعة من خيارات التخزين السريعة، مثل محركات أقراص NVMe SSD، والتي يمكن أن توفر الأداء المطلوب لأحمال عمل الذكاء الاصطناعي كثيرة المتطلبات. كما أنه يدعم الشبكات عالية السرعة، مثل InfiniBand وEthernet. يمكن للعملاء الاتصال بالطلقات على هذه الخيارات.

المزيد عن برنامج مبتكري الذكاء الاصطناعي

بالإضافة إلى توفير الوصول إلى الأجهزة، فإن برنامج Lenovo AI Innovators يوفر للشركات الناشئة إمكانية الوصول إلى مراكز التميز للذكاء الاصطناعي التابعة لشركة Lenovo. تزود هذه المراكز الشركات الناشئة بالخبرة والموارد التي تحتاجها لبناء أدلة مخصصة للمفهوم للعملاء المحتملين.

قال ميرفي: "كان برنامج مبتكري الذكاء الاصطناعي مهمًا جدًا لخطتنا عندما بدأنا (مع مشروع الصورة الرمزية لمذيع أخبار MBN)". "لقد ساعدنا ذلك في تفصيل الرؤية الإستراتيجية لرئيسنا التنفيذي في الولايات المتحدة المتمثلة في الهبوط والتوسع، والاستفادة مما فعلناه في كوريا، ومن ثم إحضاره إلى أمريكا الشمالية."

وفي هذه الأثناء، تعمل DeepBrain الآن مع أكثر من اثنتي عشرة محطة إخبارية في جميع أنحاء الصين وكوريا مع مذيعي أخبار يعتمدون على الذكاء الاصطناعي، وجميعهم يستخدمون منتج AI Studios الموضح على موقع الشركة على الويب، كما قال مورفي.

تخدم مراكز التميز 180 دولة وأكثر من 20,000 شريك تجاري، حيث تساعدهم يوميًا على بناء إثباتات شخصية للمفهوم للعملاء المحتملين.

وستعرض لينوفو العديد من حلول الجيل التالي – بما في ذلك حالة استخدام DeepBrain – في معرضها مؤتمر لينوفو العالمي للتكنولوجيا فى الاول من اكتوبر 24.

برعاية Lenovo.

الطابع الزمني:

اكثر من السجل