لماذا تحتاج إلى معرفة أصل الذكاء الاصطناعي لديك؟

لماذا تحتاج إلى معرفة أصل الذكاء الاصطناعي لديك؟

لماذا تحتاج إلى معرفة ذكاء بيانات PlatoBlockchain الخاص بأصل الذكاء الاصطناعي الخاص بك. البحث العمودي. منظمة العفو الدولية.

التعليق

يعمل الذكاء الاصطناعي (AI) على تغيير كل جانب من جوانب حياتنا اليومية بسرعة تقريبًا، بدءًا من كيفية عملنا إلى كيفية استيعابنا للمعلومات وحتى كيفية تحديد قادتنا. كما هو الحال مع أي تكنولوجيا، فإن الذكاء الاصطناعي غير أخلاقي، ولكن يمكن استخدامه لتعزيز المجتمع أو تطويره تقديم الأذى.

البيانات هي الجينات التي تدعم تطبيقات الذكاء الاصطناعي. إنه الحمض النووي والحمض النووي الريبي (RNA) ملتفان في قطعة واحدة. كما يقال غالبًا عند إنشاء أنظمة برمجية: "قمامة تدخل/قمامة تخرج". إن تقنية الذكاء الاصطناعي تتسم بالدقة والأمان والفعالية بقدر مصادر البيانات التي تعتمد عليها. إن المفتاح لضمان وفاء الذكاء الاصطناعي بوعده وتجنب كوابيسه يكمن في القدرة على إبعاد القمامة ومنعها من الانتشار والتكرار عبر الملايين من تطبيقات الذكاء الاصطناعي.

وهذا ما يسمى مصدر البيانات، ولا يمكننا الانتظار يومًا آخر لتنفيذ الضوابط التي تمنع مستقبل الذكاء الاصطناعي لدينا من أن يصبح كومة قمامة ضخمة.

وتؤدي البيانات السيئة إلى نماذج الذكاء الاصطناعي التي يمكنها نشر نقاط ضعف الأمن السيبراني والمعلومات الخاطئة والهجمات الأخرى على مستوى العالم في ثوانٍ. اليوم الذكاء الاصطناعي التوليدي تعد نماذج (GenAI) معقدة بشكل لا يصدق، ولكن في جوهرها، تتنبأ نماذج GenAI ببساطة بأفضل جزء تالٍ من البيانات التي سيتم إخراجها، في ضوء مجموعة من البيانات السابقة الموجودة.

قياس الدقة

يقوم نموذج من نوع ChatGPT بتقييم مجموعة الكلمات التي تشكل السؤال الأصلي المطروح وجميع الكلمات الموجودة في استجابة النموذج حتى الآن لحساب أفضل كلمة تالية سيتم إخراجها. ويفعل ذلك بشكل متكرر حتى يقرر أنه قدم ما يكفي من الاستجابة. لنفترض أنك تقوم بتقييم قدرة النموذج على تجميع الكلمات التي تشكل جملًا جيدة الصياغة وصحيحة نحويًا والتي تتعلق بالموضوع وذات صلة بالمحادثة بشكل عام. وفي هذه الحالة، تكون نماذج اليوم جيدة بشكل مدهش، وهي مقياس للدقة.

الغوص أعمق في ما إذا كان النص الذي ينتجه الذكاء الاصطناعي ينقل دائمًا معلومات "صحيحة". ويشير بشكل مناسب إلى مستوى الثقة في المعلومات المنقولة. ويكشف هذا عن المشكلات التي تأتي من النماذج التي تتنبأ بشكل جيد للغاية في المتوسط، ولكن ليس بشكل جيد في الحالات المتطورة - وهو ما يمثل مشكلة المتانة. يمكن أن يتفاقم الأمر عندما يتم تخزين مخرجات البيانات الضعيفة من نماذج الذكاء الاصطناعي عبر الإنترنت واستخدامها كبيانات تدريب مستقبلية لهذه النماذج وغيرها.

يمكن أن تتكرر المخرجات الضعيفة على نطاق لم نشهده من قبل، مما يتسبب في حلقة هلاك الذكاء الاصطناعي.

إذا أراد أحد العناصر السيئة المساعدة في هذه العملية، فيمكنه عمدًا تشجيع إنتاج بيانات سيئة للغاية وتخزينها ونشرها - مما يؤدي إلى ظهور المزيد من المعلومات الخاطئة من روبوتات الدردشة، أو شيء شائن ومخيف مثل أن تقرر نماذج الطيار الآلي للسيارات أنها بحاجة إلى ذلك. انحرف بالسيارة بسرعة إلى اليمين على الرغم من وجود أشياء في الطريق إذا "رأت" صورة مصممة خصيصًا أمامها (افتراضيًا بالطبع).

بعد عقود من الزمن، بدأت صناعة تطوير البرمجيات - بقيادة وكالة أمن البنية التحتية للأمن السيبراني - أخيرًا بتنفيذ حل آمن حسب التصميم الإطار. تصميم آمن ينص على أن الأمن السيبراني هو أساس عملية تطوير البرمجيات، وأحد مبادئه الأساسية يتطلب فهرسة كل مكون من مكونات تطوير البرمجيات - فاتورة مواد البرمجيات (SBOM) – لتعزيز الأمن والمرونة. وأخيرًا، يحل الأمان محل السرعة باعتباره العامل الأكثر أهمية في الوصول إلى السوق.

تأمين تصاميم الذكاء الاصطناعي

يحتاج الذكاء الاصطناعي إلى شيء مماثل. تمنع حلقة تعليقات الذكاء الاصطناعي تقنيات الدفاع عن الأمن السيبراني السابقة الشائعة، مثل تتبع توقيعات البرامج الضارة، أو بناء محيط حول موارد الشبكة، أو مسح التعليمات البرمجية المكتوبة بواسطة الإنسان بحثًا عن نقاط الضعف. يجب علينا أن نجعل تصميمات الذكاء الاصطناعي الآمنة مطلبًا خلال مهد التكنولوجيا حتى يمكن جعل الذكاء الاصطناعي آمنًا قبل فترة طويلة من فتح صندوق باندورا.

حسنا، كيف لنا ان نحل هذه المشكلة؟ يجب أن نأخذ صفحة من عالم الأوساط الأكاديمية. نحن ندرب الطلاب ببيانات تدريب منسقة للغاية، ونفسرها وننقلها إليهم من خلال صناعة المعلمين. نحن نواصل هذا النهج لتعليم البالغين، ولكن من المتوقع أن يقوم الكبار بالمزيد من تنظيم البيانات بأنفسهم.

يحتاج التدريب على نموذج الذكاء الاصطناعي إلى اتباع نهج البيانات المنسقة على مرحلتين. للبدء، سيتم تدريب نماذج الذكاء الاصطناعي الأساسية باستخدام المنهجيات الحالية باستخدام كميات هائلة من مجموعات البيانات الأقل تنظيمًا. ستكون نماذج اللغة الكبيرة الأساسية هذه (LLMs) مشابهة تقريبًا للطفل حديث الولادة. سيتم بعد ذلك تدريب نماذج المستوى الأساسي باستخدام مجموعات بيانات منسقة للغاية تشبه كيفية تعليم الأطفال وتربيتهم ليصبحوا بالغين.

لن يكون الجهد المبذول لبناء مجموعات بيانات تدريب كبيرة ومنسقة لجميع أنواع الأهداف صغيرًا. وهذا مشابه لكل الجهود التي يبذلها الآباء والمدارس والمجتمع لتوفير بيئة جيدة ومعلومات جيدة للأطفال أثناء نموهم (كما نأمل) ليصبحوا مساهمين فاعلين وذوي قيمة مضافة في المجتمع. هذا هو مستوى الجهد المطلوب لبناء مجموعات بيانات عالية الجودة لتدريب نماذج الذكاء الاصطناعي عالية الجودة، والتي تعمل بشكل جيد، بأقل قدر من الفساد، ويمكن أن يؤدي ذلك إلى صناعة كاملة من الذكاء الاصطناعي والبشر يعملون معًا لتعليم نماذج الذكاء الاصطناعي لتكون جيدة في وظيفتهم المستهدفة. .

تُظهر حالة عملية التدريب على الذكاء الاصطناعي اليوم بعض العلامات على هذه العملية المكونة من مرحلتين. ولكن نظرًا لحداثة تكنولوجيا GenAI والصناعة، فإن الكثير من التدريب يأخذ نهج المرحلة الأولى الأقل تنظيمًا.

عندما يتعلق الأمر بأمن الذكاء الاصطناعي، لا يمكننا الانتظار لمدة ساعة، ناهيك عن عقد من الزمن. يحتاج الذكاء الاصطناعي إلى تطبيق 23andMe الذي يتيح المراجعة الكاملة لـ "علم الأنساب الخوارزمي" حتى يتمكن المطورون من فهم تاريخ "العائلة" للذكاء الاصطناعي بشكل كامل لمنع تكرار المشكلات المزمنة، وإصابة الأنظمة الحيوية التي نعتمد عليها كل يوم، وإحداث ضرر اقتصادي ومجتمعي قد يكون ذلك لا رجعة فيه.

أمننا القومي يعتمد على ذلك.

الطابع الزمني:

اكثر من قراءة مظلمة