10 تصورات مذهلة لتعلم الآلة يجب أن تعرفها في عام 2023

Yellowbrick لإنشاء مخططات للتعلم الآلي باستخدام كود أقل

تصوير ديفيد بيسنوي on Unsplash

يلعب تصور البيانات دورًا مهمًا في التعلم الآلي.

تتضمن حالات استخدام تصور البيانات في التعلم الآلي ما يلي:

  • ضبط فرط المعلمة
  • تقييم أداء النموذج
  • التحقق من صحة افتراضات النموذج
  • البحث عن القيم المتطرفة
  • اختيار أهم الميزات
  • تحديد الأنماط والارتباطات بين السمات

تسمى التصورات المرتبطة مباشرة بالأشياء الرئيسية المذكورة أعلاه في التعلم الآلي تصورات التعلم الآلي.

أحيانًا يكون إنشاء تصورات التعلم الآلي عملية معقدة لأنها تتطلب الكثير من التعليمات البرمجية للكتابة حتى في Python. ولكن بفضل المصدر المفتوح من Python يلوبريك مكتبة ، حتى تصورات التعلم الآلي المعقدة يمكن إنشاؤها باستخدام كود أقل. تعمل هذه المكتبة على توسيع واجهة برمجة تطبيقات Scikit-Learn وتوفر وظائف عالية المستوى للتشخيصات المرئية التي لا يتم توفيرها بواسطة Scikit-Learn.

اليوم ، سأناقش الأنواع التالية من تصورات التعلم الآلي ، وحالات استخدامها وتنفيذ Yellowbrick بالتفصيل.

تصورات Yellowbrick ML
-----------------------------
01 مؤامرة المكون الرئيسي
02 منحنى التحقق من الصحة
03 منحنى التعلم
04 مؤامرة الكوع
05 مؤامرة صورة ظلية
06 مؤامرة عدم التوازن الطبقي
07 مؤامرة المخلفات
08 مؤامرة خطأ التنبؤ
09 مؤامرة مسافة كوك
10 ميزة أهمية المؤامرة

التنزيل

يمكن تثبيت Yellowbrick عن طريق تشغيل أحد الأوامر التالية.

  • بذرة تنصيب المجموعه:
نقطة تثبيت الطوب الأصفر
  • كوندا تنصيب المجموعه:
conda install -c Districtdatalabs Yellowbrick

باستخدام Yellowbrick

متخيلات Yellowbrick لها بناء جملة يشبه Scikit-Learn. المتخيل هو كائن يتعلم من البيانات لإنتاج تصور. غالبًا ما يتم استخدامه مع مقدر Scikit-Learn. لتدريب متخيل ، نسميه طريقة () المناسبة.

حفظ المؤامرة

لحفظ قطعة أرض تم إنشاؤها باستخدام متخيل Yellowbrick ، ​​نسمي طريقة show () على النحو التالي. سيؤدي هذا إلى حفظ المؤامرة كملف PNG على القرص.

visualizer.show (outpath = "name_of_the_plot.png")

الأستعمال

يرسم مخطط المكون الرئيسي بيانات عالية الأبعاد في مخطط مبعثر ثنائي الأبعاد أو ثلاثي الأبعاد. لذلك ، هذه المؤامرة مفيدة للغاية لتحديد الأنماط المهمة في البيانات عالية الأبعاد.

تنفيذ Yellowbrick

يعد إنشاء هذه الحبكة بالطريقة التقليدية أمرًا معقدًا ويستغرق وقتًا طويلاً. نحتاج إلى تطبيق PCA على مجموعة البيانات أولاً ثم استخدام مكتبة matplotlib لإنشاء مخطط التشتت.

بدلاً من ذلك ، يمكننا استخدام فئة PCA المتخيل من Yellowbrick لتحقيق نفس الوظيفة. إنه يستخدم طريقة تحليل المكونات الرئيسية ، ويقلل من أبعاد مجموعة البيانات وينشئ مخطط التشتت بسطرين أو ثلاثة أسطر من التعليمات البرمجية! كل ما نحتاج إلى القيام به هو تحديد بعض وسيطات الكلمات الرئيسية في فئة PCA ().

لنأخذ مثالاً لفهم هذا الأمر بشكل أكبر. هنا ، نستخدم ملف سرطان الثدي مجموعة البيانات (انظر تنويه في النهاية) يحتوي على 30 ميزة و 569 عينة من فئتين (خبيث و حميدة). بسبب الأبعاد العالية (30 ميزة) في البيانات ، من المستحيل رسم البيانات الأصلية في مخطط مبعثر ثنائي الأبعاد أو ثلاثي الأبعاد ما لم نطبق PCA على مجموعة البيانات.

يشرح الكود التالي كيف يمكننا استخدام متخيل PCA الخاص بـ Yellowbrick لإنشاء مخطط مبعثر ثنائي الأبعاد لمجموعة بيانات 2 بعدًا.

(الكود من قبل المؤلف)
مؤامرة المكون الرئيسي - 2D (الصورة بواسطة المؤلف)

يمكننا أيضًا إنشاء مخطط مبعثر ثلاثي الأبعاد من خلال الإعداد projection=3في فئة PCA ().

(الكود من قبل المؤلف)
مؤامرة المكون الرئيسي - 3D (الصورة من المؤلف)

تشمل أهم معلمات متخيل PCA ما يلي:

  • مقياس: منطقي ، افتراضي True. يشير هذا إلى ما إذا كان يجب تحجيم البيانات أم لا. يجب علينا قياس البيانات قبل تشغيل PCA. تعلم المزيد عن هنا.
  • تنبؤ: int ، الافتراضي هو 2. متى projection=2، يتم إنشاء مخطط مبعثر ثنائي الأبعاد. متي projection=3، يتم إنشاء مخطط مبعثر ثلاثي الأبعاد.
  • الطبقات: القائمة الافتراضية None. يشير هذا إلى تسميات الفصل لكل فئة في y. ستكون أسماء الفئات هي تسميات وسيلة الإيضاح.

الأستعمال

يرسم منحنى التحقق من الصحة تأثير أ عزباء Hyperparameter في القطار ومجموعة التحقق من الصحة. من خلال النظر إلى المنحنى ، يمكننا تحديد الظروف الملائمة والنقصان والظروف المناسبة للنموذج للقيم المحددة للمعلمة الفائقة المعطاة. عند وجود عدة معلمات تشعبية لضبطها مرة واحدة ، لا يمكن استخدام منحنى التحقق من الصحة. مثبَّت ، يمكنك استخدام البحث الشبكي أو البحث العشوائي.

تنفيذ Yellowbrick

يعد إنشاء منحنى التحقق بالطريقة التقليدية أمرًا معقدًا ويستغرق وقتًا طويلاً. بدلاً من ذلك ، يمكننا استخدام متخيل ValidationCurve الخاص بـ Yellowbrick.

لرسم منحنى التحقق في Yellowbirck ، سنقوم ببناء مصنف غابة عشوائي باستخدام نفس المصنف سرطان الثدي مجموعة البيانات (انظر تنويه في نهايةالمطاف). سنقوم برسم تأثير أقصى عمق hyperparameter في نموذج الغابة العشوائية.

يشرح الكود التالي كيف يمكننا استخدام متخيل المنحنى ValidationCurve الخاص بـ Yellowbrick لإنشاء منحنى تحقق باستخدام سرطان الثدي مجموعة البيانات.

(الكود من قبل المؤلف)
منحنى التحقق من الصحة (الصورة من المؤلف)

يبدأ النموذج في التجهيز بعد أقصى عمق قيمة 6. متى max_depth=6، يناسب النموذج بيانات التدريب جيدًا كما أنه يعمم جيدًا على البيانات الجديدة غير المرئية.

تتضمن أهم معلمات مصور ValidationCurve:

  • مقدر: يمكن أن يكون هذا أي نموذج Scikit-Learn ML مثل شجرة القرار ، والغابة العشوائية ، وآلة ناقلات الدعم ، وما إلى ذلك.
  • اسم المعلمة: هذا هو اسم المعامل التشعبي الذي نريد مراقبته.
  • بارام_رانج: يتضمن هذا القيم المحتملة لـ param_name.
  • السيرة الذاتية: int ، يحدد عدد الطيات للتحقق المتبادل.
  • التهديف: خيط، يحتوي على طريقة تسجيل النموذج. للتصنيف ، دقة هو المفضل.

الأستعمال

يرسم منحنى التعلم أخطاء التدريب والتحقق من الصحة أو الدقة مقابل عدد الفترات أو عدد مثيلات التدريب. قد تعتقد أن كلاً من منحنيات التعلم والتحقق من الصحة يظهران بنفس الشكل ، ولكن يتم رسم عدد التكرارات في المحور x لمنحنى التعلم بينما يتم رسم قيم المعلمة الفائقة في المحور x لمنحنى التحقق من الصحة.

تشمل استخدامات منحنى التعلم ما يلي:

  • منحنى التعلم يستخدم للكشف غير مناسب, المفرط و مجرد حق شروط النموذج.
  • يستخدم منحنى التعلم لتحديد sتقارب منخفض, متذبذب, تتأرجح مع الاختلاف و التقارب الصحيح سيناريوهات عند العثور على معدل التعلم الأمثل لشبكة عصبية أو نموذج ML.
  • يتم استخدام منحنى التعلم لمعرفة مدى استفادة نموذجنا من إضافة المزيد من بيانات التدريب. عند استخدامه بهذه الطريقة ، يُظهر المحور السيني عدد حالات التدريب.

تنفيذ Yellowbrick

يعد إنشاء منحنى التعلم بالطريقة التقليدية أمرًا معقدًا ويستغرق وقتًا طويلاً. بدلاً من ذلك ، يمكننا استخدام متخيل LearningCurve من Yellowbrick.

لرسم منحنى تعليمي في Yellowbirck ، سنقوم ببناء مصنف متجه للدعم باستخدام نفس المصنف سرطان الثدي مجموعة البيانات (انظر تنويه في نهايةالمطاف).

يشرح الكود التالي كيف يمكننا استخدام متخيل LearningCurve في Yellowbrick لإنشاء منحنى التحقق باستخدام سرطان الثدي مجموعة البيانات.

(الكود من قبل المؤلف)
منحنى التعلم (الصورة من المؤلف)

لن يستفيد النموذج من إضافة المزيد من حالات التدريب. تم تدريب النموذج بالفعل بـ 569 حالة تدريب. لم تتحسن دقة التحقق من الصحة بعد 175 حالة تدريب.

تتضمن أهم معلمات متخيل LearningCurve ما يلي:

  • مقدر: يمكن أن يكون هذا أي نموذج Scikit-Learn ML مثل شجرة القرار ، والغابة العشوائية ، وآلة ناقلات الدعم ، وما إلى ذلك.
  • السيرة الذاتية: int ، يحدد عدد الطيات للتحقق المتبادل.
  • التهديف: خيط، يحتوي على طريقة تسجيل النموذج. للتصنيف ، دقة هو المفضل.

الأستعمال

يتم استخدام مخطط الكوع لتحديد العدد الأمثل من المجموعات في مجموعات K-Means. يتناسب النموذج بشكل أفضل مع النقطة التي يظهر فيها الكوع في المخطط الخطي. الكوع هو نقطة الانعطاف على الرسم البياني.

تنفيذ Yellowbrick

يعد إنشاء مخطط الكوع بالطريقة التقليدية أمرًا معقدًا ويستغرق وقتًا طويلاً. بدلاً من ذلك ، يمكننا استخدام KElbowVisualizer من Yellowbrick.

لرسم منحنى تعليمي في Yellowbirck ، سنقوم ببناء نموذج تجميع K-Means باستخدام قزحية مجموعة البيانات (انظر تنويه في نهايةالمطاف).

يشرح الكود التالي كيف يمكننا استخدام Yellowbrick's KElbowVisualizer لإنشاء مخطط Elbow باستخدام قزحية مجموعة البيانات.

(الكود من قبل المؤلف)
مؤامرة الكوع (الصورة من المؤلف)

كوع يحدث عند k = 4 (مشروح بخط متقطع). تشير المؤامرة إلى أن العدد الأمثل للعناقيد للنموذج هو 4. بمعنى آخر ، النموذج مُلائم جيدًا مع 4 مجموعات.

تشمل أهم معلمات KElbowVisualizer ما يلي:

  • مقدر: مثيل نموذج K-Means
  • k: int أو tuple. إذا كان عددًا صحيحًا ، فسيتم حساب درجات المجموعات في النطاق (2 ، ك). إذا كانت بنية tuple ، فسيتم حساب نتائج المجموعات في النطاق المحدد ، على سبيل المثال ، (3 ، 11).

الأستعمال

يتم استخدام مخطط الصورة الظلية لتحديد العدد الأمثل للعناقيد في مجموعة K-Means وأيضًا للكشف عن عدم توازن الكتلة. توفر هذه المؤامرة نتائج دقيقة للغاية من مؤامرة الكوع.

تنفيذ Yellowbrick

يعد إنشاء مخطط الصورة الظلية بالطريقة التقليدية أمرًا معقدًا ويستغرق وقتًا طويلاً. بدلاً من ذلك ، يمكننا استخدام SilhouetteVisualizer من Yellowbrick.

لإنشاء مخطط صورة ظلية في Yellowbirck ، سنقوم ببناء نموذج تجميع K-Means باستخدام قزحية مجموعة البيانات (انظر تنويه في نهايةالمطاف).

تشرح الكتل البرمجية التالية كيف يمكننا استخدام SilhouetteVisualizer من Yellowbrick لإنشاء مخططات صور ظلية باستخدام قزحية مجموعة بيانات ذات قيم مختلفة لـ k (عدد المجموعات).

ك = 2

(الكود من قبل المؤلف)
مؤامرة صورة ظلية مع مجموعتين (ك = 2)، (الصورة من قبل المؤلف)

من خلال تغيير عدد المجموعات في فئة KMeans () ، يمكننا تنفيذ الكود أعلاه في أوقات مختلفة لإنشاء مخططات صورة ظلية عندما k = 3 و k = 4 و k = 5.

ك = 3

مؤامرة صورة ظلية مع مجموعتين (ك = 3)، (الصورة من قبل المؤلف)

ك = 4

مؤامرة صورة ظلية مع مجموعتين (ك = 4)، (الصورة من قبل المؤلف)

ك = 5

مؤامرة صورة ظلية مع مجموعتين (ك = 4)، (الصورة من قبل المؤلف)

تحتوي مؤامرة الصورة الظلية على شكل سكين واحد لكل مجموعة. يتم إنشاء كل شكل سكين بواسطة أشرطة تمثل جميع نقاط البيانات في المجموعة. لذلك ، يمثل عرض شكل السكين عدد جميع الحالات في المجموعة. يمثل طول الشريط معامل Silhouette لكل حالة. يشير الخط المتقطع إلى درجة الصورة الظلية - المصدر: التدريب العملي على K-Means Clustering (كتبه لي).

تخبرنا قطعة الأرض ذات العروض المتساوية تقريبًا لأشكال السكين أن المجموعات متوازنة جيدًا ولديها نفس عدد الحالات تقريبًا داخل كل مجموعة - أحد أهم الافتراضات في مجموعة K-Means.

عندما تمد القضبان في شكل سكين الخط المتقطع ، يتم فصل المجموعات جيدًا - افتراض مهم آخر في مجموعات K-Means.

عندما تكون k = 3 ، تكون المجموعات متوازنة جيدًا ومنفصلة جيدًا. إذن ، العدد الأمثل للعناقيد في مثالنا هو 3.

تشمل أهم معلمات SilhouetteVisualizer ما يلي:

  • مقدر: مثيل نموذج K-Means
  • الألوان: خيط ، مجموعة من الألوان المستخدمة لكل شكل سكين. "yellowbrick" أو أحد سلاسل خرائط الألوان Matplotlib مثل "Accent" و "Set1" وما إلى ذلك.

الأستعمال

تكتشف مؤامرة عدم توازن الفئة عدم توازن الفئات في العمود الهدف في مجموعات بيانات التصنيف.

يحدث عدم توازن الفئة عندما تحتوي إحدى الفئات على عدد أكبر من الحالات مقارنة بالفئة الأخرى. على سبيل المثال ، تحتوي مجموعة البيانات المتعلقة باكتشاف البريد الإلكتروني العشوائي على 9900 مثيل لفئة "ليست بريدًا عشوائيًا" و 100 حالة فقط لفئة "البريد العشوائي". سوف يفشل النموذج في التقاط طبقة الأقلية ( الاسبام الفئة). نتيجة لذلك ، لن يكون النموذج دقيقًا في التنبؤ بفئة الأقلية عند حدوث خلل في الفصل - المصدر: أهم 20 خطأ في التعلم الآلي والتعلم العميق تحدث سرًا خلف الكواليس (كتبه لي).

تنفيذ Yellowbrick

يعد إنشاء مخطط عدم التوازن الطبقي بالطريقة التقليدية معقدًا ويستغرق وقتًا طويلاً. بدلاً من ذلك ، يمكننا استخدام متخيل ClassBalance من Yellowbrick.

لرسم مخطط اختلال في الفصل في Yellowbirck ، سنستخدم سرطان الثدي مجموعة البيانات (مجموعة بيانات التصنيف ، انظر تنويه في نهايةالمطاف).

يشرح الكود التالي كيف يمكننا استخدام متخيل ClassBalance من Yellowbrick لإنشاء مؤامرة عدم توازن في الفصل باستخدام سرطان الثدي مجموعة البيانات.

(الكود من قبل المؤلف)
مؤامرة عدم التوازن الطبقي (الصورة من المؤلف)

هناك أكثر من 200 حالة في ملف خبيث class وأكثر من 350 حالة في حميدة صف دراسي. لذلك ، لا يمكننا أن نرى الكثير من عدم التوازن الطبقي هنا على الرغم من أن الأمثلة ليست موزعة بالتساوي بين الفئتين.

تتضمن أهم معلمات متخيل ClassBalance ما يلي:

  • ملصقات: list ، أسماء الفئات الفريدة في العمود الهدف.

الأستعمال

يتم استخدام مؤامرة القيم المتبقية في الانحدار الخطي لتحديد ما إذا كانت القيم المتبقية (القيم المتنبأ بها القيم الملاحظة) غير مرتبطة (مستقلة) عن طريق تحليل تباين الأخطاء في نموذج الانحدار.

يتم إنشاء مؤامرة القيم المتبقية من خلال رسم البقايا مقابل التنبؤات. إذا كان هناك أي نوع من النمط بين التنبؤات والمتبقي ، فإنه يؤكد أن نموذج الانحدار المجهز ليس مثاليًا. إذا كانت النقاط مشتتة بشكل عشوائي حول المحور السيني ، فإن نموذج الانحدار يتلاءم جيدًا مع البيانات.

تنفيذ Yellowbrick

يعد إنشاء مخطط المخلفات بالطريقة التقليدية أمرًا معقدًا ويستغرق وقتًا طويلاً. بدلاً من ذلك ، يمكننا استخدام متخيل موقع Yellowbrick's ResidualsPlot.

لرسم قطعة أرض متبقية في Yellowbirck ، سنستخدم ملف دعاية (إعلان.csv، انظر تنويه في النهاية) مجموعة البيانات.

يشرح الكود التالي كيف يمكننا استخدام متخيل Yellowbrick's ResidualsPlot لإنشاء مؤامرة متبقية باستخدام دعاية مجموعة البيانات.

(الكود من قبل المؤلف)
مؤامرة المخلفات (الصورة من المؤلف)

يمكننا أن نرى بوضوح نوعًا من النمط غير الخطي بين التنبؤات والبقايا في مؤامرة القيم المتبقية. نموذج الانحدار المجهز ليس مثاليًا ، لكنه جيد بما فيه الكفاية.

تشمل أهم معلمات متخيل ResidualsPlot ما يلي:

  • مقدر: يمكن أن يكون هذا أي انحدار Scikit-Learn.
  • اصمت: منطقي ، افتراضي True. ما إذا كان سيتم رسم الرسم البياني للمخلفات ، والذي يستخدم للتحقق من افتراض آخر - يتم توزيع المخلفات بشكل طبيعي تقريبًا بمتوسط ​​0 وانحراف معياري ثابت.

الأستعمال

مخطط خطأ التنبؤ في الانحدار الخطي هو طريقة رسومية تُستخدم لتقييم نموذج الانحدار.

يتم إنشاء مخطط خطأ التنبؤ عن طريق رسم التنبؤات مقابل القيم المستهدفة الفعلية.

إذا قدم النموذج تنبؤات دقيقة للغاية ، فيجب أن تكون النقاط على خط 45 درجة. خلاف ذلك ، النقاط مشتتة حول هذا الخط.

تنفيذ Yellowbrick

يعد إنشاء مخطط خطأ التنبؤ بالطريقة التقليدية أمرًا معقدًا ويستغرق وقتًا طويلاً. بدلاً من ذلك ، يمكننا استخدام متخيل الخطأ في موقع Yellowbrick.

لرسم مخطط خطأ تنبؤ في Yellowbirck ، سنستخدم الامتداد دعاية (إعلان.csv، انظر تنويه في النهاية) مجموعة البيانات.

يشرح الكود التالي كيف يمكننا استخدام متخيل الخطأ في Yellowbrick لإنشاء مؤامرة متبقية باستخدام دعاية مجموعة البيانات.

(الكود من قبل المؤلف)
مؤامرة خطأ التنبؤ (الصورة من المؤلف)

النقاط ليست بالضبط على خط 45 درجة ، لكن النموذج جيد بما فيه الكفاية.

تتضمن أهم معلمات مصور التنبؤ بالأخطاء ما يلي:

  • مقدر: يمكن أن يكون هذا أي انحدار Scikit-Learn.
  • هوية: منطقي ، افتراضي True. سواء لرسم خط 45 درجة.

الأستعمال

تقيس مسافة كوك تأثير الأمثلة على الانحدار الخطي. تعتبر المثيلات ذات التأثيرات الكبيرة بمثابة قيم متطرفة. مجموعة البيانات التي تحتوي على عدد كبير من القيم المتطرفة ليست مناسبة للانحدار الخطي دون المعالجة المسبقة. ببساطة ، يتم استخدام مخطط مسافة الطباخ لاكتشاف القيم المتطرفة في مجموعة البيانات.

تنفيذ Yellowbrick

يعد إنشاء مخطط مسافة الطباخ بالطريقة التقليدية أمرًا معقدًا ويستغرق وقتًا طويلاً. بدلاً من ذلك ، يمكننا استخدام متخيل CooksDistance من Yellowbrick.

لرسم مخطط مسافة كوك في Yellowbirck ، سنستخدم دعاية (إعلان.csv، انظر تنويه في النهاية) مجموعة البيانات.

يشرح الكود التالي كيف يمكننا استخدام متخيل CooksDistance الخاص بـ Yellowbrick لإنشاء مخطط مسافة للطباخ باستخدام دعاية مجموعة البيانات.

(الكود من قبل المؤلف)
مؤامرة مسافة كوك (الصورة من المؤلف)

هناك بعض الملاحظات التي تمد عتبة الخط (الأحمر الأفقي). هم القيم المتطرفة. لذلك ، يجب أن نجهز البيانات قبل عمل أي نموذج انحدار.

تشمل أهم معلمات متخيل CooksDistance ما يلي:

  • رسم_الحد: منطقي ، افتراضي True. ما إذا كان سيتم رسم خط العتبة.

الأستعمال

يتم استخدام مؤامرة استيراد الميزات لتحديد الحد الأدنى من الميزات المهمة المطلوبة لإنتاج نموذج ML. نظرًا لعدم مساهمة جميع الميزات في النموذج ، يمكننا إزالة الميزات الأقل أهمية من النموذج. سيقلل ذلك من تعقيد النموذج. النماذج البسيطة سهلة التدريب والتفسير.

مؤامرة استيراد الميزة تصور الأهمية النسبية لكل ميزة.

تنفيذ Yellowbrick

يعد إنشاء مخطط استيراد الميزات بالطريقة التقليدية معقدًا ويستغرق وقتًا طويلاً. بدلاً من ذلك ، يمكننا استخدام متخيل FeatureImportances الخاص بـ Yellowbrick.

لرسم مخطط استيراد الميزات في Yellowbirck ، سنستخدم امتداد سرطان الثدي مجموعة البيانات (انظر تنويه في النهاية) الذي يحتوي على 30 ميزة.

يشرح الكود التالي كيف يمكننا استخدام متخيل FeatureImportances الخاص بـ Yellowbrick لإنشاء مؤامرة استيراد ميزة باستخدام سرطان الثدي مجموعة البيانات.

(الكود من قبل المؤلف)
ميزة أهمية المؤامرة (الصورة من المؤلف)

لا تُسهم جميع الميزات الثلاثين في مجموعة البيانات بشكل كبير في النموذج. يمكننا إزالة الميزات ذات الأشرطة الصغيرة من مجموعة البيانات وإعادة تجهيز النموذج بالميزات المحددة.

تتضمن أهم معلمات متخيل FeatureImportances ما يلي:

  • مقدر: اي مقدر Scikit-Learn يدعم أي منهما feature_importances_ السمة أو coef_ السمة.
  • نسبيا: منطقي ، افتراضي True. ما إذا كان سيتم رسم الأهمية النسبية كنسبة مئوية. إذا False، يتم عرض النتيجة الرقمية الأولية لأهمية الميزة.
  • مطلق: منطقي ، افتراضي False. ما إذا كان يجب النظر فقط في حجم المعاملات من خلال تجنب العلامات السلبية.
  1. مؤامرة المكون الرئيسي: PCA ()، الاستخدام - تصور البيانات عالية الأبعاد في مخطط مبعثر ثنائي الأبعاد أو ثلاثي الأبعاد يمكن استخدامه لتحديد الأنماط المهمة في البيانات عالية الأبعاد.
  2. منحنى التحقق من الصحة: منحنى التحقق من الصحة ()، الاستخدام - يرسم تأثير أ عزباء Hyperparameter في القطار ومجموعة التحقق من الصحة.
  3. منحنى التعلم: منحنى التعلم()، الاستخدام - يكتشف غير مناسب, المفرط و مجرد حق شروط النموذج ، يحدد sتقارب منخفض, متذبذب, تتأرجح مع الاختلاف و التقارب الصحيح السيناريوهات عند العثور على معدل التعلم الأمثل لشبكة عصبية ، يوضح مدى استفادة نموذجنا من إضافة المزيد من بيانات التدريب.
  4. مؤامرة الكوع: KElbowVisualizer ()، الاستخدام - يحدد العدد الأمثل للمجموعات في مجموعات K-Means.
  5. مؤامرة صورة ظلية: صورة ظلية فيجوالايزر ()، الاستخدام - يحدد العدد الأمثل للمجموعات في مجموعات K-Means ، ويكشف عدم توازن الكتلة في مجموعات K-Means.
  6. مؤامرة عدم توازن الفئة: ClassBalance ()، الاستخدام - يكتشف عدم توازن الفئات في العمود الهدف في مجموعات بيانات التصنيف.
  7. مؤامرة المخلفات: القسيمة ()، الاستخدام - يحدد ما إذا كانت القيم المتبقية (القيم المتنبأ بها القيم الملاحظة) غير مرتبطة (مستقلة) عن طريق تحليل تباين الأخطاء في نموذج الانحدار.
  8. مؤامرة خطأ التنبؤ: خطأ التنبؤ ()، الاستخدام - طريقة رسومية تُستخدم لتقييم نموذج الانحدار.
  9. مخطط مسافة الطباخ: مسافة الطهاة ()، الاستخدام - يكتشف القيم المتطرفة في مجموعة البيانات بناءً على مسافات كوك بين الحالات.
  10. مؤامرة أهمية الميزة: FeatureImportances ()، الاستخدام - يحدد الحد الأدنى من الميزات المهمة المطلوبة بناءً على الأهمية النسبية لكل ميزة لإنتاج نموذج ML.

هذه نهاية منشور اليوم.

يرجى إعلامي إذا كان لديك أي أسئلة أو تعليقات.

قراءة التالي (مستحسن)

  • Yellowbrick لتصور أهمية الميزات باستخدام سطر واحد من التعليمات البرمجية
  • شرح منحنى التحقق من الصحة - رسم تأثير معلمة تشعبية واحدة
  • رسم منحنى التعلم لتحليل الأداء التدريبي للشبكة العصبية
  • التدريب العملي على K-Means Clustering

ادعموني ككاتبة

أتمنى أنك استمتعت بقراءة هذا المقال. إذا كنت ترغب في دعمي ككاتب، يرجى النظر في ذلك الاشتراك للحصول على العضوية للحصول على وصول غير محدود إلى Medium. لا يتكلف سوى 5 دولارات شهريًا وسأتلقى جزءًا من رسوم عضويتك.

شكرا جزيلا لدعمكم المستمر! نراكم في المقال التالي. تعلم سعيد للجميع!

معلومات مجموعة بيانات سرطان الثدي

  • تنويه: دوا ، د.غراف ، سي (2019). مستودع تعلم الآلة UCI [http://archive.ics.uci.edu/ml]. إيرفين ، كاليفورنيا: جامعة كاليفورنيا ، كلية المعلومات وعلوم الكمبيوتر.
  • المصدر https://archive.ics.uci.edu/ml/datasets/breast+cancer+wisconsin+(diagnostic)
  • رخصة: د. وليام هـ. وولبرج (قسم الجراحة العامة.
    جامعة ويسكونسن) ، شارع دبليو نيك (قسم علوم الحاسبات.
    جامعة ويسكونسن) و أولفي L. Mangasarian (قسم علوم الكمبيوتر بجامعة ويسكونسن) يحمل حقوق الطبع والنشر لمجموعة البيانات هذه. تبرع Nick Street بمجموعة البيانات هذه للجمهور تحت ترخيص Creative Commons Attribution 4.0 (CC BY 4.0). يمكنك معرفة المزيد حول أنواع تراخيص مجموعة البيانات المختلفة هنا.

معلومات مجموعة بيانات قزحية العين

  • تنويه: دوا ، د.غراف ، سي (2019). مستودع تعلم الآلة UCI [http://archive.ics.uci.edu/ml]. إيرفين ، كاليفورنيا: جامعة كاليفورنيا ، كلية المعلومات وعلوم الكمبيوتر.
  • المصدر https://archive.ics.uci.edu/ml/datasets/iris
  • رخصة: RA فيشر تمتلك حقوق الطبع والنشر لمجموعة البيانات هذه. تبرع مايكل مارشال بمجموعة البيانات هذه للجمهور تحت رخصة المشاع الإبداعي للملك العام (CC0). يمكنك معرفة المزيد حول أنواع تراخيص مجموعة البيانات المختلفة هنا.

معلومات مجموعة البيانات الإعلانية

مراجع حسابات

10 تصورات مذهلة للتعلم الآلي يجب أن تعرفها في عام 2023 10 عبر https://towardsdatascience.com/feed

<!–

->

الطابع الزمني:

اكثر من مستشارو Blockchain