احصل على رؤى الصحة العامة بسرعة أكبر مع التعلم الآلي بدون رمز باستخدام Amazon SageMaker Canvas | خدمات أمازون ويب

احصل على رؤى الصحة العامة بسرعة أكبر مع التعلم الآلي بدون رمز باستخدام Amazon SageMaker Canvas | خدمات أمازون ويب

تمتلك مؤسسات الصحة العامة ثروة من البيانات حول أنواع مختلفة من الأمراض والاتجاهات الصحية وعوامل الخطر. لطالما استخدم موظفوهم النماذج الإحصائية وتحليلات الانحدار لاتخاذ قرارات مهمة مثل استهداف السكان الذين لديهم أعلى عوامل الخطر لمرض بعلاجات ، أو التنبؤ بتطور الفاشيات المتعلقة.

عندما تظهر تهديدات الصحة العامة ، تزداد سرعة البيانات ، ويمكن أن تنمو مجموعات البيانات الواردة بشكل أكبر ، وتصبح إدارة البيانات أكثر صعوبة. هذا يجعل من الصعب تحليل البيانات بشكل كلي والحصول على رؤى منها. وعندما يكون الوقت جوهريًا ، فإن السرعة وخفة الحركة في تحليل البيانات واستخلاص الأفكار منها تعد من العوائق الرئيسية لتشكيل استجابات صحية سريعة وقوية.

تتضمن الأسئلة النموذجية التي تواجهها مؤسسات الصحة العامة خلال أوقات التوتر ما يلي:

  • هل سيكون هناك علاجات كافية في مكان معين؟
  • ما عوامل الخطر التي تؤدي إلى النتائج الصحية؟
  • ما هي الفئات السكانية الأكثر عرضة للإصابة بالعدوى مرة أخرى؟

نظرًا لأن الإجابة على هذه الأسئلة تتطلب فهم العلاقات المعقدة بين العديد من العوامل المختلفة - غالبًا ما تكون متغيرة وديناميكية - فإن إحدى الأدوات القوية المتاحة لدينا هي التعلم الآلي (ML) ، والتي يمكن نشرها لتحليل هذه المشكلات الكمية المعقدة والتنبؤ بها وحلها. لقد رأينا بشكل متزايد تطبيق ML لمعالجة المشاكل الصحية الصعبة مثل تصنيف أورام المخ مع تحليل الصور و توقع الحاجة إلى الصحة النفسية لنشر برامج التدخل المبكر.

ولكن ماذا يحدث إذا كانت مؤسسات الصحة العامة تفتقر إلى المهارات المطلوبة لتطبيق ML على هذه الأسئلة؟ يتم إعاقة تطبيق ML على مشاكل الصحة العامة ، وتفقد منظمات الصحة العامة القدرة على تطبيق أدوات كمية قوية لمواجهة تحدياتها.

فكيف نزيل هذه الاختناقات؟ الجواب هو إضفاء الطابع الديمقراطي على ML والسماح لعدد أكبر من المهنيين الصحيين ذوي الخبرة العميقة في المجال باستخدامه وتطبيقه على الأسئلة التي يريدون حلها.

قماش أمازون سيج ميكر هي أداة ML بدون تعليمات برمجية تمكّن اختصاصيي الصحة العامة مثل علماء الأوبئة والإعلاميين والإحصائيين الحيويين من تطبيق ML على أسئلتهم ، دون الحاجة إلى خلفية علم البيانات أو خبرة ML. يمكنهم قضاء وقتهم في البيانات ، وتطبيق خبراتهم في المجال ، واختبار الفرضيات بسرعة ، وتحديد الرؤى. تساعد Canvas على جعل الصحة العامة أكثر إنصافًا من خلال إضفاء الطابع الديمقراطي على ML ، مما يسمح لخبراء الصحة بتقييم مجموعات البيانات الكبيرة وتمكينهم من خلال رؤى متقدمة باستخدام ML.

في هذا المنشور ، نوضح كيف يمكن لخبراء الصحة العامة توقع الطلب الفعلي على علاج معين خلال الثلاثين يومًا القادمة باستخدام Canvas. يوفر لك Canvas واجهة مرئية تتيح لك إنشاء تنبؤات ML دقيقة بنفسك دون الحاجة إلى أي خبرة في تعلم الآلة أو الحاجة إلى كتابة سطر واحد من التعليمات البرمجية.

حل نظرة عامة

لنفترض أننا نعمل على البيانات التي جمعناها من ولايات عبر الولايات المتحدة. قد نشكل فرضية مفادها أن بلدية أو موقعًا معينًا ليس لديه علاجات كافية في الأسابيع القادمة. كيف نختبر ذلك بسرعة وبدرجة عالية من الدقة؟

بالنسبة لهذا المنشور ، نستخدم مجموعة بيانات متاحة للجمهور من وزارة الصحة والخدمات الإنسانية الأمريكية ، والتي تحتوي على بيانات سلاسل زمنية مجمعة من الدولة تتعلق بـ COVID-19 ، بما في ذلك استخدام المستشفى ، وتوافر بعض العلاجات ، وأكثر من ذلك بكثير. مجموعة البيانات (تم الإبلاغ عن COVID-19 تأثير المريض وقدرة المستشفى بواسطة State Timeseries (RAW)) يمكن تنزيله من healthdata.gov ، ويحتوي على 135 عمودًا وأكثر من 60,000 صف. يتم تحديث مجموعة البيانات بشكل دوري.

في الأقسام التالية ، نوضح كيفية إجراء تحليل البيانات الاستكشافية وإعدادها ، وبناء نموذج التنبؤ ML ، وإنشاء تنبؤات باستخدام Canvas.

قم بتحليل وإعداد البيانات الاستكشافية

عند القيام بتوقع السلاسل الزمنية في Canvas ، نحتاج إلى تقليل عدد الميزات أو الأعمدة وفقًا لحصص الخدمة. في البداية ، نقوم بتقليل عدد الأعمدة إلى 12 والتي من المحتمل أن تكون الأكثر صلة. على سبيل المثال ، قمنا بإسقاط الأعمدة الخاصة بالعمر لأننا نتطلع إلى توقع إجمالي الطلب. قمنا أيضًا بإسقاط الأعمدة التي كانت بياناتها مشابهة للأعمدة الأخرى التي احتفظنا بها. في التكرارات المستقبلية ، من المعقول تجربة الاحتفاظ بالأعمدة الأخرى واستخدام إمكانية شرح الميزات في Canvas لتحديد أهمية هذه الميزات والتي نريد الاحتفاظ بها. نقوم أيضًا بإعادة تسمية state العمود ل location.

بالنظر إلى مجموعة البيانات ، قررنا أيضًا إزالة جميع الصفوف لعام 2020 ، نظرًا لوجود علاجات محدودة متاحة في ذلك الوقت. هذا يسمح لنا بتقليل الضوضاء وتحسين جودة البيانات لنموذج ML للتعلم منها.

يمكن تقليل عدد الأعمدة بطرق مختلفة. يمكنك تحرير مجموعة البيانات في جدول بيانات ، أو مباشرة داخل Canvas باستخدام واجهة المستخدم.

يمكنك استيراد البيانات إلى Canvas من مصادر مختلفة ، بما في ذلك من الملفات المحلية من جهاز الكمبيوتر الخاص بك ، خدمة تخزين أمازون البسيطة (Amazon S3) دلاء ، أمازون أثينا, ندفة الثلج (انظر إعداد مجموعة بيانات التدريب والتحقق من الصحة لتصنيف الوجوه باستخدام تكامل ندفة الثلج والتدريب باستخدام Amazon SageMaker Canvas)، و أكثر من 40 مصدر بيانات إضافي.

بعد استيراد بياناتنا ، يمكننا استكشاف وتصور بياناتنا للحصول على رؤى إضافية حولها ، مثل المخططات المبعثرة أو المخططات الشريطية. ننظر أيضًا إلى العلاقة بين الميزات المختلفة للتأكد من أننا اخترنا ما نعتقد أنه الأفضل منها. تُظهر لقطة الشاشة التالية مثالاً على التصور.

احصل على رؤى الصحة العامة بسرعة أكبر من خلال التعلم الآلي بدون تعليمات برمجية باستخدام Amazon SageMaker Canvas | أمازون ويب سيرفيسز PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.

بناء نموذج التنبؤ ML

نحن الآن جاهزون لإنشاء نموذجنا ، والذي يمكننا القيام به ببضع نقرات فقط. نختار العمود الذي يحدد العلاجات المتاحة على أنها هدفنا. يحدد Canvas تلقائيًا مشكلتنا كتوقع متسلسل زمني بناءً على العمود الهدف الذي اخترناه للتو ، ويمكننا تكوين المعلمات المطلوبة.

نقوم بتكوين ملف item_id، المعرف الفريد ، كموقع لأن مجموعة البيانات الخاصة بنا يتم توفيرها حسب الموقع (ولايات الولايات المتحدة). نظرًا لأننا ننشئ تنبؤًا بسلسلة زمنية ، نحتاج إلى تحديد طابع زمني ، وهو date في مجموعة البيانات الخاصة بنا. أخيرًا ، نحدد عدد الأيام في المستقبل التي نريد توقعها (في هذا المثال ، نختار 30 يومًا). توفر Canvas أيضًا القدرة على تضمين جدول عطلة لتحسين الدقة. في هذه الحالة ، نستخدم عطلات الولايات المتحدة لأنها مجموعة بيانات مقرها الولايات المتحدة.

باستخدام Canvas ، يمكنك الحصول على رؤى من بياناتك قبل إنشاء نموذج عن طريق الاختيار معاينة النموذج. يوفر لك هذا الوقت والتكلفة من خلال عدم بناء نموذج إذا كان من غير المحتمل أن تكون النتائج مرضية. من خلال معاينة نموذجنا ، ندرك أن تأثير بعض الأعمدة منخفض ، مما يعني أن القيمة المتوقعة للعمود على النموذج منخفضة. نقوم بإزالة الأعمدة عن طريق إلغاء تحديدها في Canvas (الأسهم الحمراء في لقطة الشاشة التالية) ونرى تحسنًا في مقياس الجودة المقدر (السهم الأخضر).

احصل على رؤى الصحة العامة بسرعة أكبر من خلال التعلم الآلي بدون تعليمات برمجية باستخدام Amazon SageMaker Canvas | أمازون ويب سيرفيسز PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.

ننتقل إلى بناء نموذجنا ، لدينا خياران ، بناء سريع و بناء قياسي. يُنتج Quick build نموذجًا مدربًا في أقل من 20 دقيقة ، مع إعطاء الأولوية للسرعة على الدقة. يعد هذا أمرًا رائعًا للتجريب ، وهو نموذج أكثر شمولاً من نموذج المعاينة. ينتج الإصدار القياسي نموذجًا مدربًا في أقل من 4 ساعات ، مع إعطاء الأولوية للدقة على زمن الانتقال ، والتكرار من خلال عدد من تكوينات النموذج لتحديد أفضل نموذج تلقائيًا.

أولاً ، نجرب الإنشاء السريع للتحقق من صحة معاينة النموذج. بعد ذلك ، نظرًا لأننا سعداء بالنموذج ، اخترنا Standard build لكي تساعد Canvas في بناء أفضل نموذج ممكن لمجموعة البيانات الخاصة بنا. إذا كان نموذج البناء السريع قد أنتج نتائج غير مرضية ، فسنرجع ونعدل بيانات الإدخال لالتقاط مستوى أعلى من الدقة. يمكننا تحقيق ذلك ، على سبيل المثال ، عن طريق إضافة أو إزالة أعمدة أو صفوف في مجموعة البيانات الأصلية الخاصة بنا. يدعم نموذج الإنشاء السريع التجريب السريع دون الحاجة إلى الاعتماد على موارد علوم البيانات النادرة أو الانتظار حتى يكتمل نموذج كامل.

توليد تنبؤات

الآن وقد تم بناء النموذج ، يمكننا التنبؤ بتوافر العلاجات من خلال location. لنلقِ نظرة على شكل مخزوننا الفعلي المقدّر للأيام الثلاثين القادمة ، في هذه الحالة لواشنطن العاصمة.

تنتج Canvas تنبؤات احتمالية للطلب العلاجي ، مما يسمح لنا بفهم كل من القيمة المتوسطة والحدود العليا والسفلى. في لقطة الشاشة التالية ، يمكنك رؤية نهاية البيانات التاريخية (البيانات من مجموعة البيانات الأصلية). يمكنك بعد ذلك رؤية ثلاثة خطوط جديدة: المتوسط ​​(الكم 50) المتوقع باللون البنفسجي ، والحد الأدنى (الكمية العاشرة) باللون الأزرق الفاتح ، والحد الأعلى (القيمة 10) باللون الأزرق الداكن.

احصل على رؤى الصحة العامة بسرعة أكبر من خلال التعلم الآلي بدون تعليمات برمجية باستخدام Amazon SageMaker Canvas | أمازون ويب سيرفيسز PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.

يوفر فحص الحدود العليا والسفلى نظرة ثاقبة على توزيع احتمالية التنبؤ ويسمح لنا باتخاذ قرارات مستنيرة حول المستويات المرغوبة من المخزون المحلي لهذا العلاج. يمكننا إضافة هذه الرؤية إلى البيانات الأخرى (على سبيل المثال ، توقعات تطور المرض ، أو الفعالية العلاجية والاستيعاب) لاتخاذ قرارات مستنيرة بشأن الطلبات المستقبلية ومستويات المخزون.

وفي الختام

تعمل أدوات ML بدون كود على تمكين خبراء الصحة العامة من تطبيق ML بسرعة وفعالية على تهديدات الصحة العامة. إن إضفاء الطابع الديمقراطي على تعلم الآلة يجعل مؤسسات الصحة العامة أكثر مرونة وكفاءة في مهمتها المتمثلة في حماية الصحة العامة. يمكن الآن إجراء التحليلات المخصصة التي يمكن أن تحدد الاتجاهات المهمة أو نقاط الانعطاف في مخاوف الصحة العامة مباشرة من قبل المتخصصين ، دون الحاجة إلى التنافس على موارد خبراء ML المحدودة وإبطاء أوقات الاستجابة واتخاذ القرار.

في هذا المنشور ، أظهرنا كيف يمكن لشخص ليس لديه أي معرفة بتعلم الآلة أن يستخدم Canvas للتنبؤ بالمخزون الفعلي لعلاج معين. يمكن إجراء هذا التحليل بواسطة أي محلل في هذا المجال ، من خلال قوة التقنيات السحابية و ML بدون كود. يؤدي القيام بذلك إلى توزيع القدرات على نطاق واسع ويسمح لوكالات الصحة العامة بأن تكون أكثر استجابة ، واستخدام موارد المكاتب المركزية والميدانية بكفاءة أكبر لتحقيق نتائج أفضل للصحة العامة.

ما هي بعض الأسئلة التي قد تطرحها ، وكيف يمكن لأدوات الكود المنخفض / بدون رمز أن تساعدك في الإجابة عليها؟ إذا كنت مهتمًا بمعرفة المزيد عن Canvas ، فارجع إلى قماش أمازون سيج ميكر وابدأ في تطبيق ML على أسئلتك الصحية الكمية.


عن المؤلفين

احصل على رؤى الصحة العامة بسرعة أكبر من خلال التعلم الآلي بدون تعليمات برمجية باستخدام Amazon SageMaker Canvas | أمازون ويب سيرفيسز PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.هنريك بال هو مهندس حلول أول في AWS يدعم القطاع العام في الولايات المتحدة. يعمل عن كثب مع العملاء في مجموعة من الموضوعات من التعلم الآلي إلى الأمان والحوكمة على نطاق واسع. في أوقات فراغه ، يحب ركوب الدراجات على الطرق ، والدراجات النارية ، أو قد تجده يعمل في مشروع آخر لتحسين المنزل.

احصل على رؤى الصحة العامة بسرعة أكبر من خلال التعلم الآلي بدون تعليمات برمجية باستخدام Amazon SageMaker Canvas | أمازون ويب سيرفيسز PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.دان سنريتش يؤدي Go إلى Market product management لـ Amazon SageMaker Canvas و Amazon Forecast. إنه يركز على إضفاء الطابع الديمقراطي على التعلم الآلي منخفض الكود / بدون رمز وتطبيقه لتحسين نتائج الأعمال. قبل AWS ، قام Dan ببناء منصات SaaS للمؤسسات ونماذج مخاطر السلسلة الزمنية التي يستخدمها المستثمرون المؤسسيون لإدارة المخاطر وإنشاء المحافظ. خارج العمل ، يمكن العثور عليه وهو يلعب الهوكي والغوص والسفر وقراءة الخيال العلمي.

الطابع الزمني:

اكثر من التعلم الآلي من AWS