تنبؤ سهل ودقيق باستخدام ذكاء بيانات AutoGluon-TimeSeries PlatoBlockchain. البحث العمودي. منظمة العفو الدولية.

التنبؤ السهل والدقيق مع AutoGluon-TimeSeries

AutoGluon-TimeSeries هي أحدث إضافة إلى AutoGluon ، والتي تساعدك بسهولة على بناء نماذج قوية للتنبؤ بالسلسلة الزمنية مع أقل من ثلاثة أسطر من التعليمات البرمجية.

يعد التنبؤ بالسلاسل الزمنية مهمة شائعة في مجموعة واسعة من الصناعات وكذلك المجالات العلمية. يعد الوصول إلى تنبؤات موثوقة للعرض أو الطلب أو السعة أمرًا بالغ الأهمية للتخطيط للأعمال. ومع ذلك ، فإن التنبؤ بالسلاسل الزمنية يمثل مشكلة صعبة ، خاصةً عند توفر الآلاف من السلاسل الزمنية المحتملة ذات الصلة ، مثل المبيعات في كتالوج كبير في التجارة الإلكترونية ، أو السعة في مئات المواقع التشغيلية.

غالبًا ما تكون طرق التنبؤ الإحصائي أو القائم على الحكم البسيطة خطوط أساس قوية بالفعل يصعب تحسينها باستخدام أساليب التعلم الآلي الجديدة (ML). علاوة على ذلك ، تتنوع تطبيقات التطورات الحديثة في تعلم الآلة للتنبؤ ، مع طرق قليلة مثل DeepAR [1] أو محولات الاندماج المؤقتة [2] ظهرت كخيارات شائعة. ومع ذلك ، يصعب تدريب هذه الأساليب وضبطها ونشرها في الإنتاج ، مما يتطلب معرفة متخصصة في ML وتحليل السلاسل الزمنية.

يعد AutoML موضوعًا سريع النمو داخل ML ، مع التركيز على أتمتة المهام الشائعة في خطوط أنابيب ML ، بما في ذلك المعالجة المسبقة للميزات واختيار النموذج وضبط النموذج والتجميع والنشر. AutoGluon-TimeSeries هي أحدث إضافة إلى AutoGluon، أحد حلول AutoML الرائدة مفتوحة المصدر ، ويبني على إطار عمل AutoGluon القوي لـ AutoML في مهام التنبؤ. تم تصميم AutoGluon-TimeSeries لبناء أنظمة تنبؤ قوية بأقل من ثلاثة أسطر من التعليمات البرمجية ، مما يخفف من تحديات المعالجة المسبقة للميزات ، واختيار النموذج ، وضبط النموذج ، وسهولة النشر.

بدعوة بسيطة إلى AutoGluon-TimeSeries TimeSeriesPredictor، يتبع AutoGluon ترتيبًا بديهيًا للأولوية في النماذج الملائمة: بدءًا من خطوط الأساس البسيطة الساذجة والانتقال إلى الشبكة العصبية العالمية القوية والأساليب المعززة القائمة على الأشجار ، كل ذلك ضمن الميزانية الزمنية المحددة من قبل المستخدم. عندما تكون السلاسل الزمنية ذات الصلة (المتغيرات المشتركة المتغيرة بمرور الوقت أو المتغيرات الخارجية) أو البيانات الوصفية للعنصر (ميزات ثابتة) متاحة ، فإن AutoGluon-TimeSeries تأخذها في الاعتبار في التنبؤ. تستفيد المكتبة أيضًا من تحسين Bayesian لضبط المعلمة الفائقة ، للوصول إلى أفضل تكوين للنموذج عن طريق ضبط النماذج المعقدة. أخيرًا ، تجمع AutoGluon-TimeSeries بين أفضل الأساليب الإحصائية والمستندة إلى ML في مجموعة نموذجية مُحسّنة للمشكلة المطروحة.

في هذا المنشور ، نعرض سهولة استخدام AutoGluon-TimeSeries في بناء متنبئ قوي سريعًا.

ابدأ مع AutoGluon-TimeSeries

للبدء ، تحتاج إلى تثبيت AutoGluon ، والذي يتم تنفيذه بسهولة باستخدام نقطة على غلاف UNIX:

pip install "autogluon>=0.6"

تقدم AutoGluon-TimeSeries ملف TimeSeriesDataFrame فئة للعمل مع مجموعات البيانات التي تتضمن سلاسل زمنية متعددة ذات صلة (تسمى أحيانًا مجموعة بيانات اللوحة). يمكن إنشاء إطارات البيانات هذه من ما يسمى بإطارات بيانات التنسيق الطويلة ، والتي تحتوي على معرفات سلاسل زمنية وطوابع زمنية مرتبة في صفوف. فيما يلي أحد الأمثلة على البيانات المأخوذة من مسابقة M4 [3]. هنا ، item_id يحدد العمود المعرف الفريد لسلسلة زمنية واحدة ، مثل معرف المنتج لبيانات المبيعات اليومية للعديد من المنتجات. ال target العمود هو قيمة الفائدة التي ستتعلم AutoGluon-TimeSeries التنبؤ بها. weekend هو متغير إضافي متغير بمرور الوقت قمنا بإنتاجه لتحديد ما إذا كانت الملاحظة في عطلة نهاية الأسبوع أم لا.

يمكننا بسهولة إنتاج ملف TimeSeriesDataFrame من مجموعة البيانات هذه باستخدام امتداد from_data_frame البناء. انظر التعليمات البرمجية بايثون التالية:

df = TimeSeriesDataFrame.from_data_frame(raw_data_frame)

تحتوي بعض بيانات السلاسل الزمنية على ميزات غير متغيرة بمرور الوقت (ميزات ثابتة أو بيانات تعريف عنصر) يمكن استخدامها في تدريب نموذج التنبؤ. على سبيل المثال ، تتميز مجموعة البيانات M4 بمتغير فئة لكل سلسلة زمنية. يمكن إضافة هذه إلى TimeSeriesDataFrame عن طريق ضبط static_features متغير مع إطار بيانات جديد.

تنبؤ سهل ودقيق باستخدام ذكاء بيانات AutoGluon-TimeSeries PlatoBlockchain. البحث العمودي. منظمة العفو الدولية.

استخدم الكود التالي:

df.static_features = raw_static_features

تدريب متنبئ بالسلاسل الزمنية

أخيرًا ، يمكننا استدعاء TimeSeriesPredictor لتلائم مجموعة واسعة من نماذج التنبؤ لبناء نظام تنبؤ دقيق. انظر الكود التالي:

predictor = TimeSeriesPredictor(
    prediction_length=7,
    eval_metric="MASE",
    known_covariates_names=["weekend"],
)

هنا ، نحدد أن TimeSeriesPredictor يجب أن ينتج نماذج للتنبؤ بالفترات الزمنية السبع التالية والحكم على أفضل النماذج باستخدام متوسط ​​الخطأ المطلق (ميس). علاوة على ذلك ، نشير إلى أن المتغير المشترك متغير بمرور الوقت weekend متاح في مجموعة البيانات. يمكننا الآن احتواء كائن التوقع على TimeSeriesDataFrame أنتجت في وقت سابق:

predictor.fit(df, presets="medium_quality", time_limit=1800)

بصرف النظر عن توفير بيانات التدريب ، نطلب من المتنبئ استخدامها “medium_quality” المسبقة. تأتي AutoGluon-TimeSeries مع عدة إعدادات مسبقة لتحديد مجموعات فرعية من النماذج التي يجب مراعاتها ومقدار الوقت الذي تقضيه في ضبطها ، وإدارة المفاضلة بين سرعة التدريب مقابل الدقة. بصرف النظر عن الإعدادات المسبقة ، يمكن للمستخدمين الأكثر خبرة استخدام ملف hyperparameters حجة لتحديد نماذج المكونات بدقة والمعلمات الفائقة التي يجب تعيينها عليها. نحدد أيضًا حدًا زمنيًا يبلغ 1,800 ثانية ، وبعد ذلك يتوقف المتنبئ عن التدريب.

تحت الغطاء ، تقوم AutoGluon-TimeSeries بتدريب أكبر عدد ممكن من النماذج في غضون الإطار الزمني المحدد ، بدءًا من خطوط الأساس الساذجة ولكنها قوية والعمل نحو المتنبئين الأكثر تعقيدًا استنادًا إلى الأشجار المعززة ونماذج الشبكة العصبية. بالاتصال predictor.leaderboard()، يمكننا الاطلاع على قائمة بجميع النماذج التي دربتها ودرجات الدقة وأوقات التدريب لكل منها. لاحظ أن كل نموذج AutoGluon-TimeSeries يُبلغ عن أخطائه بتنسيق "أعلى هو أفضل" ، مما يعني أن معظم مقاييس أخطاء التنبؤ يتم ضربها في -1 عند الإبلاغ عنها. انظر المثال التالي:

              model  score_val  pred_time_val  fit_time_marginal  fit_order
0  WeightedEnsemble  -0.612510      15.406334          48.428711          8
1  AutoGluonTabular  -0.654924       1.068694         104.208688          6
2            DeepAR  -0.673366       6.731659        1065.956648          7
3     SeasonalNaive  -1.035286       0.410615           0.000742          2
4               ETS  -1.073640       5.832542           0.000584          3
5             Theta  -1.107362       1.773439           0.000614          4
6             ARIMA  -3.006273       2.483140           0.000625          5
7             Naive  -3.427339      29.532215           0.000577          1

التنبؤ مع TimeSeriesPredictor

أخيرًا ، يمكننا استخدام المتنبئ للتنبؤ بكل السلاسل الزمنية في TimeSeriesDataFrame، 7 أيام في المستقبل. لاحظ أنه نظرًا لأننا استخدمنا المتغيرات المشتركة المتغيرة بمرور الوقت والتي يُفترض أنها معروفة في المستقبل ، فيجب تحديدها أيضًا في وقت التنبؤ. انظر الكود التالي:

predictions = predictor.predict(
	df,
	known_covariates=future_known_covariates
)

بشكل افتراضي ، توفر AutoGluon-TimeSeries كلاً من التنبؤات النقطية والتنبؤات الاحتمالية (الكمية) للقيمة المستهدفة. تعد التنبؤات الاحتمالية ضرورية في العديد من مهام التخطيط ، ويمكن استخدامها لحساب الفترات الزمنية بمرونة ، مما يتيح المهام النهائية مثل تخطيط المخزون والسعة.

تنبؤ سهل ودقيق باستخدام ذكاء بيانات AutoGluon-TimeSeries PlatoBlockchain. البحث العمودي. منظمة العفو الدولية.

فيما يلي نموذج مخطط للتنبؤ يوضح تنبؤات النقاط وفترات التنبؤ.

تنبؤ سهل ودقيق باستخدام ذكاء بيانات AutoGluon-TimeSeries PlatoBlockchain. البحث العمودي. منظمة العفو الدولية.

وفي الختام

توفر AutoGluon-TimeSeries للمتنبئين وعلماء البيانات طريقة سريعة وسهلة لبناء نماذج تنبؤ قوية. بالإضافة إلى بعض ميزات المكتبة شائعة الاستخدام والتي تم عرضها في هذا المنشور ، تتميز AutoGluon-TimeSeries بمجموعة من الطرق لتكوين التنبؤات للمستخدمين المتقدمين. من السهل أيضًا تدريب المتنبئين ونشرهم وتقديمهم على نطاق واسع الأمازون SageMakerباستخدام التعلم العميق AutoGluon حاويات.

لمزيد من التفاصيل حول استخدام AutoGluon ، والأمثلة ، والبرامج التعليمية ، بالإضافة إلى المهام الأخرى التي يعالجها AutoGluon مثل التعلم على البيانات المجدولة أو متعددة الوسائط ، قم بزيارة AutoGluon. للبدء في استخدام AutoGluon-TimeSeries ، تحقق من البرنامج التعليمي للبدء السريع أو لدينا برنامج تعليمي متعمق لإلقاء نظرة أعمق على جميع الميزات التي تقدمها المكتبة. اتبع AutoGluon على تويتر، ونجمة علينا GitHub جيثب: لتكون على اطلاع بآخر التحديثات.

للتنبؤ على نطاق واسع من خلال عمليات الحوسبة وسير العمل المخصصة ، والدعم على مستوى المؤسسة ، وإمكانية شرح التوقعات والمزيد ، تحقق أيضًا توقعات الأمازون.

مراجع حسابات

[1] ساليناس وديفيد وفالنتين فلونكرت وجان جاستهاوس وتيم جانوشوفسكي. "DeepAR: التنبؤ الاحتمالي مع الشبكات المتكررة الانحدار الذاتي." المجلة الدولية للتنبؤ 36 (3): 2020-1181.

[2] ليم ، بريان ، سيركان أو أريك ، نيكولاس لوف ، وتوماس فيستر. "محولات الانصهار المؤقتة للتنبؤ بالسلسلة الزمنية متعددة الآفاق القابلة للتفسير." المجلة الدولية للتنبؤ 37.4 (2021): 1748-1764.

[3] ماكريداكيس ، وسبيروس ، وإيفانجيلوس سبيليوتيس ، وفاسيليوس أسيماكوبولوس. "مسابقة M4: 100,000 سلسلة زمنية و 61 طريقة للتنبؤ." المجلة الدولية للتنبؤ 36.1 (2020): 54-74.


عن المؤلفين

تنبؤ سهل ودقيق باستخدام ذكاء بيانات AutoGluon-TimeSeries PlatoBlockchain. البحث العمودي. منظمة العفو الدولية.كانر تركمان هو عالم تطبيقي في Amazon Web Services ، حيث يعمل على حل المشكلات عند تقاطع التعلم الآلي والتنبؤ ، بالإضافة إلى تطوير AutoGluon-TimeSeries. قبل انضمامه إلى AWS ، عمل في صناعة الاستشارات الإدارية كعالم بيانات ، حيث خدم الخدمات المالية وصناعات الاتصالات في مشاريع في جميع أنحاء العالم. تمتد اهتمامات كانر البحثية الشخصية على مجموعة من الموضوعات ، بما في ذلك التنبؤ والاستدلال السببي و AutoML.

تنبؤ سهل ودقيق باستخدام ذكاء بيانات AutoGluon-TimeSeries PlatoBlockchain. البحث العمودي. منظمة العفو الدولية.أولكسندر ششور هو عالم تطبيقي في Amazon Web Services ، حيث يعمل على التنبؤ بالسلاسل الزمنية في AutoGluon-TimeSeries. قبل انضمامه إلى AWS ، أكمل درجة الدكتوراه في التعلم الآلي من الجامعة التقنية في ميونيخ بألمانيا ، حيث أجرى أبحاثًا حول النماذج الاحتمالية لبيانات الأحداث. تشمل اهتماماته البحثية التعلم الآلي للبيانات الزمنية والنمذجة التوليدية.

تنبؤ سهل ودقيق باستخدام ذكاء بيانات AutoGluon-TimeSeries PlatoBlockchain. البحث العمودي. منظمة العفو الدولية.نيك إريكسون هو عالم تطبيقي أقدم في Amazon Web Services. حصل على درجة الماجستير في علوم الكمبيوتر والهندسة من جامعة مينيسوتا توين سيتيز. وهو المؤلف المشارك والمطور الرئيسي لإطار AutoML مفتوح المصدر AutoGluon. بدءًا من مجموعة أدوات ML للمنافسة الشخصية في عام 2018 ، قام Nick باستمرار بتوسيع قدرات AutoGluon وانضم إلى Amazon AI في عام 2019 لفتح مصدر المشروع والعمل بدوام كامل على تطوير أحدث التقنيات في AutoML.

الطابع الزمني:

اكثر من التعلم الآلي من AWS