تسريع نتائج الأعمال من خلال تحسينات في الأداء بنسبة 70٪ لمعالجة البيانات والتدريب والاستدلال باستخدام Amazon SageMaker Canvas | خدمات أمازون ويب

تسريع نتائج الأعمال من خلال تحسينات في الأداء بنسبة 70٪ لمعالجة البيانات والتدريب والاستدلال باستخدام Amazon SageMaker Canvas | خدمات أمازون ويب

قماش أمازون سيج ميكر هي واجهة مرئية تمكن محللي الأعمال من إنشاء تنبؤات دقيقة للتعلم الآلي (ML) من تلقاء أنفسهم ، دون الحاجة إلى أي خبرة في تعلم الآلة أو الحاجة إلى كتابة سطر واحد من التعليمات البرمجية. تتيح واجهة المستخدم البديهية لـ SageMaker Canvas لمحللي الأعمال تصفح مصادر البيانات المختلفة والوصول إليها في السحابة أو في أماكن العمل ، وإعداد البيانات واستكشافها ، وبناء نماذج ML وتدريبها ، وإنشاء تنبؤات دقيقة داخل مساحة عمل واحدة.

يسمح SageMaker Canvas للمحللين باستخدام أحمال عمل بيانات مختلفة لتحقيق نتائج الأعمال المطلوبة بدقة وأداء عاليين. يتم استخراج متطلبات الحوسبة والتخزين والذاكرة لإنشاء تنبؤات دقيقة من المستخدم النهائي ، مما يمكّنه من التركيز على مشكلة العمل التي يتعين حلها. في وقت سابق من هذا العام ، نحن أعلن تحسينات الأداء استنادًا إلى ملاحظات العملاء لتقديم أوقات تدريب نموذجية أسرع وأكثر دقة باستخدام SageMaker Canvas.

في هذا المنشور ، نوضح كيف يمكن لـ SageMaker Canvas الآن معالجة البيانات وتدريب النماذج وإنشاء تنبؤات مع زيادة السرعة والكفاءة لأحجام مجموعات البيانات المختلفة.

المتطلبات الأساسية المسبقة

إذا كنت ترغب في المتابعة ، فأكمل المتطلبات الأساسية التالية:

  1. أحصل على حساب AWS.
  2. قم بإعداد قماش SageMaker. للحصول على تعليمات ، راجع المتطلبات الأساسية لإعداد Amazon SageMaker Canvas.
  3. قم بتنزيل مجموعتي البيانات التاليتين على جهاز الكمبيوتر المحلي لديك. الأول هو مجموعة بيانات NYC Yellow Taxi Trip؛ والثاني هو بيانات سلوك التجارة الإلكترونية حول أحداث البيع بالتجزئة المتعلقة بالمنتجات والمستخدمين.

تأتي كلتا مجموعتي البيانات تحت ترخيص Attribution 4.0 International (CC BY 4.0) وهم أحرار في المشاركة والتكيف.

تحسينات معالجة البيانات

مع تحسينات الأداء الأساسية ، تحسن وقت استيراد البيانات إلى SageMaker Canvas بأكثر من 70٪. يمكنك الآن استيراد مجموعات بيانات تصل إلى 2 جيجا بايت في حوالي 50 ثانية وما يصل إلى 5 جيجا بايت في حوالي 65 ثانية.

تسريع نتائج الأعمال من خلال تحسينات في الأداء بنسبة 70% لمعالجة البيانات والتدريب والاستدلال باستخدام Amazon SageMaker Canvas | أمازون ويب سيرفيسز PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.

بعد استيراد البيانات ، يقوم محللو الأعمال عادةً بالتحقق من صحة البيانات للتأكد من عدم وجود مشكلات في مجموعة البيانات. يمكن أن تضمن عمليات التحقق من الصحة النموذجية احتواء الأعمدة على نوع البيانات الصحيح ، ومعرفة ما إذا كانت نطاقات القيمة تتماشى مع التوقعات ، والتأكد من وجود تفرد في القيم عند الاقتضاء ، وغيرها.

أصبح التحقق من صحة البيانات أسرع الآن. في اختباراتنا ، استغرقت جميع عمليات التحقق من الصحة 50 ثانية لمجموعة بيانات سيارات الأجرة التي يتجاوز حجمها 5 غيغابايت ، وهو تحسن في السرعة بمقدار 10 مرات.

تسريع نتائج الأعمال من خلال تحسينات في الأداء بنسبة 70% لمعالجة البيانات والتدريب والاستدلال باستخدام Amazon SageMaker Canvas | أمازون ويب سيرفيسز PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.

تحسينات التدريب النموذجية

تمكّنك تحسينات الأداء المتعلقة بتدريب نموذج ML في SageMaker Canvas الآن من تدريب النماذج دون الوقوع في حالات فشل محتملة لطلبات نفاد الذاكرة.

تُظهر لقطة الشاشة التالية نتائج تشغيل بناء ناجح باستخدام مجموعة بيانات كبيرة تأثير total_amount ميزة على المتغير الهدف.

تسريع نتائج الأعمال من خلال تحسينات في الأداء بنسبة 70% لمعالجة البيانات والتدريب والاستدلال باستخدام Amazon SageMaker Canvas | أمازون ويب سيرفيسز PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.

تحسينات الاستدلال

أخيرًا ، حققت تحسينات استدلال SageMaker Canvas تقليل استهلاك الذاكرة بمقدار 3.5 مرة في حالة وجود مجموعات بيانات أكبر في اختبارنا الداخلي.

وفي الختام

في هذا المنشور ، رأينا العديد من التحسينات مع SageMaker Canvas في الاستيراد والتحقق من الصحة والتدريب والاستدلال. لقد لاحظنا زيادة في قدرته على استيراد مجموعات البيانات الكبيرة بنسبة 70٪. لقد رأينا تحسنًا بمقدار 10 مرات في التحقق من صحة البيانات ، وانخفاضًا بمقدار 3.5 مرة في استهلاك الذاكرة. تتيح لك هذه التحسينات العمل بشكل أفضل مع مجموعات البيانات الكبيرة وتقليل الوقت عند إنشاء نماذج ML باستخدام SageMaker Canvas.

نحن نشجعك على تجربة التحسينات بنفسك. نرحب بتعليقاتك لأننا نعمل باستمرار على تحسينات الأداء لتحسين تجربة المستخدم.


عن المؤلفين

تسريع نتائج الأعمال من خلال تحسينات في الأداء بنسبة 70% لمعالجة البيانات والتدريب والاستدلال باستخدام Amazon SageMaker Canvas | أمازون ويب سيرفيسز PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.بيتر تشونج هو مهندس حلول لـ AWS ، ومتحمس لمساعدة العملاء في الكشف عن الرؤى من بياناتهم. لقد عمل على بناء حلول لمساعدة المؤسسات على اتخاذ قرارات تعتمد على البيانات في كل من القطاعين العام والخاص. وهو حاصل على جميع شهادات AWS بالإضافة إلى شهادتي GCP. يستمتع بالقهوة والطبخ والبقاء نشيطًا وقضاء الوقت مع أسرته.

تسريع نتائج الأعمال من خلال تحسينات في الأداء بنسبة 70% لمعالجة البيانات والتدريب والاستدلال باستخدام Amazon SageMaker Canvas | أمازون ويب سيرفيسز PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.تيم سونغ هو مهندس تطوير برمجيات في AWS SageMaker ، ويتمتع بخبرة تزيد عن 10 سنوات كمطور برامج ومستشار وقائد تقني ، وقد أظهر قدرته على تقديم منتجات قابلة للتطوير وموثوقة وحل المشكلات المعقدة. في أوقات فراغه ، يستمتع بالطبيعة والجري في الهواء الطلق والمشي لمسافات طويلة وما إلى ذلك.

تسريع نتائج الأعمال من خلال تحسينات في الأداء بنسبة 70% لمعالجة البيانات والتدريب والاستدلال باستخدام Amazon SageMaker Canvas | أمازون ويب سيرفيسز PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.هاريهاران سوريش هو مهندس حلول أول في AWS. إنه شغوف بقواعد البيانات والتعلم الآلي وتصميم الحلول المبتكرة. قبل انضمامه إلى AWS ، كان Hariharan مهندسًا للمنتجات ، ومتخصصًا في تنفيذ الخدمات المصرفية الأساسية ، ومطورًا ، وعمل مع مؤسسات BFSI لأكثر من 11 عامًا. بعيدًا عن التكنولوجيا ، فهو يستمتع بالطيران المظلي وركوب الدراجات.

تسريع نتائج الأعمال من خلال تحسينات في الأداء بنسبة 70% لمعالجة البيانات والتدريب والاستدلال باستخدام Amazon SageMaker Canvas | أمازون ويب سيرفيسز PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.مايا هايلي مهندس حلول في Amazon Web Services ومقرها في منطقة واشنطن العاصمة. في هذا الدور ، تساعد عملاء القطاع العام على تحقيق أهداف مهمتهم من خلال حلول مصممة جيدًا على AWS. لديها 5 سنوات من الخبرة تمتد من الرعاية الصحية غير الربحية ووسائل الإعلام والترفيه وتجارة التجزئة. شغفها هو الاستفادة من الذكاء (AI) والتعلم الآلي (ML) لمساعدة عملاء القطاع العام على تحقيق أهدافهم التجارية والتقنية.

الطابع الزمني:

اكثر من التعلم الآلي من AWS