يوفر LightGBM المدمج في Amazon SageMaker الآن تدريبًا موزعًا باستخدام Dask

أعاد نشره أفلاطون

المتابعون: 0

الأمازون SageMaker يوفر مجموعة من خوارزميات مدمجة, نماذج مدربة مسبقًاو قوالب الحلول الجاهزة لمساعدة علماء البيانات وممارسي التعلم الآلي (ML) على البدء في التدريب ونشر نماذج التعلم الآلي بسرعة. يمكنك استخدام هذه الخوارزميات والنماذج لكل من التعلم الخاضع للإشراف وغير الخاضع للإشراف. يمكنهم معالجة أنواع مختلفة من بيانات الإدخال ، بما في ذلك الجدول والصورة والنص.

بدءًا من اليوم ، تقدم خوارزمية SageMaker LightGBM تدريبًا موزعًا باستخدام داسك إطار لكل من التصنيف الجدولي ومهام الانحدار. إنها متاحة من خلال SageMaker بيثون SDK. يمكن أن يكون تنسيق البيانات المدعوم إما CSV أو الباركيه. يتم إجراء تجارب قياس الأداء واسعة النطاق على ثلاث مجموعات بيانات متاحة للجمهور مع إعدادات مختلفة للتحقق من أدائها.

يهتم العملاء بشكل متزايد بنماذج التدريب على مجموعات البيانات الكبيرة باستخدام SageMaker LightGBM ، والتي قد تستغرق يومًا أو أكثر. في هذه الحالات ، قد تتمكن من تسريع العملية من خلال توزيع التدريب على أجهزة أو عمليات متعددة في مجموعة. يناقش هذا المنشور كيف يساعدك SageMaker LightGBM في إعداد التدريب الموزع وإطلاقه ، دون تكلفة وصعوبة إدارة مجموعات التدريب الخاصة بك بشكل مباشر.

بيان المشكلة

أصبح التعلم الآلي أداة أساسية لاستخراج الرؤى من كميات كبيرة من البيانات. من التعرف على الصور والكلام إلى معالجة اللغة الطبيعية والتحليلات التنبؤية ، تم تطبيق نماذج ML على مجموعة واسعة من المشاكل. مع استمرار نمو مجموعات البيانات من حيث الحجم والتعقيد ، يمكن أن تصبح أساليب التدريب التقليدية مستهلكة للوقت وكثيفة الموارد بشكل متزايد. هذا هو المكان الذي يلعب فيه التدريب الموزع.

التدريب الموزع هو تقنية تسمح بالمعالجة المتوازية لكميات كبيرة من البيانات عبر أجهزة أو أجهزة متعددة. من خلال تقسيم البيانات وتدريب نماذج متعددة على التوازي ، يمكن أن يقلل التدريب الموزع بشكل كبير من وقت التدريب ويحسن أداء النماذج على البيانات الضخمة. في السنوات الأخيرة ، كان التدريب الموزع آلية شائعة في تدريب الشبكات العصبية العميقة على حالات الاستخدام مثل نماذج اللغة الكبيرة (LLMs) ، وإنشاء الصور وتصنيفها ، ومهام إنشاء النص باستخدام أطر عمل مثل PyTorch و TensorFlow و MXNet. في هذا المنشور ، نناقش كيف يمكن تطبيق التدريب الموزع على البيانات الجدولية (نوع شائع من البيانات موجود في العديد من الصناعات مثل التمويل والرعاية الصحية والتجزئة) باستخدام خوارزمية Dask و LightGBM لمهام مثل الانحدار والتصنيف.

Dask هي مكتبة حوسبة متوازية مفتوحة المصدر تسمح بالمعالجة المتوازية الموزعة لمجموعات البيانات الكبيرة في Python. إنه مصمم للعمل مع نظام Python والنظام البيئي الحالي لعلوم البيانات مثل NumPy و Pandas. عندما يتعلق الأمر بالتدريب الموزع ، يمكن استخدام Dask لموازنة تحميل البيانات والمعالجة المسبقة ومهام التدريب النموذجية ، وهو يتكامل جيدًا مع خوارزميات ML الشائعة مثل LightGBM. LightGBM هو إطار عمل معزز متدرج يستخدم خوارزميات التعلم القائمة على الأشجار ، والتي تم تصميمها لتكون فعالة وقابلة للتطوير لتدريب النماذج الكبيرة على البيانات الضخمة. من خلال الجمع بين هاتين المكتبتين القويتين ، تم دمج LightGBM v3.2.0 الآن مع Dask للسماح بالتعلم الموزع عبر أجهزة متعددة لإنتاج نموذج واحد.

كيف يعمل التدريب الموزع

التدريب الموزع على الخوارزميات المستندة إلى الشجرة هو أسلوب يتم استخدامه عندما تكون مجموعة البيانات كبيرة جدًا بحيث لا يمكن معالجتها على مثيل واحد أو عندما لا تكون الموارد الحسابية لمثيل واحد كافية لتدريب النموذج المستند إلى الشجرة بكمية معقولة من الوقت. يسمح بتدريب نموذج عبر مثيلات أو آلات متعددة ، بدلاً من جهاز واحد. يتم ذلك عن طريق تقسيم مجموعة البيانات إلى مجموعات فرعية أصغر تسمى قطع، وتوزيعها على المثيلات المتاحة. ثم يقوم كل مثيل بتدريب نموذج على مجموعة البيانات المخصصة له ، ويتم دمج النتائج لاحقًا باستخدام خوارزميات التجميع لتشكيل نموذج واحد.

في النماذج المستندة إلى الأشجار مثل LightGBM ، تكمن التكلفة الحسابية الرئيسية في بناء هيكل الشجرة. يتم ذلك عادةً عن طريق فرز واختيار مجموعات فرعية من البيانات.

الآن ، دعنا نستكشف كيف يقوم LightGBM بالتدريب الموازي. يمكن لـ LightGBM استخدام ثلاثة أنواع من التوازي:

توازي البيانات - هذا هو الشكل الأساسي لتوازي البيانات. يتم تقسيم البيانات أفقيًا إلى مجموعات فرعية أصغر ويتم توزيعها بين مثيلات متعددة. يقوم كل مثيل ببناء المدرج التكراري المحلي الخاص به ، ويتم دمج جميع الرسوم البيانية ، ثم يتم إجراء الانقسام باستخدام ملف تقليل التشتت الخوارزمية. يتم إنشاء المدرج التكراري في الحالات المحلية عن طريق تقسيم المجموعة الفرعية من البيانات المحلية إلى صناديق منفصلة ، وحساب عدد نقاط البيانات في كل حاوية. تساعد هذه الخوارزمية القائمة على الرسم البياني في تسريع التدريب وتقليل استخدام الذاكرة.
ميزة التوازي - في توازي الميزات ، يكون كل جهاز مسؤولاً عن تدريب مجموعة فرعية من ميزات النموذج ، بدلاً من مجموعة فرعية من البيانات. يمكن أن يكون هذا مفيدًا عند العمل مع مجموعات البيانات التي تحتوي على عدد كبير من الميزات ، لأنها تتيح استخدامًا أكثر كفاءة للموارد. إنه يعمل من خلال العثور على أفضل نقطة انقسام محلية في كل حالة ، ثم يقوم بتوصيل أفضل تقسيم مع المثيلات الأخرى. يحافظ تطبيق LightGBM على جميع ميزات البيانات في كل جهاز لتقليل تكلفة توصيل أفضل الانقسامات.
موازاة التصويت - في موازاة التصويت ، يتم تقسيم البيانات إلى مجموعات فرعية أصغر وتوزيعها على أجهزة متعددة. تقوم كل آلة بتدريب نموذج على مجموعة البيانات الفرعية المخصصة لها ، ويتم دمج النتائج لاحقًا لتشكيل نموذج واحد أكبر. ومع ذلك ، بدلاً من استخدام التدرجات من جميع الأجهزة لتحديث معلمات النموذج ، يتم استخدام آلية التصويت لتحديد التدرجات التي يجب استخدامها. يمكن أن يكون هذا مفيدًا عند العمل مع مجموعات البيانات التي تحتوي على الكثير من الضوضاء أو القيم المتطرفة ، لأنها يمكن أن تساعد في تقليل تأثير هذه على النموذج النهائي. في وقت كتابة هذا المنشور ، كان تكامل LightGBM مع Dask يدعم فقط أنواع البيانات والتصويت المتوازية.

سيقوم SageMaker بإعداد وإدارة مجموعة Dask تلقائيًا عند استخدام مثيلات متعددة مع حاوية LightGBM المدمجة.

حل نظرة عامة

عندما تبدأ مهمة تدريبية باستخدام LightGBM بحالات متعددة ، نقوم أولاً بإنشاء مجموعة Dask. يعمل مثيل واحد كمجدول Dask ، والمثيلات المتبقية لها عمال Dask ، حيث يكون لكل عامل مؤشرات ترابط متعددة. كل عامل في العنقود لديه جزء من البيانات لإجراء الحسابات الموزعة ، كما هو موضح في الشكل التالي.

يوفر LightGBM المدمج في Amazon SageMaker الآن تدريبًا موزعًا باستخدام Dask PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.

تمكين التدريب الموزع

متطلبات بيانات الإدخال هي كما يلي:

يمكن أن يكون تنسيق بيانات الإدخال المدعوم للتدريب إما CSV أو باركيه. يُسمح لك بوضع أكثر من ملف بيانات واحد تحت كل من قنوات التدريب وقنوات التحقق من الصحة. إذا تم تحديد ملفات متعددة ، فستقوم الخوارزمية بتجميعها جميعًا على أنها بيانات تدريب أو التحقق من الصحة. يمكن أن يكون اسم ملف البيانات أي سلسلة طالما أنه ينتهي بـ .csv أو .parquet.
لكل ملف بيانات ، تتطلب الخوارزمية أن يكون المتغير الهدف في العمود الأول وأنه لا ينبغي أن يحتوي على سجل رأس. هذا يتبع اتفاقية خوارزمية SageMaker XGBoost.
إذا كانت تنبئك تتضمن ميزات فئوية ، فيمكنك تقديم ملف JSON مسمى cat_index.json في نفس موقع بيانات التدريب الخاصة بك. يجب أن يحتوي هذا الملف على قاموس Python ، حيث يمكن أن يكون المفتاح أي سلسلة والقيمة هي قائمة من الأعداد الصحيحة الفريدة. يجب أن يشير كل عدد صحيح في قائمة القيم إلى فهرس العمود الخاص بالميزات الفئوية المقابلة في ملف البيانات الخاص بك. يبدأ المؤشر بالقيمة 1 ، لأن القيمة 0 تتوافق مع المتغير المستهدف. ال cat_index.json يجب وضع الملف تحت دليل بيانات التدريب ، كما هو موضح في المثال التالي.
نوع المثيل الذي يدعمه التدريب الموزع هو وحدة المعالجة المركزية.

دعنا نستخدم البيانات بتنسيق CSV كمثال. يمكن تنظيم بيانات القطار والتحقق من الصحة على النحو التالي:

-- training_dataset_s3_path -- data_1.csv -- data_2.csv -- data_3.csv -- cat_idx.json -- validation_dataset_s3_path -- data_1.csv

يمكنك تحديد نوع الإدخال ليكون إما text/csv or application/x-parquet:

from sagemaker.inputs import TrainingInput content_type = "text/csv" # or "application/x-parquet" train_input = TrainingInput( training_dataset_s3_path, content_type=content_type
) validation_input = TrainingInput( validation_dataset_s3_path, content_type=content_type
)

قبل التدريب الموزع ، يمكنك استرداد المعلمات الفائقة الافتراضية لـ LightGBM وتجاوزها بقيم مخصصة:

from sagemaker import hyperparameters # Retrieve the default hyper-parameters for LightGBM
hyperparameters = hyperparameters.retrieve_default( model_id=train_model_id, model_version=train_model_version
) # [Optional] Override default hyperparameters with custom values
hyperparameters[ "num_boost_round"
] = "500" hyperparameters["tree_learner"] = "voting" ### specify either 'data' or 'voting' parallelism for distributed training. Unfortnately, for dask lightgbm, the 'feature' is not supported. See github issue: https://github.com/microsoft/LightGBM/issues/3834

لتمكين التدريب الموزع ، يمكنك ببساطة تحديد الحجة instance_count في الفصل sagemaker.estimator.Estimator أن يكون أكثر من 1. يتم الاعتناء ببقية العمل تحت غطاء المحرك. انظر رمز المثال التالي:

from sagemaker.estimator import Estimator
from sagemaker.utils import name_from_base training_job_name = name_from_base("sagemaker-built-in-distributed-lgb") # Create SageMaker Estimator instance
tabular_estimator = Estimator( role=aws_role, image_uri=train_image_uri, source_dir=train_source_uri, model_uri=train_model_uri, entry_point="transfer_learning.py", instance_count=4, ### select the instance count you would like to use for distributed training volume_size=30, ### volume_size (int or PipelineVariable): Size in GB of the storage volume to use for storing input and output data during training (default: 30). instance_type=training_instance_type, max_run=360000, hyperparameters=hyperparameters, output_path=s3_output_location,
) # Launch a SageMaker Training job by passing s3 path of the training data
tabular_estimator.fit( { "train": train_input, "validation": validation_input, }, logs=True, job_name=training_job_name
)

تُظهر لقطات الشاشة التالية سجل عمل تدريب ناجح من دفتر الملاحظات. سجلات مختلفة الأمازون الحوسبة المرنة السحابية تتميز أجهزة (Amazon EC2) بألوان مختلفة.

التدريب الموزع متوافق أيضًا مع SageMaker ضبط النموذج التلقائي. لمزيد من التفاصيل ، انظر سبيل المثال دفتر.

المقارنة

لقد أجرينا تجارب معيارية للتحقق من صحة أداء التدريب الموزع في SageMaker LightGBM على ثلاث مجموعات بيانات مختلفة متاحة للجمهور لمهام التصنيف الانحدار والثنائي ومتعدد الفئات. تفاصيل التجربة كالتالي:

يتم تقسيم كل مجموعة بيانات إلى بيانات التدريب والتحقق من الصحة والاختبار وفقًا لقاعدة الانقسام 80/20/10. لكل مجموعة بيانات ونوع مثيل وعددها ، نقوم بتدريب LightGBM على بيانات التدريب ؛ تسجيل المقاييس مثل الوقت القابل للفوترة (لكل حالة) ، ووقت التشغيل الإجمالي ، ومتوسط خسارة التدريب في نهاية آخر شجرة مبنية على جميع الحالات ، وفقدان التحقق من الصحة في نهاية آخر شجرة مبنية ؛ وتقييم أدائها على بيانات الاختبار المستمر.
لكل تجربة ، نستخدم نفس المجموعة بالضبط من قيم المعلمات الفائقة ، حيث يبلغ عدد الأشجار 500 شجرة باستثناء مجموعة بيانات الإقراض. بالنسبة لمجموعة بيانات الإقراض ، نستخدم 100 كعدد الأشجار لأنه يكفي للحصول على أفضل النتائج في بيانات اختبار الانتظار.
تم حساب متوسط كل رقم معروض في الجدول على ثلاث تجارب.
نظرًا لأنه يتم تدريب كل نموذج بمجموعة واحدة ثابتة من قيم المعلمات الفائقة ، يمكن تحسين أرقام قياس التقييم في بيانات اختبار الانتظار بشكل أكبر باستخدام تحسين المعلمة الفائقة.

الوقت القابل للفوترة يشير إلى وقت ساعة الحائط المطلق. إجمالي وقت التشغيل هو الوقت المرن الذي يدير التدريب الموزع ، والذي يتضمن الوقت والوقت القابل للفوترة لتدوير المثيلات وتثبيت التبعيات. بالنسبة لفقدان التحقق من الصحة في نهاية آخر شجرة مبنية ، لم نقم بعمل المتوسط على جميع المثيلات كخسارة تدريب لأن جميع بيانات التحقق من الصحة تم تعيينها لمثيل واحد ، وبالتالي فإن هذا المثيل فقط لديه مقياس فقدان التحقق . نفاد الذاكرة (OOM) يعني أن مجموعة البيانات أصابت خطأ نفاد الذاكرة أثناء التدريب. وظيفة الخسارة ومقاييس التقييم المستخدمة هي ثنائي ومتعدد الطبقات logloss, L2, دقة, F1, روك الجامعة الأمريكية, ماكرو F1, F1 مايكرو ، R2, MAEو MSE.

التوقع هو أنه مع زيادة عدد المثيلات ، ينخفض الوقت القابل للفوترة (لكل مثيل) وإجمالي وقت التشغيل ، بينما يظل متوسط خسارة التدريب وفقدان التحقق من الصحة في نهاية آخر شجرة مبنية ونتائج التقييم على بيانات اختبار الانتظار هي نفس.

أجرينا ثلاث تجارب:

قياس الأداء على مجموعتي بيانات متاحتين للجمهور باستخدام CSV كتنسيق بيانات الإدخال
ضع علامة مرجعية على مجموعة بيانات مختلفة باستخدام Parquet كتنسيق بيانات الإدخال
قارن أداء النموذج على أنواع المثيلات المختلفة مع إعطاء عدد معين من المثيلات

مجموعات البيانات التي استخدمناها هي بيانات إقراض النادي, بيانات الكودو بيانات سيارات الأجرة في مدينة نيويورك. يتم تقديم إحصاءات البيانات على النحو التالي.

بيانات	المقاس	عدد الأمثلة	عدد الميزات	نوع المشكلة
قرض النادي	~ 10 جرام	1، 439، 141	955	التصنيف الثنائي
الكود	~ 10 جرام	18، 268، 221	9	تصنيف متعدد الفئات (عدد الفئات في الهدف: 10)
تاكسي مدينة نيويورك	~ 0.5 جرام	83، 601، 440	8	تراجع

يحتوي الجدول التالي على نتائج قياس الأداء لمجموعتي البيانات الأولين باستخدام CSV كتنسيق إدخال البيانات. لأغراض توضيحية ، قمنا بإزالة الميزات الفئوية لبيانات قرض نادي الإقراض. يتم عرض إحصائيات البيانات في الجدول. تتوافق نتائج التجربة مع توقعاتنا.

بيانات	عدد المثيلات (m5.2xlarge)	الوقت القابل للفوترة لكل مثيل (بالثواني)	إجمالي وقت التشغيل (بالثواني)	متوسط خسارة التدريب على جميع المثيلات في نهاية آخر شجرة تم بناؤها	فقدان التحقق من الصحة في نهاية آخر شجرة تم بناؤها	مقاييس التقييم على بيانات اختبار الانتظار
قرض النادي	.	.	.	اللوغوس الثنائي	اللوغوس الثنائي	صحة (٪)	F1 (٪)	ROC الجامعة الأمريكية (٪)
.	1	خارج الذاكرة
.	2	خارج الذاكرة
.	4	461	614	0.034	0.039	98.9	96.6	99.7
.	6	375	561	0.034	0.039	98.9	96.6	99.7
.	8	359	549	0.034	0.039	98.9	96.7	99.7
.	10	338	522	0.036	0.037	98.9	96.6	99.7
.
الكود	.	.	.	متعدد الطبقات logloss	متعدد الطبقات logloss	صحة (٪)	F1 ماكرو (٪)	F1 مايكرو (٪)
.	1	5329	5414	0.937	0.947	65.6	59.3	65.6
.	2	3175	3294	0.94	0.942	65.5	59	65.5
.	4	2593	2695	0.937	0.942	65.6	59.3	65.6
.	8	2253	2377	0.938	0.943	65.6	59.3	65.6
.	10	2160	2285	0.937	0.942	65.6	59.3	65.6

يحتوي الجدول التالي على نتائج قياس الأداء باستخدام بيانات سيارات الأجرة في مدينة نيويورك مع الباركيه كتنسيق بيانات الإدخال. بالنسبة لبيانات سيارات الأجرة في مدينة نيويورك ، نستخدم ملف سجلات تاكسي الرحلة الصفراء من 2009 إلى 2022. نحن نتبع سبيل المثال دفتر لإجراء معالجة الميزات. تستهلك البيانات المعالجة 8.5 جيجا بايت من ذاكرة القرص عند حفظها بتنسيق CSV ، و 0.55 جيجا فقط عند حفظها بتنسيق باركيه.

لوحظ نمط مماثل موضح في الجدول السابق. مع زيادة عدد المثيلات ، ينخفض الوقت القابل للفوترة (لكل مثيل) وإجمالي وقت التشغيل ، بينما يظل متوسط خسارة التدريب وفقدان التحقق من الصحة في نهاية الشجرة المبنية الأخيرة ونتائج التقييم على بيانات اختبار الانتظار كما هي.

بيانات	عدد المثيلات (m5.4xlarge)	الوقت القابل للفوترة لكل مثيل (بالثواني)	إجمالي وقت التشغيل (بالثواني)	متوسط خسارة التدريب على جميع المثيلات في نهاية آخر شجرة تم بناؤها	فقدان التحقق من الصحة في نهاية آخر شجرة تم بناؤها	مقاييس التقييم على بيانات اختبار الانتظار
تاكسي مدينة نيويورك	.	.	.	L2	L2	R2 (٪)	MSE	MAE
.	1	951	1036	6.543	6.543	54.7	42.8	2.7
.	2	635	727	6.545	6.545	54.7	42.8	2.7
.	4	501	628	6.637	6.639	53.4	44.1	2.8
.	6	435	552	6.74	6.74	52	45.4	2.8
.	8	410	510	6.919	6.924	52.3	44.9	2.9

نجري أيضًا تجارب قياس الأداء ونقارن الأداء في ظل أنواع مثيلات مختلفة باستخدام مجموعة بيانات الكود. بالنسبة لعدد مثيل معين ، عندما يصبح نوع المثيل أكبر ، ينخفض الوقت القابل للفوترة وإجمالي وقت التشغيل.

.	مل		مل		مل
عدد المثيلات	الوقت القابل للفوترة لكل مثيل (بالثواني)	إجمالي وقت التشغيل (بالثواني)	الوقت القابل للفوترة لكل مثيل (بالثواني)	إجمالي وقت التشغيل (بالثواني)	الوقت القابل للفوترة لكل مثيل (بالثواني)	إجمالي وقت التشغيل (بالثواني)
1	5329	5414	2793	2904	1302	1394
2	3175	3294	1911	2000	1006	1098
4	2593	2695	1451	1557	891	973

وفي الختام

بفضل قوة إطار الحوسبة الموزعة في Dask وخوارزمية تعزيز التدرج الفعال لـ LightGBM ، يمكن لعلماء البيانات والمطورين تدريب النماذج على مجموعات البيانات الكبيرة بشكل أسرع وأكثر كفاءة من استخدام أساليب العقدة المفردة التقليدية. تجعل خوارزمية SageMaker LightGBM عملية إعداد التدريب الموزع باستخدام إطار عمل Dask لكل من التصنيف المجدول ومهام الانحدار أسهل بكثير. الخوارزمية متاحة الآن من خلال SageMaker Python SDK. يمكن أن يكون تنسيق البيانات المدعوم إما CSV أو باركيه. تم إجراء تجارب قياس الأداء واسعة النطاق على ثلاث مجموعات بيانات متاحة للجمهور مع إعدادات مختلفة للتحقق من أدائها.

يمكنك إحضار مجموعة البيانات الخاصة بك وتجربة هذه الخوارزميات الجديدة على SageMaker ، وتحقق من ملف سبيل المثال دفتر لاستخدام الخوارزميات المضمنة المتوفرة على GitHub.

عن المؤلفين

يوفر LightGBM المدمج في Amazon SageMaker الآن تدريبًا موزعًا باستخدام Dask PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية. الدكتور شين هوانغ هو عالم تطبيقي في Amazon SageMaker JumpStart وخوارزميات Amazon SageMaker المدمجة. يركز على تطوير خوارزميات التعلم الآلي القابلة للتطوير. تتركز اهتماماته البحثية في مجال معالجة اللغة الطبيعية ، والتعلم العميق القابل للتفسير على البيانات المجدولة ، والتحليل القوي لتجميع الزمكان غير المعياري. وقد نشر العديد من الأوراق البحثية في ACL و ICDM ومؤتمرات KDD والجمعية الملكية للإحصاء: مجلة Series A.

ويل بدر هو اختصاصي رئيسي في الذكاء الاصطناعي / تعلم الآلة SA يعمل كجزء من فريق التعلم الآلي العالمي في أمازون. ويل متحمس لاستخدام التكنولوجيا بطرق مبتكرة للتأثير بشكل إيجابي على المجتمع. في أوقات فراغه ، يحب الغوص ولعب كرة القدم واستكشاف جزر المحيط الهادئ.

الدكتور لي تشانغ هو مدير المنتج الرئيسي - التقني لخوارزميات Amazon SageMaker JumpStart و Amazon SageMaker المضمنة ، وهي خدمة تساعد علماء البيانات وممارسي التعلم الآلي على البدء في التدريب ونشر نماذجهم ، وتستخدم التعلم المعزز مع Amazon SageMaker. فاز عمله السابق كعضو فريق بحث رئيسي ومخترع رئيسي في IBM Research بجائزة اختبار ورقة الوقت في IEEE INFOCOM.

محتوى مدعوم من تحسين محركات البحث وتوزيع العلاقات العامة. تضخيم اليوم.
بلاتوبلوكشين. Web3 Metaverse Intelligence. تضخيم المعرفة. الوصول هنا.
المصدر https://aws.amazon.com/blogs/machine-learning/amazon-sagemaker-built-in-lightgbm-now-offers-distributed-training-using-dask/

الطابع الزمني: ٣ فبراير ٢٠٢٤

الطابع الزمني: أبريل 26، 2024

يقدم LightGBM المدمج في Amazon SageMaker الآن تدريبًا موزعًا باستخدام Dask

أعاد نشره أفلاطون

بيان المشكلة

كيف يعمل التدريب الموزع

حل نظرة عامة

تمكين التدريب الموزع

المقارنة

وفي الختام

عن المؤلفين

اكثر من التعلم الآلي من AWS

يختار الآن Amazon SageMaker Automatic Model Tuning تلقائيًا تكوينات الضبط لتحسين قابلية الاستخدام وكفاءة التكلفة | خدمات أمازون ويب

اكتشاف الشذوذ باستخدام Amazon SageMaker Edge Manager باستخدام AWS IoT Greengrass V2

أفضل الممارسات وأنماط التصميم لبناء مسارات عمل التعلم الآلي باستخدام Amazon SageMaker Pipelines | خدمات ويب أمازون

جدولة دفاتر ملاحظاتك من أي بيئة JupyterLab باستخدام ملحق Amazon SageMaker JupyterLab | خدمات أمازون ويب

استخدم عينات Github مع Amazon SageMaker Data Wrangler

من نحن

البحث العمودي و Ai

الانطلاق

ابق على تواصل

حسابي