PaddleOCR على متن الطائرة مع مشاريع Amazon SageMaker لـ MLOps لإجراء التعرف البصري على الأحرف على مستندات الهوية

أعاد نشره أفلاطون

المتابعون: 0

التعرف الضوئي على الحروف (OCR) هو مهمة تحويل النص المطبوع أو المكتوب بخط اليد إلى نص مشفر آليًا. تم استخدام التعرف الضوئي على الحروف على نطاق واسع في سيناريوهات مختلفة ، مثل إلكترون المستندات ومصادقة الهوية. نظرًا لأن التعرف الضوئي على الحروف يمكن أن يقلل بشكل كبير من الجهد اليدوي لتسجيل المعلومات الأساسية ويكون بمثابة خطوة دخول لفهم كميات كبيرة من المستندات ، فإن نظام التعرف الضوئي على الحروف الدقيق يلعب دورًا حاسمًا في عصر التحول الرقمي.

يركز مجتمع المصادر المفتوحة والباحثون على كيفية تحسين دقة التعرف الضوئي على الحروف ، وسهولة الاستخدام ، والتكامل مع النماذج المدربة مسبقًا ، والإرشاد ، والمرونة. من بين العديد من الأطر المقترحة ، اكتسب PaddleOCR اهتمامًا متزايدًا مؤخرًا. يركز الإطار المقترح على الحصول على دقة عالية مع موازنة الكفاءة الحسابية. بالإضافة إلى ذلك ، فإن النماذج المدربة مسبقًا للغة الصينية والإنجليزية تجعلها شائعة في السوق القائمة على اللغة الصينية. انظر PaddleOCR جيثب الريبو لمزيد من التفاصيل.

في AWS ، اقترحنا أيضًا خدمات AI متكاملة جاهزة للاستخدام بدون خبرة في التعلم الآلي (ML). لاستخراج النص والبيانات المنظمة مثل الجداول والنماذج من المستندات ، يمكنك استخدام أمازون تيكستراك. يستخدم تقنيات ML لقراءة أي نوع من المستندات ومعالجته ، واستخراج النص والكتابة اليدوية والجداول والبيانات الأخرى بدقة دون أي جهد يدوي.

لعلماء البيانات الذين يريدون المرونة في استخدام إطار عمل مفتوح المصدر لتطوير نموذج OCR الخاص بك ، نقدم أيضًا خدمة ML المُدارة بالكامل الأمازون SageMaker. يمكّنك SageMaker من تنفيذ أفضل ممارسات MLOps طوال دورة حياة ML ، ويوفر قوالب ومجموعات أدوات لتقليل الرفع الثقيل غير المتمايز لوضع مشروعات ML في الإنتاج.

في هذا المنشور ، نركز على تطوير نماذج مخصصة ضمن إطار عمل PaddleOCR على SageMaker. نسير خلال دورة حياة تطوير ML لتوضيح كيف يمكن لـ SageMaker مساعدتك في بناء نموذج وتدريبه ، وفي النهاية نشر النموذج كخدمة ويب. على الرغم من أننا نوضح هذا الحل باستخدام PaddleOCR ، فإن الإرشادات العامة صحيحة بالنسبة للأطر التعسفية التي سيتم استخدامها في SageMaker. لمرافقة هذا المنشور ، نقدم أيضًا نموذجًا للرمز بتنسيق مستودع جيثب.

إطار عمل PaddleOCR

كإطار عمل OCR معتمد على نطاق واسع ، يحتوي PaddleOCR على اكتشاف النص المنسق والتعرف على النص وخوارزميات من طرف إلى طرف. يختار التفاضل التفاضلي (DB) والشبكة العصبية المتكررة التلافيفية (CRNN) كنماذج أساسية للكشف والتعرف ، ويقترح سلسلة من النماذج ، تسمى PP-OCR ، للتطبيقات الصناعية بعد سلسلة من استراتيجيات التحسين.

يهدف نموذج PP-OCR إلى سيناريوهات عامة ويشكل مكتبة نموذجية للغات مختلفة. يتكون من ثلاثة أجزاء: اكتشاف النص ، واكتشاف الصندوق وتصحيحه ، والتعرف على النص ، كما هو موضح في الشكل التالي على PaddleOCR مستودع GitHub الرسمي. يمكنك أيضًا الرجوع إلى ورقة البحث PP-OCR: نظام OCR عملي خفيف الوزن للغاية للمزيد من المعلومات.

لكي تكون أكثر تحديدًا ، يتكون PaddleOCR من ثلاث مهام متتالية:

كشف النص - الغرض من اكتشاف النص هو تحديد منطقة النص في الصورة. يمكن أن تستند هذه المهام على شبكة تجزئة بسيطة.
كشف الصندوق وتصحيحه - يجب تحويل كل مربع نص إلى مربع مستطيل أفقي للتعرف على النص لاحقًا. للقيام بذلك ، يقترح PaddleOCR تدريب مصنف اتجاه النص (مهمة تصنيف الصورة) لتحديد اتجاه النص.
التعرف على النص - بعد اكتشاف مربع النص ، يقوم نموذج أداة التعرف على النص بإجراء استدلال على كل مربع نص وإخراج النتائج وفقًا لموقع مربع النص. يعتمد PaddleOCR على طريقة CRNN المستخدمة على نطاق واسع.

يوفر PaddleOCR نماذج عالية الجودة مدربة مسبقًا يمكن مقارنتها بالتأثيرات التجارية. يمكنك إما استخدام النموذج المدرب مسبقًا لنموذج الكشف أو مصنف الاتجاه أو نموذج التعرف ، أو يمكنك ضبط كل نموذج فردي وإعادة تدريبه لخدمة حالة الاستخدام الخاصة بك. لزيادة كفاءة وفعالية اكتشاف الصينية التقليدية والإنجليزية ، نوضح كيفية ضبط نموذج التعرف على النص. النموذج المدربين مسبقًا الذي نختاره هو ch_ppocr_mobile_v2.0_rec_train، وهو نموذج خفيف الوزن يدعم اللغة الصينية والإنجليزية والتعرف على الأرقام. فيما يلي مثال على نتيجة الاستدلال باستخدام بطاقة هوية هونج كونج.

في الأقسام التالية ، نتعرف على كيفية ضبط النموذج المدرب مسبقًا باستخدام SageMaker.

أفضل ممارسات MLOps مع SageMaker

SageMaker هي خدمة ML مُدارة بالكامل. باستخدام SageMaker ، يمكن لعلماء البيانات والمطورين إنشاء نماذج ML وتدريبها بسرعة وسهولة ، ثم نشرها مباشرةً في بيئة مُدارة جاهزة للإنتاج.

يستخدم العديد من علماء البيانات SageMaker لتسريع دورة حياة ML. في هذا القسم ، نوضح كيف يمكن لـ SageMaker مساعدتك من التجريب إلى إنتاج ML. باتباع الخطوات القياسية لمشروع ML ، من العبارة التجريبية (تطوير الكود والتجارب) ، إلى العبارة التشغيلية (أتمتة نموذج بناء سير العمل وخطوط أنابيب النشر) ، يمكن لـ SageMaker تحقيق الكفاءة في الخطوات التالية:

استكشف البيانات وقم ببناء كود ML باستخدام أمازون ساجميكر ستوديو دفاتر الملاحظات.
تدريب وضبط النموذج مع وظيفة تدريب SageMaker.
انشر النموذج بنقطة نهاية SageMaker لخدمة النموذج.
نسق سير العمل مع خطوط أنابيب Amazon SageMaker.

يوضح الرسم البياني التالي هذه البنية وسير العمل.

من المهم ملاحظة أنه يمكنك استخدام SageMaker بطريقة معيارية. على سبيل المثال ، يمكنك إنشاء التعليمات البرمجية الخاصة بك باستخدام بيئة تطوير متكاملة محلية (IDE) وتدريب نموذجك ونشره على SageMaker ، أو يمكنك تطوير نموذجك وتدريبه في مصادر حساب المجموعة الخاصة بك ، واستخدام خط أنابيب SageMaker لتنسيق سير العمل و النشر على نقطة نهاية SageMaker. هذا يعني أن SageMaker يوفر منصة مفتوحة للتكيف مع متطلباتك الخاصة.

انظر الى الكود في موقعنا مستودع جيثب و README لفهم بنية الكود.

توفير مشروع SageMaker

يمكنك استخدام مشاريع Amazon SageMaker لتبدأ رحلتك. باستخدام مشروع SageMaker ، يمكنك إدارة إصدارات مستودعات Git الخاصة بك حتى تتمكن من التعاون عبر الفرق بكفاءة أكبر ، وضمان تناسق التعليمات البرمجية ، وتمكين التكامل المستمر والتسليم المستمر (CI / CD). على الرغم من أن أجهزة الكمبيوتر المحمولة مفيدة لبناء النماذج وتجريبها ، فعندما يكون لديك فريق من علماء البيانات ومهندسي تعلم الآلة يعملون على مشكلة تعلّم الآلة ، فأنت بحاجة إلى طريقة أكثر قابلية للتطوير للحفاظ على اتساق الكود ولديك تحكم أكثر صرامة في الإصدار.

تقوم مشاريع SageMaker بإنشاء قالب MLOps مكون مسبقًا ، والذي يتضمن المكونات الأساسية لتبسيط تكامل PaddleOCR:

مستودع أكواد لإنشاء صور حاوية مخصصة للمعالجة والتدريب والاستدلال ، مدمج مع أدوات CI / CD. هذا يسمح لنا بتكوين صورة Docker المخصصة الخاصة بنا والضغط إلى سجل الأمازون المرنة للحاويات (Amazon ECR) ليكون جاهزًا للاستخدام.
خط أنابيب SageMaker يحدد خطوات إعداد البيانات والتدريب وتقييم النموذج وتسجيل النموذج. هذا يعدنا لنكون جاهزين MLOps عندما ينتقل مشروع ML إلى الإنتاج.
الموارد المفيدة الأخرى ، مثل مستودع Git للتحكم في إصدار التعليمات البرمجية ، ومجموعة النماذج التي تحتوي على إصدارات النموذج ، ومشغل تغيير التعليمات البرمجية لخط أنابيب بناء النموذج ، والمشغل المستند إلى الحدث لخط أنابيب نشر النموذج.

يمكنك استخدام التعليمات البرمجية الأولية لـ SageMaker لإنشاء مشاريع SageMaker قياسية ، أو قالب معين أنشأته مؤسستك لأعضاء الفريق. في هذا المنشور ، نستخدم المعيار نموذج MLOps لبناء الصورة وبناء النماذج ونشر النموذج. لمزيد من المعلومات حول إنشاء مشروع في الاستوديو ، ارجع إلى أنشئ مشروع MLOps باستخدام Amazon SageMaker Studio.

استكشف البيانات وأنشئ كود ML باستخدام SageMaker Studio Notebooks

دفاتر SageMaker Studio هي دفاتر ملاحظات تعاونية يمكنك تشغيلها بسرعة لأنك لست بحاجة إلى إعداد مثيلات الحوسبة وتخزين الملفات مسبقًا. يفضل العديد من علماء البيانات استخدام IDE المستند إلى الويب لتطوير كود ML ، وتصحيح أخطاء API للمكتبة بسرعة ، وتشغيل الأشياء مع عينة صغيرة من البيانات للتحقق من صحة البرنامج النصي للتدريب.

في دفاتر ملاحظات Studio ، يمكنك استخدام بيئة سابقة الإنشاء لأطر عمل مشتركة مثل TensorFlow و PyTorch و Pandas و Scikit-Learn. يمكنك تثبيت التبعيات على النواة المبنية مسبقًا ، أو إنشاء صورة النواة الدائمة الخاصة بك. لمزيد من المعلومات ، يرجى الرجوع إلى قم بتثبيت مكتبات ونواة خارجية في Amazon SageMaker Studio. توفر أجهزة كمبيوتر Studio المحمولة أيضًا بيئة Python لتشغيل وظائف تدريب SageMaker أو النشر أو خدمات AWS الأخرى. في الأقسام التالية ، نوضح كيفية استخدام دفاتر ملاحظات Studio كبيئة لبدء التدريب ومهام النشر.

يوفر SageMaker بيئة تطوير متكاملة قوية ؛ إنها منصة تعلم مفتوحة حيث يتمتع علماء البيانات بالمرونة لاستخدام بيئة التطوير المفضلة لديهم. بالنسبة لعلماء البيانات الذين يفضلون IDE محلي مثل PyCharm أو Visual Studio Code ، يمكنك استخدام بيئة Python المحلية لتطوير كود ML الخاص بك ، واستخدام SageMaker للتدريب في بيئة قابلة للتطوير مُدارة. لمزيد من المعلومات، راجع قم بتشغيل مهمة TensorFlow على Amazon SageMaker باستخدام PyCharm IDE. بعد أن يكون لديك نموذج قوي ، يمكنك اعتماد أفضل ممارسات MLOps مع SageMaker.

حاليًا ، يوفر SageMaker أيضًا ملفات مثيلات دفتر SageMaker كحلنا القديم لبيئة Jupyter Notebook. لديك المرونة لتشغيل أمر Docker build و استخدم الوضع المحلي SageMaker للتدريب على مثيل الكمبيوتر الدفتري الخاص بك. نوفر أيضًا نموذجًا لرمز PaddleOCR في مستودع الكود الخاص بنا: ./train_and_deploy/notebook.ipynb.

أنشئ صورة مخصصة باستخدام قالب مشروع SageMaker

يستخدم SageMaker بشكل مكثف حاويات Docker لمهام الإنشاء ووقت التشغيل. يمكنك تشغيل الحاوية الخاصة بك مع SageMaker بسهولة. انظر المزيد من التفاصيل الفنية في استخدم خوارزميات التدريب الخاصة بك.

ومع ذلك ، بصفتك عالم بيانات ، قد لا يكون بناء حاوية أمرًا سهلاً. توفر مشاريع SageMaker طريقة بسيطة لك لإدارة التبعيات المخصصة من خلال خط أنابيب CI / CD لبناء الصورة. عند استخدام مشروع SageMaker ، يمكنك إجراء تحديثات على صورة التدريب باستخدام حاوية Dockerfile المخصصة. للحصول على إرشادات خطوة بخطوة ، راجع أنشئ مشاريع Amazon SageMaker باستخدام خطوط أنابيب CI / CD لبناء الصور. من خلال الهيكل المقدم في النموذج ، يمكنك تعديل الكود المقدم في هذا المستودع لبناء حاوية تدريب PaddleOCR.

بالنسبة لهذا المنشور ، نعرض بساطة إنشاء صورة مخصصة للمعالجة والتدريب والاستدلال. يحتوي GitHub repo على ثلاثة مجلدات:

هذه المشاريع تتبع هيكل مماثل. خذ صورة حاوية التدريب كمثال ؛ ال image-build-train/ يحتوي المستودع على الملفات التالية:

ملف codebuild-buildspec.yml الذي يتم استخدامه لتكوين ملفات AWS كود البناء بحيث يمكن إنشاء الصورة ودفعها إلى Amazon ECR.
ملف Docker المستخدم لبناء Docker ، والذي يحتوي على جميع التبعيات وكود التدريب.
نقطة دخول train.py للبرنامج النصي للتدريب ، مع جميع المعلمات الفائقة (مثل معدل التعلم وحجم الدُفعة) التي يمكن تهيئتها كوسيطة. يتم تحديد هذه الحجج عند بدء وظيفة التدريب.
التبعيات.

عندما تدفع الرمز إلى المستودع المقابل ، يتم تشغيله خط أنابيب AWS لبناء حاوية تدريب لك. يتم تخزين صورة الحاوية المخصصة في مستودع Amazon ECR ، كما هو موضح في الشكل السابق. تم اعتماد إجراء مماثل لتوليد صورة الاستدلال.

قم بتدريب النموذج باستخدام SDK للتدريب على SageMaker

بعد التحقق من صحة كود الخوارزمية وتعبئته في حاوية ، يمكنك استخدام وظيفة تدريب SageMaker لتوفير بيئة مُدارة لتدريب النموذج. هذه البيئة سريعة الزوال ، مما يعني أنه يمكنك الحصول على موارد حساب منفصلة وآمنة (مثل GPU) أو بيئة موزعة متعددة GPU لتشغيل التعليمات البرمجية الخاصة بك. عند اكتمال التدريب ، يحفظ SageMaker عيوب النموذج الناتجة في ملف خدمة تخزين أمازون البسيطة (Amazon S3) الذي تحدده. تظل جميع بيانات السجل والبيانات الوصفية موجودة في ملف وحدة تحكم إدارة AWSو Studio و الأمازون CloudWatch.

تتضمن الوظيفة التدريبية عدة أجزاء مهمة من المعلومات:

عنوان URL لحاوية S3 حيث قمت بتخزين بيانات التدريب
عنوان URL لحاوية S3 حيث تريد تخزين مخرجات الوظيفة
موارد الحوسبة المُدارة التي تريد أن يستخدمها SageMaker لتدريب النموذج
مسار Amazon ECR حيث يتم تخزين حاوية التدريب

لمزيد من المعلومات حول وظائف التدريب ، انظر نماذج القطار. رمز المثال لوظيفة التدريب متاح في تجارب-قطار-دفتر ملاحظات.

يجعل SageMaker المعلمات الفائقة في ملف CreateTrainingJob طلب متاح في حاوية Docker في /opt/ml/input/config/hyperparameters.json ملف.

نستخدم حاوية التدريب المخصصة كنقطة دخول ونحدد بيئة GPU للبنية التحتية. يتم تفصيل جميع المعلمات التشعبية ذات الصلة كمعلمات ، مما يسمح لنا بتتبع تكوين كل وظيفة على حدة ، ومقارنتها بتتبع التجربة.

نظرًا لأن عملية علم البيانات موجهة للغاية نحو البحث ، فمن الشائع إجراء تجارب متعددة بشكل متوازٍ. يتطلب هذا نهجًا يتتبع جميع التجارب المختلفة والخوارزميات المختلفة ومجموعات البيانات والمعلمات الفائقة التي تمت تجربتها. تتيح لك Amazon SageMaker Experiments تنظيم وتتبع ومقارنة وتقييم تجارب ML الخاصة بك. نظهر هذا أيضًا في تجارب-قطار-دفتر ملاحظات. لمزيد من التفاصيل ، يرجى الرجوع إلى إدارة التعلم الآلي باستخدام تجارب Amazon SageMaker.

نشر النموذج لخدمة النموذج

بالنسبة للنشر ، خاصة لخدمة النماذج في الوقت الفعلي ، قد يجد العديد من علماء البيانات صعوبة في القيام بذلك دون مساعدة من فرق العمليات. يجعل SageMaker من السهل نشر نموذجك المدرّب في الإنتاج باستخدام ملف SageMaker بيثون SDK. يمكنك نشر النموذج الخاص بك في خدمات استضافة SageMaker والحصول على نقطة نهاية لاستخدامها في الاستدلال في الوقت الفعلي.

في العديد من المؤسسات ، قد لا يكون علماء البيانات مسؤولين عن صيانة البنية التحتية لنقطة النهاية. ومع ذلك ، فإن اختبار النموذج الخاص بك كنقطة نهاية وضمان سلوكيات التنبؤ الصحيحة هو في الواقع مسؤولية علماء البيانات. لذلك ، قام SageMaker بتبسيط المهام للنشر عن طريق إضافة مجموعة من الأدوات و SDK لهذا الغرض.

بالنسبة لحالة الاستخدام في المنشور ، نريد أن نمتلك إمكانيات تفاعلية في الوقت الفعلي وزمن انتقال منخفض. الاستدلال في الوقت الحقيقي مثالي لهذا العبء الاستدلال. ومع ذلك ، هناك العديد من الخيارات للتكيف مع كل متطلب محدد. لمزيد من المعلومات ، يرجى الرجوع إلى نشر النماذج للاستدلال.

لنشر الصورة المخصصة ، يمكن لعلماء البيانات استخدام SageMaker SDK ، الموضحة في

تجارب-نشر-دفتر ملاحظات.

في مجلة create_model طلب ، يتضمن تعريف الحاوية ModelDataUrl المعلمة ، التي تحدد موقع Amazon S3 حيث يتم تخزين عناصر النموذج. يستخدم SageMaker هذه المعلومات لتحديد مكان نسخ عناصر النموذج. يقوم بنسخ القطع الأثرية إلى ملف /opt/ml/model دليل للاستخدام من خلال رمز الاستدلال الخاص بك. ال serve و predictor.py هي نقطة الدخول للخدمة ، مع أداة النموذج التي يتم تحميلها عند بدء النشر. لمزيد من المعلومات، راجع استخدم كود الاستدلال الخاص بك مع خدمات الاستضافة.

نظم سير عملك مع خطوط أنابيب SageMaker

تتمثل الخطوة الأخيرة في التفاف التعليمات البرمجية الخاصة بك على أنها تدفقات عمل MLOps شاملة ، وتطبيق أفضل ممارسات MLOps. في SageMaker ، تتم إدارة عبء عمل بناء النموذج ، وهو رسم بياني دوري موجه (DAG) ، بواسطة SageMaker Pipelines. خطوط الأنابيب هي خدمة مُدارة بالكامل تدعم التنسيق وتتبع نسب البيانات. بالإضافة إلى ذلك ، نظرًا لتكامل خطوط الأنابيب مع SageMaker Python SDK ، يمكنك إنشاء خطوط الأنابيب الخاصة بك برمجيًا باستخدام واجهة Python عالية المستوى التي استخدمناها سابقًا أثناء خطوة التدريب.

نحن نقدم مثالاً على رمز خط الأنابيب لتوضيح التنفيذ في خط أنابيب.

يتضمن خط الأنابيب خطوة معالجة مسبقة لإنشاء مجموعة البيانات وخطوة التدريب وخطوة الحالة وخطوة تسجيل النموذج. في نهاية كل عملية تشغيل ، قد يرغب علماء البيانات في تسجيل نموذجهم لعناصر تحكم الإصدار ونشر النموذج الأفضل أداءً. يوفر سجل نموذج SageMaker مكانًا مركزيًا لإدارة إصدارات النماذج ونماذج الكتالوج وتشغيل النشر الآلي للنموذج مع حالة الموافقة لنموذج معين. لمزيد من التفاصيل ، يرجى الرجوع إلى تسجيل النماذج ونشرها باستخدام نموذج التسجيل.

في نظام ML ، يساعد تنظيم سير العمل الآلي على منع تدهور أداء النموذج ، أي انحراف النموذج. يتيح لك الاكتشاف المبكر والاستباقي لانحرافات البيانات اتخاذ إجراءات تصحيحية ، مثل نماذج إعادة التدريب. يمكنك تشغيل خط أنابيب SageMaker لإعادة تدريب إصدار جديد من النموذج بعد اكتشاف الانحرافات. يمكن أيضًا تحديد مشغل خط الأنابيب بواسطة الأمازون SageMaker نموذج مراقب، والتي تراقب باستمرار جودة النماذج في الإنتاج. من خلال القدرة على التقاط البيانات لتسجيل المعلومات ، يدعم Model Monitor مراقبة جودة البيانات والنموذج ، والتحيز ، ومراقبة انحراف إسناد الميزات. لمزيد من التفاصيل ، انظر نماذج المراقبة للبيانات وجودة النموذج ، والتحيز ، وقابلية الشرح.

وفي الختام

في هذا المنشور ، أوضحنا كيفية تشغيل إطار العمل PaddleOCR على SageMaker لمهام التعرف الضوئي على الحروف. لمساعدة علماء البيانات على الانضمام إلى SageMaker بسهولة ، انتقلنا خلال دورة حياة تطوير ML ، من بناء الخوارزميات ، إلى التدريب ، إلى استضافة النموذج كخدمة ويب للاستدلال في الوقت الفعلي. يمكنك استخدام رمز القالب الذي قدمناه لترحيل إطار عمل تعسفي إلى منصة SageMaker. جربه لمشروع ML الخاص بك وأخبرنا بقصص نجاحك.

حول المؤلف

جوني (جاكي) ليو هو عالم تطبيقي أقدم في AWS. لديها سنوات عديدة من الخبرة العملية في مجال التعلم الآلي. لديها خبرة عملية غنية في تطوير وتنفيذ الحلول في بناء نماذج التعلم الآلي في خوارزميات التنبؤ بسلسلة التوريد ، وأنظمة توصية الإعلانات ، ومنطقة التعرف الضوئي على الحروف (OCR) و البرمجة اللغوية العصبية (NLP).

يانوي كوي، دكتوراه ، مهندس حلول متخصص في التعلم الآلي في AWS. بدأ أبحاث التعلم الآلي في IRISA (معهد أبحاث علوم الكمبيوتر والأنظمة العشوائية) ، ولديه عدة سنوات من الخبرة في بناء تطبيقات صناعية مدعومة بالذكاء الاصطناعي في رؤية الكمبيوتر ومعالجة اللغة الطبيعية والتنبؤ بسلوك المستخدم عبر الإنترنت. في AWS ، يشارك خبرة المجال ويساعد العملاء على إطلاق العنان لإمكانات الأعمال ، وتحقيق نتائج قابلة للتنفيذ من خلال التعلم الآلي على نطاق واسع. خارج العمل ، يستمتع بالقراءة والسفر.

يي آن تشين هي مطورة برامج في Amazon Lab 126. لديها أكثر من 10 سنوات من الخبرة في تطوير منتجات تعتمد على التعلم الآلي عبر مختلف التخصصات ، بما في ذلك التخصيص ومعالجة اللغة الطبيعية ورؤية الكمبيوتر. خارج العمل ، تحب الجري لمسافات طويلة وركوب الدراجات.

الطابع الزمني: 8 تموز، 202222 تموز، 2022

الطابع الزمني: أغسطس 10، 2023

على متن الطائرة PaddleOCR مع Amazon SageMaker Projects لـ MLOps لإجراء التعرف البصري على الأحرف في مستندات الهوية

أعاد نشره أفلاطون

إطار عمل PaddleOCR

أفضل ممارسات MLOps مع SageMaker

توفير مشروع SageMaker

استكشف البيانات وأنشئ كود ML باستخدام SageMaker Studio Notebooks

أنشئ صورة مخصصة باستخدام قالب مشروع SageMaker

قم بتدريب النموذج باستخدام SDK للتدريب على SageMaker

نشر النموذج لخدمة النموذج

نظم سير عملك مع خطوط أنابيب SageMaker

وفي الختام

حول المؤلف

اكثر من التعلم الآلي من AWS

إطلاق العنان للكفاءة: تسخير قوة التنفيذ الانتقائي في خطوط أنابيب Amazon SageMaker | خدمات أمازون ويب

تقديم برنامج النموذج المخصص لمركز AWS Geneative AI Innovation Center لـ Anthropic Claude | خدمات الويب الأمازون

تحديد مشكلات البيانات الشائعة وتجنبها أثناء عدم إنشاء نماذج ML البرمجية باستخدام Amazon SageMaker Canvas

قم بإعداد بيانات السلاسل الزمنية باستخدام Amazon SageMaker Data Wrangler

نماذج الاستضافة في SageMaker: أفضل الممارسات في اختبار النماذج وتحديثها على SageMaker

قم بحل مشاكل العمل من البداية إلى النهاية من خلال التعلم الآلي في حلول Amazon SageMaker JumpStart

أنشئ خطوط أنابيب لبناء نموذج Amazon SageMaker وانشر نماذج R باستخدام RStudio على Amazon SageMaker

من نحن

البحث العمودي و Ai

الانطلاق

ابق على تواصل

حسابي