تلخيص النص باستخدام Amazon SageMaker والوجه المتعانق

أعاد نشره أفلاطون

المتابعون: 0

في هذا المنشور ، نوضح لك كيفية تنفيذ أحد أكثر النماذج المدربة مسبقًا على Hugging Face التي تم تنزيلها والمستخدمة لتلخيص النص ، ديستيلبارت-سي إن إن-12-6، داخل دفتر Jupyter باستخدام الأمازون SageMaker و مجموعة أدوات استدلال الوجه المعانقة من SageMaker. استنادًا إلى الخطوات الموضحة في هذا المنشور ، يمكنك محاولة تلخيص النص من ملف ويكي النص-2 بيانات تدار بواسطة fast.ai، متاح في سجل البيانات المفتوحة على AWS.

تتزايد أحجام البيانات العالمية على نطاق زيتابايت حيث تقوم الشركات والمستهلكون بتوسيع استخدامهم للمنتجات الرقمية والخدمات عبر الإنترنت. لفهم هذه البيانات المتزايدة بشكل أفضل ، تطورت تقنيات التعلم الآلي (ML) لمعالجة اللغة الطبيعية (NLP) لتحليل النص لمعالجة حالات الاستخدام التي تتضمن تلخيص النص ، والتعرف على الكيانات ، والتصنيف ، والترجمة ، والمزيد. تقدم AWS تدريبًا مسبقًا خدمات AWS AI يمكن دمجها في التطبيقات باستخدام استدعاءات API ولا تتطلب خبرة في تعلم الآلة. فمثلا، فهم الأمازون يمكن أن يؤدي مهام البرمجة اللغوية العصبية مثل التعرف على الكيانات المخصصة ، وتحليل المشاعر ، واستخراج العبارة الرئيسية ، ونمذجة الموضوع ، والمزيد لجمع الأفكار من النص. يمكن أن تؤدي تحليل النص على مجموعة متنوعة من اللغات لميزاته المختلفة.

يعد تلخيص النص أسلوبًا مفيدًا في فهم كميات كبيرة من البيانات النصية لأنه ينشئ مجموعة فرعية من المعلومات ذات المعنى السياقي من المستندات المصدر. يمكنك تطبيق تقنية البرمجة اللغوية العصبية (NLP) على المستندات والمقالات النصية الأطول ، مما يتيح استهلاكًا أسرع وفهرسة مستندات أكثر فاعلية ، على سبيل المثال لتلخيص ملاحظات المكالمات من الاجتماعات.

وجه يعانق هي مكتبة مشهورة مفتوحة المصدر للغة البرمجة اللغوية العصبية ، مع أكثر من 49,000 من النماذج المدربة مسبقًا بأكثر من 185 لغة مع دعم لأطر عمل مختلفة. تتمتع AWS و Hugging Face بامتداد شراكة يسمح بالتكامل السلس من خلال SageMaker مع مجموعة من حاويات التعلم العميق (DLC) من AWS للتدريب والاستدلال في PyTorch أو TensorFlow ومقدرات وتنبؤات Hugging Face لـ SageMaker Python SDK. تساعد هذه الإمكانات في SageMaker المطورين وعلماء البيانات على بدء استخدام البرمجة اللغوية العصبية على AWS بسهولة أكبر. عادةً ما تكون معالجة النصوص باستخدام المحولات في أطر التعلم العميق مثل PyTorch مهمة معقدة وتستغرق وقتًا طويلاً لعلماء البيانات ، وغالبًا ما تؤدي إلى الإحباط ونقص الكفاءة عند تطوير مشاريع البرمجة اللغوية العصبية. يعمل ظهور مجتمعات الذكاء الاصطناعي مثل Hugging Face ، جنبًا إلى جنب مع قوة خدمات ML في السحابة مثل SageMaker ، على تسريع وتبسيط تطوير مهام معالجة النصوص هذه. يساعدك SageMaker في بناء نماذج Hugging Face وتدريبها ونشرها وتشغيلها.

نظرة عامة على تلخيص النص

يمكنك تطبيق تلخيص النص لتحديد الجمل الأساسية داخل مستند أو تحديد الجمل الأساسية عبر مستندات متعددة. يمكن أن ينتج عن تلخيص النص نوعين من الملخصات: استخلاصي وتجريدي. لا تحتوي الملخصات الاستخراجية على أي نص تم إنشاؤه آليًا وهي مجموعة من الجمل المهمة المحددة من مستند الإدخال. تحتوي الملخصات التجريدية على عبارات وجمل جديدة يمكن للبشر قراءتها تم إنشاؤها بواسطة نموذج تلخيص النص. تعتمد معظم أنظمة تلخيص النص على التلخيص الاستخراجي نظرًا لصعوبة إجراء تلخيص دقيق للنص التجريدي.

يحتوي Hugging Face على أكثر من 400 جهاز تم تدريبه مسبقًا على أحدث طراز نماذج تلخيص النص المتاحة، وتنفيذ مجموعات مختلفة من تقنيات البرمجة اللغوية العصبية. يتم تدريب هذه النماذج على مجموعات بيانات مختلفة ، ويتم تحميلها وصيانتها بواسطة شركات التكنولوجيا وأعضاء مجتمع Hugging Face. يمكنك تصفية النماذج حسب الأكثر تنزيلًا أو الأكثر إعجابًا ، وتحميلها مباشرةً عند استخدام ملف تلخيص خط أنابيب Hugging Face محول API. يبسط محول Hugging Face عملية تنفيذ البرمجة اللغوية العصبية (NLP) بحيث يمكن ضبط نماذج البرمجة اللغوية العصبية عالية الأداء لتقديم ملخصات نصية ، دون الحاجة إلى معرفة واسعة بعملية تعلم الآلة.

تعانق نماذج تلخيص نص الوجه على AWS

تقدم SageMaker لمحللي الأعمال وعلماء البيانات ومهندسي MLOps مجموعة مختارة من الأدوات لتصميم وتشغيل أعباء عمل ML على AWS. توفر لك هذه الأدوات تنفيذًا واختبارًا أسرع لنماذج ML لتحقيق أفضل النتائج.

XNUMX. من قائمة مجموعة أدوات استدلال الوجه المعانقة من SageMaker، مكتبة مفتوحة المصدر ، نحدد ثلاث طرق مختلفة لتنفيذ واستضافة نماذج تلخيص نص Hugging Face باستخدام دفتر Jupyter:

خط أنابيب تلخيص تعانق الوجه - إنشاء خط أنابيب تلخيص تعانق الوجه باستخدام "summarization"معرّف المهمة لاستخدام نموذج تلخيص افتراضي للنص للاستدلال داخل دفتر ملاحظات Jupyter. تعمل خطوط الأنابيب هذه على تجريد الكود المعقد ، مما يوفر لممارسي ML المبتدئين واجهة برمجة تطبيقات بسيطة لتنفيذ تلخيص النص بسرعة دون تكوين نقطة نهاية للاستدلال. يسمح خط الأنابيب أيضًا لممارس ML باختيار نموذج محدد مُدرَّب مسبقًا والمرمز المرتبط به. تقوم الرموز المميزة بإعداد النص ليكون جاهزًا كمدخل للنموذج عن طريق تقسيم النص إلى كلمات أو كلمات فرعية ، والتي يتم تحويلها بعد ذلك إلى معرفات من خلال جدول بحث. للتبسيط ، يوفر مقتطف الشفرة التالي الحالة الافتراضية عند استخدام خطوط الأنابيب. ال ديستيلبارت-سي إن إن-12-6 يعد النموذج أحد أكثر نماذج التلخيص التي تم تنزيلها على Hugging Face وهو ملف النموذج الافتراضي لخط أنابيب التلخيص. يستدعي السطر الأخير النموذج الذي تم تدريبه مسبقًا للحصول على ملخص للنص الذي تم تمريره وفقًا للوسيطتين المقدمتين.
```
from transformers import pipeline summarizer = pipeline("summarization")
summarizer("An apple a day, keeps the doctor away", min_length=5, max_length=20)
```
نقطة نهاية SageMaker بنموذج مدرب مسبقًا - أنشئ نقطة نهاية SageMaker بنموذج مدرب مسبقًا من معانقة الوجه النموذجي المحور ونشره على نقطة نهاية للاستدلال ، مثل مثيل ml.m5.xlarge في مقتطف الشفرة التالي. تسمح هذه الطريقة لممارسي تعلم الآلة ذوي الخبرة باختيار نماذج مفتوحة المصدر محددة بسرعة ، وضبطها ، ونشر النماذج في حالات الاستدلال عالية الأداء.
```
from sagemaker.huggingface import HuggingFaceModel
from sagemaker import get_execution_role role = get_execution_role() # Hub Model configuration. https://huggingface.co/models
hub = { 'HF_MODEL_ID':'sshleifer/distilbart-cnn-12-6', 'HF_TASK':'summarization'
} # create Hugging Face Model Class
huggingface_model = HuggingFaceModel( transformers_version='4.17.0', pytorch_version='1.10.2', py_version='py38', env=hub, role=role,
) # deploy model to SageMaker Inference
predictor = huggingface_model.deploy(initial_instance_count=1,instance_type="ml.m5.xlarge")
```
نقطة نهاية SageMaker بنموذج مدرب - أنشئ نقطة نهاية لنموذج SageMaker بنموذج مدرب مخزّن في ملف خدمة تخزين أمازون البسيطة (Amazon S3) ونشره على نقطة نهاية للاستدلال. تسمح هذه الطريقة لممارسي تعلم الآلة ذوي الخبرة بنشر نماذجهم المخزنة على Amazon S3 بسرعة في مثيلات الاستدلال عالية الأداء. يتم تنزيل النموذج نفسه من Hugging Face وضغطه ، ومن ثم يمكن تحميله إلى Amazon S3. هذه الخطوة موضحة في مقتطف الشفرة التالي:
```
from sagemaker.huggingface import HuggingFaceModel
from sagemaker import get_execution_role role = get_execution_role() # create Hugging Face Model Class
huggingface_model = HuggingFaceModel( transformers_version='4.17.0', pytorch_version='1.0.2', py_version='py38', model_data='s3://my-trained-model/artifacts/model.tar.gz', role=role,
) # deploy model to SageMaker Inference
predictor = huggingface_model.deploy(initial_instance_count=1,instance_type="ml.m5.xlarge")
```

لدى AWS العديد من الموارد المتاحة لمساعدتك في نشر أعباء عمل ML الخاصة بك. ال عدسة التعلم الآلي ل إطار عمل AWS المصمم جيدًا يوصي بأفضل ممارسات أعباء العمل ، بما في ذلك تحسين الموارد وخفض التكلفة. تضمن مبادئ التصميم الموصى بها هذه نشر أعباء عمل ML المصممة جيدًا على AWS في الإنتاج. التوصية بالاستدلال من Amazon SageMaker يساعدك على تحديد المثيل الصحيح لنشر نماذج ML الخاصة بك بأداء وتكلفة استدلال مثاليين. يُسرع مُوصي الاستدلال عملية نشر النموذج ويقلل من الوقت اللازم للتسويق عن طريق أتمتة اختبار الحمل وتحسين أداء النموذج عبر مثيلات ML.

في الأقسام التالية ، نوضح كيفية تحميل نموذج مدرب من حاوية S3 ونشره في مثيل استنتاج مناسب.

المتطلبات الأساسية المسبقة

في هذا الدليل ، يجب أن يكون لديك المتطلبات الأساسية التالية:

An حساب AWS.
دفتر Jupyter في الداخل أمازون ساجميكر ستوديو أو مثيلات دفتر SageMaker. في هذا المنشور ، نستخدم صورة "Python 3 (PyTorch 1.4 Python 3.6 CPU Optimized)" مع مقتطفات التعليمات البرمجية المتوفرة ، ولكن يمكنك استخدام أي نسخة أعلى من صورة PyTorch من حبات SageMaker المتاحة.
مجموعة بيانات في حاوية S3 ، مثل ويكي النص-2 مجموعة البيانات من سجل البيانات المفتوحة على AWS.

قم بتحميل نموذج Hugging Face إلى SageMaker لاستنتاج تلخيص النص

استخدم الكود التالي لتنزيل نموذج تلخيص النص الذي تم تدريبه مسبقًا على Hugging Face ديستيلبارت-سي إن إن-12-6 و tokenizer الخاص به ، واحفظهم محليًا في SageMaker إلى دليل دفتر Jupyter الخاص بك:

from transformers import BartTokenizer, BartForConditionalGeneration, BartConfig PRE_TRAINED_MODEL_NAME='sshleifer/distilbart-cnn-12-6' model = BartForConditionalGeneration.from_pretrained(PRE_TRAINED_MODEL_NAME, cache_dir=hf_cache_dir)
model.save_pretrained('./models/bart_model/') tokenizer = BartTokenizer.from_pretrained(PRE_TRAINED_MODEL_NAME)
tokenizer.save_pretrained('./models/bart_tokenizer/')

قم بضغط نموذج تلخيص النص المحفوظ والرمز المميز الخاص به في تنسيق tar.gz وتحميل الأداة النموذجية المضغوطة إلى حاوية S3:

! tar -C models/ -czf model.tar.gz code/ bart_tokenizer/ bart_model/
from sagemaker.s3 import S3Uploader file_key = 'model.tar.gz'
model_artifact = S3Uploader.upload(file_key,'s3://my-trained-model/artifacts')

اختر صورة حاوية عامل ميناء الاستدلال لإجراء استنتاج تلخيص النص. حدد نظام التشغيل Linux ، وإطار عمل PyTorch ، وإصدار Hugging Face Transformer وحدد ملف الأمازون الحوسبة المرنة السحابية (Amazon EC2) نوع المثيل لتشغيل الحاوية.

تتوفر صورة Docker بتنسيق سجل الأمازون المرنة للحاويات (Amazon ECR) لحساب AWS نفسه ، ويتم إرجاع رابط صورة الحاوية هذه كمعرّف URI.

from sagemaker.image_uris import retrieve deploy_instance_type = 'ml.m5.xlarge' pytorch_inference_image_uri = retrieve('huggingface', region=region, version='4.6.1', instance_type=deploy_instance_type, base_framework_version='pytorch1.8.1', image_scope='inference')

حدد نموذج تلخيص النص الذي سيتم نشره بواسطة صورة الحاوية المحددة التي تقوم بالاستدلال. في مقتطف الكود التالي ، يتم نشر النموذج المضغوط الذي تم تحميله إلى Amazon S3:

from sagemaker.huggingface.model import HuggingFaceModel
from sagemaker import get_execution_role role = get_execution_role() # create Hugging Face Model Class
huggingface_model = HuggingFaceModel( model_data="s3://my-trained-model/artifacts/model.tar.gz", # path to your trained sagemaker model image_uri=pytorch_inference_image_uri, role=role, # iam role with permissions to create an Endpoint transformers_version="4.6.1", # transformers version used
) # deploy model to SageMaker Inference
predictor = huggingface_model.deploy( initial_instance_count=1, instance_type="ml.m5.xlarge"
)

اختبر نموذج تلخيص النص المنشور على إدخال عينة:

# example request, you need to define "inputs"
data = { "text": "Camera - You are awarded a SiPix Digital Camera! call 09061221066 fromm landline. Delivery within 28 days."
} # request
predictor.predict(data)

استخدم Inference التوصية لتقييم مثيل EC2 الأمثل لمهمة الاستدلال

بعد ذلك ، قم بإنشاء نماذج حمولة متعددة من نص الإدخال بتنسيق JSON واضغطها في ملف حمولة واحد. يتم استخدام عينات الحمولة الصافية هذه بواسطة "مُوصي الاستدلال" لمقارنة أداء الاستدلال بين أنواع مثيلات EC2 المختلفة. يجب أن تتطابق كل حمولة نموذجية مع تنسيق JSON الموضح سابقًا. يمكنك الحصول على أمثلة من ويكي النص-2 بيانات تدار بواسطة fast.ai، متاح في سجل البيانات المفتوحة على AWS.

قم بتحميل أداة نموذج تلخيص النص المضغوط وملف حمولة العينة المضغوطة إلى حاوية S3. لقد قمنا بتحميل النموذج في خطوة سابقة ، ولكن من أجل التوضيح ، قمنا بتضمين الكود لتحميله مرة أخرى:

bucket = sagemaker.Session().default_bucket() prefix = "sagemaker/inference-recommender" model_archive_name = "model.tar.gz"
payload_archive_name = "payload.tar.gz" sample_payload_url = sagemaker.Session().upload_data( payload_archive_name, bucket=bucket, key_prefix=prefix + "/inference"
)
model_url = sagemaker.Session().upload_data( model_archive_name, bucket=bucket, key_prefix=prefix + "/model"
)

راجع قائمة نماذج ML القياسية المتوفرة على SageMaker عبر حدائق الحيوان النموذجية المشتركة، مثل البرمجة اللغوية العصبية ورؤية الكمبيوتر. حدد نموذج البرمجة اللغوية العصبية لإجراء استنتاج تلخيص النص:

import boto3
import pandas as pd inference_client = boto3.client("sagemaker", region) list_model_metadata_response = inference_client.list_model_metadata() domains = []
frameworks = []
framework_versions = []
tasks = []
models = [] for model_summary in list_model_metadata_response["ModelMetadataSummaries"]: domains.append(model_summary["Domain"]) tasks.append(model_summary["Task"]) models.append(model_summary["Model"]) frameworks.append(model_summary["Framework"]) framework_versions.append(model_summary["FrameworkVersion"]) data = { "Domain": domains, "Task": tasks, "Framework": frameworks, "FrameworkVersion": framework_versions, "Model": models,
} df = pd.DataFrame(data) pd.set_option("display.max_rows", None)
pd.set_option("display.max_columns", None)
pd.set_option("display.width", 1000)
pd.set_option("display.colheader_justify", "center")
pd.set_option("display.precision", 3) display(df.sort_values(by=["Domain", "Task", "Framework", "FrameworkVersion"]))

يستخدم المثال التالي الامتداد bert-base-cased نموذج البرمجة اللغوية العصبية. قم بتسجيل نموذج تلخيص النص في ملف سجل نموذج SageMaker مع المجال وإطار العمل والمهمة المحددين بشكل صحيح من الخطوة السابقة. يتم عرض معلمات هذا المثال في بداية مقتطف الشفرة التالي.

لاحظ نطاق أنواع مثيلات EC2 التي سيتم تقييمها بواسطة Inference التوصية تحت SupportedRealtimeInferenceInstanceTypes في الكود التالي. تأكد من أن ملف حدود الخدمة لحساب AWS تسمح بنشر هذه الأنواع من عقد الاستدلال.

ml_domain = "NATURAL_LANGUAGE_PROCESSING"
ml_task = "FILL_MASK"
model_name = "bert-base-cased"
dlc_uri = pytorch_inference_image_uri
framework = 'PYTORCH'
framework_version='1.6.0' inference_client = boto3.client("sagemaker", region) model_package_group_name = uuid.uuid1() model_pacakge_group_response = inference_client.create_model_package_group( ModelPackageGroupName=str(model_package_group_name), ModelPackageGroupDescription="description"
) model_package_version_response = inference_client.create_model_package( ModelPackageGroupName=str(model_package_group_name), ModelPackageDescription="InferenceRecommenderDemo", Domain=ml_domain, Task=ml_task, SamplePayloadUrl=sample_payload_url, InferenceSpecification={ "Containers": [ { "ContainerHostname": "huggingface-pytorch", "Image": dlc_uri, "ModelDataUrl": model_url, "Framework": framework, "FrameworkVersion": framework_version, "NearestModelName": model_name, "Environment": { "SAGEMAKER_CONTAINER_LOG_LEVEL": "20", "SAGEMAKER_PROGRAM": "inference.py", "SAGEMAKER_REGION": region, "SAGEMAKER_SUBMIT_DIRECTORY": model_url, }, }, ], "SupportedRealtimeInferenceInstanceTypes": [ "ml.t2.xlarge", "ml.c5.xlarge", "ml.m5.xlarge", "ml.m5d.xlarge", "ml.r5.xlarge", "ml.inf1.xlarge", ], "SupportedContentTypes": [ "application/json", ], "SupportedResponseMIMETypes": ["application/json"], },
)

قم بإنشاء وظيفة افتراضية لموصي الاستدلال باستخدام الامتداد ModelPackageVersion الناتجة عن الخطوة السابقة. ال uuid تُستخدم مكتبة Python لإنشاء اسم فريد للوظيفة.

from sagemaker import get_execution_role client = boto3.client("sagemaker", region) role = get_execution_role()
default_job = uuid.uuid1()
default_response = client.create_inference_recommendations_job( JobName=str(default_job), JobDescription="Job Description", JobType="Default", RoleArn=role, InputConfig={"ModelPackageVersionArn": model_package_version_response["ModelPackageArn"]},
)

يمكنك الحصول على حالة وظيفة Inference Consulter عن طريق تشغيل الكود التالي:

inference_recommender_job = client.describe_inference_recommendations_job( JobName=str(default_job)
)

عندما تكون حالة الوظيفة COMPLETED، قارن وقت استجابة الاستدلال ، ووقت التشغيل ، والمقاييس الأخرى لأنواع مثيلات EC2 التي تم تقييمها بواسطة الوظيفة الافتراضية Inference التوصية. حدد نوع العقدة المناسب بناءً على متطلبات حالة الاستخدام الخاصة بك.

data = [ {**x["EndpointConfiguration"], **x["ModelConfiguration"], **x["Metrics"]} for x in inference_recommender_job["InferenceRecommendations"]
]
df = pd.DataFrame(data)
df.drop("VariantName", inplace=True, axis=1)
pd.set_option("max_colwidth", 400)
df.head()

وفي الختام

يقدم SageMaker طرقًا متعددة لاستخدام نماذج Hugging Face ؛ لمزيد من الأمثلة ، تحقق من عينات AWS GitHub. اعتمادًا على مدى تعقيد حالة الاستخدام والحاجة إلى ضبط النموذج ، يمكنك تحديد الطريقة المثلى لاستخدام هذه النماذج. يمكن أن تكون خطوط أنابيب Hugging Face نقطة انطلاق جيدة لتجربة النماذج المناسبة واختيارها بسرعة. عندما تحتاج إلى تخصيص النماذج المحددة وتحديد معلماتها ، يمكنك تنزيل النماذج ونشرها لنقاط نهاية الاستدلال المخصصة. لضبط النموذج بشكل أكبر لحالة استخدام معينة ، ستحتاج إلى تدريب النموذج بعد تنزيله.

تعمل نماذج البرمجة اللغوية العصبية بشكل عام ، بما في ذلك نماذج تلخيص النص ، بشكل أفضل بعد تدريبها على مجموعة بيانات خاصة بحالة الاستخدام. تتأكد ميزات MLOPs ومراقبة النموذج لـ SageMaker من أن النموذج المنشور يستمر في الأداء ضمن التوقعات. في هذا المنشور ، استخدمنا Inference توصية لتقييم نوع المثيل الأنسب لنشر نموذج تلخيص النص. يمكن لهذه التوصيات تحسين الأداء والتكلفة لحالة استخدام ML الخاصة بك.

حول المؤلف

نضال البيروتي هو مهندس حلول أول في Amazon Web Services ، ولديه شغف لحلول التعلم الآلي. يتمتع نضال بأكثر من 25 عامًا من الخبرة في العمل في مجموعة متنوعة من أدوار تكنولوجيا المعلومات العالمية على مختلف المستويات والقطاعات. يعمل نضال كمستشار موثوق للعديد من عملاء AWS لدعم وتسريع رحلة تبني السحابة الخاصة بهم.

دارين كو مهندس حلول مقره لندن. يقدم المشورة لعملاء الشركات الصغيرة والمتوسطة في المملكة المتحدة وأيرلندا بشأن إعادة الهندسة والابتكار على السحابة. دارين مهتم بالتطبيقات التي تم إنشاؤها باستخدام بنى بدون خادم وهو متحمس لحل تحديات الاستدامة من خلال التعلم الآلي.