درک آمازون یک سرویس پردازش زبان طبیعی (NLP) است که از یادگیری ماشین (ML) برای کشف بینش از متن استفاده می کند. Amazon Comprehend ویژگی های سفارشی شده را ارائه می دهد، شناسایی موجودیت سفارشی, طبقه بندی سفارشیو API های از پیش آموزش دیده مانند استخراج عبارات کلیدی، تجزیه و تحلیل احساسات، شناسایی موجودیت و موارد دیگر، بنابراین می توانید به راحتی NLP را در برنامه های خود ادغام کنید.
ما اخیراً نوتبوکهای مرتبط با Amazon Comprehend را اضافه کردهایم Amazon SageMaker JumpStart نوتبوکهایی که میتوانند به شما کمک کنند تا با استفاده از طبقهبندیکننده سفارشی Amazon Comprehend و شناسایی موجودیت سفارشی به سرعت شروع کنید. میتوانید از طبقهبندی سفارشی برای سازماندهی اسناد به دستهها (کلاسهایی) که تعریف میکنید استفاده کنید. تشخیص موجودیت سفارشی با کمک به شما در شناسایی انواع موجودی که منحصر به دامنه یا کسب و کار شما هستند و در حالت عمومی از پیش تعیین شده نیستند، قابلیت Amazon Comprehend شناسایی موجودیت را افزایش می دهد. انواع موجودیت.
در این پست، ما به شما نشان میدهیم که چگونه از JumpStart برای ایجاد طبقهبندی سفارشی Amazon Comprehend و مدلهای تشخیص موجودیت سفارشی به عنوان بخشی از نیازهای سازمانی NLP خود استفاده کنید.
SageMaker JumpStart
La Amazon SageMaker Studio صفحه فرود گزینه ای را برای استفاده از JumpStart فراهم می کند. JumpStart با ارائه مدل های از پیش آموزش دیده برای انواع مختلفی از مشکلات، راه سریعی را برای شروع ارائه می کند. شما می توانید این مدل ها را آموزش و کوک کنید. JumpStart همچنین منابع دیگری مانند نوت بوک، وبلاگ و ویدئو را فراهم می کند.
نوت بوک های JumpStart اساسا کد نمونه ای هستند که می توانید از آنها به عنوان نقطه شروع برای شروع سریع استفاده کنید. در حال حاضر، ما بیش از 40 نوت بوک را در اختیار شما قرار می دهیم که می توانید از آنها همانطور که هست استفاده کنید یا در صورت نیاز سفارشی کنید. با استفاده از جستجو یا پانل نمای تب دار می توانید نوت بوک های خود را پیدا کنید. پس از یافتن نوت بوکی که می خواهید استفاده کنید، می توانید نوت بوک را وارد کنید، آن را بر اساس نیازهای خود سفارشی کنید و زیرساخت و محیطی را برای اجرای نوت بوک انتخاب کنید.
با نوت بوک های JumpStart شروع کنید
برای شروع با JumpStart، به آمازون SageMaker کنسول و استودیو را باز کنید. رجوع شود به با SageMaker Studio شروع کنید برای دستورالعمل نحوه شروع کار با Studio. سپس مراحل زیر را انجام دهید:
- در استودیو، به صفحه راه اندازی JumpStart بروید و انتخاب کنید به SageMaker JumpStart بروید.
راه های متعددی برای جستجو به شما پیشنهاد شده است. میتوانید از برگههای بالا برای رسیدن به آنچه میخواهید استفاده کنید یا از کادر جستجو همانطور که در تصویر زیر نشان داده شده است استفاده کنید.
- برای یافتن نوت بوک ها به آدرس زیر می رویم نوت بوک تب.
در زمان نگارش، JumpStart 47 نوت بوک ارائه می دهد. می توانید از فیلترها برای یافتن نوت بوک های مرتبط با Amazon Comprehend استفاده کنید.
- بر نوع محتوا منوی کشویی ، را انتخاب کنید دفتر یادداشت.
همانطور که در تصویر زیر می بینید، ما در حال حاضر دو نوت بوک آمازون Comprehend داریم.
در بخش های بعدی، هر دو نوت بوک را بررسی می کنیم.
Amazon Comprehend Custom Classifier
در این نوت بوک نحوه استفاده از آن را نشان می دهیم API طبقه بندی کننده سفارشی برای ایجاد یک مدل طبقه بندی اسناد.
طبقهبندیکننده سفارشی یک ویژگی کاملاً مدیریتشده Amazon Comprehend است که به شما امکان میدهد مدلهای طبقهبندی متن سفارشی را بسازید که منحصر به کسبوکار شما هستند، حتی اگر تخصص کمی در ML داشته باشید یا اصلاً تخصص نداشته باشید. طبقهبندیکننده سفارشی مبتنی بر قابلیتهای موجود Amazon Comprehend است که قبلاً بر روی دهها میلیون سند آموزش دیدهاند. بسیاری از پیچیدگی های مورد نیاز برای ساخت یک مدل طبقه بندی NLP را انتزاعی می کند. طبقهبندیکننده سفارشی بهطور خودکار دادههای آموزشی را بارگیری و بررسی میکند، الگوریتمهای مناسب ML را انتخاب میکند، مدل شما را آموزش میدهد، فراپارامترهای بهینه را پیدا میکند، مدل را آزمایش میکند و معیارهای عملکرد مدل را ارائه میکند. طبقهبندیکننده سفارشی Amazon Comprehend همچنین یک کنسول با کاربری آسان برای کل گردش کار ML، از جمله برچسبگذاری متن با استفاده از Amazon SageMaker Ground Truth، آموزش و استقرار یک مدل و تجسم نتایج آزمون. با یک طبقهبندی سفارشی آمازون Comprehend، میتوانید مدلهای زیر را بسازید:
- مدل طبقه بندی چند طبقه – در طبقه بندی چند طبقه، هر سند می تواند یک و تنها یک کلاس به آن اختصاص داده شود. کلاس های فردی متقابل هستند. به عنوان مثال، یک فیلم را می توان به عنوان یک مستند یا علمی تخیلی طبقه بندی کرد، اما نه هر دو در یک زمان.
- مدل طبقه بندی چند برچسبی - در طبقهبندی چند برچسبی، کلاسهای جداگانه نشاندهنده دستههای مختلف هستند، اما این دستهها به نوعی به هم مرتبط هستند و متقابل نیستند. در نتیجه، هر سند حداقل یک کلاس به آن اختصاص داده شده است، اما می تواند تعداد بیشتری داشته باشد. به عنوان مثال، یک فیلم می تواند به سادگی یک فیلم اکشن باشد، یا می تواند یک فیلم اکشن، یک فیلم علمی تخیلی و یک کمدی باشد، همه در یک زمان.
این نوت بوک برای آموزش یک مدل با مجموعه داده نمونه یا با مجموعه داده خاص کسب و کار شما به تخصص ML نیاز ندارد. می توانید از عملیات API که در این نوت بوک بحث شده است در برنامه های خود استفاده کنید.
شناسایی نهاد سفارشی آمازون
در این نوت بوک نحوه استفاده از آن را نشان می دهیم API شناسایی موجودیت سفارشی برای ایجاد یک مدل شناسایی موجودیت
تشخیص موجودیت سفارشی با کمک به شما در شناسایی انواع موجودیت خاص خود که در انواع موجودیت های عمومی از پیش تعیین شده نیستند، قابلیت های Amazon Comprehend را گسترش می دهد. این بدان معنی است که می توانید اسناد را تجزیه و تحلیل کنید و موجودیت هایی مانند کدهای محصول یا موجودیت های خاص کسب و کار را که متناسب با نیازهای خاص شما هستند استخراج کنید.
ساختن یک شناسایی دقیق موجودیت سفارشی به تنهایی میتواند فرآیند پیچیدهای باشد که مستلزم تهیه مجموعههای بزرگی از اسناد آموزشی مشروح دستی و انتخاب الگوریتمها و پارامترهای مناسب برای آموزش مدل است. Amazon Comprehend با ارائه حاشیه نویسی خودکار و توسعه مدل برای ایجاد یک مدل تشخیص موجودیت سفارشی به کاهش پیچیدگی کمک می کند.
دفترچه یادداشت نمونه مجموعه داده آموزشی را در قالب CSV می گیرد و استنتاج را در مقابل ورودی متن اجرا می کند. Amazon Comprehend همچنین از یک مورد استفاده پیشرفته پشتیبانی میکند که دادههای حاشیهنویسی Ground Truth را برای آموزش دریافت میکند و به شما امکان میدهد مستقیماً استنتاج را روی فایلهای PDF و اسناد Word اجرا کنید. برای اطلاعات بیشتر مراجعه کنید با استفاده از Amazon Comprehend یک شناسه موجودیت سفارشی برای اسناد PDF بسازید.
Amazon Comprehend محدودیتهای حاشیهنویسی را کاهش داده است و به شما امکان میدهد تا نتایج پایدارتری داشته باشید، مخصوصاً برای نمونههای فرعی چند عکس. برای اطلاعات بیشتر در مورد این بهبود، مراجعه کنید Amazon Comprehend محدودیتهای حاشیهنویسی کمتری را برای شناسایی موجودیت سفارشی اعلام میکند.
این نوت بوک برای آموزش یک مدل با مجموعه داده نمونه یا با مجموعه داده خاص کسب و کار شما به تخصص ML نیاز ندارد. می توانید از عملیات API که در این نوت بوک بحث شده است در برنامه های خود استفاده کنید.
از نوتبوکهای Amazon Comprehend JumpStart استفاده، سفارشیسازی و استقرار آنها
پس از انتخاب نوت بوک آمازون Comprehend که می خواهید استفاده کنید، آن را انتخاب کنید واردات نوت بوک. همانطور که این کار را انجام می دهید، می توانید شروع کرنل نوت بوک را ببینید.
وارد کردن نوت بوک شما باعث انتخاب نمونه، هسته و تصویر نوت بوک می شود که برای اجرای نوت بوک استفاده می شود. پس از فراهم شدن زیرساخت های پیش فرض، می توانید انتخاب ها را بر اساس نیاز خود تغییر دهید.
اکنون، طرح کلی نوت بوک را مرور کنید و بخش های مربوط به تنظیم پیش نیازها، تنظیم داده ها، آموزش مدل، اجرای استنتاج و توقف مدل را به دقت مطالعه کنید. با خیال راحت کد تولید شده را بر اساس نیاز خود سفارشی کنید.
بر اساس نیاز خود، ممکن است بخواهید بخش های زیر را سفارشی کنید:
- ویرایش - برای یک برنامه تولیدی، توصیه می کنیم سیاست های دسترسی را فقط به مواردی که برای اجرای برنامه لازم است محدود کنید. مجوزها را می توان بر اساس موارد استفاده، مانند آموزش یا استنباط، و نام منابع خاص، مانند یک کامل، محدود کرد. سرویس ذخیره سازی ساده آمازون نام سطل (Amazon S3) یا الگوی نام سطل S3. همچنین باید دسترسی به طبقهبندیکننده سفارشی یا عملیات SageMaker را فقط به مواردی که برنامه شما به آن نیاز دارد محدود کنید.
- داده ها و مکان - نوت بوک نمونه داده های نمونه و مکان های S3 را در اختیار شما قرار می دهد. بر اساس نیازهای خود، می توانید از داده های خود برای آموزش، اعتبارسنجی و آزمایش استفاده کنید و در صورت نیاز از مکان های مختلف S3 استفاده کنید. به طور مشابه، هنگامی که مدل ایجاد می شود، می توانید انتخاب کنید که مدل در مکان های مختلف نگهداری شود. فقط مطمئن شوید که مجوزهای مناسب برای دسترسی به سطل های S3 را ارائه کرده اید.
- مراحل پیش پردازش – اگر از دادههای مختلف برای آموزش و آزمایش استفاده میکنید، ممکن است بخواهید مراحل پیشپردازش را بر اساس نیاز خود تنظیم کنید.
- آزمایش داده ها - می توانید داده های استنتاج خود را برای آزمایش بیاورید.
- پاک کردن - منابع راه اندازی شده توسط نوت بوک را حذف کنید تا از شارژ مجدد جلوگیری کنید.
نتیجه
در این پست، ما به شما نشان دادیم که چگونه از JumpStart برای یادگیری و ردیابی سریع با استفاده از APIهای آمازون Comprehend استفاده کنید، با ایجاد راحتتر یافتن و اجرای نوتبوکهای مرتبط با Amazon Comprehend از استودیو در حالی که گزینهای برای تغییر کد در صورت نیاز دارید. نوتبوکها از مجموعه دادههای نمونه با اطلاعیههای محصول AWS و مقالات نمونه خبری استفاده میکنند. میتوانید از این نوت بوک برای یادگیری نحوه استفاده از APIهای آمازون Comprehend در نوتبوک پایتون استفاده کنید، یا میتوانید از آن به عنوان نقطه شروع استفاده کنید و کد را بیشتر برای نیازهای منحصربهفرد و استقرار تولید خود گسترش دهید.
میتوانید از JumpStart استفاده کنید و از بیش از 40 نوتبوک در موضوعات مختلف در همه مناطقی که Studio بدون هزینه اضافی در دسترس است استفاده کنید.
درباره نویسنده
لانا ژانگ Sr. Solutions Architect در تیم خدمات هوش مصنوعی AWS WWSO با تخصص در AI و ML برای تعدیل و شناسایی محتوا است. او علاقه زیادی به ترویج خدمات هوش مصنوعی AWS و کمک به مشتریان برای تغییر راه حل های تجاری خود دارد.
میناکشیسوندارام تانداوارایان یک متخصص ارشد AI/ML با AWS است. او به حسابهای استراتژیک پیشرفته در سفر هوش مصنوعی و ML کمک میکند. او علاقه زیادی به هوش مصنوعی مبتنی بر داده دارد
راچنا چادا یک معمار راه حل اصلی AI/ML در حساب های استراتژیک در AWS است. Rachna خوشبین است که معتقد است استفاده اخلاقی و مسئولانه از هوش مصنوعی می تواند جامعه را در آینده بهبود بخشد و رونق اقتصادی و اجتماعی را به ارمغان بیاورد. راچنا در اوقات فراغت خود دوست دارد با خانواده خود، پیاده روی و گوش دادن به موسیقی وقت بگذراند.
- AI
- آی هنر
- مولد هنر ai
- ربات ai
- AI / ML
- درک آمازون
- آمازون SageMaker
- Amazon SageMaker JumpStart
- اطلاعیه ها
- هوش مصنوعی
- گواهی هوش مصنوعی
- هوش مصنوعی در بانکداری
- ربات هوش مصنوعی
- ربات های هوش مصنوعی
- نرم افزار هوش مصنوعی
- آموزش ماشین AWS
- بلاکچین
- کنفرانس بلاک چین ai
- coingenius
- هوش مصنوعی محاوره ای
- کنفرانس کریپتو ai
- دل-ه
- یادگیری عمیق
- گوگل ai
- متوسط (200)
- فراگیری ماشین
- افلاطون
- افلاطون آی
- هوش داده افلاطون
- بازی افلاطون
- PlatoData
- بازی پلاتو
- مقیاس Ai
- نحو
- زفیرنت