شناسایی آمازون قابلیت های دید کامپیوتری از پیش آموزش دیده و قابل تنظیم را برای استخراج اطلاعات و بینش از تصاویر و فیلم ها ارائه می دهد. یکی از این قابلیت ها این است برچسب های شناسایی آمازونکه اشیا، صحنه ها، اعمال و مفاهیم را در تصاویر تشخیص می دهد. مشتریانی مانند Synchronoss، شاترو Nomad Media از برچسبهای شناسایی آمازون برای افزودن خودکار متادیتا به کتابخانه محتوای خود و فعال کردن نتایج جستجوی مبتنی بر محتوا استفاده میکنند. TripleLift از برچسبهای شناسایی آمازون برای تعیین بهترین لحظات برای درج پویا تبلیغاتی استفاده میکند که تجربه مشاهده را برای مخاطبان تکمیل میکند. vidmob از برچسبهای شناسایی آمازون برای استخراج ابرداده از خلاقان تبلیغاتی استفاده میکند تا نقش منحصر به فرد تصمیمگیری خلاقانه در عملکرد تبلیغات را درک کند، بنابراین بازاریابان میتوانند تبلیغاتی تولید کنند که بر اهداف کلیدی آنها تأثیر بگذارد. علاوه بر این، هزاران مشتری دیگر از برچسبهای شناسایی آمازون برای پشتیبانی از موارد استفاده دیگر مانند طبقهبندی عکسهای مسیر یا پیادهروی، شناسایی افراد یا وسایل نقلیه در فیلمهای دوربین امنیتی، و طبقهبندی تصاویر اسناد هویتی استفاده میکنند.
Amazon Rekognition Labels برای تصاویر، 600 برچسب جدید، از جمله نشانهها و فعالیتها را شناسایی میکند و دقت را برای بیش از 2,000 برچسب موجود بهبود میبخشد. علاوه بر این، Amazon Rekognition Labels اکنون از ویژگی های تصویر برای تشخیص رنگ های غالب یک تصویر، پیش زمینه و پس زمینه آن و همچنین اشیاء شناسایی شده با جعبه های محدود پشتیبانی می کند. Image Properties همچنین روشنایی، وضوح و کنتراست تصویر را اندازه گیری می کند. در نهایت، Amazon Rekognition Labels اکنون نتایج برچسب را با استفاده از دو فیلد اضافی سازماندهی می کند. aliases
و categories
و از فیلتر کردن آن نتایج پشتیبانی می کند. در قسمت های بعدی قابلیت های جدید و مزایای آنها را با چند مثال با جزئیات بیشتر بررسی می کنیم.
برچسب های جدید
Amazon Rekognition Labels بیش از 600 برچسب جدید اضافه کرده است و لیست برچسب های پشتیبانی شده را گسترش داده است. در زیر چند نمونه از برچسب های جدید آورده شده است:
- مکان های دیدنی محبوب - پل بروکلین، کولوسئوم، برج ایفل، ماچو پیچو، تاج محل و غیره
- فعالیت - تشویق، دوچرخه سواری، جشن گرفتن، پریدن، راه رفتن سگ و غیره
- تشخیص آسیب - فرورفتگی ماشین، خراش ماشین، خوردگی، آسیب به خانه، آسیب سقف، آسیب موریانه و غیره.
- متن و اسناد - نمودار نوار، کارت پرواز، نمودار جریان، نوت بوک، فاکتور، رسید و غیره
- ورزش ها - بازی بیسبال، خفاش کریکت، اسکیت، راگبی، واترپلو و غیره
- خیلی بیشتر - مسابقه قایق، سرگرمی، منظره شهری، روستا، پیشنهاد عروسی، ضیافت و غیره
با استفاده از این برچسبها، مشتریان در اشتراکگذاری تصویر، عکاسی سهام یا رسانههای پخش میتوانند به طور خودکار ابردادههای جدیدی را به کتابخانه محتوای خود اضافه کنند تا قابلیتهای جستجوی خود را بهبود بخشند.
بیایید به یک مثال تشخیص برچسب برای پل بروکلین نگاه کنیم.
جدول زیر برچسبها و امتیازات اطمینان بازگشتی در پاسخ API را نشان میدهد.
برچسب ها | نمرات اعتماد به نفس |
پل بروکلین | 95.6 |
پل | 95.6 |
راهنما | 95.6 |
برچسب های بهبود یافته
Amazon Rekognition Labels همچنین دقت بیش از 2,000 برچسب را بهبود بخشیده است. در زیر چند نمونه از برچسب های بهبود یافته آورده شده است:
- فعالیت - غواصی، رانندگی، مطالعه، نشستن، ایستادن و غیره
- پوشاک و لوازم جانبی - کوله پشتی، کمربند، بلوز، هودی، کاپشن، کفش و غیره
- خانه و داخل خانه - استخر، گلدان، بالش، شومینه، پتو و غیره
- فناوری و محاسبات - هدفون، تلفن همراه، رایانه لوحی، خواندن، لپ تاپ و غیره
- وسایل نقلیه و خودرو - کامیون، چرخ، لاستیک، سپر، صندلی ماشین، آینه ماشین و غیره
- متن و اسناد - پاسپورت، گواهینامه رانندگی، کارت بازرگانی، سند و غیره
- خیلی بیشتر - سگ، کانگورو، میدان شهر، جشنواره، خندیدن و غیره
ویژگی های تصویر برای تشخیص رنگ غالب و کیفیت تصویر
Image Properties یک قابلیت جدید Amazon Rekognition Labels برای تصاویر است و می تواند با یا بدون قابلیت تشخیص برچسب استفاده شود. توجه: ویژگی های تصویر است قیمت جداگانه از Amazon Rekognition Labels، و فقط با SDK های به روز شده در دسترس است.
تشخیص رنگ غالب
Image Properties رنگ های غالب یک تصویر را بر اساس درصد پیکسل شناسایی می کند. این رنگ های غالب به نقشه برداری می شوند 140 پالت رنگ CSS، RGB، کد هگز، و 12 رنگ ساده شده (سبز، صورتی، سیاه، قرمز، زرد، فیروزه ای، قهوه ای، نارنجی، سفید، بنفش، آبی، خاکستری). به طور پیشفرض، API تا 10 رنگ غالب را برمیگرداند، مگر اینکه تعداد رنگهایی را که باید برگردانده شوند، مشخص کنید. حداکثر تعداد رنگ های غالبی که API می تواند برگرداند 12 رنگ است.
هنگامی که از ویژگی های تصویر به صورت مستقل استفاده می شود، رنگ های غالب یک تصویر و همچنین پیش زمینه و پس زمینه آن را تشخیص می دهد. هنگامی که به همراه ویژگیهای تشخیص برچسب استفاده میشود، ویژگیهای تصویر همچنین رنگهای غالب اشیاء شناساییشده را با کادرهای محدود شناسایی میکند.
مشتریان در اشتراکگذاری تصویر یا عکاسی سهام میتوانند از تشخیص رنگ غالب برای غنیسازی فرادادههای کتابخانه تصویر خود برای بهبود کشف محتوا استفاده کنند، و به کاربران نهایی خود اجازه میدهند تا بر اساس رنگ فیلتر کنند یا اشیاء را با رنگهای خاص جستجو کنند، مانند «صندلی آبی» یا «کفشهای قرمز». ” علاوه بر این، مشتریان در تبلیغات می توانند عملکرد تبلیغات را بر اساس رنگ دارایی های خلاقانه خود تعیین کنند.
کیفیت تصویر
علاوه بر تشخیص رنگ غالب، Image Properties همچنین کیفیت تصویر را از طریق امتیازهای روشنایی، وضوح و کنتراست اندازه گیری می کند. هر یک از این امتیازات از 0 تا 100 متغیر است. به عنوان مثال، یک تصویر بسیار تاریک مقادیر روشنایی کم را برمیگرداند، در حالی که یک تصویر با نور روشن مقادیر بالایی را برمیگرداند.
با این امتیازات، مشتریان در اشتراکگذاری تصویر، تبلیغات یا تجارت الکترونیک میتوانند بازرسی کیفیت را انجام دهند و تصاویر را با روشنایی و وضوح کم فیلتر کنند تا پیشبینیهای برچسب غلط را کاهش دهند.
تصویر زیر نمونه ای از برج ایفل را نشان می دهد.
جدول زیر نمونه ای از داده های Image Properties است که در پاسخ API بازگردانده شده است.
تصویر زیر نمونه ای برای صندلی قرمز است.
نمونه زیر نمونه ای از داده های Image Properties است که در پاسخ API بازگردانده شده است.
تصویر زیر نمونه ای برای سگی با پس زمینه زرد است.
نمونه زیر نمونه ای از داده های Image Properties است که در پاسخ API بازگردانده شده است.
فیلدهای مستعار و دسته بندی های جدید
Amazon Rekognition Labels اکنون دو فیلد جدید را برمی گرداند. aliases
و categories
، در پاسخ API. نامهای مستعار نامهای دیگری برای همان برچسب هستند و دستهها برچسبهای فردی را بر اساس ۴۰ موضوع مشترک، مانند Food and Beverage
و Animals and Pets
. با بهروزرسانی مدل شناسایی برچسب، نامهای مستعار دیگر در لیست اولیه نام برچسبها برگردانده نمیشوند. در عوض، نام مستعار در جدید برگردانده می شود aliases
فیلد در پاسخ API. توجه: نامهای مستعار و دستهها فقط با SDKهای بهروز شده بازگردانده میشوند.
مشتریان در اشتراکگذاری عکس، تجارت الکترونیک یا تبلیغات میتوانند از نامهای مستعار و دستهبندیها برای سازماندهی طبقهبندی فراداده محتوای خود برای بهبود جستجو و فیلتر کردن محتوا استفاده کنند:
- مثال نام مستعار - زیرا
Car
وAutomobile
نام مستعار هستند، میتوانید با استفاده از آن متادیتا را به تصویر اضافه کنیدCar
وAutomobile
همزمان - نمونه دسته ها – میتوانید از دستهها برای ایجاد فیلتر دستهبندی یا نمایش تمام تصاویر مربوط به یک دسته خاص استفاده کنید، مانند
Food and Beverage
، بدون نیاز به افزودن متادیتا به هر تصویر باFood and Beverage
تصویر زیر نمونه ای از تشخیص برچسب را با نام مستعار و دسته بندی برای یک غواص نشان می دهد.
جدول زیر برچسبها، امتیازات اطمینان، نامهای مستعار و دستههای بازگردانده شده در پاسخ API را نشان میدهد.
برچسب ها | نمرات اعتماد به نفس | نام مستعار | دسته بندی ها |
طبیعت | 99.9 | - | طبیعت و فضای باز |
آب | 99.9 | - | طبیعت و فضای باز |
غواصی | 99.9 | اسکوبای آبی | سفر و ماجراجویی |
فرد | 99.9 | انسانی | توضیحات شخص |
فعالیتهای اوقات فراغت | 99.9 | تفریح | سفر و ماجراجویی |
ورزش ها | 99.9 | ورزش ها | ورزش ها |
تصویر زیر نمونه ای برای دوچرخه سوار است.
جدول زیر حاوی برچسبها، امتیازات اطمینان، نامهای مستعار و دستههای بازگردانده شده در پاسخ API است.
برچسب ها | نمرات اعتماد به نفس | نام مستعار | دسته بندی ها |
آسمان | 99.9 | - | طبیعت و فضای باز |
بیرون از خانه | 99.9 | - | طبیعت و فضای باز |
فرد | 98.3 | انسانی | توضیحات شخص |
غروب | 98.1 | غروب، سحر | طبیعت و فضای باز |
دوچرخه | 96.1 | دوچرخه | سرگرمی و علاقه |
دوچرخه سواري | 85.1 | دوچرخه سوار، دوچرخه سوار | اعمال |
فیلترهای گنجاندن و حذف
آمازون Rekognition Labels گزینههای جدیدی را برای فیلتر کردن درج و حذف در پارامترهای ورودی API معرفی میکند تا لیست خاصی از برچسبهای بازگردانده شده در پاسخ API را محدود کند. میتوانید فهرستی صریح از برچسبها یا دستههایی که میخواهید شامل یا حذف کنید ارائه کنید. توجه: این فیلترها با SDK های به روز شده در دسترس هستند.
مشتریان می توانند از فیلترهای گنجاندن و حذف برای به دست آوردن برچسب ها یا دسته بندی های خاصی که به آنها علاقه مند هستند، بدون نیاز به ایجاد منطق اضافی در برنامه خود استفاده کنند. به عنوان مثال مشتریان در بیمه می توانند استفاده کنند LabelCategoriesInclusionFilter
فقط شامل نتایج برچسب در Damage Detection
رده است.
کد زیر یک درخواست نمونه API با فیلترهای گنجاندن و حذف است:
در زیر نمونه هایی از نحوه عملکرد فیلترهای گنجاندن و حذف آمده است:
- اگر فقط می خواهید تشخیص دهید
Person
وCar
، و به برچسب های دیگر اهمیت ندهید، می توانید [“Person”,”Car”
] که درLabelsInclusionFilter
. - اگر می خواهید همه برچسب ها را به جز برای
Clothing
، می توانید مشخص کنید [“Clothing”
] که درLabelsExclusionFilter
. - اگر می خواهید فقط برچسب ها را در داخل شناسایی کنید
Animal and Pets
دسته ها به جزDog
وCat
، می توانید مشخص کنید ["Animal and Pets"
] درLabelCategoriesInclusionFilter
، با ["Dog", "Cat"
] که درLabelsExclusionFilter
. - اگر برچسبی در
LabelsInclusionFilter
orLabelsExclusionFilter
، نام مستعار آنها بر این اساس شامل یا حذف می شود زیراaliases
یک طبقه بندی فرعی از برچسب ها است. به عنوان مثال، به دلیلAutomobile
نام مستعار استCar
، اگر مشخص کنیدCar
inLabelsInclusionFilter
، API را برمی گرداندCar
برچسب باAutomobile
درaliases
رشته.
نتیجه
برچسبهای شناسایی آمازون 600 برچسب جدید را شناسایی کرده و دقت بیش از 2,000 برچسب موجود را بهبود میبخشد. همراه با این بهروزرسانیها، Amazon Rekognition Labels اکنون از ویژگیهای تصویر، نامهای مستعار و دستهها و همچنین فیلترهای گنجاندن و گنجاندن پشتیبانی میکند.
برای امتحان مدل جدید تشخیص برچسب با ویژگیهای جدید آن، وارد حساب AWS خود شوید و آن را بررسی کنید کنسول تشخیص آمازون برای تشخیص برچسب و ویژگی های تصویر. برای کسب اطلاعات بیشتر، مراجعه کنید شناسایی برچسب ها.
درباره نویسندگان
ماریا هاندوکو مدیر محصول ارشد در AWS است. او بر کمک به مشتریان برای حل چالش های تجاری خود از طریق یادگیری ماشینی و بینایی کامپیوتر تمرکز دارد. او در اوقات فراغت خود از پیاده روی، گوش دادن به پادکست ها و کاوش در غذاهای مختلف لذت می برد.
شیپرا کانوریا مدیر محصول اصلی در AWS است. او مشتاق کمک به مشتریان برای حل پیچیده ترین مشکلاتشان با قدرت یادگیری ماشینی و هوش مصنوعی است. قبل از پیوستن به AWS، شیپرا بیش از 4 سال را در آمازون الکسا گذراند، جایی که بسیاری از ویژگیهای مرتبط با بهرهوری را در دستیار صوتی الکسا راهاندازی کرد.
- AI
- آی هنر
- مولد هنر ai
- ربات ai
- شناسایی آمازون
- هوش مصنوعی
- گواهی هوش مصنوعی
- هوش مصنوعی در بانکداری
- ربات هوش مصنوعی
- ربات های هوش مصنوعی
- نرم افزار هوش مصنوعی
- آموزش ماشین AWS
- بلاکچین
- کنفرانس بلاک چین ai
- coingenius
- هوش مصنوعی محاوره ای
- کنفرانس کریپتو ai
- دل-ه
- یادگیری عمیق
- گوگل ai
- فراگیری ماشین
- افلاطون
- افلاطون آی
- هوش داده افلاطون
- بازی افلاطون
- PlatoData
- بازی پلاتو
- مقیاس Ai
- نحو
- زفیرنت