استفاده از داده های تحرک برای استخراج بینش با استفاده از قابلیت های جغرافیایی Amazon SageMaker | خدمات وب آمازون

استفاده از داده های تحرک برای استخراج بینش با استفاده از قابلیت های جغرافیایی Amazon SageMaker | خدمات وب آمازون

داده های جغرافیایی داده های مربوط به مکان های خاص در سطح زمین هستند. می تواند یک منطقه جغرافیایی را به عنوان یک کل نشان دهد یا می تواند یک رویداد مرتبط با یک منطقه جغرافیایی را نشان دهد. تجزیه و تحلیل داده های مکانی در چند صنعت مورد توجه قرار می گیرد. این شامل درک مکان هایی است که داده ها از منظر فضایی وجود دارند و چرا در آنجا وجود دارند.

دو نوع داده جغرافیایی وجود دارد: داده های برداری و داده های شطرنجی. داده‌های شطرنجی ماتریسی از سلول‌ها هستند که به صورت شبکه نمایش داده می‌شوند و بیشتر عکس‌ها و تصاویر ماهواره‌ای را نشان می‌دهند. در این پست، ما روی داده‌های برداری تمرکز می‌کنیم که به صورت مختصات جغرافیایی طول و عرض جغرافیایی و همچنین خطوط و چندضلعی‌ها (مناطق) که آنها را به هم متصل یا در بر می‌گیرند، نشان داده می‌شوند. داده های برداری دارای موارد استفاده زیادی در استخراج بینش های تحرک است. داده های تلفن همراه کاربر یکی از این مؤلفه های آن است و بیشتر از موقعیت جغرافیایی دستگاه های تلفن همراه با استفاده از GPS یا ناشران برنامه با استفاده از SDK یا ادغام های مشابه به دست می آید. برای هدف این پست، ما به این داده ها به عنوان اشاره می کنیم داده های تحرک.

این سریال دو قسمتی است. در این پست اول، داده های تحرک، منابع آن و یک طرح معمولی از این داده ها را معرفی می کنیم. سپس موارد مختلف استفاده را مورد بحث قرار می‌دهیم و بررسی می‌کنیم که چگونه می‌توانید از خدمات AWS برای پاکسازی داده‌ها استفاده کنید، چگونه یادگیری ماشینی (ML) می‌تواند به این تلاش کمک کند، و چگونه می‌توانید از داده‌ها در تولید تصاویر و بینش استفاده اخلاقی کنید. پست دوم ماهیت فنی بیشتری خواهد داشت و این مراحل را با جزئیات در کنار کد نمونه پوشش می دهد. این پست یک مجموعه داده نمونه یا کد نمونه ندارد، بلکه نحوه استفاده از داده ها را پس از خرید از یک جمع کننده داده پوشش می دهد.

شما می توانید قابلیت های جغرافیایی Amazon SageMaker برای همپوشانی داده های تحرک بر روی نقشه پایه و ارائه تجسم لایه ای برای تسهیل همکاری. ویژوالایزر تعاملی مبتنی بر GPU و نوت‌بوک‌های پایتون راهی بی‌نظیر برای کاوش میلیون‌ها نقطه داده در یک پنجره واحد و اشتراک‌گذاری بینش و نتایج را فراهم می‌کنند.

منابع و طرحواره

منابع کمی از داده های تحرک وجود دارد. به غیر از پینگ‌های GPS و ناشران برنامه، منابع دیگری مانند نقاط دسترسی Wi-Fi، داده‌های جریان پیشنهادی به‌دست‌آمده از طریق ارائه تبلیغات در دستگاه‌های تلفن همراه، و فرستنده‌های سخت‌افزاری خاص که توسط کسب‌وکارها (به‌عنوان مثال در فروشگاه‌های فیزیکی قرار داده شده‌اند) برای تقویت مجموعه داده استفاده می‌شوند. ). اغلب برای کسب و کارها دشوار است که خودشان این داده ها را جمع آوری کنند، بنابراین ممکن است آن را از جمع آوری داده ها خریداری کنند. جمع‌آوری‌کننده‌های داده، داده‌های تحرک را از منابع مختلف جمع‌آوری می‌کنند، آن‌ها را تمیز می‌کنند، نویز اضافه می‌کنند و داده‌ها را به صورت روزانه برای مناطق جغرافیایی خاص در دسترس قرار می‌دهند. با توجه به ماهیت خود داده ها و به دلیل دشواری به دست آوردن آنها، دقت و کیفیت این داده ها می تواند به طور قابل توجهی متفاوت باشد، و این بر عهده کسب و کار است که این را با استفاده از معیارهایی مانند کاربران فعال روزانه، کل پینگ های روزانه، ارزیابی و تأیید کنند. و میانگین پینگ روزانه در هر دستگاه. جدول زیر نشان می دهد که یک طرح معمولی از یک فید داده روزانه ارسال شده توسط جمع آوری کننده های داده چگونه ممکن است به نظر برسد.

صفت توضیحات:
شناسه یا MAID شناسه تبلیغات تلفن همراه (MAID) دستگاه (هش شده)
LAT عرض جغرافیایی دستگاه
طول طول جغرافیایی دستگاه
ژئوهش مکان ژئوهش دستگاه
نوع وسیله سیستم عامل دستگاه = IDFA یا GAID
افقی_دقت دقت مختصات افقی GPS (بر حسب متر)
برچسب زمان مهر زمانی رویداد
ip آدرس آیپی
ALT ارتفاع دستگاه (بر حسب متر)
سرعت سرعت دستگاه (بر حسب متر بر ثانیه)
کشور کد دو رقمی ISO برای کشور مبدا
بود کدهای نشان دهنده حالت
شهرستان کدهای نشان دهنده شهر
کد پستی کد پستی محل مشاهده شناسه دستگاه
حامل حامل دستگاه
دستگاه_سازنده سازنده دستگاه

موارد استفاده

داده های تحرک کاربردهای گسترده ای در صنایع مختلف دارد. موارد زیر برخی از رایج ترین موارد استفاده هستند:

  • معیارهای چگالی - تجزیه و تحلیل ترافیک پیاده روی می تواند با تراکم جمعیت برای مشاهده فعالیت ها و بازدید از نقاط مورد علاقه (POI) ترکیب شود. این معیارها تصویری از تعداد دستگاه‌ها یا کاربرانی را ارائه می‌دهند که به طور فعال در حال توقف و تعامل با یک تجارت هستند، که می‌تواند بیشتر برای انتخاب سایت یا حتی تجزیه و تحلیل الگوهای حرکت در اطراف یک رویداد (مثلاً افرادی که برای یک روز بازی سفر می‌کنند) استفاده شود. برای به دست آوردن چنین بینش‌هایی، داده‌های خام ورودی از طریق فرآیند استخراج، تبدیل و بارگذاری (ETL) برای شناسایی فعالیت‌ها یا درگیری‌ها از جریان پیوسته پینگ‌های مکان دستگاه می‌گذرد. ما می توانیم فعالیت ها را با شناسایی توقف های ایجاد شده توسط کاربر یا دستگاه تلفن همراه با خوشه بندی پینگ ها با استفاده از مدل های ML در آن تجزیه و تحلیل کنیم. آمازون SageMaker.
  • سفرها و مسیرها – فید موقعیت مکانی روزانه یک دستگاه را می توان به صورت مجموعه ای از فعالیت ها (توقف ها) و سفرها (حرکت) بیان کرد. یک جفت فعالیت می تواند نشان دهنده یک سفر بین آنها باشد و ردیابی سفر توسط دستگاه متحرک در فضای جغرافیایی می تواند به ترسیم مسیر واقعی منجر شود. الگوهای مسیر حرکت کاربر می تواند به بینش های جالبی مانند الگوهای ترافیک، مصرف سوخت، برنامه ریزی شهری و موارد دیگر منجر شود. همچنین می تواند داده هایی را برای تجزیه و تحلیل مسیر برداشته شده از نقاط تبلیغاتی مانند بیلبورد، شناسایی کارآمدترین مسیرهای تحویل برای بهینه سازی عملیات زنجیره تامین، یا تجزیه و تحلیل مسیرهای تخلیه در بلایای طبیعی (به عنوان مثال، تخلیه طوفان) ارائه دهد.
  • تجزیه و تحلیل حوضه آبریز - A حوضه آبریز به مکان هایی اشاره دارد که یک منطقه معین بازدیدکنندگان خود را که ممکن است مشتریان یا مشتریان بالقوه باشند از آنجا جذب می کند. کسب‌وکارهای خرده‌فروشی می‌توانند از این اطلاعات برای تعیین مکان بهینه برای افتتاح یک فروشگاه جدید استفاده کنند، یا تعیین کنند که آیا دو مکان فروشگاه خیلی به هم نزدیک هستند و حوضه‌های آبریز همپوشانی دارند و تجارت یکدیگر را مختل می‌کنند. آن‌ها همچنین می‌توانند دریابند که مشتریان واقعی از کجا آمده‌اند، مشتریان بالقوه‌ای را شناسایی کنند که از منطقه عبور می‌کنند و به محل کار یا خانه سفر می‌کنند، معیارهای بازدید مشابه را برای رقبا تجزیه و تحلیل کنند و موارد دیگر. شرکت‌های Marketing Tech (MarTech) و Advertisement Tech (AdTech) نیز می‌توانند از این تحلیل برای بهینه‌سازی کمپین‌های بازاریابی با شناسایی مخاطبان نزدیک به فروشگاه برند یا رتبه‌بندی فروشگاه‌ها بر اساس عملکرد برای تبلیغات خارج از خانه استفاده کنند.

چندین مورد استفاده دیگر نیز وجود دارد، از جمله ایجاد اطلاعات مکانی برای املاک تجاری، افزایش داده های تصاویر ماهواره ای با اعداد پیاده، شناسایی مراکز تحویل برای رستوران ها، تعیین احتمال تخلیه محله، کشف الگوهای حرکت مردم در طول یک بیماری همه گیر، و موارد دیگر.

چالش ها و استفاده اخلاقی

استفاده اخلاقی از داده‌های تحرک می‌تواند به بینش‌های جالب زیادی منجر شود که می‌تواند به سازمان‌ها کمک کند تا عملیات خود را بهبود بخشند، بازاریابی مؤثر انجام دهند یا حتی به مزیت رقابتی دست یابند. برای استفاده اخلاقی از این داده ها، چندین مرحله باید دنبال شود.

با جمع آوری خود داده ها شروع می شود. اگرچه بیشتر داده‌های جابجایی عاری از اطلاعات شناسایی شخصی (PII) مانند نام و آدرس باقی می‌مانند، جمع‌آوران و جمع‌آورندگان داده‌ها باید رضایت کاربر را برای جمع‌آوری، استفاده، ذخیره و اشتراک‌گذاری داده‌های خود داشته باشند. قوانین حفظ حریم خصوصی داده‌ها مانند GDPR و CCPA باید رعایت شوند زیرا به کاربران اجازه می‌دهند تعیین کنند کسب‌وکارها چگونه می‌توانند از داده‌هایشان استفاده کنند. این اولین گام حرکتی اساسی به سمت استفاده اخلاقی و مسئولانه از داده های تحرک است، اما می توان کارهای بیشتری انجام داد.

به هر دستگاه یک شناسه تبلیغاتی هش شده موبایل (MAID) اختصاص داده شده است که برای لنگر انداختن پینگ‌های فردی استفاده می‌شود. این را می توان با استفاده بیشتر مبهم کرد آمازون میسی, آمازون S3 Object Lambda, درک آمازون، یا حتی AWS Glue Studio تبدیل PII را شناسایی کنید. برای اطلاعات بیشتر مراجعه کنید تکنیک های رایج برای شناسایی داده های PHI و PII با استفاده از خدمات AWS.

به غیر از PII، باید ملاحظاتی برای پوشاندن مکان منزل کاربر و همچنین مکان‌های حساس دیگر مانند پایگاه‌های نظامی یا مکان‌های عبادت در نظر گرفته شود.

گام نهایی برای استفاده اخلاقی، استخراج و صدور تنها معیارهای انبوه از Amazon SageMaker است. این به معنای دریافت معیارهایی مانند تعداد متوسط ​​یا تعداد کل بازدیدکنندگان در مقابل الگوهای سفر فردی است. دریافت روندهای روزانه، هفتگی، ماهانه یا سالانه؛ یا نمایه سازی الگوهای تحرک بر روی داده های در دسترس عموم مانند داده های سرشماری.

بررسی اجمالی راه حل

همانطور که قبلاً ذکر شد، خدمات AWS که می توانید برای تجزیه و تحلیل داده های تحرک استفاده کنید عبارتند از Amazon S3، Amazon Macie، AWS Glue، S3 Object Lambda، Amazon Comprehend و قابلیت های جغرافیایی Amazon SageMaker. قابلیت‌های زمین فضایی Amazon SageMaker ساخت، آموزش و استقرار مدل‌ها را با استفاده از داده‌های مکانی برای دانشمندان داده و مهندسان ML آسان می‌کند. می‌توانید مجموعه داده‌های جغرافیایی در مقیاس بزرگ را به طور مؤثر تغییر دهید یا غنی کنید، ساخت مدل را با مدل‌های ML از قبل آموزش‌دیده تسریع کنید، و پیش‌بینی‌های مدل و داده‌های مکانی را بر روی یک نقشه تعاملی با استفاده از گرافیک‌های شتاب‌دهنده سه‌بعدی و ابزارهای تجسم داخلی بررسی کنید.

معماری مرجع زیر یک گردش کار با استفاده از ML با داده های مکانی را به تصویر می کشد.

نمودار معماری

در این گردش کار، داده های خام از منابع داده های مختلف جمع آوری شده و در یک ذخیره می شوند سرویس ذخیره سازی ساده آمازون (S3) سطل. آمازون Macie در این سطل S3 برای شناسایی و ویرایش و PII استفاده می شود. سپس از چسب AWS برای تمیز کردن و تبدیل داده های خام به فرمت مورد نیاز استفاده می شود، سپس داده های اصلاح شده و تمیز شده در یک سطل S3 جداگانه ذخیره می شوند. برای آن دسته از تبدیل های داده ای که از طریق چسب AWS امکان پذیر نیست، از آن استفاده می کنید AWS لامبدا برای اصلاح و پاکسازی داده های خام هنگامی که داده ها پاک می شوند، می توانید از Amazon SageMaker برای ساخت، آموزش و استقرار مدل های ML بر روی داده های مکانی آماده شده استفاده کنید. شما همچنین می توانید استفاده کنید مشاغل پردازش جغرافیایی ویژگی قابلیت‌های جغرافیایی Amazon SageMaker برای پیش‌پردازش داده‌ها - به عنوان مثال، استفاده از یک تابع Python و دستورات SQL برای شناسایی فعالیت‌ها از داده‌های تحرک خام. دانشمندان داده می توانند این فرآیند را با اتصال از طریق نوت بوک های Amazon SageMaker انجام دهند. همچنین می توانید استفاده کنید آمازون QuickSight برای تجسم نتایج کسب و کار و سایر معیارهای مهم از داده ها.

قابلیت‌های جغرافیایی Amazon SageMaker و مشاغل پردازش مکانی

پس از اینکه داده ها به دست آمد و با یک خوراک روزانه به Amazon S3 وارد شد و برای هر گونه داده حساس پاک شد، می توان آن را با استفاده از یک برنامه به Amazon SageMaker وارد کرد. Amazon SageMaker Studio دفترچه یادداشت با تصویر جغرافیایی. اسکرین شات زیر نمونه ای از پینگ های روزانه دستگاه را نشان می دهد که در آمازون S3 به عنوان یک فایل CSV آپلود شده و سپس در یک قاب داده پاندا بارگذاری شده است. نوت بوک Amazon SageMaker Studio با تصویر جغرافیایی با کتابخانه های مکانی مانند GDAL، GeoPandas، Fiona و Shapely از پیش بارگذاری شده است و پردازش و تجزیه و تحلیل این داده ها را آسان می کند.

Use mobility data to derive insights using Amazon SageMaker geospatial capabilities | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

این مجموعه داده نمونه شامل تقریباً 400,000 پینگ روزانه دستگاه از 5,000 دستگاه از 14,000 مکان منحصر به فرد است که از کاربران بازدیدکننده از مرکز خرید Arrowhead Mall، مجتمع مرکز خرید محبوب در فینیکس، آریزونا، در 15 مه 2023 ضبط شده است. تصویر صفحه قبلی زیر مجموعه ای از ستون ها را نشان می دهد. طرح واره داده را MAID ستون نشان دهنده شناسه دستگاه است و هر MAID در هر دقیقه پینگ هایی تولید می کند که طول و عرض جغرافیایی دستگاه را ارسال می کند و در فایل نمونه به صورت ثبت شده است. Lat و Lng ستون ها.

تصاویر زیر تصاویری از ابزار تجسم نقشه قابلیت‌های جغرافیایی Amazon SageMaker است که توسط استودیوی Foursquare ارائه شده است، که طرح‌بندی پینگ‌ها را از دستگاه‌هایی که بین ساعت 7 صبح تا 00 بعد از ظهر از مرکز بازدید می‌کنند به تصویر می‌کشد.

تصویر زیر پینگ هایی از مرکز خرید و مناطق اطراف آن را نشان می دهد.

Use mobility data to derive insights using Amazon SageMaker geospatial capabilities | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

در زیر پینگ هایی از داخل فروشگاه های مختلف در مرکز خرید نشان داده شده است.

Use mobility data to derive insights using Amazon SageMaker geospatial capabilities | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

هر نقطه در اسکرین شات ها یک پینگ از یک دستگاه معین را در یک نقطه زمانی معین نشان می دهد. مجموعه‌ای از پینگ‌ها نشان‌دهنده مکان‌های محبوبی است که دستگاه‌ها در آنجا جمع شده یا متوقف شده‌اند، مانند فروشگاه‌ها یا رستوران‌ها.

به عنوان بخشی از ETL اولیه، این داده های خام را می توان با استفاده از چسب AWS بر روی جداول بارگذاری کرد. می‌توانید یک خزنده AWS Glue ایجاد کنید تا با اشاره به مکان داده‌های خام در Amazon S3 به‌عنوان منبع داده، طرح‌واره داده‌ها را شناسایی کرده و جداول را تشکیل دهید.

Use mobility data to derive insights using Amazon SageMaker geospatial capabilities | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Use mobility data to derive insights using Amazon SageMaker geospatial capabilities | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

همانطور که در بالا ذکر شد، داده های خام (پینگ های روزانه دستگاه)، حتی پس از ETL اولیه، نشان دهنده یک جریان پیوسته از پینگ های GPS است که مکان دستگاه را نشان می دهد. برای استخراج بینش عملی از این داده ها، باید توقف ها و سفرها (مسیرها) را شناسایی کنیم. این را می توان با استفاده از مشاغل پردازش جغرافیایی ویژگی قابلیت های جغرافیایی SageMaker. پردازش آمازون SageMaker از یک تجربه مدیریت شده و ساده در SageMaker برای اجرای بارهای کاری پردازش داده با کانتینر جغرافیایی ساخته شده استفاده می کند. زیرساخت های اساسی برای یک کار پردازش SageMaker به طور کامل توسط SageMaker مدیریت می شود. این ویژگی کد سفارشی را قادر می‌سازد تا روی داده‌های مکانی ذخیره‌شده در آمازون S3 با اجرای یک ظرف ML جغرافیایی در یک کار پردازش SageMaker اجرا شود. می‌توانید با نوشتن کدهای سفارشی با کتابخانه‌های منبع باز، عملیات سفارشی را روی داده‌های مکانی باز یا خصوصی اجرا کنید و با استفاده از کارهای پردازش SageMaker، عملیات را در مقیاس اجرا کنید. رویکرد مبتنی بر کانتینر نیازهای مربوط به استانداردسازی محیط توسعه را با کتابخانه‌های منبع باز رایج حل می‌کند.

برای اجرای چنین بارهای کاری در مقیاس بزرگ، به یک خوشه محاسباتی انعطاف پذیر نیاز دارید که بتواند از ده ها نمونه برای پردازش یک بلوک شهری تا هزاران نمونه برای پردازش در مقیاس سیاره ای مقیاس کند. مدیریت دستی یک خوشه محاسباتی DIY کند و گران است. این ویژگی به ویژه زمانی مفید است که مجموعه داده تحرک شامل بیش از چند شهر در چندین ایالت یا حتی کشورها باشد و می توان از آن برای اجرای یک رویکرد ML دو مرحله ای استفاده کرد.

اولین گام استفاده از خوشه بندی فضایی مبتنی بر چگالی برنامه های کاربردی با الگوریتم نویز (DBSCAN) برای خوشه بندی توقف های پینگ است. گام بعدی استفاده از روش ماشین‌های بردار پشتیبان (SVM) برای بهبود بیشتر دقت توقف‌های شناسایی‌شده و همچنین تشخیص توقف‌های با درگیری با POI در مقابل توقف‌های بدون توقف (مانند خانه یا محل کار) است. همچنین می‌توانید از SageMaker Processing برای ایجاد سفرها و مسیرها از پینگ‌های روزانه دستگاه با شناسایی توقف‌های متوالی و نقشه‌برداری مسیر بین ایستگاه‌های مبدا و مقصد استفاده کنید.

پس از پردازش داده‌های خام (پینگ‌های دستگاه روزانه) در مقیاس با کارهای پردازش جغرافیایی، مجموعه داده جدید به نام stops باید طرح زیر را داشته باشد.

صفت توضیحات:
شناسه یا MAID شناسه تبلیغات موبایلی دستگاه (هش شده)
LAT عرض جغرافیایی مرکز خوشه توقف
طول طول وسط مرکز خوشه توقف
ژئوهش مکان ژئوهش POI
نوع وسیله سیستم عامل دستگاه (IDFA یا GAID)
برچسب زمان زمان شروع توقف
dwell_time زمان توقف توقف (بر حسب ثانیه)
ip آدرس آیپی
ALT ارتفاع دستگاه (بر حسب متر)
کشور کد دو رقمی ISO برای کشور مبدا
بود کدهای نشان دهنده حالت
شهرستان کدهای نشان دهنده شهر
کد پستی کد پستی محل مشاهده شناسه دستگاه
حامل حامل دستگاه
دستگاه_سازنده سازنده دستگاه

استاپ ها با خوشه بندی پینگ ها در هر دستگاه ادغام می شوند. خوشه بندی مبتنی بر چگالی با پارامترهایی مانند آستانه توقف 300 ثانیه و حداقل فاصله بین توقف ها 50 متر ترکیب می شود. این پارامترها را می توان بر اساس مورد استفاده شما تنظیم کرد.

تصویر زیر تقریباً 15,000 استاپ شناسایی شده از 400,000 پینگ را نشان می دهد. زیر مجموعه ای از طرحواره قبلی نیز وجود دارد، جایی که ستون Dwell Time نشان دهنده مدت زمان توقف، و Lat و Lng ستون ها نشان دهنده طول و عرض جغرافیایی مرکز خوشه توقف ها در هر دستگاه در هر مکان هستند.

پس از ETL، داده ها در قالب فایل پارکت ذخیره می شوند، که یک فرمت ذخیره سازی ستونی است که پردازش مقادیر زیادی از داده ها را آسان تر می کند.

Use mobility data to derive insights using Amazon SageMaker geospatial capabilities | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Use mobility data to derive insights using Amazon SageMaker geospatial capabilities | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

اسکرین شات زیر توقف های ادغام شده از پینگ در هر دستگاه را در داخل مرکز خرید و مناطق اطراف نشان می دهد.

Use mobility data to derive insights using Amazon SageMaker geospatial capabilities | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

پس از شناسایی ایستگاه‌ها، این مجموعه داده را می‌توان با داده‌های POI در دسترس عموم یا داده‌های POI سفارشی مخصوص مورد استفاده برای شناسایی فعالیت‌ها، مانند تعامل با مارک‌ها، ملحق کرد.

اسکرین شات زیر ایستگاه های شناسایی شده در POI های اصلی (فروشگاه ها و مارک ها) در داخل مرکز خرید Arrowhead را نشان می دهد.

Use mobility data to derive insights using Amazon SageMaker geospatial capabilities | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

کدهای پستی خانه برای پنهان کردن مکان خانه هر بازدیدکننده برای حفظ حریم خصوصی در صورتی که بخشی از سفر آنها در مجموعه داده باشد، استفاده شده است. طول و عرض جغرافیایی در چنین مواردی مختصات مربوط به مرکز کد پستی است.

تصویر زیر نمایشی بصری از چنین فعالیت هایی است. تصویر سمت چپ ایستگاه‌ها را به فروشگاه‌ها نشان می‌دهد، و تصویر سمت راست ایده‌ای از چیدمان خود مرکز خرید می‌دهد.

Use mobility data to derive insights using Amazon SageMaker geospatial capabilities | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

این مجموعه داده به‌دست‌آمده را می‌توان به روش‌های مختلفی تجسم کرد که در بخش‌های بعدی به آن‌ها می‌پردازیم.

معیارهای چگالی

ما می توانیم تراکم فعالیت ها و بازدیدها را محاسبه و تجسم کنیم.

1 مثال - تصویر زیر 15 فروشگاه برتر بازدید شده در مرکز خرید را نشان می دهد.

Use mobility data to derive insights using Amazon SageMaker geospatial capabilities | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

2 مثال – اسکرین شات زیر تعداد بازدید از فروشگاه اپل را در هر ساعت نشان می دهد.

Use mobility data to derive insights using Amazon SageMaker geospatial capabilities | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

سفرها و مسیرها

همانطور که قبلا ذکر شد، یک جفت فعالیت متوالی نشان دهنده یک سفر است. می‌توانیم از روش زیر برای استخراج سفرها از داده‌های فعالیت‌ها استفاده کنیم. در اینجا، از توابع پنجره با SQL برای تولید استفاده می شود trips جدول، همانطور که در تصویر نشان داده شده است.

Use mobility data to derive insights using Amazon SageMaker geospatial capabilities | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Use mobility data to derive insights using Amazon SageMaker geospatial capabilities | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

بعد از trips جدول ایجاد می شود، سفر به یک POI را می توان تعیین کرد.

مثال 1 - تصویر زیر 10 فروشگاه برتر را نشان می دهد که ترافیک را به سمت فروشگاه اپل هدایت می کنند.

Use mobility data to derive insights using Amazon SageMaker geospatial capabilities | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

2 مثال – اسکرین شات زیر تمام سفرها به مرکز خرید Arrowhead را نشان می دهد.

Use mobility data to derive insights using Amazon SageMaker geospatial capabilities | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

3 مثال – ویدئوی زیر الگوهای حرکتی داخل مرکز خرید را نشان می دهد.

Use mobility data to derive insights using Amazon SageMaker geospatial capabilities | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

4 مثال – ویدئوی زیر الگوهای حرکت در خارج از مرکز خرید را نشان می دهد.

Use mobility data to derive insights using Amazon SageMaker geospatial capabilities | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

تجزیه و تحلیل حوضه آبریز

ما می توانیم تمام بازدیدهای یک POI را تجزیه و تحلیل کنیم و حوضه آبریز را تعیین کنیم.

مثال 1 - اسکرین شات زیر همه بازدیدها از فروشگاه Macy را نشان می دهد.

Use mobility data to derive insights using Amazon SageMaker geospatial capabilities | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

2 مثال – اسکرین شات زیر 10 کد پستی منطقه اصلی خانه (مرزهای مشخص شده) را نشان می دهد که از آنجا بازدیدها انجام شده است.

Use mobility data to derive insights using Amazon SageMaker geospatial capabilities | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

بررسی کیفیت داده ها

ما می‌توانیم فید داده‌های دریافتی روزانه را از نظر کیفیت بررسی کنیم و با استفاده از داشبورد QuickSight و تجزیه و تحلیل داده‌ها، ناهنجاری‌ها را تشخیص دهیم. تصویر زیر یک نمونه داشبورد را نشان می دهد.

Use mobility data to derive insights using Amazon SageMaker geospatial capabilities | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

نتیجه

داده های تحرک و تجزیه و تحلیل آن برای به دست آوردن بینش مشتری و به دست آوردن مزیت رقابتی، یک حوزه تخصصی باقی مانده است، زیرا به دست آوردن یک مجموعه داده منسجم و دقیق دشوار است. با این حال، این داده‌ها می‌توانند به سازمان‌ها کمک کنند تا زمینه را به تحلیل‌های موجود اضافه کنند و حتی بینش جدیدی در مورد الگوهای حرکت مشتری ایجاد کنند. قابلیت‌های جغرافیایی Amazon SageMaker و کارهای پردازش مکانی می‌توانند به پیاده‌سازی این موارد استفاده و استخراج بینش به روشی بصری و قابل دسترس کمک کنند.

در این پست، نحوه استفاده از خدمات AWS برای پاکسازی داده‌های تحرک و سپس استفاده از قابلیت‌های جغرافیایی Amazon SageMaker برای تولید مجموعه داده‌های مشتق شده مانند توقف‌ها، فعالیت‌ها و سفرها با استفاده از مدل‌های ML را نشان دادیم. سپس از مجموعه داده های مشتق برای تجسم الگوهای حرکتی و ایجاد بینش استفاده کردیم.

شما می توانید با قابلیت های جغرافیایی Amazon SageMaker به دو روش شروع کنید:

برای کسب اطلاعات بیشتر، بازدید قابلیت های جغرافیایی Amazon SageMaker و شروع کار با Amazon SageMaker geospatial. همچنین از ما دیدن فرمایید GitHub repo، که دارای چندین نمونه نوت بوک در مورد قابلیت های جغرافیایی Amazon SageMaker است.


درباره نویسنده

Use mobility data to derive insights using Amazon SageMaker geospatial capabilities | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.جیمی متیوز یک معمار راه حل های AWS، با تخصص در فناوری AI/ML است. جیمی خارج از بوستون است و با مشتریان سازمانی کار می کند تا کسب و کار خود را با استفاده از ابر تغییر دهند و به آنها کمک کند راه حل های کارآمد و پایدار بسازند. او علاقه زیادی به خانواده، ماشین ها و هنرهای رزمی ترکیبی دارد.

Use mobility data to derive insights using Amazon SageMaker geospatial capabilities | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.گیریش کشاو یک معمار راه حل در AWS است که به مشتریان در سفر مهاجرت ابری خود کمک می کند تا بارهای کاری را به طور ایمن و کارآمد نوسازی کرده و اجرا کنند. او با رهبران تیم های فناوری کار می کند تا آنها را در زمینه امنیت برنامه، یادگیری ماشین، بهینه سازی هزینه و پایداری راهنمایی کند. او خارج از سانفرانسیسکو است و عاشق سفر، پیاده‌روی، تماشای ورزش و کاوش در آبجوسازی‌های صنایع دستی است.

Use mobility data to derive insights using Amazon SageMaker geospatial capabilities | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.رامش جتی یکی از رهبران ارشد Solutions Architecture است که بر کمک به مشتریان سازمانی AWS برای کسب درآمد از دارایی های داده خود متمرکز شده است. او به مدیران و مهندسان توصیه می کند که راه حل های ابری بسیار مقیاس پذیر، قابل اعتماد و مقرون به صرفه را طراحی و بسازند، به ویژه بر روی یادگیری ماشین، داده ها و تجزیه و تحلیل تمرکز دارند. او در اوقات فراغت خود از تفریح ​​در فضای باز، دوچرخه سواری و پیاده روی با خانواده لذت می برد.

تمبر زمان:

بیشتر از آموزش ماشین AWS