داده های جغرافیایی داده های مربوط به مکان های خاص در سطح زمین هستند. می تواند یک منطقه جغرافیایی را به عنوان یک کل نشان دهد یا می تواند یک رویداد مرتبط با یک منطقه جغرافیایی را نشان دهد. تجزیه و تحلیل داده های مکانی در چند صنعت مورد توجه قرار می گیرد. این شامل درک مکان هایی است که داده ها از منظر فضایی وجود دارند و چرا در آنجا وجود دارند.
دو نوع داده جغرافیایی وجود دارد: داده های برداری و داده های شطرنجی. دادههای شطرنجی ماتریسی از سلولها هستند که به صورت شبکه نمایش داده میشوند و بیشتر عکسها و تصاویر ماهوارهای را نشان میدهند. در این پست، ما روی دادههای برداری تمرکز میکنیم که به صورت مختصات جغرافیایی طول و عرض جغرافیایی و همچنین خطوط و چندضلعیها (مناطق) که آنها را به هم متصل یا در بر میگیرند، نشان داده میشوند. داده های برداری دارای موارد استفاده زیادی در استخراج بینش های تحرک است. داده های تلفن همراه کاربر یکی از این مؤلفه های آن است و بیشتر از موقعیت جغرافیایی دستگاه های تلفن همراه با استفاده از GPS یا ناشران برنامه با استفاده از SDK یا ادغام های مشابه به دست می آید. برای هدف این پست، ما به این داده ها به عنوان اشاره می کنیم داده های تحرک.
این سریال دو قسمتی است. در این پست اول، داده های تحرک، منابع آن و یک طرح معمولی از این داده ها را معرفی می کنیم. سپس موارد مختلف استفاده را مورد بحث قرار میدهیم و بررسی میکنیم که چگونه میتوانید از خدمات AWS برای پاکسازی دادهها استفاده کنید، چگونه یادگیری ماشینی (ML) میتواند به این تلاش کمک کند، و چگونه میتوانید از دادهها در تولید تصاویر و بینش استفاده اخلاقی کنید. پست دوم ماهیت فنی بیشتری خواهد داشت و این مراحل را با جزئیات در کنار کد نمونه پوشش می دهد. این پست یک مجموعه داده نمونه یا کد نمونه ندارد، بلکه نحوه استفاده از داده ها را پس از خرید از یک جمع کننده داده پوشش می دهد.
شما می توانید قابلیت های جغرافیایی Amazon SageMaker برای همپوشانی داده های تحرک بر روی نقشه پایه و ارائه تجسم لایه ای برای تسهیل همکاری. ویژوالایزر تعاملی مبتنی بر GPU و نوتبوکهای پایتون راهی بینظیر برای کاوش میلیونها نقطه داده در یک پنجره واحد و اشتراکگذاری بینش و نتایج را فراهم میکنند.
منابع و طرحواره
منابع کمی از داده های تحرک وجود دارد. به غیر از پینگهای GPS و ناشران برنامه، منابع دیگری مانند نقاط دسترسی Wi-Fi، دادههای جریان پیشنهادی بهدستآمده از طریق ارائه تبلیغات در دستگاههای تلفن همراه، و فرستندههای سختافزاری خاص که توسط کسبوکارها (بهعنوان مثال در فروشگاههای فیزیکی قرار داده شدهاند) برای تقویت مجموعه داده استفاده میشوند. ). اغلب برای کسب و کارها دشوار است که خودشان این داده ها را جمع آوری کنند، بنابراین ممکن است آن را از جمع آوری داده ها خریداری کنند. جمعآوریکنندههای داده، دادههای تحرک را از منابع مختلف جمعآوری میکنند، آنها را تمیز میکنند، نویز اضافه میکنند و دادهها را به صورت روزانه برای مناطق جغرافیایی خاص در دسترس قرار میدهند. با توجه به ماهیت خود داده ها و به دلیل دشواری به دست آوردن آنها، دقت و کیفیت این داده ها می تواند به طور قابل توجهی متفاوت باشد، و این بر عهده کسب و کار است که این را با استفاده از معیارهایی مانند کاربران فعال روزانه، کل پینگ های روزانه، ارزیابی و تأیید کنند. و میانگین پینگ روزانه در هر دستگاه. جدول زیر نشان می دهد که یک طرح معمولی از یک فید داده روزانه ارسال شده توسط جمع آوری کننده های داده چگونه ممکن است به نظر برسد.
صفت | توضیحات: |
شناسه یا MAID | شناسه تبلیغات تلفن همراه (MAID) دستگاه (هش شده) |
LAT | عرض جغرافیایی دستگاه |
طول | طول جغرافیایی دستگاه |
ژئوهش | مکان ژئوهش دستگاه |
نوع وسیله | سیستم عامل دستگاه = IDFA یا GAID |
افقی_دقت | دقت مختصات افقی GPS (بر حسب متر) |
برچسب زمان | مهر زمانی رویداد |
ip | آدرس آیپی |
ALT | ارتفاع دستگاه (بر حسب متر) |
سرعت | سرعت دستگاه (بر حسب متر بر ثانیه) |
کشور | کد دو رقمی ISO برای کشور مبدا |
بود | کدهای نشان دهنده حالت |
شهرستان | کدهای نشان دهنده شهر |
کد پستی | کد پستی محل مشاهده شناسه دستگاه |
حامل | حامل دستگاه |
دستگاه_سازنده | سازنده دستگاه |
موارد استفاده
داده های تحرک کاربردهای گسترده ای در صنایع مختلف دارد. موارد زیر برخی از رایج ترین موارد استفاده هستند:
- معیارهای چگالی - تجزیه و تحلیل ترافیک پیاده روی می تواند با تراکم جمعیت برای مشاهده فعالیت ها و بازدید از نقاط مورد علاقه (POI) ترکیب شود. این معیارها تصویری از تعداد دستگاهها یا کاربرانی را ارائه میدهند که به طور فعال در حال توقف و تعامل با یک تجارت هستند، که میتواند بیشتر برای انتخاب سایت یا حتی تجزیه و تحلیل الگوهای حرکت در اطراف یک رویداد (مثلاً افرادی که برای یک روز بازی سفر میکنند) استفاده شود. برای به دست آوردن چنین بینشهایی، دادههای خام ورودی از طریق فرآیند استخراج، تبدیل و بارگذاری (ETL) برای شناسایی فعالیتها یا درگیریها از جریان پیوسته پینگهای مکان دستگاه میگذرد. ما می توانیم فعالیت ها را با شناسایی توقف های ایجاد شده توسط کاربر یا دستگاه تلفن همراه با خوشه بندی پینگ ها با استفاده از مدل های ML در آن تجزیه و تحلیل کنیم. آمازون SageMaker.
- سفرها و مسیرها – فید موقعیت مکانی روزانه یک دستگاه را می توان به صورت مجموعه ای از فعالیت ها (توقف ها) و سفرها (حرکت) بیان کرد. یک جفت فعالیت می تواند نشان دهنده یک سفر بین آنها باشد و ردیابی سفر توسط دستگاه متحرک در فضای جغرافیایی می تواند به ترسیم مسیر واقعی منجر شود. الگوهای مسیر حرکت کاربر می تواند به بینش های جالبی مانند الگوهای ترافیک، مصرف سوخت، برنامه ریزی شهری و موارد دیگر منجر شود. همچنین می تواند داده هایی را برای تجزیه و تحلیل مسیر برداشته شده از نقاط تبلیغاتی مانند بیلبورد، شناسایی کارآمدترین مسیرهای تحویل برای بهینه سازی عملیات زنجیره تامین، یا تجزیه و تحلیل مسیرهای تخلیه در بلایای طبیعی (به عنوان مثال، تخلیه طوفان) ارائه دهد.
- تجزیه و تحلیل حوضه آبریز - A حوضه آبریز به مکان هایی اشاره دارد که یک منطقه معین بازدیدکنندگان خود را که ممکن است مشتریان یا مشتریان بالقوه باشند از آنجا جذب می کند. کسبوکارهای خردهفروشی میتوانند از این اطلاعات برای تعیین مکان بهینه برای افتتاح یک فروشگاه جدید استفاده کنند، یا تعیین کنند که آیا دو مکان فروشگاه خیلی به هم نزدیک هستند و حوضههای آبریز همپوشانی دارند و تجارت یکدیگر را مختل میکنند. آنها همچنین میتوانند دریابند که مشتریان واقعی از کجا آمدهاند، مشتریان بالقوهای را شناسایی کنند که از منطقه عبور میکنند و به محل کار یا خانه سفر میکنند، معیارهای بازدید مشابه را برای رقبا تجزیه و تحلیل کنند و موارد دیگر. شرکتهای Marketing Tech (MarTech) و Advertisement Tech (AdTech) نیز میتوانند از این تحلیل برای بهینهسازی کمپینهای بازاریابی با شناسایی مخاطبان نزدیک به فروشگاه برند یا رتبهبندی فروشگاهها بر اساس عملکرد برای تبلیغات خارج از خانه استفاده کنند.
چندین مورد استفاده دیگر نیز وجود دارد، از جمله ایجاد اطلاعات مکانی برای املاک تجاری، افزایش داده های تصاویر ماهواره ای با اعداد پیاده، شناسایی مراکز تحویل برای رستوران ها، تعیین احتمال تخلیه محله، کشف الگوهای حرکت مردم در طول یک بیماری همه گیر، و موارد دیگر.
چالش ها و استفاده اخلاقی
استفاده اخلاقی از دادههای تحرک میتواند به بینشهای جالب زیادی منجر شود که میتواند به سازمانها کمک کند تا عملیات خود را بهبود بخشند، بازاریابی مؤثر انجام دهند یا حتی به مزیت رقابتی دست یابند. برای استفاده اخلاقی از این داده ها، چندین مرحله باید دنبال شود.
با جمع آوری خود داده ها شروع می شود. اگرچه بیشتر دادههای جابجایی عاری از اطلاعات شناسایی شخصی (PII) مانند نام و آدرس باقی میمانند، جمعآوران و جمعآورندگان دادهها باید رضایت کاربر را برای جمعآوری، استفاده، ذخیره و اشتراکگذاری دادههای خود داشته باشند. قوانین حفظ حریم خصوصی دادهها مانند GDPR و CCPA باید رعایت شوند زیرا به کاربران اجازه میدهند تعیین کنند کسبوکارها چگونه میتوانند از دادههایشان استفاده کنند. این اولین گام حرکتی اساسی به سمت استفاده اخلاقی و مسئولانه از داده های تحرک است، اما می توان کارهای بیشتری انجام داد.
به هر دستگاه یک شناسه تبلیغاتی هش شده موبایل (MAID) اختصاص داده شده است که برای لنگر انداختن پینگهای فردی استفاده میشود. این را می توان با استفاده بیشتر مبهم کرد آمازون میسی, آمازون S3 Object Lambda, درک آمازون، یا حتی AWS Glue Studio تبدیل PII را شناسایی کنید. برای اطلاعات بیشتر مراجعه کنید تکنیک های رایج برای شناسایی داده های PHI و PII با استفاده از خدمات AWS.
به غیر از PII، باید ملاحظاتی برای پوشاندن مکان منزل کاربر و همچنین مکانهای حساس دیگر مانند پایگاههای نظامی یا مکانهای عبادت در نظر گرفته شود.
گام نهایی برای استفاده اخلاقی، استخراج و صدور تنها معیارهای انبوه از Amazon SageMaker است. این به معنای دریافت معیارهایی مانند تعداد متوسط یا تعداد کل بازدیدکنندگان در مقابل الگوهای سفر فردی است. دریافت روندهای روزانه، هفتگی، ماهانه یا سالانه؛ یا نمایه سازی الگوهای تحرک بر روی داده های در دسترس عموم مانند داده های سرشماری.
بررسی اجمالی راه حل
همانطور که قبلاً ذکر شد، خدمات AWS که می توانید برای تجزیه و تحلیل داده های تحرک استفاده کنید عبارتند از Amazon S3، Amazon Macie، AWS Glue، S3 Object Lambda، Amazon Comprehend و قابلیت های جغرافیایی Amazon SageMaker. قابلیتهای زمین فضایی Amazon SageMaker ساخت، آموزش و استقرار مدلها را با استفاده از دادههای مکانی برای دانشمندان داده و مهندسان ML آسان میکند. میتوانید مجموعه دادههای جغرافیایی در مقیاس بزرگ را به طور مؤثر تغییر دهید یا غنی کنید، ساخت مدل را با مدلهای ML از قبل آموزشدیده تسریع کنید، و پیشبینیهای مدل و دادههای مکانی را بر روی یک نقشه تعاملی با استفاده از گرافیکهای شتابدهنده سهبعدی و ابزارهای تجسم داخلی بررسی کنید.
معماری مرجع زیر یک گردش کار با استفاده از ML با داده های مکانی را به تصویر می کشد.
در این گردش کار، داده های خام از منابع داده های مختلف جمع آوری شده و در یک ذخیره می شوند سرویس ذخیره سازی ساده آمازون (S3) سطل. آمازون Macie در این سطل S3 برای شناسایی و ویرایش و PII استفاده می شود. سپس از چسب AWS برای تمیز کردن و تبدیل داده های خام به فرمت مورد نیاز استفاده می شود، سپس داده های اصلاح شده و تمیز شده در یک سطل S3 جداگانه ذخیره می شوند. برای آن دسته از تبدیل های داده ای که از طریق چسب AWS امکان پذیر نیست، از آن استفاده می کنید AWS لامبدا برای اصلاح و پاکسازی داده های خام هنگامی که داده ها پاک می شوند، می توانید از Amazon SageMaker برای ساخت، آموزش و استقرار مدل های ML بر روی داده های مکانی آماده شده استفاده کنید. شما همچنین می توانید استفاده کنید مشاغل پردازش جغرافیایی ویژگی قابلیتهای جغرافیایی Amazon SageMaker برای پیشپردازش دادهها - به عنوان مثال، استفاده از یک تابع Python و دستورات SQL برای شناسایی فعالیتها از دادههای تحرک خام. دانشمندان داده می توانند این فرآیند را با اتصال از طریق نوت بوک های Amazon SageMaker انجام دهند. همچنین می توانید استفاده کنید آمازون QuickSight برای تجسم نتایج کسب و کار و سایر معیارهای مهم از داده ها.
قابلیتهای جغرافیایی Amazon SageMaker و مشاغل پردازش مکانی
پس از اینکه داده ها به دست آمد و با یک خوراک روزانه به Amazon S3 وارد شد و برای هر گونه داده حساس پاک شد، می توان آن را با استفاده از یک برنامه به Amazon SageMaker وارد کرد. Amazon SageMaker Studio دفترچه یادداشت با تصویر جغرافیایی. اسکرین شات زیر نمونه ای از پینگ های روزانه دستگاه را نشان می دهد که در آمازون S3 به عنوان یک فایل CSV آپلود شده و سپس در یک قاب داده پاندا بارگذاری شده است. نوت بوک Amazon SageMaker Studio با تصویر جغرافیایی با کتابخانه های مکانی مانند GDAL، GeoPandas، Fiona و Shapely از پیش بارگذاری شده است و پردازش و تجزیه و تحلیل این داده ها را آسان می کند.
این مجموعه داده نمونه شامل تقریباً 400,000 پینگ روزانه دستگاه از 5,000 دستگاه از 14,000 مکان منحصر به فرد است که از کاربران بازدیدکننده از مرکز خرید Arrowhead Mall، مجتمع مرکز خرید محبوب در فینیکس، آریزونا، در 15 مه 2023 ضبط شده است. تصویر صفحه قبلی زیر مجموعه ای از ستون ها را نشان می دهد. طرح واره داده را MAID
ستون نشان دهنده شناسه دستگاه است و هر MAID در هر دقیقه پینگ هایی تولید می کند که طول و عرض جغرافیایی دستگاه را ارسال می کند و در فایل نمونه به صورت ثبت شده است. Lat
و Lng
ستون ها.
تصاویر زیر تصاویری از ابزار تجسم نقشه قابلیتهای جغرافیایی Amazon SageMaker است که توسط استودیوی Foursquare ارائه شده است، که طرحبندی پینگها را از دستگاههایی که بین ساعت 7 صبح تا 00 بعد از ظهر از مرکز بازدید میکنند به تصویر میکشد.
تصویر زیر پینگ هایی از مرکز خرید و مناطق اطراف آن را نشان می دهد.
در زیر پینگ هایی از داخل فروشگاه های مختلف در مرکز خرید نشان داده شده است.
هر نقطه در اسکرین شات ها یک پینگ از یک دستگاه معین را در یک نقطه زمانی معین نشان می دهد. مجموعهای از پینگها نشاندهنده مکانهای محبوبی است که دستگاهها در آنجا جمع شده یا متوقف شدهاند، مانند فروشگاهها یا رستورانها.
به عنوان بخشی از ETL اولیه، این داده های خام را می توان با استفاده از چسب AWS بر روی جداول بارگذاری کرد. میتوانید یک خزنده AWS Glue ایجاد کنید تا با اشاره به مکان دادههای خام در Amazon S3 بهعنوان منبع داده، طرحواره دادهها را شناسایی کرده و جداول را تشکیل دهید.
همانطور که در بالا ذکر شد، داده های خام (پینگ های روزانه دستگاه)، حتی پس از ETL اولیه، نشان دهنده یک جریان پیوسته از پینگ های GPS است که مکان دستگاه را نشان می دهد. برای استخراج بینش عملی از این داده ها، باید توقف ها و سفرها (مسیرها) را شناسایی کنیم. این را می توان با استفاده از مشاغل پردازش جغرافیایی ویژگی قابلیت های جغرافیایی SageMaker. پردازش آمازون SageMaker از یک تجربه مدیریت شده و ساده در SageMaker برای اجرای بارهای کاری پردازش داده با کانتینر جغرافیایی ساخته شده استفاده می کند. زیرساخت های اساسی برای یک کار پردازش SageMaker به طور کامل توسط SageMaker مدیریت می شود. این ویژگی کد سفارشی را قادر میسازد تا روی دادههای مکانی ذخیرهشده در آمازون S3 با اجرای یک ظرف ML جغرافیایی در یک کار پردازش SageMaker اجرا شود. میتوانید با نوشتن کدهای سفارشی با کتابخانههای منبع باز، عملیات سفارشی را روی دادههای مکانی باز یا خصوصی اجرا کنید و با استفاده از کارهای پردازش SageMaker، عملیات را در مقیاس اجرا کنید. رویکرد مبتنی بر کانتینر نیازهای مربوط به استانداردسازی محیط توسعه را با کتابخانههای منبع باز رایج حل میکند.
برای اجرای چنین بارهای کاری در مقیاس بزرگ، به یک خوشه محاسباتی انعطاف پذیر نیاز دارید که بتواند از ده ها نمونه برای پردازش یک بلوک شهری تا هزاران نمونه برای پردازش در مقیاس سیاره ای مقیاس کند. مدیریت دستی یک خوشه محاسباتی DIY کند و گران است. این ویژگی به ویژه زمانی مفید است که مجموعه داده تحرک شامل بیش از چند شهر در چندین ایالت یا حتی کشورها باشد و می توان از آن برای اجرای یک رویکرد ML دو مرحله ای استفاده کرد.
اولین گام استفاده از خوشه بندی فضایی مبتنی بر چگالی برنامه های کاربردی با الگوریتم نویز (DBSCAN) برای خوشه بندی توقف های پینگ است. گام بعدی استفاده از روش ماشینهای بردار پشتیبان (SVM) برای بهبود بیشتر دقت توقفهای شناساییشده و همچنین تشخیص توقفهای با درگیری با POI در مقابل توقفهای بدون توقف (مانند خانه یا محل کار) است. همچنین میتوانید از SageMaker Processing برای ایجاد سفرها و مسیرها از پینگهای روزانه دستگاه با شناسایی توقفهای متوالی و نقشهبرداری مسیر بین ایستگاههای مبدا و مقصد استفاده کنید.
پس از پردازش دادههای خام (پینگهای دستگاه روزانه) در مقیاس با کارهای پردازش جغرافیایی، مجموعه داده جدید به نام stops باید طرح زیر را داشته باشد.
صفت | توضیحات: |
شناسه یا MAID | شناسه تبلیغات موبایلی دستگاه (هش شده) |
LAT | عرض جغرافیایی مرکز خوشه توقف |
طول | طول وسط مرکز خوشه توقف |
ژئوهش | مکان ژئوهش POI |
نوع وسیله | سیستم عامل دستگاه (IDFA یا GAID) |
برچسب زمان | زمان شروع توقف |
dwell_time | زمان توقف توقف (بر حسب ثانیه) |
ip | آدرس آیپی |
ALT | ارتفاع دستگاه (بر حسب متر) |
کشور | کد دو رقمی ISO برای کشور مبدا |
بود | کدهای نشان دهنده حالت |
شهرستان | کدهای نشان دهنده شهر |
کد پستی | کد پستی محل مشاهده شناسه دستگاه |
حامل | حامل دستگاه |
دستگاه_سازنده | سازنده دستگاه |
استاپ ها با خوشه بندی پینگ ها در هر دستگاه ادغام می شوند. خوشه بندی مبتنی بر چگالی با پارامترهایی مانند آستانه توقف 300 ثانیه و حداقل فاصله بین توقف ها 50 متر ترکیب می شود. این پارامترها را می توان بر اساس مورد استفاده شما تنظیم کرد.
تصویر زیر تقریباً 15,000 استاپ شناسایی شده از 400,000 پینگ را نشان می دهد. زیر مجموعه ای از طرحواره قبلی نیز وجود دارد، جایی که ستون Dwell Time
نشان دهنده مدت زمان توقف، و Lat
و Lng
ستون ها نشان دهنده طول و عرض جغرافیایی مرکز خوشه توقف ها در هر دستگاه در هر مکان هستند.
پس از ETL، داده ها در قالب فایل پارکت ذخیره می شوند، که یک فرمت ذخیره سازی ستونی است که پردازش مقادیر زیادی از داده ها را آسان تر می کند.
اسکرین شات زیر توقف های ادغام شده از پینگ در هر دستگاه را در داخل مرکز خرید و مناطق اطراف نشان می دهد.
پس از شناسایی ایستگاهها، این مجموعه داده را میتوان با دادههای POI در دسترس عموم یا دادههای POI سفارشی مخصوص مورد استفاده برای شناسایی فعالیتها، مانند تعامل با مارکها، ملحق کرد.
اسکرین شات زیر ایستگاه های شناسایی شده در POI های اصلی (فروشگاه ها و مارک ها) در داخل مرکز خرید Arrowhead را نشان می دهد.
کدهای پستی خانه برای پنهان کردن مکان خانه هر بازدیدکننده برای حفظ حریم خصوصی در صورتی که بخشی از سفر آنها در مجموعه داده باشد، استفاده شده است. طول و عرض جغرافیایی در چنین مواردی مختصات مربوط به مرکز کد پستی است.
تصویر زیر نمایشی بصری از چنین فعالیت هایی است. تصویر سمت چپ ایستگاهها را به فروشگاهها نشان میدهد، و تصویر سمت راست ایدهای از چیدمان خود مرکز خرید میدهد.
این مجموعه داده بهدستآمده را میتوان به روشهای مختلفی تجسم کرد که در بخشهای بعدی به آنها میپردازیم.
معیارهای چگالی
ما می توانیم تراکم فعالیت ها و بازدیدها را محاسبه و تجسم کنیم.
1 مثال - تصویر زیر 15 فروشگاه برتر بازدید شده در مرکز خرید را نشان می دهد.
2 مثال – اسکرین شات زیر تعداد بازدید از فروشگاه اپل را در هر ساعت نشان می دهد.
سفرها و مسیرها
همانطور که قبلا ذکر شد، یک جفت فعالیت متوالی نشان دهنده یک سفر است. میتوانیم از روش زیر برای استخراج سفرها از دادههای فعالیتها استفاده کنیم. در اینجا، از توابع پنجره با SQL برای تولید استفاده می شود trips
جدول، همانطور که در تصویر نشان داده شده است.
بعد از trips
جدول ایجاد می شود، سفر به یک POI را می توان تعیین کرد.
مثال 1 - تصویر زیر 10 فروشگاه برتر را نشان می دهد که ترافیک را به سمت فروشگاه اپل هدایت می کنند.
2 مثال – اسکرین شات زیر تمام سفرها به مرکز خرید Arrowhead را نشان می دهد.
3 مثال – ویدئوی زیر الگوهای حرکتی داخل مرکز خرید را نشان می دهد.
4 مثال – ویدئوی زیر الگوهای حرکت در خارج از مرکز خرید را نشان می دهد.
تجزیه و تحلیل حوضه آبریز
ما می توانیم تمام بازدیدهای یک POI را تجزیه و تحلیل کنیم و حوضه آبریز را تعیین کنیم.
مثال 1 - اسکرین شات زیر همه بازدیدها از فروشگاه Macy را نشان می دهد.
2 مثال – اسکرین شات زیر 10 کد پستی منطقه اصلی خانه (مرزهای مشخص شده) را نشان می دهد که از آنجا بازدیدها انجام شده است.
بررسی کیفیت داده ها
ما میتوانیم فید دادههای دریافتی روزانه را از نظر کیفیت بررسی کنیم و با استفاده از داشبورد QuickSight و تجزیه و تحلیل دادهها، ناهنجاریها را تشخیص دهیم. تصویر زیر یک نمونه داشبورد را نشان می دهد.
نتیجه
داده های تحرک و تجزیه و تحلیل آن برای به دست آوردن بینش مشتری و به دست آوردن مزیت رقابتی، یک حوزه تخصصی باقی مانده است، زیرا به دست آوردن یک مجموعه داده منسجم و دقیق دشوار است. با این حال، این دادهها میتوانند به سازمانها کمک کنند تا زمینه را به تحلیلهای موجود اضافه کنند و حتی بینش جدیدی در مورد الگوهای حرکت مشتری ایجاد کنند. قابلیتهای جغرافیایی Amazon SageMaker و کارهای پردازش مکانی میتوانند به پیادهسازی این موارد استفاده و استخراج بینش به روشی بصری و قابل دسترس کمک کنند.
در این پست، نحوه استفاده از خدمات AWS برای پاکسازی دادههای تحرک و سپس استفاده از قابلیتهای جغرافیایی Amazon SageMaker برای تولید مجموعه دادههای مشتق شده مانند توقفها، فعالیتها و سفرها با استفاده از مدلهای ML را نشان دادیم. سپس از مجموعه داده های مشتق برای تجسم الگوهای حرکتی و ایجاد بینش استفاده کردیم.
شما می توانید با قابلیت های جغرافیایی Amazon SageMaker به دو روش شروع کنید:
برای کسب اطلاعات بیشتر، بازدید قابلیت های جغرافیایی Amazon SageMaker و شروع کار با Amazon SageMaker geospatial. همچنین از ما دیدن فرمایید GitHub repo، که دارای چندین نمونه نوت بوک در مورد قابلیت های جغرافیایی Amazon SageMaker است.
درباره نویسنده
جیمی متیوز یک معمار راه حل های AWS، با تخصص در فناوری AI/ML است. جیمی خارج از بوستون است و با مشتریان سازمانی کار می کند تا کسب و کار خود را با استفاده از ابر تغییر دهند و به آنها کمک کند راه حل های کارآمد و پایدار بسازند. او علاقه زیادی به خانواده، ماشین ها و هنرهای رزمی ترکیبی دارد.
گیریش کشاو یک معمار راه حل در AWS است که به مشتریان در سفر مهاجرت ابری خود کمک می کند تا بارهای کاری را به طور ایمن و کارآمد نوسازی کرده و اجرا کنند. او با رهبران تیم های فناوری کار می کند تا آنها را در زمینه امنیت برنامه، یادگیری ماشین، بهینه سازی هزینه و پایداری راهنمایی کند. او خارج از سانفرانسیسکو است و عاشق سفر، پیادهروی، تماشای ورزش و کاوش در آبجوسازیهای صنایع دستی است.
رامش جتی یکی از رهبران ارشد Solutions Architecture است که بر کمک به مشتریان سازمانی AWS برای کسب درآمد از دارایی های داده خود متمرکز شده است. او به مدیران و مهندسان توصیه می کند که راه حل های ابری بسیار مقیاس پذیر، قابل اعتماد و مقرون به صرفه را طراحی و بسازند، به ویژه بر روی یادگیری ماشین، داده ها و تجزیه و تحلیل تمرکز دارند. او در اوقات فراغت خود از تفریح در فضای باز، دوچرخه سواری و پیاده روی با خانواده لذت می برد.
- محتوای مبتنی بر SEO و توزیع روابط عمومی. امروز تقویت شوید.
- PlatoData.Network Vertical Generative Ai. به خودت قدرت بده دسترسی به اینجا.
- PlatoAiStream. هوش وب 3 دانش تقویت شده دسترسی به اینجا.
- PlatoESG. کربن ، CleanTech، انرژی، محیط، خورشیدی، مدیریت پسماند دسترسی به اینجا.
- PlatoHealth. هوش بیوتکنولوژی و آزمایشات بالینی. دسترسی به اینجا.
- منبع: https://aws.amazon.com/blogs/machine-learning/use-mobility-data-to-derive-insights-using-amazon-sagemaker-geospatial-capabilities/
- : دارد
- :است
- :نه
- :جایی که
- $UP
- 000
- 1
- 10
- 100
- 14
- ٪۱۰۰
- 2023
- 300
- 361
- 3d
- 400
- 50
- 7
- 9
- a
- درباره ما
- بالاتر
- شتاب دادن
- تسریع شد
- دسترسی
- در دسترس
- انجام دادن
- دقت
- دقیق
- دست
- عملی
- فعال
- فعالانه
- فعالیت ها
- واقعی
- اضافه کردن
- نشانی
- پایبند شد
- تنظیم شده
- تصویب
- آگهی
- مزیت - فایده - سود - منفعت
- تبلیغات
- تبلیغات
- پس از
- جمع کننده
- جمع کننده ها
- AI / ML
- کمک
- الگوریتم
- معرفی
- در کنار
- همچنین
- هر چند
- am
- آمازون
- درک آمازون
- آمازون SageMaker
- آمازون SageMaker geospatial
- Amazon SageMaker Studio
- آمازون خدمات وب
- مقدار
- an
- تجزیه و تحلیل
- تحلیل
- علم تجزیه و تحلیل
- تحلیل
- تجزیه و تحلیل
- لنگر
- و
- اختلالات
- هر
- جدا
- نرم افزار
- اپل
- کاربرد
- امنیت نرم افزار
- برنامه های کاربردی
- روش
- تقریبا
- معماری
- هستند
- محدوده
- مناطق
- آریزونا
- دور و بر
- هنر
- AS
- دارایی
- اختصاص داده
- مرتبط است
- At
- رسیدن
- حضار
- تقویت کردن
- در دسترس
- میانگین
- AWS
- چسب AWS
- پایه
- مستقر
- اساس
- BE
- زیرا
- بوده
- بودن
- میان
- پیشنهاد
- مسدود کردن
- بوستون
- مرز
- مارک های
- ساختن
- بنا
- ساخته شده در
- کسب و کار
- کسب و کار
- اما
- by
- محاسبه
- نام
- مبارزات
- CAN
- می توانید دریافت کنید
- قابلیت های
- اتومبیل
- مورد
- موارد
- CCPA
- سلول ها
- سرشماری
- زنجیر
- بررسی
- شهرستانها
- شهر:
- تمیز
- نزدیک
- ابر
- خوشه
- خوشه بندی
- رمز
- کد
- همکاری
- جمع آوری
- مجموعه
- جمع
- ستون
- ستون ها
- ترکیب شده
- می آید
- آینده
- تجاری
- املاک تجاری
- مشترک
- عموما
- شرکت
- رقابتی
- رقبای
- پیچیده
- جزء
- درک
- محاسبه
- اتصال
- متوالی
- رضایت
- ملاحظات
- استوار
- مصرف
- ظرف
- شامل
- زمینه
- مداوم
- هزینه
- کشور
- کشور
- پوشش
- را پوشش می دهد
- سادگی
- خزنده
- ایجاد
- سفارشی
- مشتری
- مشتریان
- روزانه
- داشبورد
- داشبورد
- داده ها
- نقاط داده
- حریم خصوصی داده ها
- پردازش داده ها
- مجموعه داده ها
- روز
- تحویل
- نشان
- تصویربرداری
- گسترش
- مشتق
- استخراج
- نشات گرفته
- طرح
- مقصدهای
- جزئیات
- تشخیص
- مشخص کردن
- مشخص
- تعیین
- پروژه
- دستگاه
- دستگاه ها
- مشکل
- مستقیم
- حوادث
- کشف
- بحث و تبادل نظر
- فاصله
- تمیز دادن
- DIY
- میکند
- انجام شده
- DOT
- تساوی
- دو
- مدت
- در طی
- هر
- پیش از آن
- آسان تر
- ساده
- موثر
- موثر
- موثر
- تلاش
- قدرت دادن
- را قادر می سازد
- شامل
- نامزدی
- درگیری
- جذاب
- مورد تأیید
- غنی سازی
- سرمایه گذاری
- محیط
- به خصوص
- املاک
- اخلاقی
- حتی
- واقعه
- هر
- مثال
- مدیران
- موجود
- وجود دارد
- گران
- تجربه
- تخصص
- اکتشاف
- بررسی
- صادرات
- بیان
- عصاره
- خانواده
- ویژگی
- تغذیه
- کمی از
- پرونده
- نهایی
- پیدا کردن
- فیونا
- نام خانوادگی
- قابل انعطاف
- تمرکز
- متمرکز شده است
- به دنبال
- پیروی
- پا
- برای
- فرم
- قالب
- FRAME
- فرانسیسکو
- رایگان
- از جانب
- سوخت
- کاملا
- تابع
- توابع
- بیشتر
- به دست آوردن
- بازی
- جمع آوری
- GDPR
- تولید می کنند
- تولید
- تولید می کند
- مولد
- جغرافیایی
- جغرافیایی
- زمین فضایی ML
- دریافت کنید
- گرفتن
- GIF
- داده
- می دهد
- می رود
- GPS
- گرافیک
- بزرگ
- توری
- راهنمایی
- سخت افزار
- درهم
- آیا
- he
- کمک
- مفید
- کمک
- کمک می کند
- اینجا کلیک نمایید
- برجسته
- خیلی
- خود را
- صفحه اصلی
- افقی
- ساعت
- چگونه
- چگونه
- اما
- HTML
- HTTP
- HTTPS
- هاب
- طوفان
- ID
- اندیشه
- شناسایی
- شناسایی
- شناسایی
- IDFA
- if
- تصویر
- انجام
- مهم
- بهبود
- in
- از جمله
- وارد شونده
- فرد
- لوازم
- اطلاعات
- شالوده
- اول
- داخل
- بینش
- یکپارچگی
- اطلاعات
- تعاملی
- علاقه
- جالب
- به
- معرفی
- حسی
- IT
- ITS
- خود
- کار
- شغل ها
- پیوست
- سفر
- JPG
- بزرگ
- در مقیاس بزرگ
- قوانین
- لایه لایه
- طرح
- رهبری
- رهبر
- رهبران
- یاد گرفتن
- یادگیری
- ترک کرد
- کتابخانه ها
- پسندیدن
- احتمال
- خطوط
- بار
- محل
- مکان
- نگاه کنيد
- شبیه
- دوست دارد
- دستگاه
- فراگیری ماشین
- ماشین آلات
- ساخته
- حفظ
- عمده
- ساخت
- باعث می شود
- اداره می شود
- مدیریت
- دستی
- بسیاری
- نقشه
- نقشه برداری
- نقشه ها
- بازار یابی (Marketing)
- فناوری بازاریابی
- مارتک
- نظامی
- ماسک
- ماتریس
- ممکن است..
- به معنی
- ذکر شده
- روش
- متریک
- مهاجرت
- نظامی
- میلیون ها نفر
- حد اقل
- دقیقه
- مخلوط
- ML
- موبایل
- دستگاه موبایل
- دستگاه های تلفن همراه
- تحرک
- مدل
- مدل
- نوین کردن
- اصلاح شده
- تغییر
- کسب درآمد
- ماهیانه
- بیش
- اکثر
- اغلب
- حرکت
- جنبش
- جنبش ها
- متحرک
- چندگانه
- بسیاری
- باید
- نام
- طبیعی
- طبیعت
- نیاز
- نیازهای
- جدید
- بعد
- تو رفتگی در دیوار
- سر و صدا
- دفتر یادداشت
- عدد
- تعداد
- هدف
- مشاهده کردن
- گرفتن
- به دست آمده
- بدست آوردن
- رخ داده است
- of
- غالبا
- on
- ONE
- فقط
- به سوی
- باز کن
- منبع باز
- عمل
- عملیات
- مخالف
- بهینه
- بهینه سازی
- بهینه سازی
- or
- سازمان های
- دیگر
- ما
- خارج
- نتایج
- خارج از منزل
- خارج از
- روی
- جفت
- پانداها
- بیماری همه گیر
- پارامترهای
- بخش
- ویژه
- عبور
- احساساتی
- مسیر
- الگوهای
- مردم
- برای
- انجام
- کارایی
- شخصا
- چشم انداز
- عنقا
- عکس
- فیزیکی
- تصویر
- پینگ
- اماکن
- برنامه ریزی
- افلاطون
- هوش داده افلاطون
- PlatoData
- pm
- نقطه
- نقطه
- محبوب
- جمعیت
- موقعیت
- ممکن
- پست
- پتانسیل
- مشتریان بالقوه
- صفحه اصلی
- ماقبل
- پیش بینی
- در حال حاضر
- خلوت
- خصوصی
- روند
- در حال پردازش
- تولید کردن
- ارائه
- عمومی
- ناشران
- خرید
- خریداری شده
- هدف
- پــایتــون
- کیفیت
- رتبه بندی
- نسبتا
- خام
- واقعی
- املاک و مستغلات
- ثبت
- مراجعه
- مرجع
- اشاره دارد
- مناطق
- قابل اعتماد
- بقایای
- نشان دادن
- نمایندگی
- نمایندگی
- نمایندگی
- نشان دهنده
- ضروری
- قابل احترام
- مسئوليت
- رستوران ها
- نتیجه
- نتایج
- خرده فروشی
- راست
- مسیر
- مسیرها
- دویدن
- در حال اجرا
- حکیم ساز
- مجموعه داده نمونه
- سان
- سان فرانسیسکو
- ماهواره ای
- مقیاس پذیر
- مقیاس
- دانشمندان
- تصاویر
- sdks
- بدون درز
- دوم
- ثانیه
- بخش
- ایمن
- تیم امنیت لاتاری
- انتخاب
- ارشد
- حساس
- فرستاده
- جداگانه
- سلسله
- خدمات
- خدمت
- چند
- اشتراک گذاری
- خريد كردن
- باید
- نشان داده شده
- نشان می دهد
- مشابه
- ساده
- ساده شده
- تنها
- سایت
- کند
- So
- مزایا
- حل می کند
- برخی از
- به دنبال
- منبع
- منابع
- فضا
- فضایی
- خاص
- ورزش ها
- نقاط
- استاندارد سازی
- آغاز شده
- شروع می شود
- اظهارات
- ایالات
- گام
- مراحل
- توقف
- متوقف شد
- متوقف کردن
- توقف
- ذخیره سازی
- opbevare
- ذخیره شده
- پرده
- ساده
- جریان
- استودیو
- قابل توجه
- چنین
- عرضه
- زنجیره تامین
- پشتیبانی
- سطح
- اطراف
- پایداری
- قابل تحمل
- سیستم
- جدول
- صورت گرفته
- تیم ها
- فن آوری
- فنی
- تکنیک
- پیشرفته
- ده ها
- نسبت به
- که
- La
- محوطه
- منبع
- شان
- آنها
- خودشان
- سپس
- آنجا.
- اینها
- آنها
- این
- کسانی که
- هزاران نفر
- آستانه
- از طریق
- زمان
- به
- هم
- ابزار
- ابزار
- بالا
- بالا 10
- جمع
- طرف
- ردیابی
- ترافیک
- قطار
- مسیر
- دگرگون کردن
- تحولات
- فرستنده
- سفر
- سفر
- روند
- سفر
- دو
- انواع
- نوعی
- اساسی
- درک
- منحصر به فرد
- آپلود شده
- استفاده کنید
- مورد استفاده
- استفاده
- کاربر
- کاربران
- استفاده
- با استفاده از
- استفاده کنید
- متنوع
- مختلف
- بررسی
- از طريق
- تصویری
- بازدید
- بازدید
- بازدید کنندگان
- بازدیدکننده داشته است
- بصری
- تجسم
- تجسم
- تصاویر
- vs
- تماشای
- مسیر..
- راه
- we
- وب
- خدمات وب
- هفتگی
- خوب
- چی
- چه زمانی
- که
- WHO
- تمام
- چرا
- وای فای
- بطور گسترده
- اراده
- پنجره
- با
- بدون
- مهاجرت کاری
- گردش کار
- با این نسخهها کار
- نوشته
- سالانه
- شما
- شما
- زفیرنت
- زیپ