Wykorzystaj dane dotyczące mobilności, aby uzyskać szczegółowe informacje, korzystając z możliwości geoprzestrzennych Amazon SageMaker | Usługi internetowe Amazona

Wykorzystaj dane dotyczące mobilności, aby uzyskać szczegółowe informacje, korzystając z możliwości geoprzestrzennych Amazon SageMaker | Usługi internetowe Amazona

Dane geoprzestrzenne to dane o określonych lokalizacjach na powierzchni Ziemi. Może reprezentować obszar geograficzny jako całość lub może reprezentować wydarzenie powiązane z obszarem geograficznym. Analiza danych geoprzestrzennych jest pożądana w kilku branżach. Wymaga zrozumienia, gdzie dane istnieją z perspektywy przestrzennej i dlaczego tam istnieją.

Istnieją dwa typy danych geoprzestrzennych: dane wektorowe i dane rastrowe. Dane rastrowe to macierz komórek przedstawiona w postaci siatki, reprezentującej głównie zdjęcia i zdjęcia satelitarne. W tym poście skupiamy się na danych wektorowych, które są reprezentowane jako współrzędne geograficzne szerokości i długości geograficznej oraz linie i wielokąty (obszary) je łączące lub obejmujące. Dane wektorowe mają wiele zastosowań w uzyskiwaniu informacji na temat mobilności. Jednym z takich elementów są mobilne dane użytkowników, które pochodzą głównie z położenia geograficznego urządzeń mobilnych korzystających z GPS lub wydawców aplikacji korzystających z pakietów SDK lub podobnych integracji. Na potrzeby tego wpisu dane te będziemy nazywać dane dotyczące mobilności.

Jest to seria dwuczęściowa. W pierwszym poście przedstawiamy dane dotyczące mobilności, ich źródła oraz typowy schemat tych danych. Następnie omawiamy różne przypadki użycia i badamy, w jaki sposób można używać usług AWS do czyszczenia danych, w jaki sposób uczenie maszynowe (ML) może pomóc w tym wysiłku oraz w jaki sposób można etycznie wykorzystać dane do generowania wizualizacji i spostrzeżeń. Drugi post będzie miał charakter bardziej techniczny i szczegółowo omówi te kroki wraz z przykładowym kodem. Ten post nie zawiera przykładowego zbioru danych ani przykładowego kodu, raczej opisuje sposób wykorzystania danych po ich zakupie od agregatora danych.

Możesz użyć Możliwości geoprzestrzenne Amazon SageMaker nakładać dane dotyczące mobilności na mapę bazową i zapewniać warstwową wizualizację ułatwiającą współpracę. Interaktywny wizualizator zasilany przez procesor graficzny i notesy w języku Python umożliwiają płynne eksplorowanie milionów punktów danych w jednym oknie oraz udostępnianie spostrzeżeń i wyników.

Źródła i schemat

Istnieje niewiele źródeł danych na temat mobilności. Oprócz sygnałów GPS i wydawców aplikacji do powiększania zbioru danych wykorzystywane są inne źródła, takie jak punkty dostępu Wi-Fi, dane dotyczące strumieni ofert uzyskiwane w wyniku wyświetlania reklam na urządzeniach mobilnych oraz określone nadajniki sprzętowe umieszczane przez firmy (na przykład w sklepach stacjonarnych ). Firmom często trudno jest samodzielnie zebrać te dane, dlatego mogą je zakupić od agregatorów danych. Agregatory danych zbierają dane dotyczące mobilności z różnych źródeł, oczyszczają je, dodają szumu i codziennie udostępniają dane dla określonych regionów geograficznych. Ze względu na charakter samych danych oraz fakt, że są one trudne do uzyskania, dokładność i jakość tych danych może się znacznie różnić, a ocena i weryfikacja tego należą do firm za pomocą takich wskaźników, jak dzienna liczba aktywnych użytkowników, łączna dzienna liczba pingów, i średnie dzienne pingi na urządzenie. Poniższa tabela pokazuje, jak może wyglądać typowy schemat dziennego strumienia danych wysyłanego przez agregatory danych.

Atrybut Opis
Dowód osobisty lub pokojówka Identyfikator wyświetlania reklam mobilnych (MAID) urządzenia (zaszyfrowany)
lat Szerokość geograficzna urządzenia
LNG Długość geograficzna urządzenia
geohash Lokalizacja Geohash urządzenia
rodzaj urządzenia System operacyjny urządzenia = IDFA lub GAID
pozioma_dokładność Dokładność poziomych współrzędnych GPS (w metrach)
znak czasu Znacznik czasu wydarzenia
ip adres IP
alt Wysokość urządzenia (w metrach)
prędkość Prędkość urządzenia (w metrach/sekundę)
kraj Dwucyfrowy kod ISO kraju pochodzenia
były Kody reprezentujące stan
miasto Kody reprezentujące miasto
kod pocztowy Kod pocztowy miejsca, w którym widoczny jest identyfikator urządzenia
nośnik Nośnik urządzenia
producent_urządzenia Producent urządzenia

Przypadków użycia

Dane dotyczące mobilności mają szerokie zastosowanie w różnych gałęziach przemysłu. Oto niektóre z najczęstszych przypadków użycia:

  • Metryki gęstości – Analizę ruchu pieszego można połączyć z gęstością zaludnienia, aby obserwować działania i wizyty w punktach szczególnych (POI). Wskaźniki te przedstawiają obraz tego, ile urządzeń lub użytkowników aktywnie zatrzymuje się i wchodzi w interakcję z firmą, co można dalej wykorzystać do wyboru lokalizacji lub nawet analizy wzorców poruszania się wokół wydarzenia (na przykład osób podróżujących na mecz). Aby uzyskać takie informacje, przychodzące surowe dane przechodzą proces wyodrębniania, przekształcania i ładowania (ETL) w celu zidentyfikowania działań lub interakcji na podstawie ciągłego strumienia pingów lokalizacji urządzenia. Możemy analizować działania, identyfikując zatrzymania wykonane przez użytkownika lub urządzenie mobilne, grupując pingi przy użyciu modeli ML Amazon Sage Maker.
  • Podróże i trajektorie – Codzienny kanał lokalizacyjny urządzenia można wyrazić jako zbiór czynności (przystanków) i podróży (ruch). Para działań może reprezentować podróż między nimi, a śledzenie podróży przez poruszające się urządzenie w przestrzeni geograficznej może prowadzić do odwzorowania rzeczywistej trajektorii. Wzorce trajektorii przemieszczania się użytkowników mogą prowadzić do ciekawych spostrzeżeń, takich jak wzorce ruchu, zużycie paliwa, planowanie miasta i nie tylko. Może także dostarczać danych do analizy trasy pobranej z punktów reklamowych takich jak billboard, identyfikować najbardziej efektywne trasy dostaw w celu optymalizacji operacji w łańcuchu dostaw czy analizować drogi ewakuacyjne w przypadku klęsk żywiołowych (np. ewakuacja przed huraganem).
  • Analiza obszaru zlewni - obszar zlewni odnosi się do miejsc, z których dany obszar przyciąga gości, którzy mogą być klientami lub potencjalnymi klientami. Firmy prowadzące handel detaliczny mogą wykorzystać te informacje do określenia optymalnej lokalizacji do otwarcia nowego sklepu lub ustalenia, czy dwie lokalizacje sklepów nie są zbyt blisko siebie, a ich obszary zasięgu się nakładają i utrudniają sobie nawzajem działalność. Mogą także dowiedzieć się, skąd pochodzą rzeczywiści klienci, zidentyfikować potencjalnych klientów, którzy przechodzą przez dany obszar, jadąc do pracy lub domu, analizować podobne wskaźniki odwiedzin dla konkurencji i nie tylko. Firmy zajmujące się marketingiem (MarTech) i reklamą (AdTech) mogą również wykorzystać tę analizę do optymalizacji kampanii marketingowych poprzez identyfikację odbiorców w pobliżu sklepu danej marki lub do uszeregowania sklepów według skuteczności reklam zewnętrznych.

Istnieje kilka innych zastosowań, w tym generowanie informacji lokalizacyjnych dla nieruchomości komercyjnych, uzupełnianie danych ze zdjęć satelitarnych o liczbę odwiedzin, identyfikacja węzłów dostaw dla restauracji, określanie prawdopodobieństwa ewakuacji okolicy, odkrywanie wzorców przemieszczania się ludzi podczas pandemii i nie tylko.

Wyzwania i etyczne wykorzystanie

Etyczne wykorzystanie danych dotyczących mobilności może prowadzić do wielu interesujących spostrzeżeń, które mogą pomóc organizacjom ulepszyć swoje działania, prowadzić skuteczny marketing, a nawet osiągnąć przewagę konkurencyjną. Aby wykorzystać te dane w sposób etyczny, należy wykonać kilka kroków.

Zaczyna się od samego gromadzenia danych. Chociaż większość danych dotyczących mobilności nie zawiera informacji umożliwiających identyfikację użytkownika, takich jak imię i nazwisko oraz adres, podmioty gromadzące i agregatory danych muszą mieć zgodę użytkownika na gromadzenie, wykorzystywanie, przechowywanie i udostępnianie ich danych. Należy przestrzegać przepisów dotyczących ochrony danych, takich jak RODO i CCPA, ponieważ dają one użytkownikom możliwość określenia, w jaki sposób firmy mogą wykorzystywać ich dane. Ten pierwszy krok stanowi istotny krok w kierunku etycznego i odpowiedzialnego wykorzystania danych dotyczących mobilności, ale można zrobić więcej.

Każdemu urządzeniu przypisany jest zaszyfrowany identyfikator reklamy mobilnej (MAID), który służy do zakotwiczenia poszczególnych pingów. Można to jeszcze bardziej zaciemnić za pomocą Amazonka, Lambda obiektów Amazon S3, Amazon Comprehend, a nawet Pracownia Kleju AWS Wykryj transformację PII. Aby uzyskać więcej informacji, zobacz Typowe techniki wykrywania danych PHI i PII przy użyciu usług AWS.

Oprócz informacji umożliwiających identyfikację należy rozważyć zamaskowanie lokalizacji domowej użytkownika, a także innych wrażliwych lokalizacji, takich jak bazy wojskowe lub miejsca kultu.

Ostatnim krokiem w kierunku etycznego wykorzystania jest uzyskanie i eksportowanie wyłącznie zagregowanych danych z Amazon SageMaker. Oznacza to uzyskiwanie wskaźników, takich jak średnia lub całkowita liczba odwiedzających, w przeciwieństwie do indywidualnych wzorców podróży; uzyskiwanie trendów dziennych, tygodniowych, miesięcznych lub rocznych; lub indeksowanie wzorców mobilności w oparciu o publicznie dostępne dane, takie jak dane ze spisu ludności.

Omówienie rozwiązania

Jak wspomniano wcześniej, usługi AWS, których można użyć do analizy danych dotyczących mobilności, to usługi geoprzestrzenne Amazon S3, Amazon Macie, AWS Glue, S3 Object Lambda, Amazon Comprehend i Amazon SageMaker. Możliwości geoprzestrzenne Amazon SageMaker ułatwiają analitykom danych i inżynierom ML budowanie, trenowanie i wdrażanie modeli przy użyciu danych geoprzestrzennych. Możesz efektywnie przekształcać lub wzbogacać wielkoskalowe zestawy danych geoprzestrzennych, przyspieszać budowanie modeli za pomocą wstępnie wytrenowanych modeli uczenia maszynowego oraz eksplorować prognozy modeli i dane geoprzestrzenne na interaktywnej mapie przy użyciu grafiki 3D z akceleracją i wbudowanych narzędzi do wizualizacji.

Poniższa architektura referencyjna przedstawia przepływ pracy przy użyciu uczenia maszynowego z danymi geoprzestrzennymi.

Schemat Architektury

W tym przepływie pracy surowe dane są agregowane z różnych źródeł danych i przechowywane w pliku Usługa Amazon Simple Storage (S3) wiadro. Amazon Macie jest używany w tym segmencie S3 do identyfikacji i redagowania informacji umożliwiających identyfikację. Następnie stosuje się klej AWS Glue do czyszczenia i przekształcania surowych danych do wymaganego formatu, po czym zmodyfikowane i oczyszczone dane są przechowywane w osobnym wiadrze S3. W przypadku transformacji danych, które nie są możliwe za pomocą kleju AWS, używasz AWS Lambda do modyfikowania i czyszczenia surowych danych. Po wyczyszczeniu danych możesz użyć Amazon SageMaker do tworzenia, uczenia i wdrażania modeli uczenia maszynowego na przygotowanych danych geoprzestrzennych. Możesz także skorzystać z Zadania związane z przetwarzaniem geoprzestrzennym funkcja możliwości geoprzestrzennych Amazon SageMaker do wstępnego przetwarzania danych — na przykład użycie funkcji Python i instrukcji SQL do identyfikacji działań na podstawie surowych danych dotyczących mobilności. Analitycy danych mogą przeprowadzić ten proces, łącząc się za pośrednictwem notatników Amazon SageMaker. Możesz także użyć Amazon QuickSight do wizualizacji wyników biznesowych i innych ważnych wskaźników na podstawie danych.

Możliwości i zadania przetwarzania geoprzestrzennego Amazon SageMaker

Po pobraniu danych i wprowadzeniu ich do Amazon S3 wraz z codziennym zasilaniem i oczyszczeniu z wszelkich wrażliwych danych, można je zaimportować do Amazon SageMaker za pomocą Studio Amazon SageMaker notatnik z obrazem geoprzestrzennym. Poniższy zrzut ekranu pokazuje przykład codziennych pingów urządzeń przesłanych do Amazon S3 jako plik CSV, a następnie załadowanych do ramki danych pandy. Notatnik Amazon SageMaker Studio z obrazem geoprzestrzennym ma fabrycznie załadowane biblioteki geoprzestrzenne, takie jak GDAL, GeoPandas, Fiona i Shapely, co ułatwia przetwarzanie i analizowanie tych danych.

Wykorzystaj dane dotyczące mobilności, aby uzyskać szczegółowe informacje, korzystając z możliwości geoprzestrzennych Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Ten przykładowy zbiór danych zawiera około 400,000 5,000 poleceń ping urządzeń dziennie z 14,000 urządzeń z 15 2023 unikalnych miejsc zarejestrowanych przez użytkowników odwiedzających Arrowhead Mall, popularny kompleks centrów handlowych w Phoenix w Arizonie, XNUMX maja XNUMX r. Powyższy zrzut ekranu przedstawia podzbiór kolumn w schemat danych. The MAID kolumna reprezentuje identyfikator urządzenia, a każdy MAID generuje pingi co minutę, przekazując szerokość i długość geograficzną urządzenia, zapisaną w przykładowym pliku jako Lat i Lng kolumny.

Poniżej znajdują się zrzuty ekranu z narzędzia do wizualizacji map dostępnego w ramach możliwości geoprzestrzennych Amazon SageMaker obsługiwanego przez Foursquare Studio, przedstawiające układ sygnałów z urządzeń odwiedzających centrum handlowe w godzinach od 7:00 do 6:00.

Poniższy zrzut ekranu pokazuje pingi z centrum handlowego i okolic.

Wykorzystaj dane dotyczące mobilności, aby uzyskać szczegółowe informacje, korzystając z możliwości geoprzestrzennych Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Poniżej przedstawiono pingi z różnych sklepów w centrum handlowym.

Wykorzystaj dane dotyczące mobilności, aby uzyskać szczegółowe informacje, korzystając z możliwości geoprzestrzennych Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Każda kropka na zrzutach ekranu przedstawia ping z danego urządzenia w danym momencie. Grupa pingów reprezentuje popularne miejsca, w których gromadziły się lub zatrzymywały urządzenia, takie jak sklepy czy restauracje.

W ramach początkowego ETL te surowe dane można załadować do tabel za pomocą kleju AWS. Możesz utworzyć przeszukiwacz AWS Glue, aby identyfikować schemat danych i tworzyć tabele, wskazując lokalizację surowych danych w Amazon S3 jako źródło danych.

Wykorzystaj dane dotyczące mobilności, aby uzyskać szczegółowe informacje, korzystając z możliwości geoprzestrzennych Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Wykorzystaj dane dotyczące mobilności, aby uzyskać szczegółowe informacje, korzystając z możliwości geoprzestrzennych Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Jak wspomniano powyżej, surowe dane (codzienne pingi urządzenia), nawet po początkowym ETL, będą reprezentować ciągły strumień pingów GPS wskazujących lokalizacje urządzeń. Aby wyciągnąć z tych danych przydatne wnioski, musimy zidentyfikować przystanki i podróże (trajektorie). Można to osiągnąć za pomocą Zadania związane z przetwarzaniem geoprzestrzennym funkcja możliwości geoprzestrzennych SageMaker. Przetwarzanie Amazon SageMaker korzysta z uproszczonego, zarządzanego środowiska SageMaker do uruchamiania zadań związanych z przetwarzaniem danych za pomocą specjalnie zaprojektowanego kontenera geoprzestrzennego. Podstawowa infrastruktura zadania SageMaker Processing jest w pełni zarządzana przez SageMaker. Ta funkcja umożliwia uruchamianie niestandardowego kodu na danych geoprzestrzennych przechowywanych w usłudze Amazon S3 poprzez uruchomienie kontenera geoprzestrzennego ML w zadaniu przetwarzania SageMaker. Możesz uruchamiać niestandardowe operacje na otwartych lub prywatnych danych geoprzestrzennych, pisząc niestandardowy kod za pomocą bibliotek open source i uruchamiać operacje na dużą skalę przy użyciu zadań SageMaker Processing. Podejście oparte na kontenerach rozwiązuje potrzeby związane ze standaryzacją środowiska programistycznego za pomocą powszechnie używanych bibliotek open source.

Aby uruchamiać obciążenia na tak dużą skalę, potrzebny jest elastyczny klaster obliczeniowy, który można skalować od dziesiątek instancji do przetwarzania przecznic po tysiące instancji do przetwarzania na skalę planetarną. Ręczne zarządzanie klastrem obliczeniowym typu „zrób to sam” jest powolne i kosztowne. Ta funkcja jest szczególnie pomocna, gdy zbiór danych dotyczących mobilności obejmuje więcej niż kilka miast w wielu stanach lub nawet krajach i można ją wykorzystać do zastosowania dwuetapowego podejścia do uczenia maszynowego.

Pierwszym krokiem jest użycie algorytmu klastrowania przestrzennego aplikacji opartego na gęstości z algorytmem szumu (DBSCAN) w celu klastrowania zatrzymań z pakietów ping. Następnym krokiem jest zastosowanie metody maszyn wektorów nośnych (SVM) w celu dalszej poprawy dokładności zidentyfikowanych przystanków, a także rozróżnienia przystanków mających kontakt z POI od przystanków bez niego (takich jak dom lub praca). Możesz także użyć zadania przetwarzania SageMaker do generowania podróży i trajektorii na podstawie codziennych pingów urządzeń, identyfikując kolejne przystanki i mapując ścieżkę między przystankami źródłowymi i docelowymi.

Po przetworzeniu nieprzetworzonych danych (codzienne pingi urządzeń) na dużą skalę za pomocą zadań przetwarzania geoprzestrzennego nowy zestaw danych o nazwie zatrzymania powinien mieć następujący schemat.

Atrybut Opis
Dowód osobisty lub pokojówka Identyfikator wyświetlania reklam mobilnych urządzenia (zaszyfrowany)
lat Szerokość środka ciężkości skupiska zatrzymującego
LNG Długość geograficzna środka ciężkości skupiska zatrzymującego
geohash Geohash lokalizacji POI
rodzaj urządzenia System operacyjny urządzenia (IDFA lub GAID)
znak czasu Godzina rozpoczęcia przystanku
czas oczekiwania Czas przebywania zatrzymania (w sekundach)
ip adres IP
alt Wysokość urządzenia (w metrach)
kraj Dwucyfrowy kod ISO kraju pochodzenia
były Kody reprezentujące stan
miasto Kody reprezentujące miasto
kod pocztowy Kod pocztowy miejsca, w którym widoczny jest identyfikator urządzenia
nośnik Nośnik urządzenia
producent_urządzenia Producent urządzenia

Zatrzymania są konsolidowane poprzez grupowanie pingów na urządzenie. Klastrowanie oparte na gęstości łączy się z takimi parametrami, jak próg zatrzymania wynoszący 300 sekund i minimalna odległość między przystankami wynosząca 50 metrów. Parametry te można dostosować w zależności od przypadku użycia.

Poniższy zrzut ekranu przedstawia około 15,000 400,000 przystanków zidentyfikowanych na podstawie XNUMX XNUMX sygnałów ping. Występuje również podzbiór poprzedniego schematu, gdzie kolumna Dwell Time reprezentuje czas trwania zatrzymania, a Lat i Lng kolumny reprezentują szerokość i długość geograficzną centroid klastra przystanków na urządzenie na lokalizację.

Po ETL dane są przechowywane w formacie pliku Parquet, który jest formatem kolumnowym, który ułatwia przetwarzanie dużych ilości danych.

Wykorzystaj dane dotyczące mobilności, aby uzyskać szczegółowe informacje, korzystając z możliwości geoprzestrzennych Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Wykorzystaj dane dotyczące mobilności, aby uzyskać szczegółowe informacje, korzystając z możliwości geoprzestrzennych Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Poniższy zrzut ekranu przedstawia przystanki skonsolidowane na podstawie pingów na urządzenie w centrum handlowym i okolicach.

Wykorzystaj dane dotyczące mobilności, aby uzyskać szczegółowe informacje, korzystając z możliwości geoprzestrzennych Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Po zidentyfikowaniu przystanków ten zbiór danych można połączyć z publicznie dostępnymi danymi POI lub niestandardowymi danymi POI specyficznymi dla przypadku użycia w celu zidentyfikowania działań, takich jak interakcja z markami.

Poniższy zrzut ekranu przedstawia przystanki zidentyfikowane w głównych punktach POI (sklepach i markach) w centrum handlowym Arrowhead.

Wykorzystaj dane dotyczące mobilności, aby uzyskać szczegółowe informacje, korzystając z możliwości geoprzestrzennych Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Domowe kody pocztowe zostały użyte do zamaskowania lokalizacji domowej każdego odwiedzającego w celu zachowania prywatności w przypadku, gdy jest to część jego podróży w zbiorze danych. W takich przypadkach szerokość i długość geograficzna są odpowiednimi współrzędnymi środka ciężkości kodu pocztowego.

Poniższy zrzut ekranu stanowi wizualną reprezentację takich działań. Obraz po lewej stronie przedstawia przystanki prowadzące do sklepów, a obraz po prawej daje wyobrażenie o układzie samego centrum handlowego.

Wykorzystaj dane dotyczące mobilności, aby uzyskać szczegółowe informacje, korzystając z możliwości geoprzestrzennych Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Powstały zbiór danych można wizualizować na wiele sposobów, które omówimy w kolejnych sekcjach.

Metryki gęstości

Potrafimy obliczyć i wizualizować intensywność działań i wizyt.

1 przykład – Poniższy zrzut ekranu przedstawia 15 najczęściej odwiedzanych sklepów w centrum handlowym.

Wykorzystaj dane dotyczące mobilności, aby uzyskać szczegółowe informacje, korzystając z możliwości geoprzestrzennych Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

2 przykład – Poniższy zrzut ekranu pokazuje liczbę wizyt w Apple Store w poszczególnych godzinach.

Wykorzystaj dane dotyczące mobilności, aby uzyskać szczegółowe informacje, korzystając z możliwości geoprzestrzennych Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Podróże i trajektorie

Jak wspomniano wcześniej, para następujących po sobie czynności reprezentuje podróż. Możemy zastosować następujące podejście do obliczenia podróży na podstawie danych dotyczących działań. W tym przypadku funkcje okna są używane z SQL w celu wygenerowania pliku trips tabeli, jak pokazano na zrzucie ekranu.

Wykorzystaj dane dotyczące mobilności, aby uzyskać szczegółowe informacje, korzystając z możliwości geoprzestrzennych Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Wykorzystaj dane dotyczące mobilności, aby uzyskać szczegółowe informacje, korzystając z możliwości geoprzestrzennych Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Po trips zostanie wygenerowana tabela, można określić wycieczki do POI.

Przykład 1 – Poniższy zrzut ekranu przedstawia 10 największych sklepów, które kierują ruch pieszy w stronę Apple Store.

Wykorzystaj dane dotyczące mobilności, aby uzyskać szczegółowe informacje, korzystając z możliwości geoprzestrzennych Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

2 przykład – Poniższy zrzut ekranu pokazuje wszystkie wycieczki do centrum handlowego Arrowhead.

Wykorzystaj dane dotyczące mobilności, aby uzyskać szczegółowe informacje, korzystając z możliwości geoprzestrzennych Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

3 przykład – Poniższy film pokazuje wzorce ruchu w centrum handlowym.

Wykorzystaj dane dotyczące mobilności, aby uzyskać szczegółowe informacje, korzystając z możliwości geoprzestrzennych Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

4 przykład – Poniższy film pokazuje wzorce ruchu poza centrum handlowym.

Wykorzystaj dane dotyczące mobilności, aby uzyskać szczegółowe informacje, korzystając z możliwości geoprzestrzennych Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Analiza obszaru zlewni

Możemy analizować wszystkie wizyty w punktach POI i określać obszar zasięgu.

Przykład 1 – Poniższy zrzut ekranu przedstawia wszystkie wizyty w sklepie Macy’s.

Wykorzystaj dane dotyczące mobilności, aby uzyskać szczegółowe informacje, korzystając z możliwości geoprzestrzennych Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

2 przykład – Poniższy zrzut ekranu przedstawia 10 głównych kodów pocztowych obszarów domowych (podświetlone granice), z których miały miejsce wizyty.

Wykorzystaj dane dotyczące mobilności, aby uzyskać szczegółowe informacje, korzystając z możliwości geoprzestrzennych Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Kontrola jakości danych

Możemy sprawdzać jakość codziennie przychodzących danych i wykrywać anomalie, korzystając z dashboardów QuickSight i analiz danych. Poniższy zrzut ekranu przedstawia przykładowy dashboard.

Wykorzystaj dane dotyczące mobilności, aby uzyskać szczegółowe informacje, korzystając z możliwości geoprzestrzennych Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Wnioski

Dane dotyczące mobilności i ich analiza w celu uzyskania wiedzy o klientach i uzyskania przewagi konkurencyjnej pozostają obszarem niszowym, ponieważ trudno jest uzyskać spójny i dokładny zbiór danych. Dane te mogą jednak pomóc organizacjom dodać kontekst do istniejących analiz, a nawet uzyskać nowe informacje na temat wzorców przemieszczania się klientów. Możliwości geoprzestrzenne i zadania przetwarzania geoprzestrzennego Amazon SageMaker mogą pomóc we wdrażaniu tych przypadków użycia i uzyskiwaniu spostrzeżeń w intuicyjny i przystępny sposób.

W tym poście pokazaliśmy, jak używać usług AWS do czyszczenia danych dotyczących mobilności, a następnie wykorzystywać możliwości geoprzestrzenne Amazon SageMaker do generowania pochodnych zbiorów danych, takich jak przystanki, działania i podróże, przy użyciu modeli ML. Następnie wykorzystaliśmy pochodne zbiory danych do wizualizacji wzorców ruchu i wygenerowania spostrzeżeń.

Możesz rozpocząć korzystanie z funkcji geoprzestrzennych Amazon SageMaker na dwa sposoby:

Aby dowiedzieć się więcej, odwiedź Możliwości geoprzestrzenne Amazon SageMaker i Pierwsze kroki z usługami geoprzestrzennymi Amazon SageMaker. Odwiedź również nasz GitHub repo, który zawiera kilka przykładowych notesów z możliwościami geoprzestrzennymi Amazon SageMaker.


O autorach

Wykorzystaj dane dotyczące mobilności, aby uzyskać szczegółowe informacje, korzystając z możliwości geoprzestrzennych Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.Jimy'ego Matthewsa jest architektem rozwiązań AWS ze specjalistyczną wiedzą w zakresie technologii AI/ML. Jimy ma siedzibę w Bostonie i współpracuje z klientami korporacyjnymi, którzy przekształcają swoje firmy poprzez przyjęcie chmury, i pomaga im budować wydajne i zrównoważone rozwiązania. Jego pasją jest rodzina, samochody i mieszane sztuki walki.

Wykorzystaj dane dotyczące mobilności, aby uzyskać szczegółowe informacje, korzystając z możliwości geoprzestrzennych Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.Girish Keshav jest architektem rozwiązań w AWS, pomagającym klientom w migracji do chmury w celu modernizacji oraz bezpiecznego i wydajnego uruchamiania obciążeń. Współpracuje z liderami zespołów technologicznych, udzielając im wskazówek w zakresie bezpieczeństwa aplikacji, uczenia maszynowego, optymalizacji kosztów i zrównoważonego rozwoju. Mieszka w San Francisco i uwielbia podróżować, wędrować, oglądać sport i zwiedzać browary rzemieślnicze.

Wykorzystaj dane dotyczące mobilności, aby uzyskać szczegółowe informacje, korzystając z możliwości geoprzestrzennych Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.Ramesh Jetty jest starszym liderem architektury rozwiązań, skupiającym się na pomaganiu klientom korporacyjnym AWS w zarabianiu na swoich zasobach danych. Doradza kadrze kierowniczej i inżynierom projektowanie i budowanie wysoce skalowalnych, niezawodnych i opłacalnych rozwiązań chmurowych, szczególnie skupiających się na uczeniu maszynowym, danych i analityce. W wolnym czasie lubi spędzać czas na świeżym powietrzu, jeżdżąc na rowerze i spacerując z rodziną.

Znak czasu:

Więcej z Uczenie maszynowe AWS