Identyfikacja punktów orientacyjnych za pomocą niestandardowych etykiet Amazon Rekognition

Opublikowane ponownie przez Plato

Obserwuje: 0

Amazon Rekognition to usługa wizji komputerowej, która ułatwia dodawanie analizy obrazu i wideo do aplikacji przy użyciu sprawdzonej, wysoce skalowalnej technologii głębokiego uczenia, która nie wymaga wiedzy o uczeniu maszynowym (ML). Dzięki Amazon Rekognition możesz identyfikować obiekty, osoby, tekst, sceny i działania na obrazach i filmach oraz wykrywać nieodpowiednie treści. Amazon Rekognition zapewnia również bardzo dokładną analizę twarzy i funkcje wyszukiwania twarzy, których można używać do wykrywania, analizowania i porównywania twarzy w wielu różnych przypadkach użycia.

Etykiety niestandardowe Amazon Rekognition to funkcja Amazon Rekognition, która ułatwia tworzenie własnych wyspecjalizowanych funkcji analizy obrazu opartych na ML w celu wykrywania unikalnych obiektów i scen integralnych z konkretnym przypadkiem użycia.

Niektóre typowe przypadki użycia niestandardowych etykiet Rekognition obejmują wyszukiwanie logo w postach w mediach społecznościowych, identyfikację produktów na półkach sklepowych, klasyfikację części maszyn na linii montażowej, rozróżnianie zdrowych i zainfekowanych roślin i nie tylko.

Etykiety rozpoznawania Amazon obsługuje popularne punkty orientacyjne, takie jak Most Brookliński, Koloseum, Wieża Eiffla, Machu Picchu, Taj Mahal, i więcej. Jeśli masz inne punkty orientacyjne lub budynki, które nie są jeszcze obsługiwane przez Amazon Rekognition, nadal możesz korzystać z niestandardowych etykiet Amazon Rekognition.

W tym poście demonstrujemy użycie niestandardowych etykiet Rekognition do wykrywania budynku Amazon Spheres w Seattle.

Dzięki Rekognition Custom Labels, AWS przejmuje za Ciebie ciężkie zadania. Rekognition Custom Labels opiera się na istniejących możliwościach Amazon Rekognition, które są już przeszkolone na dziesiątkach milionów obrazów z wielu kategorii. Zamiast tysięcy obrazów, wystarczy przesłać mały zestaw obrazów szkoleniowych (zwykle kilkaset obrazów lub mniej), które są specyficzne dla danego przypadku użycia za pośrednictwem naszej prostej konsoli. Amazon Rekognition może rozpocząć szkolenie za pomocą zaledwie kilku kliknięć. Po tym, jak Amazon Rekognition rozpocznie trenowanie z Twojego zestawu obrazów, może stworzyć dla Ciebie niestandardowy model analizy obrazu w ciągu kilku minut lub godzin. Za kulisami Rekognition Custom Labels automatycznie ładuje i sprawdza dane szkoleniowe, wybiera odpowiednie algorytmy ML, trenuje model i dostarcza metryki wydajności modelu. Następnie możesz użyć swojego niestandardowego modelu za pośrednictwem interfejsu API Rekognition Custom Labels i zintegrować go ze swoimi aplikacjami.

Omówienie rozwiązania

W naszym przykładzie używamy Kule Amazonki budynek w Seattle. Szkolimy model za pomocą Rekognition Custom Labels; za każdym razem, gdy używane są podobne obrazy, algorytm powinien zidentyfikować je jako Amazon Spheres zamiast Dome, Architecture, Glass buildinglub inne etykiety.

Najpierw pokażmy przykład wykorzystania funkcji wykrywania etykiet Amazon Rekognition, w której zasilamy obraz Amazon Spheres bez żadnego niestandardowego szkolenia. Korzystamy z konsoli Amazon Rekognition, aby otworzyć demonstrację wykrywania etykiet i przesłać nasze zdjęcie.

Po przesłaniu i przeanalizowaniu obrazu widzimy poniżej etykiety z wynikami zaufania Efekt. W tym przypadku, Dome został wykryty z wynikiem ufności 99.2%, Architecture z 99.2%, Building z 99.2%, Metropolis z 79.4% i tak dalej.

Chcemy użyć niestandardowego etykietowania, aby stworzyć komputerowy model wizyjny, który może oznaczyć obraz Amazon Spheres.

W poniższych sekcjach przeprowadzimy Cię przez proces przygotowywania zestawu danych, tworzenia projektu Rekognition Custom Labels, trenowania modelu, oceniania wyników i testowania go z dodatkowymi obrazami.

Wymagania wstępne

Zanim zaczniesz od kroków, są Kontyngenty do rozpoznawania niestandardowych etykiet, o których musisz wiedzieć. Jeśli chcesz zmienić limity, możesz poprosić o zwiększenie limitu usług.

Utwórz swój zbiór danych

Jeśli używasz etykiet niestandardowych Rekognition po raz pierwszy, zostaniesz poproszony o utworzenie Usługa Amazon Simple Storage (Amazon S3) wiadro do przechowywania zestawu danych.

W tej demonstracji na blogu wykorzystaliśmy zdjęcia sfer Amazonki, które zrobiliśmy podczas wizyty w Seattle w stanie Waszyngton. Możesz używać własnych obrazów zgodnie ze swoimi potrzebami.

Skopiuj swój zestaw danych do nowo utworzonego zasobnika, który przechowuje obrazy w odpowiednich prefiksach.

Identyfikacja punktów orientacyjnych za pomocą niestandardowych etykiet Amazon Rekognition PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Utwórz projekt

Aby utworzyć projekt etykiet niestandardowych Rekognition, wykonaj następujące kroki:

W konsoli Rekognition Custom Labels wybierz Utwórz projekt.
W razie zamówieenia projektu Nazwa Projektu, Wpisz imię.
Dodaj Utwórz projekt.

Teraz określamy konfigurację i ścieżkę zestawu danych treningowych i testowych.
Dodaj Utwórz zbiór danych.

Możesz rozpocząć od projektu, który ma pojedynczy zestaw danych, lub projektu, który ma oddzielne zestawy danych szkoleniowych i testowych. Jeśli zaczniesz od pojedynczego zestawu danych, Rekognition Custom Labels podzieli Twój zestaw danych podczas szkolenia, aby utworzyć zestaw danych szkoleniowych (80%) i testowy zestaw danych (20%) dla Twojego projektu.

Ponadto możesz tworzyć szkoleniowe i testowe zestawy danych dla projektu, importując obrazy z jednej z następujących lokalizacji:

W tym poście używamy własnego niestandardowego zestawu danych Amazon Spheres.

Wybierz Zacznij od pojedynczego zestawu danych.
Wybierz Importuj obrazy z zasobnika S3.
W razie zamówieenia projektu Identyfikator URI S3, wprowadź ścieżkę do zasobnika S3.
Jeśli chcesz, aby niestandardowe etykiety Rekognition automatycznie oznaczały obrazy za Ciebie na podstawie nazw folderów w wiaderku S3, wybierz Automatycznie przypisuj etykiety na poziomie obrazu do obrazów na podstawie nazwy folderu.
Dodaj Utwórz zbiór danych.

Zostanie otwarta strona przedstawiająca obrazy z ich etykietami. W przypadku zauważenia błędów na etykietach zapoznaj się z Debugowanie zestawów danych.

Identyfikacja punktów orientacyjnych za pomocą niestandardowych etykiet Amazon Rekognition PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Trenuj model

Po przejrzeniu zestawu danych możesz teraz trenować model.

Dodaj model pociągu.
W razie zamówieenia projektu Wybierz projekt, wprowadź ARN swojego projektu, jeśli nie ma go jeszcze na liście.
Dodaj Trenuj model.

W modele sekcji strony projektu, możesz sprawdzić aktualny status w Stan modelu kolumnie, w której odbywa się szkolenie. Czas szkolenia zwykle trwa od 30 minut do 24 godzin, w zależności od kilku czynników, takich jak liczba obrazów i liczba etykiet w zestawie szkoleniowym oraz typy algorytmów uczenia maszynowego używanych do uczenia modelu.

Po zakończeniu szkolenia modelu można zobaczyć stan modelu jako TRAINING_COMPLETED. Jeśli trening się nie powiedzie, patrz Debugowanie zakończonego niepowodzeniem szkolenia modelu.

Oceń model

Otwórz stronę szczegółów modelu. The Ocena pokazuje metryki dla każdej etykiety oraz średnią metrykę dla całego zestawu danych testowych.

Konsola Rekognition Custom Labels udostępnia następujące metryki jako podsumowanie wyników szkolenia i jako metryki dla każdej etykiety:

Możesz wyświetlić wyniki przeszkolonego modelu dla poszczególnych obrazów, jak pokazano na poniższym zrzucie ekranu.

Przetestuj model

Teraz, gdy obejrzeliśmy wyniki oceny, jesteśmy gotowi do uruchomienia modelu i analizy nowych obrazów.

Możesz uruchomić model na Użyj modelu w konsoli Rozpoznawanie etykiet niestandardowych lub za pomocą Rozpocznij wersję projektu działanie za pośrednictwem Interfejs wiersza poleceń AWS (AWS CLI) lub Python SDK.

Kiedy model jest uruchomiony, możemy analizować nowe obrazy za pomocą Wykryj niestandardowe etykiety API. Wynik z DetectCustomLabels to przewidywanie, że obraz zawiera określone obiekty, sceny lub koncepcje. Zobacz następujący kod:

aws rekognition detect-custom-labels 
--project-version-arn  
--image '{"S3Object": {"Bucket":,"Name":}}' 
--region

W danych wyjściowych możesz zobaczyć etykietę z jej wynikiem pewności:

{
    "Custom Labels": [
        {
            "Name": "Amazon Spheres",
            "Confidence": 93.55500030517578
        }
    ]
}

Jak widać z wyniku, za pomocą kilku prostych kliknięć możesz użyć Rekognition Custom Labels, aby uzyskać dokładne wyniki etykietowania. Możesz użyć tego do wielu przypadków użycia obrazu, takich jak identyfikacja niestandardowych etykiet produktów spożywczych, zwierząt domowych, części maszyn i innych.

Sprzątać

Aby wyczyścić zasoby utworzone w ramach tego wpisu i uniknąć potencjalnych powtarzających się kosztów, wykonaj następujące kroki:

Na Użyj modelu patka, zatrzymaj model.
Alternatywnie możesz zatrzymać model za pomocą Zatrzymaj wersję projektu działanie przez AWS CLI lub Python SDK. Poczekaj, aż model znajdzie się w Stopped przed przejściem do następnych kroków.
Usuń model.
Usuń projekt.
Usuń zbiór danych.
pusty zawartość wiadra S3 i usunąć wiadro.

Wnioski

W tym poście pokazaliśmy, jak używać niestandardowych etykiet Rekognition do wykrywania obrazów budynków.

Możesz rozpocząć pracę z niestandardowymi zestawami danych obrazu, a kilkoma prostymi kliknięciami w konsoli Rekognition Custom Labels możesz trenować swój model i wykrywać obiekty na obrazach. Rekognition Custom Labels może automatycznie ładować i sprawdzać dane, wybierać odpowiednie algorytmy ML, trenować model i dostarczać metryki wydajności modelu. Możesz przeglądać szczegółowe wskaźniki wydajności, takie jak precyzja, pamięć, wyniki F1 i wyniki pewności.

Nadszedł dzień, w którym możemy teraz identyfikować popularne budynki, takie jak Empire State Building w Nowym Jorku, Taj Mahal w Indiach i wiele innych na całym świecie, wstępnie oznakowanych i gotowych do użycia w celach wywiadowczych w Twoich aplikacjach. Ale jeśli masz inne punkty orientacyjne, które obecnie nie są obsługiwane przez Amazon Rekognition Labels, nie szukaj dalej i wypróbuj niestandardowe etykiety Amazon Rekognition.

Aby uzyskać więcej informacji na temat używania etykiet niestandardowych, zobacz Co to są niestandardowe etykiety Amazon Rekognition? Odwiedź również nasz GitHub repo dla kompleksowego przepływu pracy związanego z niestandardowym wykrywaniem marki Amazon Rekognition.

O autorach:

Suresh Patnam jest Principal BDM – Liderem GTM AI/ML w AWS. Współpracuje z klientami w celu budowania strategii IT, czyniąc cyfrową transformację za pośrednictwem chmury bardziej dostępną dzięki wykorzystaniu danych i AI/ML. W wolnym czasie Suresh lubi grać w tenisa i spędzać czas z rodziną.

Króliczek Kaushik jest architektem rozwiązań w AWS. Pasjonuje się budowaniem rozwiązań AI/ML na platformie AWS i pomaganiem klientom we wprowadzaniu innowacji na platformie AWS. Poza pracą lubi wędrować, wspinać się i pływać.

Znak czasu: Listopad 22, 2022Listopad 22, 2022

Znak czasu: Luty 2, 2022

Identyfikowanie punktów orientacyjnych za pomocą niestandardowych etykiet Amazon Rekognition

Opublikowane ponownie przez Plato

Omówienie rozwiązania

Wymagania wstępne

Utwórz swój zbiór danych

Utwórz projekt

Trenuj model

Oceń model

Przetestuj model

Sprzątać

Wnioski

O autorach:

Więcej z Uczenie maszynowe AWS

Łatwe i dokładne prognozowanie dzięki AutoGluon-TimeSeries

Zidentyfikuj kluczowe informacje z dokumentów tekstowych poprzez dostrajanie i HPO za pomocą Amazon SageMaker JumpStart

Utwórz aplikację do podsumowania dokumentów HCLS za pomocą Falcona, korzystając z Amazon SageMaker JumpStart | Usługi internetowe Amazona

O nas

Wyszukiwanie pionowe i AI

Platforma

Pozostań w kontakcie

Konto