Korzystaj z uczenia maszynowego bez pisania ani jednej linii kodu dzięki Amazon SageMaker Canvas | Usługi internetowe Amazona

Korzystaj z uczenia maszynowego bez pisania ani jednej linii kodu dzięki Amazon SageMaker Canvas | Usługi internetowe Amazona

W niedawnej przeszłości wykorzystywanie uczenia maszynowego (ML) do prognozowania, szczególnie w przypadku danych w postaci tekstu i obrazów, wymagało rozległej wiedzy na temat uczenia maszynowego (ML) do tworzenia i dostrajania modeli głębokiego uczenia się. Dzisiaj ML stało się bardziej dostępne dla każdego użytkownika, który chce wykorzystywać modele ML do generowania wartości biznesowej. Z Płótno Amazon SageMakermożesz tworzyć prognozy dla wielu różnych typów danych, wykraczających poza dane tabelaryczne lub szeregi czasowe, bez konieczności pisania ani jednego wiersza kodu. Możliwości te obejmują wstępnie wytrenowane modele typów danych obrazu, tekstu i dokumentu.

W tym poście omawiamy, w jaki sposób można używać wstępnie wytrenowanych modeli do pobierania prognoz dla obsługiwanych typów danych poza danymi tabelarycznymi.

Dane tekstowe

SageMaker Canvas zapewnia wizualne środowisko niewymagające kodu do tworzenia, trenowania i wdrażania modeli uczenia maszynowego. W przypadku zadań związanych z przetwarzaniem języka naturalnego (NLP) SageMaker Canvas integruje się bezproblemowo z Amazon Comprehend aby umożliwić korzystanie z kluczowych funkcji NLP, takich jak wykrywanie języka, rozpoznawanie jednostek, analiza nastrojów, modelowanie tematów i inne. Integracja eliminuje potrzebę kodowania lub inżynierii danych w celu wykorzystania solidnych modeli NLP Amazon Comrehend. Wystarczy podać dane tekstowe i wybrać jedną z czterech powszechnie używanych funkcji: analizę nastrojów, wykrywanie języka, wyodrębnianie jednostek i wykrywanie danych osobowych. W każdym scenariuszu można użyć interfejsu użytkownika do testowania i przewidywania wsadowego w celu wybrania przechowywanych danych Usługa Amazon Simple Storage (Amazonka S3).

Analizowanie danych tekstowych w SageMaker Canvas

Analiza sentymentów

Dzięki analizie nastrojów SageMaker Canvas umożliwia analizę nastrojów wprowadzonego tekstu. Może określić, czy ogólny sentyment jest pozytywny, negatywny, mieszany czy neutralny, jak pokazano na poniższym zrzucie ekranu. Jest to przydatne w sytuacjach takich jak analizowanie recenzji produktów. Na przykład tekst „Kocham ten produkt, jest niesamowity!” zostałby sklasyfikowany przez SageMaker Canvas jako wywołujący pozytywne odczucia, podczas gdy „Ten produkt jest okropny, żałuję, że go kupiłem” zostałby oznaczony jako negatywny.

Analiza sentymentów na płótnie SageMaker

Ekstrakcja bytów

SageMaker Canvas może analizować tekst i automatycznie wykrywać wspomniane w nim elementy. Kiedy dokument jest wysyłany do analizy do SageMaker Canvas, identyfikuje on w tekście osoby, organizacje, lokalizacje, daty, ilości i inne elementy. Ta funkcja wyodrębniania encji pozwala szybko uzyskać wgląd w kluczowe osoby, miejsca i szczegóły omówione w dokumentach. Aby zapoznać się z listą obsługiwanych podmiotów, zobacz podmioty.

Ekstrakcja podmiotów na płótnie SageMaker

Wykrywanie języka

SageMaker Canvas może również określić dominujący język tekstu za pomocą Amazon Comrehend. Analizuje tekst w celu zidentyfikowania języka głównego i podaje wskaźniki pewności dla wykrytego języka dominującego, ale nie wskazuje podziału procentowego w przypadku dokumentów wielojęzycznych. Aby uzyskać najlepsze wyniki w przypadku długich dokumentów w wielu językach, podziel tekst na mniejsze części i zagreguj wyniki, aby oszacować procentową zawartość języków. Działa najlepiej, jeśli tekst ma co najmniej 20 znaków.

Wykrywanie języka na płótnie SageMaker

Wykrywanie danych osobowych

Możesz także chronić wrażliwe dane, korzystając z funkcji wykrywania danych osobowych za pomocą SageMaker Canvas. Może analizować dokumenty tekstowe w celu automatycznego wykrywania podmiotów zawierających informacje osobowe (PII), co pozwala zlokalizować wrażliwe dane, takie jak imiona i nazwiska, adresy, daty urodzenia, numery telefonów, adresy e-mail i inne. Analizuje dokumenty o rozmiarze do 100 KB i zapewnia ocenę zaufania dla każdej wykrytej jednostki, dzięki czemu możesz przeglądać i selektywnie redagować najbardziej wrażliwe informacje. Aby zapoznać się z listą wykrytych podmiotów, zobacz Wykrywanie podmiotów umożliwiających identyfikację osób.

Wykrywanie danych osobowych na płótnie SageMaker

Dane obrazu

SageMaker Canvas zapewnia wizualny interfejs niewymagający kodu, który ułatwia korzystanie z funkcji widzenia komputerowego poprzez integrację z Amazon Rekognition do analizy obrazu. Na przykład możesz przesłać zestaw danych obrazów, użyć Amazon Rekognition do wykrywania obiektów i scen oraz przeprowadzić wykrywanie tekstu, aby uwzględnić szeroki zakres przypadków użycia. Interfejs wizualny i integracja z Amazon Rekognition umożliwiają osobom niebędącym programistami wykorzystanie zaawansowanych technik widzenia komputerowego.

Analizowanie danych obrazu w SageMaker Canvas

Wykrywanie obiektów na obrazach

SageMaker Canvas wykorzystuje technologię Amazon Rekognition do wykrywania etykiet (obiektów) na obrazie. Możesz przesłać obraz z interfejsu użytkownika SageMaker Canvas lub użyć pliku Przewidywanie partii aby wybrać obrazy przechowywane w wiadrze S3. Jak pokazano w poniższym przykładzie, może wyodrębnić obiekty z obrazu, takie jak wieża zegarowa, autobus, budynki i inne. Za pomocą interfejsu możesz przeszukiwać wyniki prognoz i je sortować.

Wykrywanie obiektów w obrazach na płótnie SageMaker

Wykrywanie tekstu w obrazach

Wyodrębnianie tekstu z obrazów jest bardzo częstym przypadkiem użycia. Teraz możesz z łatwością wykonać to zadanie na SageMaker Canvas, bez kodu. Tekst jest wyodrębniany jako elementy zamówienia, jak pokazano na poniższym zrzucie ekranu. Krótkie frazy na obrazie są klasyfikowane razem i identyfikowane jako fraza.

Wykrywanie tekstu w obrazach na płótnie SageMaker

Możesz wykonać prognozy wsadowe, przesyłając zestaw obrazów, wyodrębniając wszystkie obrazy w jednym zadaniu wsadowym i pobierając wyniki w postaci pliku CSV. To rozwiązanie jest przydatne, gdy chcesz wyodrębnić i wykryć tekst na obrazach.

Dane dokumentu

SageMaker Canvas oferuje szereg gotowych do użycia rozwiązań, które rozwiązują Twoje codzienne potrzeby w zakresie zrozumienia dokumentów. Rozwiązania te napędzane są przez Ekstrakt z amazonki. Aby wyświetlić wszystkie dostępne opcje dokumentów, wybierz Gotowe do użycia modele w panelu nawigacji i filtruj według dokumenty, jak pokazano na poniższym zrzucie ekranu.

Analizowanie danych dokumentu w SageMaker Canvas

Analiza dokumentów

Analiza dokumentów analizuje dokumenty i formularze pod kątem relacji między wykrytym tekstem. Operacje zwracają cztery kategorie wyodrębniania dokumentów: nieprzetworzony tekst, formularze, tabele i podpisy. Zdolność rozwiązania do zrozumienia struktury dokumentu zapewnia dodatkową elastyczność w zakresie rodzaju danych, które chcesz wyodrębnić z dokumentów. Poniższy zrzut ekranu jest przykładem tego, jak wygląda wykrywanie tabeli.

Analiza dokumentów na płótnie SageMaker

To rozwiązanie jest w stanie zrozumieć układy złożonych dokumentów, co jest pomocne, gdy trzeba wydobyć określone informacje z dokumentów.

Analiza dokumentów tożsamości

Rozwiązanie to przeznaczone jest do analizy dokumentów takich jak dowód osobisty, prawo jazdy czy inne podobne dokumenty identyfikacyjne. Informacje takie jak drugie imię, hrabstwo i miejsce urodzenia, wraz z indywidualnym poziomem pewności co do dokładności, zostaną zwrócone dla każdego dokumentu tożsamości, jak pokazano na poniższym zrzucie ekranu.

Analiza dokumentów tożsamości na platformie SageMaker Canvas

Istnieje opcja przewidywania zbiorczego, dzięki której można masowo przesyłać zestawy dokumentów identyfikacyjnych i przetwarzać je jako zadanie wsadowe. Zapewnia to szybki i bezproblemowy sposób przekształcania szczegółów dokumentu identyfikacyjnego w pary klucz-wartość, które można wykorzystać w dalszych procesach, takich jak analiza danych.

Analiza wydatków

Analiza wydatków ma na celu analizę dokumentów wydatków, takich jak faktury i paragony. Poniższy zrzut ekranu jest przykładem wyglądu wyodrębnionych informacji.

Analiza wydatków na płótnie SageMaker

Wyniki są zwracane jako pola podsumowania i pola elementów zamówienia. Pola podsumowania to pary klucz-wartość wyodrębnione z dokumentu i zawierają klucze, takie jak Suma, Due Date, Podatek. Pola pozycji pojedynczych odnoszą się do danych ułożonych w dokumencie w formie tabeli. Jest to przydatne do wyodrębniania informacji z dokumentu przy zachowaniu jego układu.

Zapytania o dokumenty

Zapytania o dokumenty służą do zadawania pytań na temat dokumentów. Jest to świetne rozwiązanie, jeśli masz wielostronicowe dokumenty i chcesz wydobyć z nich bardzo szczegółowe odpowiedzi. Poniżej znajduje się przykład typów pytań, jakie możesz zadać, oraz tego, jak wyglądają wyodrębnione odpowiedzi.

Zapytania o dokumenty w SageMaker Canvas

Rozwiązanie zapewnia prosty interfejs umożliwiający interakcję z dokumentami. Jest to przydatne, gdy chcesz uzyskać określone szczegóły w dużych dokumentach.

Wnioski

SageMaker Canvas zapewnia środowisko bez kodu, umożliwiające łatwe korzystanie z technologii ML w przypadku różnych typów danych, takich jak tekst, obrazy i dokumenty. Interfejs wizualny i integracja z usługami AWS, takimi jak Amazon Comprehend, Amazon Rekognition i Amazon Textract, eliminują potrzebę kodowania i inżynierii danych. Możesz analizować tekst pod kątem tonacji, encji, języków i informacji umożliwiających identyfikację. W przypadku obrazów wykrywanie obiektów i tekstu umożliwia zastosowanie wizji komputerowej. Wreszcie, analiza dokumentu może wyodrębnić tekst, zachowując jego układ na potrzeby dalszych procesów. Gotowe do użycia rozwiązania w SageMaker Canvas umożliwiają wykorzystanie zaawansowanych technik uczenia maszynowego do generowania wniosków zarówno z danych ustrukturyzowanych, jak i nieustrukturyzowanych. Jeśli interesuje Cię używanie narzędzi niewymagających kodu i gotowych do użycia modeli ML, wypróbuj SageMaker Canvas już dziś. Aby uzyskać więcej informacji, zobacz Rozpoczęcie korzystania z Amazon SageMaker Canvas.


O autorach

Korzystaj z uczenia maszynowego bez pisania ani jednej linii kodu dzięki Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.Julia Ang jest architektem rozwiązań z siedzibą w Singapurze. Współpracowała z klientami z różnych dziedzin, od sektora zdrowia i publicznego po firmy z branży cyfrowej, aby wdrażać rozwiązania zgodnie z ich potrzebami biznesowymi. Wspiera także klientów w Azji Południowo-Wschodniej i poza nią w korzystaniu ze sztucznej inteligencji i uczenia maszynowego w swoich firmach. Poza pracą lubi poznawać świat poprzez podróże i zajęcia twórcze.

Korzystaj z uczenia maszynowego bez pisania ani jednej linii kodu dzięki Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.Loke Jun Kai jest architektem rozwiązań specjalistycznych dla AI/ML z siedzibą w Singapurze. Współpracuje z klientami z całego ASEAN, aby opracować rozwiązania do uczenia maszynowego na dużą skalę w AWS. Jun Kai jest zwolennikiem narzędzi do uczenia maszynowego typu Low-Code No-Code. W wolnym czasie lubi przebywać na łonie natury.

Znak czasu:

Więcej z Uczenie maszynowe AWS