W niedawnej przeszłości wykorzystywanie uczenia maszynowego (ML) do prognozowania, szczególnie w przypadku danych w postaci tekstu i obrazów, wymagało rozległej wiedzy na temat uczenia maszynowego (ML) do tworzenia i dostrajania modeli głębokiego uczenia się. Dzisiaj ML stało się bardziej dostępne dla każdego użytkownika, który chce wykorzystywać modele ML do generowania wartości biznesowej. Z Płótno Amazon SageMakermożesz tworzyć prognozy dla wielu różnych typów danych, wykraczających poza dane tabelaryczne lub szeregi czasowe, bez konieczności pisania ani jednego wiersza kodu. Możliwości te obejmują wstępnie wytrenowane modele typów danych obrazu, tekstu i dokumentu.
W tym poście omawiamy, w jaki sposób można używać wstępnie wytrenowanych modeli do pobierania prognoz dla obsługiwanych typów danych poza danymi tabelarycznymi.
Dane tekstowe
SageMaker Canvas zapewnia wizualne środowisko niewymagające kodu do tworzenia, trenowania i wdrażania modeli uczenia maszynowego. W przypadku zadań związanych z przetwarzaniem języka naturalnego (NLP) SageMaker Canvas integruje się bezproblemowo z Amazon Comprehend aby umożliwić korzystanie z kluczowych funkcji NLP, takich jak wykrywanie języka, rozpoznawanie jednostek, analiza nastrojów, modelowanie tematów i inne. Integracja eliminuje potrzebę kodowania lub inżynierii danych w celu wykorzystania solidnych modeli NLP Amazon Comrehend. Wystarczy podać dane tekstowe i wybrać jedną z czterech powszechnie używanych funkcji: analizę nastrojów, wykrywanie języka, wyodrębnianie jednostek i wykrywanie danych osobowych. W każdym scenariuszu można użyć interfejsu użytkownika do testowania i przewidywania wsadowego w celu wybrania przechowywanych danych Usługa Amazon Simple Storage (Amazonka S3).
Analiza sentymentów
Dzięki analizie nastrojów SageMaker Canvas umożliwia analizę nastrojów wprowadzonego tekstu. Może określić, czy ogólny sentyment jest pozytywny, negatywny, mieszany czy neutralny, jak pokazano na poniższym zrzucie ekranu. Jest to przydatne w sytuacjach takich jak analizowanie recenzji produktów. Na przykład tekst „Kocham ten produkt, jest niesamowity!” zostałby sklasyfikowany przez SageMaker Canvas jako wywołujący pozytywne odczucia, podczas gdy „Ten produkt jest okropny, żałuję, że go kupiłem” zostałby oznaczony jako negatywny.
Ekstrakcja bytów
SageMaker Canvas może analizować tekst i automatycznie wykrywać wspomniane w nim elementy. Kiedy dokument jest wysyłany do analizy do SageMaker Canvas, identyfikuje on w tekście osoby, organizacje, lokalizacje, daty, ilości i inne elementy. Ta funkcja wyodrębniania encji pozwala szybko uzyskać wgląd w kluczowe osoby, miejsca i szczegóły omówione w dokumentach. Aby zapoznać się z listą obsługiwanych podmiotów, zobacz podmioty.
Wykrywanie języka
SageMaker Canvas może również określić dominujący język tekstu za pomocą Amazon Comrehend. Analizuje tekst w celu zidentyfikowania języka głównego i podaje wskaźniki pewności dla wykrytego języka dominującego, ale nie wskazuje podziału procentowego w przypadku dokumentów wielojęzycznych. Aby uzyskać najlepsze wyniki w przypadku długich dokumentów w wielu językach, podziel tekst na mniejsze części i zagreguj wyniki, aby oszacować procentową zawartość języków. Działa najlepiej, jeśli tekst ma co najmniej 20 znaków.
Wykrywanie danych osobowych
Możesz także chronić wrażliwe dane, korzystając z funkcji wykrywania danych osobowych za pomocą SageMaker Canvas. Może analizować dokumenty tekstowe w celu automatycznego wykrywania podmiotów zawierających informacje osobowe (PII), co pozwala zlokalizować wrażliwe dane, takie jak imiona i nazwiska, adresy, daty urodzenia, numery telefonów, adresy e-mail i inne. Analizuje dokumenty o rozmiarze do 100 KB i zapewnia ocenę zaufania dla każdej wykrytej jednostki, dzięki czemu możesz przeglądać i selektywnie redagować najbardziej wrażliwe informacje. Aby zapoznać się z listą wykrytych podmiotów, zobacz Wykrywanie podmiotów umożliwiających identyfikację osób.
Dane obrazu
SageMaker Canvas zapewnia wizualny interfejs niewymagający kodu, który ułatwia korzystanie z funkcji widzenia komputerowego poprzez integrację z Amazon Rekognition do analizy obrazu. Na przykład możesz przesłać zestaw danych obrazów, użyć Amazon Rekognition do wykrywania obiektów i scen oraz przeprowadzić wykrywanie tekstu, aby uwzględnić szeroki zakres przypadków użycia. Interfejs wizualny i integracja z Amazon Rekognition umożliwiają osobom niebędącym programistami wykorzystanie zaawansowanych technik widzenia komputerowego.
Wykrywanie obiektów na obrazach
SageMaker Canvas wykorzystuje technologię Amazon Rekognition do wykrywania etykiet (obiektów) na obrazie. Możesz przesłać obraz z interfejsu użytkownika SageMaker Canvas lub użyć pliku Przewidywanie partii aby wybrać obrazy przechowywane w wiadrze S3. Jak pokazano w poniższym przykładzie, może wyodrębnić obiekty z obrazu, takie jak wieża zegarowa, autobus, budynki i inne. Za pomocą interfejsu możesz przeszukiwać wyniki prognoz i je sortować.
Wykrywanie tekstu w obrazach
Wyodrębnianie tekstu z obrazów jest bardzo częstym przypadkiem użycia. Teraz możesz z łatwością wykonać to zadanie na SageMaker Canvas, bez kodu. Tekst jest wyodrębniany jako elementy zamówienia, jak pokazano na poniższym zrzucie ekranu. Krótkie frazy na obrazie są klasyfikowane razem i identyfikowane jako fraza.
Możesz wykonać prognozy wsadowe, przesyłając zestaw obrazów, wyodrębniając wszystkie obrazy w jednym zadaniu wsadowym i pobierając wyniki w postaci pliku CSV. To rozwiązanie jest przydatne, gdy chcesz wyodrębnić i wykryć tekst na obrazach.
Dane dokumentu
SageMaker Canvas oferuje szereg gotowych do użycia rozwiązań, które rozwiązują Twoje codzienne potrzeby w zakresie zrozumienia dokumentów. Rozwiązania te napędzane są przez Ekstrakt z amazonki. Aby wyświetlić wszystkie dostępne opcje dokumentów, wybierz Gotowe do użycia modele w panelu nawigacji i filtruj według dokumenty, jak pokazano na poniższym zrzucie ekranu.
Analiza dokumentów
Analiza dokumentów analizuje dokumenty i formularze pod kątem relacji między wykrytym tekstem. Operacje zwracają cztery kategorie wyodrębniania dokumentów: nieprzetworzony tekst, formularze, tabele i podpisy. Zdolność rozwiązania do zrozumienia struktury dokumentu zapewnia dodatkową elastyczność w zakresie rodzaju danych, które chcesz wyodrębnić z dokumentów. Poniższy zrzut ekranu jest przykładem tego, jak wygląda wykrywanie tabeli.
To rozwiązanie jest w stanie zrozumieć układy złożonych dokumentów, co jest pomocne, gdy trzeba wydobyć określone informacje z dokumentów.
Analiza dokumentów tożsamości
Rozwiązanie to przeznaczone jest do analizy dokumentów takich jak dowód osobisty, prawo jazdy czy inne podobne dokumenty identyfikacyjne. Informacje takie jak drugie imię, hrabstwo i miejsce urodzenia, wraz z indywidualnym poziomem pewności co do dokładności, zostaną zwrócone dla każdego dokumentu tożsamości, jak pokazano na poniższym zrzucie ekranu.
Istnieje opcja przewidywania zbiorczego, dzięki której można masowo przesyłać zestawy dokumentów identyfikacyjnych i przetwarzać je jako zadanie wsadowe. Zapewnia to szybki i bezproblemowy sposób przekształcania szczegółów dokumentu identyfikacyjnego w pary klucz-wartość, które można wykorzystać w dalszych procesach, takich jak analiza danych.
Analiza wydatków
Analiza wydatków ma na celu analizę dokumentów wydatków, takich jak faktury i paragony. Poniższy zrzut ekranu jest przykładem wyglądu wyodrębnionych informacji.
Wyniki są zwracane jako pola podsumowania i pola elementów zamówienia. Pola podsumowania to pary klucz-wartość wyodrębnione z dokumentu i zawierają klucze, takie jak Suma, Due Date, Podatek. Pola pozycji pojedynczych odnoszą się do danych ułożonych w dokumencie w formie tabeli. Jest to przydatne do wyodrębniania informacji z dokumentu przy zachowaniu jego układu.
Zapytania o dokumenty
Zapytania o dokumenty służą do zadawania pytań na temat dokumentów. Jest to świetne rozwiązanie, jeśli masz wielostronicowe dokumenty i chcesz wydobyć z nich bardzo szczegółowe odpowiedzi. Poniżej znajduje się przykład typów pytań, jakie możesz zadać, oraz tego, jak wyglądają wyodrębnione odpowiedzi.
Rozwiązanie zapewnia prosty interfejs umożliwiający interakcję z dokumentami. Jest to przydatne, gdy chcesz uzyskać określone szczegóły w dużych dokumentach.
Wnioski
SageMaker Canvas zapewnia środowisko bez kodu, umożliwiające łatwe korzystanie z technologii ML w przypadku różnych typów danych, takich jak tekst, obrazy i dokumenty. Interfejs wizualny i integracja z usługami AWS, takimi jak Amazon Comprehend, Amazon Rekognition i Amazon Textract, eliminują potrzebę kodowania i inżynierii danych. Możesz analizować tekst pod kątem tonacji, encji, języków i informacji umożliwiających identyfikację. W przypadku obrazów wykrywanie obiektów i tekstu umożliwia zastosowanie wizji komputerowej. Wreszcie, analiza dokumentu może wyodrębnić tekst, zachowując jego układ na potrzeby dalszych procesów. Gotowe do użycia rozwiązania w SageMaker Canvas umożliwiają wykorzystanie zaawansowanych technik uczenia maszynowego do generowania wniosków zarówno z danych ustrukturyzowanych, jak i nieustrukturyzowanych. Jeśli interesuje Cię używanie narzędzi niewymagających kodu i gotowych do użycia modeli ML, wypróbuj SageMaker Canvas już dziś. Aby uzyskać więcej informacji, zobacz Rozpoczęcie korzystania z Amazon SageMaker Canvas.
O autorach
Julia Ang jest architektem rozwiązań z siedzibą w Singapurze. Współpracowała z klientami z różnych dziedzin, od sektora zdrowia i publicznego po firmy z branży cyfrowej, aby wdrażać rozwiązania zgodnie z ich potrzebami biznesowymi. Wspiera także klientów w Azji Południowo-Wschodniej i poza nią w korzystaniu ze sztucznej inteligencji i uczenia maszynowego w swoich firmach. Poza pracą lubi poznawać świat poprzez podróże i zajęcia twórcze.
Loke Jun Kai jest architektem rozwiązań specjalistycznych dla AI/ML z siedzibą w Singapurze. Współpracuje z klientami z całego ASEAN, aby opracować rozwiązania do uczenia maszynowego na dużą skalę w AWS. Jun Kai jest zwolennikiem narzędzi do uczenia maszynowego typu Low-Code No-Code. W wolnym czasie lubi przebywać na łonie natury.
- Dystrybucja treści i PR oparta na SEO. Uzyskaj wzmocnienie już dziś.
- PlatoData.Network Pionowe generatywne AI. Wzmocnij się. Dostęp tutaj.
- PlatoAiStream. Inteligencja Web3. Wiedza wzmocniona. Dostęp tutaj.
- PlatonESG. Węgiel Czysta technologia, Energia, Środowisko, Słoneczny, Gospodarowanie odpadami. Dostęp tutaj.
- Platon Zdrowie. Inteligencja w zakresie biotechnologii i badań klinicznych. Dostęp tutaj.
- Źródło: https://aws.amazon.com/blogs/machine-learning/use-machine-learning-without-writing-a-single-line-of-code-with-amazon-sagemaker-canvas/
- :ma
- :Jest
- $W GÓRĘ
- 100
- 20
- 360
- 385
- 400
- 7
- a
- Zdolny
- O nas
- dostępny
- Stosownie
- precyzja
- w poprzek
- adres
- Adresy
- przyjąć
- zaawansowany
- rzecznik
- agregat
- AI
- AI / ML
- Wszystkie kategorie
- dopuszczać
- Pozwalać
- pozwala
- również
- Amazonka
- Amazon Comprehend
- Amazon Rekognition
- Amazon Sage Maker
- Płótno Amazon SageMaker
- Ekstrakt z amazonki
- Amazon Web Services
- wśród
- an
- analiza
- w czasie rzeczywistym sprawiają,
- ćwiczenie
- Analizując
- i
- odpowiedzi
- każdy
- SĄ
- AS
- ASEAN
- Azja
- zapytać
- At
- automatycznie
- dostępny
- AWS
- na podstawie
- BE
- stają się
- być
- jest
- BEST
- Poza
- narodziny
- obie
- Budowanie
- nieruchomości
- autobus
- biznes
- biznes
- ale
- Zakup
- by
- CAN
- brezentowy
- możliwości
- zdolność
- Kartki okolicznosciowe
- walizka
- Etui
- kategorie
- znaków
- Dodaj
- sklasyfikowany
- zegar
- kod
- Kodowanie
- wspólny
- powszechnie
- kompleks
- zrozumieć
- komputer
- Wizja komputerowa
- pewność siebie
- zawierać
- hrabstwo
- Stwórz
- Tworzenie
- Twórczy
- klient
- Klientów
- dane
- analiza danych
- Daty
- dzień do dnia
- głęboko
- głęboka nauka
- wdrażanie
- zaprojektowany
- detale
- wykryć
- wykryte
- Wykrywanie
- Ustalać
- różne
- cyfrowy
- dyskutować
- omówione
- do
- dokument
- dokumenty
- Nie
- dominujący
- pobieranie
- każdy
- łatwość
- eliminuje
- Umożliwia
- ujmujący
- Inżynieria
- podmioty
- jednostka
- Środowisko
- szczególnie
- oszacowanie
- przykład
- rozległy
- dodatkowy
- wyciąg
- ekstrakcja
- Łąka
- filet
- filtrować
- W końcu
- Elastyczność
- następujący
- W razie zamówieenia projektu
- Nasz formularz
- formularze
- cztery
- od
- Wzrost
- Generować
- otrzymać
- daje
- wspaniały
- uprząż
- Have
- mający
- he
- Zdrowie
- pomocny
- jego
- W jaki sposób
- HTML
- HTTPS
- i
- Identyfikacja
- zidentyfikowane
- zidentyfikować
- tożsamość
- if
- obraz
- zdjęcia
- in
- zawierać
- wskazać
- indywidualny
- Informacja
- wkład
- spostrzeżenia
- Integruje się
- Integracja
- integracja
- interakcji
- zainteresowany
- Interfejs
- najnowszych
- faktury
- IT
- szt
- JEGO
- Praca
- właśnie
- Klawisz
- Klawisze
- wiedza
- Etykiety
- język
- Języki
- duży
- układ
- nauka
- najmniej
- licencje
- lubić
- Linia
- Lista
- lokalizacji
- długo
- Popatrz
- wygląda jak
- WYGLĄD
- miłość
- maszyna
- uczenie maszynowe
- Główny
- robić
- WYKONUJE
- wzmiankowany
- Środkowy
- mieszany
- ML
- modelowanie
- modele
- jeszcze
- większość
- wielokrotność
- Nazwa
- Nazwy
- rodzimy
- Naturalny
- Przetwarzanie języka naturalnego
- Natura
- Nawigacja
- Potrzebować
- wymagania
- ujemny
- Neutralny
- nlp
- Nie
- już dziś
- numer
- z naszej
- przedmiot
- Wykrywanie obiektów
- obiekty
- of
- Oferty
- on
- operacje
- Option
- Opcje
- or
- organizacji
- Inne
- na zewnątrz
- zewnętrzne
- ogólny
- par
- chleb
- Przeszłość
- Ludzie
- procent
- wykonać
- osobisty
- Osobiście
- telefon
- Zwroty
- sztuk
- Miejsce
- Miejsca
- plato
- Analiza danych Platona
- PlatoDane
- pozytywny
- możliwy
- Post
- powered
- przepowiednia
- Przewidywania
- konserwowanie
- wygląda tak
- procesów
- przetwarzanie
- Produkt
- Recenzje produktu
- chronić
- zapewniać
- zapewnia
- publiczny
- zapytania
- pytania
- Szybki
- szybko
- zasięg
- Surowy
- wpływy
- niedawny
- uznanie
- odnosić się
- żal
- Relacje
- wymagany
- Efekt
- wspornikowy
- powrót
- przeglądu
- Recenzje
- krzepki
- sagemaker
- Skala
- scenariusz
- Sceny
- wynik
- bezszwowy
- płynnie
- Szukaj
- sektor
- wrażliwy
- wysłany
- sentyment
- Serie
- Usługi
- zestaw
- Zestawy
- ona
- Short
- pokazane
- Podpisy
- podobny
- Prosty
- po prostu
- Singapur
- pojedynczy
- sytuacje
- mniejszy
- So
- rozwiązanie
- Rozwiązania
- ROZWIĄZANIA
- na południowy wschód
- Azja Południowo-Wschodnia
- specjalista
- specyficzny
- dzielić
- rozpoczęty
- przechowywanie
- przechowywany
- bezpośredni
- Struktura
- zbudowany
- taki
- PODSUMOWANIE
- Utrzymany
- Wspierający
- stół
- Zadanie
- zadania
- Techniki
- test
- XNUMX
- że
- Połączenia
- świat
- ich
- Im
- Te
- to
- Przez
- czas
- Szereg czasowy
- do
- już dziś
- razem
- narzędzia
- aktualny
- Wieża
- Trening
- Przekształcać
- Podróżowanie
- próbować
- strojenie
- rodzaj
- typy
- ui
- zrozumieć
- zrozumienie
- Uploading
- posługiwać się
- przypadek użycia
- używany
- Użytkownik
- zastosowania
- za pomocą
- wartość
- różnorodność
- różnorodny
- początku.
- Zobacz i wysłuchaj
- wizja
- chcieć
- chce
- Droga..
- we
- sieć
- usługi internetowe
- Co
- jeśli chodzi o komunikację i motywację
- natomiast
- który
- Podczas
- KIM
- szeroki
- Szeroki zasięg
- będzie
- w
- w ciągu
- bez
- Praca
- pracował
- działa
- świat
- by
- pisanie
- You
- Twój
- zefirnet