Utilizați învățarea automată fără a scrie o singură linie de cod cu Amazon SageMaker Canvas | Amazon Web Services

Utilizați învățarea automată fără a scrie o singură linie de cod cu Amazon SageMaker Canvas | Amazon Web Services

În trecutul recent, utilizarea machine learning (ML) pentru a face predicții, în special pentru date sub formă de text și imagini, a necesitat cunoștințe extinse de ML pentru crearea și reglarea modelelor de deep learning. Astăzi, ML a devenit mai accesibil oricărui utilizator care dorește să folosească modele ML pentru a genera valoare de afaceri. Cu Amazon SageMaker Canvas, puteți crea predicții pentru un număr de tipuri de date diferite, dincolo de datele tabelare sau de serie de timp, fără a scrie o singură linie de cod. Aceste capabilități includ modele pre-antrenate pentru tipuri de date de imagine, text și documente.

În această postare, discutăm despre cum puteți utiliza modele pre-antrenate pentru a prelua predicții pentru tipurile de date acceptate dincolo de datele tabelare.

Date text

SageMaker Canvas oferă un mediu vizual, fără cod pentru construirea, instruirea și implementarea modelelor ML. Pentru sarcinile de procesare a limbajului natural (NLP), SageMaker Canvas se integrează perfect cu Amazon Comprehend pentru a vă permite să efectuați capabilități cheie NLP, cum ar fi detectarea limbii, recunoașterea entităților, analiza sentimentelor, modelarea subiectelor și multe altele. Integrarea elimină necesitatea oricărei codificări sau inginerie a datelor pentru a utiliza modelele robuste NLP ale Amazon Comprehend. Pur și simplu furnizați datele text și selectați dintre patru capabilități utilizate în mod obișnuit: analiza sentimentelor, detectarea limbii, extragerea entităților și detectarea informațiilor personale. Pentru fiecare scenariu, puteți utiliza interfața de utilizare pentru a testa și a utiliza predicția pe lot pentru a selecta datele stocate în Serviciul Amazon de stocare simplă (Amazon S3).

Analizarea datelor text pe SageMaker Canvas

Analiza sentimentelor

Cu analiza sentimentelor, SageMaker Canvas vă permite să analizați sentimentul textului introdus. Poate determina dacă sentimentul general este pozitiv, negativ, mixt sau neutru, așa cum se arată în următoarea captură de ecran. Acest lucru este util în situații precum analizarea recenziilor produselor. De exemplu, textul „Îmi place acest produs, este uimitor!” ar fi clasificat de SageMaker Canvas ca având un sentiment pozitiv, în timp ce „Acest produs este oribil, regret că l-am cumpărat” ar fi etichetat ca fiind un sentiment negativ.

Analiza sentimentelor pe SageMaker Canvas

Extragerea entităților

SageMaker Canvas poate analiza textul și detecta automat entitățile menționate în el. Când un document este trimis către SageMaker Canvas pentru analiză, va identifica persoane, organizații, locații, date, cantități și alte entități din text. Această capacitate de extragere a entităților vă permite să obțineți rapid informații despre persoanele cheie, locurile și detaliile discutate în documente. Pentru o listă de entități acceptate, consultați entități.

Extragerea entităților pe SageMaker Canvas

Detectarea limbajului

SageMaker Canvas poate determina, de asemenea, limba dominantă a textului folosind Amazon Comprehend. Analizează textul pentru a identifica limba principală și oferă scoruri de încredere pentru limba dominantă detectată, dar nu indică defalcări procentuale pentru documentele multilingve. Pentru cele mai bune rezultate cu documente lungi în mai multe limbi, împărțiți textul în bucăți mai mici și agregați rezultatele pentru a estima procentele de limbă. Funcționează cel mai bine cu cel puțin 20 de caractere de text.

Detectarea limbii pe SageMaker Canvas

Detectarea informațiilor personale

De asemenea, puteți proteja datele sensibile utilizând detectarea informațiilor personale cu SageMaker Canvas. Poate analiza documente text pentru a detecta automat entitățile cu informații de identificare personală (PII), permițându-vă să localizați date sensibile precum nume, adrese, date de naștere, numere de telefon, adrese de e-mail și multe altele. Analizează documente de până la 100 KB și oferă un scor de încredere pentru fiecare entitate detectată, astfel încât să puteți revizui și să redactați selectiv informațiile cele mai sensibile. Pentru o listă a entităților detectate, consultați Detectarea entităților PII.

Detectarea PII pe SageMaker Canvas

Date de imagine

SageMaker Canvas oferă o interfață vizuală, fără cod, care vă permite să utilizați capabilitățile de viziune computerizată prin integrarea cu Amazon Rekognition pentru analiza imaginilor. De exemplu, puteți încărca un set de date de imagini, puteți utiliza Amazon Rekognition pentru a detecta obiecte și scene și puteți efectua detectarea textului pentru a aborda o gamă largă de cazuri de utilizare. Interfața vizuală și integrarea Amazon Rekognition fac posibil ca non-dezvoltatorii să folosească tehnici avansate de viziune computerizată.

Analizarea datelor de imagine pe SageMaker Canvas

Detectarea obiectelor în imagini

SageMaker Canvas folosește Amazon Rekognition pentru a detecta etichete (obiecte) dintr-o imagine. Puteți încărca imaginea din interfața de utilizare SageMaker Canvas sau puteți utiliza Predicția lotului pentru a selecta imaginile stocate într-o găleată S3. După cum se arată în exemplul următor, poate extrage obiecte din imagine, cum ar fi turnul cu ceas, autobuzul, clădirile și multe altele. Puteți utiliza interfața pentru a căuta rezultatele predicției și pentru a le sorta.

Detectarea obiectelor în imagini de pe pânza SageMaker

Detectarea textului în imagini

Extragerea textului din imagini este un caz de utilizare foarte comun. Acum, puteți efectua această sarcină cu ușurință pe SageMaker Canvas fără cod. Textul este extras ca elemente rând, așa cum se arată în următoarea captură de ecran. Frazele scurte din imagine sunt clasificate împreună și identificate ca o frază.

Detectarea textului în imagini de pe pânza SageMaker

Puteți efectua previziuni în lot încărcând un set de imagini, extrageți toate imaginile într-o singură lucrare lot și descărcați rezultatele ca fișier CSV. Această soluție este utilă atunci când doriți să extrageți și să detectați text din imagini.

Datele documentului

SageMaker Canvas oferă o varietate de soluții gata de utilizare care vă rezolvă nevoile de zi cu zi de înțelegere a documentelor. Aceste soluții sunt alimentate de Text Amazon. Pentru a vedea toate opțiunile disponibile pentru documente, alegeți Modele gata de utilizare în panoul de navigare și filtrați după Documente, așa cum se arată în următoarea captură de ecran.

Analizarea datelor de document pe SageMaker Canvas

Analiza documentelor

Analiza documentelor analizează documentele și formularele pentru relațiile dintre textul detectat. Operațiunile returnează patru categorii de extragere a documentelor: text brut, formulare, tabele și semnături. Capacitatea soluției de a înțelege structura documentului vă oferă o flexibilitate suplimentară în ceea ce privește tipul de date pe care doriți să le extrageți din documente. Următoarea captură de ecran este un exemplu despre cum arată detectarea tabelului.

Analiza documentelor pe SageMaker Canvas

Această soluție este capabilă să înțeleagă aspectul documentelor complexe, ceea ce este util atunci când trebuie să extrageți informații specifice din documentele dvs.

Analiza documentelor de identitate

Această soluție este concepută pentru a analiza documente precum cărți de identitate personale, permise de conducere sau alte forme similare de identificare. Informații precum al doilea nume, județul și locul nașterii, împreună cu scorul său individual de încredere în acuratețe, vor fi returnate pentru fiecare document de identitate, așa cum se arată în următoarea captură de ecran.

Analiza documentelor de identitate pe SageMaker Canvas

Există o opțiune de a face predicție pe lot, prin care puteți încărca în bloc seturi de documente de identificare și le puteți procesa ca un lot. Aceasta oferă o modalitate rapidă și fără întreruperi de a transforma detaliile documentului de identificare în perechi cheie-valoare care pot fi utilizate pentru procesele din aval, cum ar fi analiza datelor.

Analiza cheltuielilor

Analiza cheltuielilor este concepută pentru a analiza documentele de cheltuieli, cum ar fi facturile și chitanțele. Următoarea captură de ecran este un exemplu despre cum arată informațiile extrase.

Analiza cheltuielilor pe SageMaker Canvas

Rezultatele sunt returnate ca câmpuri de rezumat și câmpuri de elemente rând. Câmpurile de rezumat sunt perechi cheie-valoare extrase din document și conțin chei precum Total general, Data scadenței, și Impozit. Câmpurile elementului rând se referă la date care sunt structurate ca un tabel în document. Acest lucru este util pentru extragerea de informații din document, păstrând în același timp aspectul acestuia.

Interogări de documente

Interogările privind documentele sunt concepute pentru ca dvs. să puneți întrebări despre documentele dvs. Aceasta este o soluție excelentă de utilizat atunci când aveți documente cu mai multe pagini și doriți să extrageți răspunsuri foarte specifice din documentele dvs. Următorul este un exemplu de tipuri de întrebări pe care le puteți pune și cum arată răspunsurile extrase.

Interogări de documente pe SageMaker Canvas

Soluția oferă o interfață simplă pentru a interacționa cu documentele. Acest lucru este util atunci când doriți să obțineți detalii specifice în documente mari.

Concluzie

SageMaker Canvas oferă un mediu fără cod pentru a utiliza ML cu ușurință pe diferite tipuri de date, cum ar fi text, imagini și documente. Interfața vizuală și integrarea cu servicii AWS precum Amazon Comprehend, Amazon Rekognition și Amazon Texttract elimină nevoia de codare și inginerie a datelor. Puteți analiza textul pentru sentimente, entități, limbi și PII. Pentru imagini, detectarea obiectelor și textului permite cazuri de utilizare a vederii computerizate. În cele din urmă, analiza documentelor poate extrage text, păstrând în același timp aspectul pentru procesele din aval. Soluțiile gata de utilizare din SageMaker Canvas vă permit să utilizați tehnici avansate de ML pentru a genera informații atât din date structurate, cât și din date nestructurate. Dacă sunteți interesat să utilizați instrumente fără cod cu modele ML gata de utilizat, încercați astăzi SageMaker Canvas. Pentru mai multe informații, consultați Începeți cu utilizarea Amazon SageMaker Canvas.


Despre autori

Use machine learning without writing a single line of code with Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.Julia Ang este un arhitect de soluții cu sediul în Singapore. Ea a lucrat cu clienți într-o gamă largă de domenii, de la sănătate și sectorul public până la afaceri digitale native, pentru a adopta soluții în funcție de nevoile lor de afaceri. Ea a sprijinit, de asemenea, clienții din Asia de Sud-Est și nu numai să folosească AI și ML în afacerile lor. În afara serviciului, îi place să învețe despre lume prin călătorii și angajându-se în activități creative.

Use machine learning without writing a single line of code with Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.Loke Jun Kai este un arhitect specializat în soluții pentru AI/ML cu sediul în Singapore. El lucrează cu clienții din ASEAN pentru a proiecta soluții de învățare automată la scară în AWS. Jun Kai este un avocat al instrumentelor de învățare automată Low-Code No-Code. În timpul liber, îi place să fie cu natura.

Timestamp-ul:

Mai mult de la Învățare automată AWS