Kasutage masinõpet ilma ühtki koodirida kirjutamata rakendusega Amazon SageMaker Canvas | Amazoni veebiteenused

Kasutage masinõpet ilma ühtki koodirida kirjutamata rakendusega Amazon SageMaker Canvas | Amazoni veebiteenused

Lähiminevikus nõudis masinõppe (ML) kasutamine ennustuste tegemiseks, eriti teksti ja kujutiste kujul olevate andmete puhul, põhjalikke ML-teadmisi süvaõppe mudelite loomiseks ja häälestamiseks. Tänaseks on ML muutunud kättesaadavamaks kõigile kasutajatele, kes soovivad kasutada ML-mudeleid ärilise väärtuse loomiseks. Koos Amazon SageMakeri lõuend, saate luua ennustusi mitme erineva andmetüübi jaoks, peale tabeli- või aegridade andmete, ilma ühtki koodirida kirjutamata. Need võimalused hõlmavad eelkoolitatud mudeleid pildi-, teksti- ja dokumendiandmete tüüpide jaoks.

Selles postituses arutame, kuidas saate kasutada eelkoolitatud mudeleid, et hankida ennustusi toetatud andmetüüpide kohta peale tabeliandmete.

Tekstiandmed

SageMaker Canvas pakub visuaalset koodivaba keskkonda ML-mudelite ehitamiseks, koolitamiseks ja juurutamiseks. Loomuliku keele töötlemise (NLP) ülesannete jaoks integreerub SageMaker Canvas sujuvalt Amazoni mõistmine võimaldab teil kasutada peamisi NLP-funktsioone, nagu keele tuvastamine, olemituvastus, sentimentide analüüs, teemade modelleerimine ja palju muud. Integreerimine välistab vajaduse mis tahes kodeerimise või andmetöötluse järele Amazon Comprehendi tugevate NLP-mudelite kasutamiseks. Peate lihtsalt sisestama oma tekstiandmed ja valima nelja sagedamini kasutatava võimaluse hulgast: meeleoluanalüüs, keeletuvastus, olemite eraldamine ja isikliku teabe tuvastamine. Iga stsenaariumi puhul saate kasutajaliidese abil testida ja kasutada salvestatud andmete valimiseks pakettprognoosi Amazoni lihtne salvestusteenus (Amazon S3).

SageMakeri lõuendi tekstiandmete analüüsimine

Sentimentide analüüs

Sentimentanalüüsi abil võimaldab SageMaker Canvas teil analüüsida sisendteksti sentimenti. See võib määrata, kas üldine meeleolu on positiivne, negatiivne, segane või neutraalne, nagu on näidatud järgmisel ekraanipildil. See on kasulik sellistes olukordades nagu tooteülevaadete analüüsimine. Näiteks tekst "Ma armastan seda toodet, see on suurepärane!" SageMaker Canvas klassifitseeriks selle positiivse meeleoluga, samas kui "See toode on kohutav, ma kahetsen selle ostmist" märgitaks negatiivseks.

Tundeanalüüs SageMakeri lõuendil

Üksuste väljavõtmine

SageMaker Canvas saab analüüsida teksti ja tuvastada automaatselt selles mainitud üksused. Kui dokument saadetakse analüüsimiseks SageMaker Canvasele, tuvastab see tekstis inimesed, organisatsioonid, asukohad, kuupäevad, kogused ja muud üksused. See olemi eraldamise võimalus võimaldab teil kiiresti saada ülevaadet dokumentides käsitletud võtmeisikutest, kohtadest ja üksikasjadest. Toetatud olemite loendi leiate jaotisest Üksused.

Teeb ekstraheerimise SageMakeri lõuendil

Keele tuvastamine

SageMaker Canvas saab Amazon Comprehendi abil määrata ka domineeriva tekstikeele. See analüüsib teksti põhikeele tuvastamiseks ja annab tuvastatud domineeriva keele usaldusväärsuse hinded, kuid ei näita mitmekeelsete dokumentide jaotusi protsentides. Parimate tulemuste saamiseks pikkade dokumentidega mitmes keeles jagage tekst väiksemateks tükkideks ja koondage tulemused keeleprotsendi hindamiseks. See töötab kõige paremini, kui teksti on vähemalt 20 tähemärki.

Keele tuvastamine SageMakeri lõuendil

Isikuandmete tuvastamine

Samuti saate kaitsta tundlikke andmeid, kasutades SageMaker Canvas'i isikliku teabe tuvastamist. See võib analüüsida tekstidokumente, et tuvastada automaatselt isikut tuvastava teabe (PII) üksused, mis võimaldab teil leida tundlikke andmeid, nagu nimed, aadressid, sünnikuupäevad, telefoninumbrid, e-posti aadressid ja palju muud. See analüüsib kuni 100 KB dokumente ja annab iga tuvastatud üksuse usaldusväärsuse skoori, et saaksite kõige tundlikuma teabe üle vaadata ja valikuliselt redigeerida. Tuvastatud üksuste loendi leiate jaotisest PII-üksuste tuvastamine.

PII tuvastamine SageMakeri lõuendil

Kujutise andmed

SageMaker Canvas pakub visuaalset koodivaba liidest, mis muudab arvuti nägemisvõimaluste kasutamise lihtsaks, integreerides Amazon Rekognitsioon pildi analüüsi jaoks. Näiteks saate üles laadida piltide andmekogumi, kasutada Amazon Rekognitioni objektide ja stseenide tuvastamiseks ning tekstituvastust, et lahendada mitmesuguseid kasutusjuhtumeid. Visuaalne liides ja Amazon Rekognitioni integratsioon võimaldavad mittearendajatel kasutada täiustatud arvutinägemise tehnikaid.

Pildiandmete analüüsimine SageMakeri lõuendil

Objektide tuvastamine piltidel

SageMaker Canvas kasutab pildil siltide (objektide) tuvastamiseks Amazon Rekognitioni. Saate pildi üles laadida SageMaker Canvas UI kaudu või kasutada Partii ennustamine vahekaart S3 ämbrisse salvestatud piltide valimiseks. Nagu on näidatud järgmises näites, saab see pildilt eraldada objekte, nagu kellatorn, buss, hooned ja palju muud. Saate kasutada liidest ennustustulemuste otsimiseks ja sortimiseks.

Objektide tuvastamine SageMakeri lõuendil olevatel piltidel

Teksti tuvastamine piltidel

Piltidelt teksti eraldamine on väga levinud kasutusjuht. Nüüd saate seda ülesannet hõlpsalt täita SageMaker Canvasil ilma koodita. Tekst ekstraheeritakse reaüksustena, nagu on näidatud järgmisel ekraanipildil. Pildil olevad lühikesed fraasid liigitatakse kokku ja identifitseeritakse fraasidena.

Tekstituvastus piltidel SageMakeri lõuendil

Saate teha pakettprognoose, laadides üles pildikomplekti, eraldades kõik pildid ühe pakktööna ja alla laadides tulemused CSV-failina. See lahendus on kasulik, kui soovite piltidelt teksti eraldada ja tuvastada.

Dokumendi andmed

SageMaker Canvas pakub mitmesuguseid kasutusvalmis lahendusi, mis lahendavad teie igapäevased dokumentide mõistmise vajadused. Neid lahendusi toidab Amazoni tekst. Kõigi saadaolevate dokumentide valikute vaatamiseks valige Kasutusvalmis mudelid navigeerimispaanil ja filtreerige dokumendid, nagu on näidatud järgmisel ekraanipildil.

SageMakeri lõuendi dokumendiandmete analüüsimine

Dokumendi analüüs

Dokumendianalüüs analüüsib dokumente ja vorme tuvastatud tekstide vaheliste seoste leidmiseks. Toimingud tagastavad nelja dokumendi ekstraheerimise kategooriat: toortekst, vormid, tabelid ja allkirjad. Lahenduse võime mõista dokumendi struktuuri annab teile täiendava paindlikkuse selle kohta, millist tüüpi andmeid soovite dokumentidest eraldada. Järgmine ekraanipilt on näide sellest, kuidas tabeli tuvastamine välja näeb.

SageMakeri lõuendi dokumendianalüüs

See lahendus suudab mõista keeruliste dokumentide paigutust, mis on abiks siis, kui teil on vaja dokumentidest konkreetset teavet eraldada.

Isikut tõendava dokumendi analüüs

See lahendus on mõeldud selliste dokumentide analüüsimiseks nagu isikutunnistused, juhiload või muud sarnased identifitseerimisvormid. Iga isikut tõendava dokumendi kohta tagastatakse teave, nagu keskmine nimi, maakond ja sünnikoht, koos selle individuaalse usaldusskooriga, nagu on näidatud järgmisel ekraanipildil.

Isikut tõendava dokumendi analüüs SageMakeri lõuendil

On võimalus teha pakettprognoosi, mille abil saate isikut tõendavate dokumentide komplekte hulgi üles laadida ja neid paketttööna töödelda. See pakub kiiret ja sujuvat viisi identifitseerimisdokumendi üksikasjade muutmiseks võtme-väärtuste paarideks, mida saab kasutada järgnevates protsessides, nagu andmeanalüüs.

Kulude analüüs

Kuluanalüüs on mõeldud kuludokumentide, nagu arved ja kviitungid, analüüsimiseks. Järgmine ekraanipilt on näide sellest, kuidas ekstraktitud teave välja näeb.

Kulude analüüs SageMakeri lõuendil

Tulemused tagastatakse kokkuvõtteväljade ja reaüksuse väljadena. Kokkuvõtteväljad on dokumendist eraldatud võtme-väärtuste paarid ja sisaldavad selliseid võtmeid nagu Üldkokkuvõte, Tähtaegja Maks. Reaüksuse väljad viitavad andmetele, mis on dokumendis struktureeritud tabelina. See on kasulik dokumendist teabe hankimiseks, säilitades selle paigutuse.

Dokumenteerige päringud

Dokumendipäringud on loodud selleks, et saaksite esitada küsimusi oma dokumentide kohta. See on suurepärane lahendus, mida kasutada, kui teil on mitmeleheküljelised dokumendid ja soovite oma dokumentidest väga konkreetseid vastuseid hankida. Järgnevalt on toodud näide küsimuste tüübist, mida saate esitada, ja kuidas väljatõmmatud vastused välja näevad.

Dokumenteerige päringud SageMakeri lõuendil

Lahendus pakub teile dokumentidega suhtlemiseks lihtsat liidest. See on abiks siis, kui soovite saada konkreetseid üksikasju suurtes dokumentides.

Järeldus

SageMaker Canvas pakub koodivaba keskkonda ML-i hõlpsaks kasutamiseks erinevate andmetüüpide (nt tekst, pildid ja dokumendid) puhul. Visuaalne liides ja integreerimine AWS-teenustega, nagu Amazon Comprehend, Amazon Rekognition ja Amazon Textract, välistab vajaduse kodeerimise ja andmetöötluse järele. Saate analüüsida teksti arvamuste, üksuste, keelte ja isikuandmete tuvastamiseks. Piltide puhul võimaldab objektide ja tekstide tuvastamine arvutinägemise kasutusjuhtumeid. Lõpuks saab dokumendianalüüsi teksti eraldada, säilitades selle paigutuse järgnevate protsesside jaoks. SageMaker Canvas kasutusvalmis lahendused võimaldavad teil kasutada täiustatud ML-tehnikaid, et luua teadmisi nii struktureeritud kui ka struktureerimata andmetest. Kui olete huvitatud koodita tööriistade kasutamisest koos kasutusvalmis ML-mudelitega, proovige juba täna SageMaker Canvast. Lisateabe saamiseks vaadake Amazon SageMaker Canvase kasutamise alustamine.


Autoritest

Kasutage masinõpet ilma ühtki koodirida kirjutamata rakendusega Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.Julia Ang on Singapuris asuv lahenduste arhitekt. Ta on töötanud klientidega erinevates valdkondades, alates tervishoiust ja avalikust sektorist kuni digitaalsete ettevõteteni, et võtta kasutusele lahendusi vastavalt nende ärivajadustele. Samuti on ta toetanud kliente Kagu-Aasias ja mujal, et nad saaksid kasutada AI ja ML oma ettevõtetes. Väljaspool tööd naudib ta maailma tundmaõppimist reisimise ja loominguliste tegevuste kaudu.

Kasutage masinõpet ilma ühtki koodirida kirjutamata rakendusega Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.Loke Jun Kai on AI/ML-i spetsialiseerunud lahenduste arhitekt, mis asub Singapuris. Ta teeb koostööd klientidega üle ASEANi, et luua AWS-is ulatuslikke masinõppelahendusi. Jun Kai pooldab madala koodiga koodita masinõppetööriistu. Vabal ajal naudib ta loodusega koos olemist.

Ajatempel:

Veel alates AWS-i masinõpe