Lähiminevikus nõudis masinõppe (ML) kasutamine ennustuste tegemiseks, eriti teksti ja kujutiste kujul olevate andmete puhul, põhjalikke ML-teadmisi süvaõppe mudelite loomiseks ja häälestamiseks. Tänaseks on ML muutunud kättesaadavamaks kõigile kasutajatele, kes soovivad kasutada ML-mudeleid ärilise väärtuse loomiseks. Koos Amazon SageMakeri lõuend, saate luua ennustusi mitme erineva andmetüübi jaoks, peale tabeli- või aegridade andmete, ilma ühtki koodirida kirjutamata. Need võimalused hõlmavad eelkoolitatud mudeleid pildi-, teksti- ja dokumendiandmete tüüpide jaoks.
Selles postituses arutame, kuidas saate kasutada eelkoolitatud mudeleid, et hankida ennustusi toetatud andmetüüpide kohta peale tabeliandmete.
Tekstiandmed
SageMaker Canvas pakub visuaalset koodivaba keskkonda ML-mudelite ehitamiseks, koolitamiseks ja juurutamiseks. Loomuliku keele töötlemise (NLP) ülesannete jaoks integreerub SageMaker Canvas sujuvalt Amazoni mõistmine võimaldab teil kasutada peamisi NLP-funktsioone, nagu keele tuvastamine, olemituvastus, sentimentide analüüs, teemade modelleerimine ja palju muud. Integreerimine välistab vajaduse mis tahes kodeerimise või andmetöötluse järele Amazon Comprehendi tugevate NLP-mudelite kasutamiseks. Peate lihtsalt sisestama oma tekstiandmed ja valima nelja sagedamini kasutatava võimaluse hulgast: meeleoluanalüüs, keeletuvastus, olemite eraldamine ja isikliku teabe tuvastamine. Iga stsenaariumi puhul saate kasutajaliidese abil testida ja kasutada salvestatud andmete valimiseks pakettprognoosi Amazoni lihtne salvestusteenus (Amazon S3).
Sentimentide analüüs
Sentimentanalüüsi abil võimaldab SageMaker Canvas teil analüüsida sisendteksti sentimenti. See võib määrata, kas üldine meeleolu on positiivne, negatiivne, segane või neutraalne, nagu on näidatud järgmisel ekraanipildil. See on kasulik sellistes olukordades nagu tooteülevaadete analüüsimine. Näiteks tekst "Ma armastan seda toodet, see on suurepärane!" SageMaker Canvas klassifitseeriks selle positiivse meeleoluga, samas kui "See toode on kohutav, ma kahetsen selle ostmist" märgitaks negatiivseks.
Üksuste väljavõtmine
SageMaker Canvas saab analüüsida teksti ja tuvastada automaatselt selles mainitud üksused. Kui dokument saadetakse analüüsimiseks SageMaker Canvasele, tuvastab see tekstis inimesed, organisatsioonid, asukohad, kuupäevad, kogused ja muud üksused. See olemi eraldamise võimalus võimaldab teil kiiresti saada ülevaadet dokumentides käsitletud võtmeisikutest, kohtadest ja üksikasjadest. Toetatud olemite loendi leiate jaotisest Üksused.
Keele tuvastamine
SageMaker Canvas saab Amazon Comprehendi abil määrata ka domineeriva tekstikeele. See analüüsib teksti põhikeele tuvastamiseks ja annab tuvastatud domineeriva keele usaldusväärsuse hinded, kuid ei näita mitmekeelsete dokumentide jaotusi protsentides. Parimate tulemuste saamiseks pikkade dokumentidega mitmes keeles jagage tekst väiksemateks tükkideks ja koondage tulemused keeleprotsendi hindamiseks. See töötab kõige paremini, kui teksti on vähemalt 20 tähemärki.
Isikuandmete tuvastamine
Samuti saate kaitsta tundlikke andmeid, kasutades SageMaker Canvas'i isikliku teabe tuvastamist. See võib analüüsida tekstidokumente, et tuvastada automaatselt isikut tuvastava teabe (PII) üksused, mis võimaldab teil leida tundlikke andmeid, nagu nimed, aadressid, sünnikuupäevad, telefoninumbrid, e-posti aadressid ja palju muud. See analüüsib kuni 100 KB dokumente ja annab iga tuvastatud üksuse usaldusväärsuse skoori, et saaksite kõige tundlikuma teabe üle vaadata ja valikuliselt redigeerida. Tuvastatud üksuste loendi leiate jaotisest PII-üksuste tuvastamine.
Kujutise andmed
SageMaker Canvas pakub visuaalset koodivaba liidest, mis muudab arvuti nägemisvõimaluste kasutamise lihtsaks, integreerides Amazon Rekognitsioon pildi analüüsi jaoks. Näiteks saate üles laadida piltide andmekogumi, kasutada Amazon Rekognitioni objektide ja stseenide tuvastamiseks ning tekstituvastust, et lahendada mitmesuguseid kasutusjuhtumeid. Visuaalne liides ja Amazon Rekognitioni integratsioon võimaldavad mittearendajatel kasutada täiustatud arvutinägemise tehnikaid.
Objektide tuvastamine piltidel
SageMaker Canvas kasutab pildil siltide (objektide) tuvastamiseks Amazon Rekognitioni. Saate pildi üles laadida SageMaker Canvas UI kaudu või kasutada Partii ennustamine vahekaart S3 ämbrisse salvestatud piltide valimiseks. Nagu on näidatud järgmises näites, saab see pildilt eraldada objekte, nagu kellatorn, buss, hooned ja palju muud. Saate kasutada liidest ennustustulemuste otsimiseks ja sortimiseks.
Teksti tuvastamine piltidel
Piltidelt teksti eraldamine on väga levinud kasutusjuht. Nüüd saate seda ülesannet hõlpsalt täita SageMaker Canvasil ilma koodita. Tekst ekstraheeritakse reaüksustena, nagu on näidatud järgmisel ekraanipildil. Pildil olevad lühikesed fraasid liigitatakse kokku ja identifitseeritakse fraasidena.
Saate teha pakettprognoose, laadides üles pildikomplekti, eraldades kõik pildid ühe pakktööna ja alla laadides tulemused CSV-failina. See lahendus on kasulik, kui soovite piltidelt teksti eraldada ja tuvastada.
Dokumendi andmed
SageMaker Canvas pakub mitmesuguseid kasutusvalmis lahendusi, mis lahendavad teie igapäevased dokumentide mõistmise vajadused. Neid lahendusi toidab Amazoni tekst. Kõigi saadaolevate dokumentide valikute vaatamiseks valige Kasutusvalmis mudelid navigeerimispaanil ja filtreerige dokumendid, nagu on näidatud järgmisel ekraanipildil.
Dokumendi analüüs
Dokumendianalüüs analüüsib dokumente ja vorme tuvastatud tekstide vaheliste seoste leidmiseks. Toimingud tagastavad nelja dokumendi ekstraheerimise kategooriat: toortekst, vormid, tabelid ja allkirjad. Lahenduse võime mõista dokumendi struktuuri annab teile täiendava paindlikkuse selle kohta, millist tüüpi andmeid soovite dokumentidest eraldada. Järgmine ekraanipilt on näide sellest, kuidas tabeli tuvastamine välja näeb.
See lahendus suudab mõista keeruliste dokumentide paigutust, mis on abiks siis, kui teil on vaja dokumentidest konkreetset teavet eraldada.
Isikut tõendava dokumendi analüüs
See lahendus on mõeldud selliste dokumentide analüüsimiseks nagu isikutunnistused, juhiload või muud sarnased identifitseerimisvormid. Iga isikut tõendava dokumendi kohta tagastatakse teave, nagu keskmine nimi, maakond ja sünnikoht, koos selle individuaalse usaldusskooriga, nagu on näidatud järgmisel ekraanipildil.
On võimalus teha pakettprognoosi, mille abil saate isikut tõendavate dokumentide komplekte hulgi üles laadida ja neid paketttööna töödelda. See pakub kiiret ja sujuvat viisi identifitseerimisdokumendi üksikasjade muutmiseks võtme-väärtuste paarideks, mida saab kasutada järgnevates protsessides, nagu andmeanalüüs.
Kulude analüüs
Kuluanalüüs on mõeldud kuludokumentide, nagu arved ja kviitungid, analüüsimiseks. Järgmine ekraanipilt on näide sellest, kuidas ekstraktitud teave välja näeb.
Tulemused tagastatakse kokkuvõtteväljade ja reaüksuse väljadena. Kokkuvõtteväljad on dokumendist eraldatud võtme-väärtuste paarid ja sisaldavad selliseid võtmeid nagu Üldkokkuvõte, Tähtaegja Maks. Reaüksuse väljad viitavad andmetele, mis on dokumendis struktureeritud tabelina. See on kasulik dokumendist teabe hankimiseks, säilitades selle paigutuse.
Dokumenteerige päringud
Dokumendipäringud on loodud selleks, et saaksite esitada küsimusi oma dokumentide kohta. See on suurepärane lahendus, mida kasutada, kui teil on mitmeleheküljelised dokumendid ja soovite oma dokumentidest väga konkreetseid vastuseid hankida. Järgnevalt on toodud näide küsimuste tüübist, mida saate esitada, ja kuidas väljatõmmatud vastused välja näevad.
Lahendus pakub teile dokumentidega suhtlemiseks lihtsat liidest. See on abiks siis, kui soovite saada konkreetseid üksikasju suurtes dokumentides.
Järeldus
SageMaker Canvas pakub koodivaba keskkonda ML-i hõlpsaks kasutamiseks erinevate andmetüüpide (nt tekst, pildid ja dokumendid) puhul. Visuaalne liides ja integreerimine AWS-teenustega, nagu Amazon Comprehend, Amazon Rekognition ja Amazon Textract, välistab vajaduse kodeerimise ja andmetöötluse järele. Saate analüüsida teksti arvamuste, üksuste, keelte ja isikuandmete tuvastamiseks. Piltide puhul võimaldab objektide ja tekstide tuvastamine arvutinägemise kasutusjuhtumeid. Lõpuks saab dokumendianalüüsi teksti eraldada, säilitades selle paigutuse järgnevate protsesside jaoks. SageMaker Canvas kasutusvalmis lahendused võimaldavad teil kasutada täiustatud ML-tehnikaid, et luua teadmisi nii struktureeritud kui ka struktureerimata andmetest. Kui olete huvitatud koodita tööriistade kasutamisest koos kasutusvalmis ML-mudelitega, proovige juba täna SageMaker Canvast. Lisateabe saamiseks vaadake Amazon SageMaker Canvase kasutamise alustamine.
Autoritest
Julia Ang on Singapuris asuv lahenduste arhitekt. Ta on töötanud klientidega erinevates valdkondades, alates tervishoiust ja avalikust sektorist kuni digitaalsete ettevõteteni, et võtta kasutusele lahendusi vastavalt nende ärivajadustele. Samuti on ta toetanud kliente Kagu-Aasias ja mujal, et nad saaksid kasutada AI ja ML oma ettevõtetes. Väljaspool tööd naudib ta maailma tundmaõppimist reisimise ja loominguliste tegevuste kaudu.
Loke Jun Kai on AI/ML-i spetsialiseerunud lahenduste arhitekt, mis asub Singapuris. Ta teeb koostööd klientidega üle ASEANi, et luua AWS-is ulatuslikke masinõppelahendusi. Jun Kai pooldab madala koodiga koodita masinõppetööriistu. Vabal ajal naudib ta loodusega koos olemist.
- SEO-põhise sisu ja PR-levi. Võimenduge juba täna.
- PlatoData.Network Vertikaalne generatiivne Ai. Jõustage ennast. Juurdepääs siia.
- PlatoAiStream. Web3 luure. Täiustatud teadmised. Juurdepääs siia.
- PlatoESG. Süsinik, CleanTech, Energia, Keskkond päikeseenergia, Jäätmekäitluse. Juurdepääs siia.
- PlatoTervis. Biotehnoloogia ja kliiniliste uuringute luureandmed. Juurdepääs siia.
- Allikas: https://aws.amazon.com/blogs/machine-learning/use-machine-learning-without-writing-a-single-line-of-code-with-amazon-sagemaker-canvas/
- :on
- :on
- $ UP
- 100
- 20
- 360
- 385
- 400
- 7
- a
- Võimalik
- MEIST
- juurdepääsetav
- Vastavalt
- täpsus
- üle
- aadress
- aadressid
- vastu võtma
- edasijõudnud
- advokaat
- agregaat
- AI
- AI / ML
- Materjal: BPA ja flataatide vaba plastik
- võimaldama
- Lubades
- võimaldab
- Ka
- Amazon
- Amazoni mõistmine
- Amazon Rekognitsioon
- Amazon SageMaker
- Amazon SageMakeri lõuend
- Amazoni tekst
- Amazon Web Services
- vahel
- an
- analüüs
- analüüsima
- analüüse
- analüüsides
- ja
- vastuseid
- mistahes
- OLEME
- AS
- ASEAN
- Aasia
- küsima
- At
- automaatselt
- saadaval
- AWS
- põhineb
- BE
- muutuma
- olnud
- on
- BEST
- Peale
- sünd
- mõlemad
- Ehitus
- hooned
- buss
- äri
- ettevõtted
- kuid
- Ostmine
- by
- CAN
- lõuend
- võimeid
- võime
- Kaardid
- juhul
- juhtudel
- kategooriad
- märki
- Vali
- salastatud
- kell
- kood
- Kodeerimine
- ühine
- tavaliselt
- keeruline
- mõista
- arvuti
- Arvuti visioon
- usaldus
- sisaldama
- maakond
- looma
- loomine
- Loominguline
- klient
- Kliendid
- andmed
- andmete analüüs
- Kuupäevad
- päevast päeva
- sügav
- sügav õpe
- juurutamine
- kavandatud
- detailid
- avastama
- tuvastatud
- Detection
- Määrama
- erinev
- digitaalne
- arutama
- arutatud
- do
- dokument
- dokumendid
- Ei tee
- domineeriv
- lae alla
- iga
- leevendada
- kõrvaldab
- võimaldab
- kaasamine
- Inseneriteadus
- üksuste
- üksus
- keskkond
- eriti
- hinnata
- näide
- ulatuslik
- lisatasu
- väljavõte
- kaevandamine
- Valdkonnad
- fail
- filtreerida
- Lõpuks
- Paindlikkus
- Järel
- eest
- vorm
- vormid
- neli
- Alates
- kasu
- tekitama
- saama
- annab
- suur
- rakmed
- Olema
- võttes
- he
- Tervis
- kasulik
- tema
- Kuidas
- HTML
- HTTPS
- i
- Identifitseerimine
- tuvastatud
- identifitseerima
- Identity
- if
- pilt
- pildid
- in
- sisaldama
- näitama
- eraldi
- info
- sisend
- teadmisi
- Integreerib
- Integreerimine
- integratsioon
- suhelda
- huvitatud
- Interface
- sisse
- arved
- IT
- kirjed
- ITS
- töö
- lihtsalt
- Võti
- võtmed
- teadmised
- Labels
- keel
- Keeled
- suur
- Layout
- õppimine
- kõige vähem
- Litsentsid
- nagu
- joon
- nimekiri
- kohad
- Pikk
- Vaata
- näeb välja
- välimus
- armastus
- masin
- masinõpe
- põhiline
- tegema
- TEEB
- mainitud
- Kesk-
- segatud
- ML
- modelleerimine
- mudelid
- rohkem
- kõige
- mitmekordne
- nimi
- nimed
- emakeelena
- Natural
- Natural Language Processing
- loodus
- NAVIGATSIOON
- Vajadus
- vajadustele
- negatiivne
- Neutraalne
- nlp
- ei
- nüüd
- number
- numbrid
- objekt
- Objekti tuvastamine
- esemeid
- of
- Pakkumised
- on
- Operations
- valik
- Valikud
- or
- organisatsioonid
- Muu
- välja
- väljaspool
- üldine
- paari
- pane
- minevik
- Inimesed
- protsent
- täitma
- isiklik
- Isiklikult
- telefon
- fraasid
- tükki
- Koht
- Kohad
- Platon
- Platoni andmete intelligentsus
- PlatoData
- positiivne
- võimalik
- post
- sisse
- ennustus
- Ennustused
- säilitamine
- protsess
- Protsessid
- töötlemine
- Toode
- Toote kommentaarid
- kaitsma
- anda
- annab
- avalik
- päringud
- Küsimused
- Kiire
- kiiresti
- valik
- Töötlemata
- laekumised
- hiljuti
- tunnustamine
- viitama
- kahetsema
- Suhted
- nõutav
- Tulemused
- säilitamine
- tagasipöördumine
- läbi
- Arvustused
- jõuline
- salveitegija
- Skaala
- stsenaarium
- stseenide
- skoor
- sujuv
- sujuvalt
- Otsing
- sektor
- tundlik
- Saadetud
- tunne
- Seeria
- Teenused
- komplekt
- Komplektid
- ta
- Lühike
- näidatud
- Allkirjad
- sarnane
- lihtne
- lihtsalt
- Singapur
- ühekordne
- olukordades
- väiksem
- So
- lahendus
- Lahendused
- LAHENDAGE
- kagus
- Kagu-Aasias
- spetsialist
- konkreetse
- jagada
- alustatud
- ladustamine
- ladustatud
- lihtne
- struktuur
- struktureeritud
- selline
- KOKKUVÕTE
- Toetatud
- Toetamine
- tabel
- Ülesanne
- ülesanded
- tehnikat
- test
- tekst
- et
- .
- maailm
- oma
- Neile
- Need
- see
- Läbi
- aeg
- Ajaseeria
- et
- täna
- kokku
- töövahendid
- teema
- Torn
- koolitus
- Muutma
- Reisimine
- püüdma
- häälestamine
- tüüp
- liigid
- ui
- mõistma
- mõistmine
- Üleslaadimine
- kasutama
- kasutage juhtumit
- Kasutatud
- Kasutaja
- kasutusalad
- kasutamine
- väärtus
- sort
- eri
- väga
- vaade
- nägemus
- tahan
- tahab
- Tee..
- we
- web
- veebiteenused
- M
- millal
- samas kui
- mis
- kuigi
- WHO
- lai
- Lai valik
- will
- koos
- jooksul
- ilma
- Töö
- töötas
- töötab
- maailm
- oleks
- kirjutamine
- sa
- Sinu
- sephyrnet