Kun sukeltamme syvemmälle digitaaliseen aikakauteen, multimodaalisuusmallien kehittäminen on ollut ratkaisevan tärkeää koneen ymmärtämisen parantamisessa. Nämä mallit käsittelevät ja luovat sisältöä erilaisiin tietomuotoihin, kuten tekstiin ja kuviin. Näiden mallien keskeinen ominaisuus on niiden kuva tekstiksi -ominaisuudet, jotka ovat osoittaneet huomattavaa taitoa tehtävissä, kuten kuvien tekstityksessä ja visuaalisissa kysymyksiin vastaamisessa.
Kääntämällä kuvat tekstiksi avaamme ja hyödynnämme visuaalisen datan sisältämää tietoa. Esimerkiksi verkkokaupassa kuva tekstiksi voi automatisoida tuotteiden luokittelun kuvien perusteella, mikä parantaa haun tehokkuutta ja tarkkuutta. Samoin se voi auttaa luomaan automaattisia valokuvakuvauksia, tarjoamalla tietoja, jotka eivät välttämättä sisälly tuotenimikkeisiin tai kuvauksiin, mikä parantaa käyttökokemusta.
Tässä viestissä annamme yleiskatsauksen suosituista multimodaalisuusmalleista. Näytämme myös, kuinka näitä esikoulutettuja malleja voidaan ottaa käyttöön Amazon Sage Maker. Lisäksi keskustelemme näiden mallien erilaisista sovelluksista keskittyen erityisesti useisiin tosielämän skenaarioihin, kuten zero-shot tagiin ja attribuutiogenerointiin verkkokaupan ja automaattisen kehotteen luomiseen kuvista.
Multimodaalisuusmallien tausta
Koneoppimismallit (ML) ovat saavuttaneet merkittäviä edistysaskeleita sellaisilla aloilla kuin luonnollisen kielen käsittely (NLP) ja tietokonenäkö, joissa mallit voivat osoittaa ihmisen kaltaista suorituskykyä analysoida ja tuottaa sisältöä yhdestä tietolähteestä. Viime aikoina on kiinnitetty yhä enemmän huomiota multimodaalisuusmallien kehittämiseen, sillä ne pystyvät käsittelemään ja tuottamaan sisältöä eri modaliteeteilla. Nämä mallit, kuten näkemyksen ja kielen verkostojen fuusio, ovat nousseet esiin, koska ne pystyvät integroimaan tietoa eri lähteistä ja eri tavoista, mikä parantaa niiden ymmärtämistä ja ilmaisukykyä.
Tässä osiossa annamme yleiskatsauksen kahdesta suositusta multimodaalisuusmallista: CLIP (Kontrastiivinen kielikuvan esikoulutus) ja BLIP (Bootstrapping Language-Image esikoulutus).
CLIP malli
CLIP on multimodaalinen visio- ja kielimalli, jota voidaan käyttää kuvan ja tekstin samankaltaisuuteen ja nollakuvan luokitteluun. CLIP on koulutettu 400 miljoonan kuva-teksti-parin tietojoukosta, joka on kerätty useista julkisesti saatavilla olevista Internetin lähteistä. Malliarkkitehtuuri koostuu kuvakooderista ja tekstienkooderista, kuten seuraavassa kaaviossa näkyy.
Harjoittelun aikana kuva ja sitä vastaava tekstinpätkä syötetään enkooderien läpi kuvan piirrevektorin ja tekstin piirrevektorin saamiseksi. Tavoitteena on, että parin kuva- ja tekstiominaisuuksilla on suuri kosinin samankaltaisuus, kun taas yhteensopimattomien parien ominaisuuksilla on alhainen samankaltaisuus. Tämä tapahtuu kontrastihäviön kautta. Tämä kontrastiivinen esikoulutus johtaa enkooderiin, jotka yhdistävät kuvat ja tekstin yhteiseen upotustilaan, jossa semantiikka on kohdistettu.
Enkoodereita voidaan sitten käyttää nolla-shot-siirto-oppimiseen loppupään tehtäviin. Päättelyhetkellä kuvan ja tekstin esiopetettu kooderi käsittelee vastaavan syötteensä ja muuntaa sen korkeaulotteiseksi vektoriesityksenä tai upottamisen. Kuvan ja tekstin upotuksia verrataan sitten niiden samankaltaisuuden, kuten kosinin samankaltaisuuden, määrittämiseksi. Tekstikehote (kuvaluokat, luokat tai tagit), jonka upotus on samankaltaisin (esimerkiksi pienin etäisyys) kuvan upotuksen kanssa, katsotaan osuvimmaksi, ja kuva luokitellaan sen mukaisesti.
BLIP malli
Toinen suosittu multimodaalisuusmalli on BLIP. Se esittelee uuden malliarkkitehtuurin, joka pystyy mukautumaan erilaisiin visiokielen tehtäviin, ja käyttää ainutlaatuista tietojoukon käynnistystekniikkaa oppiakseen meluisista verkkotiedoista. BLIP-arkkitehtuuri sisältää kuvakooderin ja tekstienkooderin: kuvamaadoitettu tekstienkooderi ruiskuttaa visuaalista informaatiota tekstienkooderin muuntajalohkoon ja kuvamaadoitettu tekstidekooderi sisällyttää visuaalisen tiedon muuntajan dekooderilohkoon. Tämän arkkitehtuurin avulla BLIP osoittaa erinomaista suorituskykyä kaikissa visiokielitehtävissä, joihin liittyy visuaalisen ja kielellisen tiedon yhdistäminen kuvapohjaisesta hausta ja sisällön luomisesta interaktiivisiin visuaalisiin dialogijärjestelmiin. Edellisessä viestissä ehdotimme a BLIP-malliin perustuva sisällönvalvontaratkaisu joka ratkaisi useita haasteita käyttämällä tietokonenäön unimodaalisia ML-lähestymistapoja.
Käyttötapaus 1: Zero-shot tagin tai attribuutin luominen verkkokauppaalustalle
Verkkokauppa-alustat toimivat dynaamisina markkinapaikkoina, jotka ovat täynnä ideoita, tuotteita ja palveluita. Kun luettelossa on miljoonia tuotteita, tehokas lajittelu ja luokittelu on merkittävä haaste. Tässä automaattisen taggauksen ja attribuuttien luomisen teho tulee omakseen. Hyödyntämällä kehittyneitä teknologioita, kuten ML ja NLP, nämä automatisoidut prosessit voivat mullistaa verkkokauppaalustojen toiminnan.
Yksi automaattisen taggauksen tai attribuuttien luomisen tärkeimmistä eduista on sen kyky parantaa haettavuutta. Asiakkaat löytävät tarkasti ja tarkasti merkityt tuotteet nopeasti ja tehokkaasti. Jos asiakas esimerkiksi etsii "puuvillakaula-aukoista t-paitaa, jossa on logo edessä", automaattinen koodaus ja attribuuttien luominen mahdollistavat hakukoneen paikantaa tuotteet, jotka eivät vastaa vain laajempaa "t-paita"-luokkaa. mutta myös "puuvillan" ja "miehistön kaulan" erityiset ominaisuudet. Tämä tarkka vastaavuus voi helpottaa yksilöllisempää ostokokemusta ja lisätä asiakastyytyväisyyttä. Lisäksi automaattisesti luodut tunnisteet tai attribuutit voivat parantaa merkittävästi tuotesuositusalgoritmeja. Syvällä tuotteen ominaisuuksien ymmärtämisellä järjestelmä voi ehdottaa asiakkaille osuvampia tuotteita, mikä lisää ostosten todennäköisyyttä ja asiakastyytyväisyyttä.
CLIP tarjoaa lupaavan ratkaisun tunnisteen tai attribuutin luomisprosessin automatisointiin. Se ottaa syötteeksi tuotekuvan ja luettelon kuvauksista tai tunnisteista, luoden vektoriesityksen tai upotuksen jokaiselle tunnisteelle. Nämä upotukset ovat korkeadimensionaalisessa tilassa, ja niiden suhteelliset etäisyydet ja suunnat heijastavat tulojen välisiä semanttisia suhteita. CLIP on esikoulutettu suuressa mittakaavassa kuva-teksti-pareja kapseloimaan nämä merkitykselliset upotukset. Jos tunniste tai attribuutti kuvaa tarkasti kuvaa, niiden upotusten tulee olla suhteellisen lähellä tässä tilassa. Vastaavien tunnisteiden tai attribuuttien luomiseksi luettelo mahdollisista tunnisteista voidaan syöttää CLIP-mallin tekstiosaan ja tallentaa tuloksena olevat upotukset. Ihannetapauksessa tämän luettelon tulisi olla tyhjentävä ja kattaa kaikki mahdolliset luokat ja attribuutit, jotka liittyvät verkkokauppaalustalla oleviin tuotteisiin. Seuraavassa kuvassa on esimerkkejä.
Voit ottaa CLIP-mallin käyttöön SageMakerissa noudattamalla muistikirjaa seuraavassa GitHub repo. Käytämme valmiiksi rakennettua SageMakeria suuret mallipäätelmät (LMI) -säiliöt ottaa mallin käyttöön. LMI-säiliöt käyttävät DJL tarjoilu käyttää malliasi johtopäätösten tekemiseen. Lisätietoja suurten mallien isännöimisestä SageMakerissa on kohdassa Ota suuria malleja käyttöön Amazon SageMakerissa käyttämällä DJLServing- ja DeepSpeed-mallin rinnakkaisjohtopäätöstä ja Ota käyttöön suuria malleja korkealla suorituskyvyllä käyttämällä FasterTransformeria Amazon SageMakerissa.
Tässä esimerkissä tarjoamme tiedostot serving.properties
, model.py
ja requirements.txt
valmistaa malliesineet ja tallentaa ne tarballtiedostoon.
serving.properties
on asetustiedosto, jota voidaan käyttää osoittamaan DJL Servingille, mitä mallien rinnakkais- ja päätelmien optimointikirjastoja haluat käyttää. Tarpeesi mukaan voit määrittää sopivan kokoonpanon. Lisätietoja konfigurointivaihtoehdoista ja kattava luettelo on kohdassa Kokoonpanot ja asetukset.model.py
on skripti, joka käsittelee kaikki käyttöpyynnöt.requirements.txt
on tekstitiedosto, joka sisältää mahdolliset lisäpip-pyörät asennettavaksi.
Jos haluat ladata mallin osoitteesta Halaaminen kasvot suoraan, voit asettaa option.model_id
parametrissa serving.properties
tiedosto mallitietovaraston sisällä isännöidyn valmiiksi koulutetun mallin mallitunnuksena huggingface.co. Säilö käyttää tätä mallitunnusta vastaavan mallin lataamiseen käyttöönoton aikana. Jos asetat model_id
ja Amazonin yksinkertainen tallennuspalvelu (Amazon S3) URL, DJL lataa malliesineet Amazon S3:sta ja vaihtaa model_id
mallin esineiden todelliseen sijaintiin. Voit osoittaa komentosarjassasi tähän arvoon ladataksesi esikoulutetun mallin. Esimerkissämme käytämme jälkimmäistä vaihtoehtoa, koska LMI-säiliö käyttää s5cmd ladata tietoja Amazon S3:sta, mikä vähentää merkittävästi nopeutta ladattaessa malleja käyttöönoton aikana. Katso seuraava koodi:
In malli.py script, lataamme mallin polun käyttämällä ominaisuustiedostossa annettua mallitunnusta:
Kun mallin artefaktit on valmisteltu ja ladattu Amazon S3:een, voit ottaa CLIP-mallin käyttöön SageMaker-isännöimällä muutaman koodirivin avulla:
Kun päätepiste on käytössä, voit kutsua päätepisteen syötekuvan ja nimiöluettelon avulla syöttökehotteena nimiön todennäköisyyksien luomiseksi:
Käyttötapaus 2: Automaattinen kehotteen luominen kuvista
Yksi innovatiivinen sovellus, jossa käytetään multimodaalisuusmalleja, on tuottaa kuvasta informatiivisia kehotteita. Generatiivisessa tekoälyssä a nopea viittaa kielimalliin tai muuhun generatiiviseen malliin syötettyyn syöttöön, joka ohjaa sitä, minkä tyyppistä sisältöä tai vastausta halutaan. Kehote on pohjimmiltaan lähtökohta tai ohjesarja, joka ohjaa mallin luontiprosessia. Se voi olla lauseen, kysymyksen, osittaisen tekstin tai minkä tahansa syötteen muodossa, joka välittää kontekstin tai halutun tulosteen mallille. Hyvin laaditun kehotteen valinta on avainasemassa luotaessa korkealaatuisia kuvia tarkasti ja osuvasti. Nopea suunnittelu on prosessi, jossa optimoidaan tai muokataan tekstisyötteitä haluttujen vastausten saamiseksi kielimallista, johon usein liittyy sanamuotoa, muotoa tai kontekstin säätöä.
Kuvien luomisen nopea suunnittelu asettaa useita haasteita, mukaan lukien seuraavat:
- Määrittele visuaaliset käsitteet tarkasti – Visuaalisten käsitteiden kuvaaminen sanoilla voi joskus olla epätarkkoja tai moniselitteisiä, mikä vaikeuttaa tarkan halutun kuvan välittämistä. Monimutkaisten yksityiskohtien tai monimutkaisten kohtausten vangitseminen tekstikehotteiden avulla ei ehkä ole yksinkertaista.
- Haluttujen tyylien tehokas määrittäminen – Tiettyjen tyyliasetusten, kuten tunnelman, väripaletin tai taiteellisen tyylin, viestiminen voi olla haastavaa pelkän tekstin avulla. Abstraktien esteettisten käsitteiden kääntäminen mallin konkreettisiksi ohjeiksi voi olla hankalaa.
- Monimutkaisuuden tasapainottaminen mallin ylikuormituksen estämiseksi – Tarkat kehotteet voivat hämmentää mallia tai johtaa sen ylikuormitukseen tiedoilla, mikä vaikuttaa luotuun tuotteeseen. On välttämätöntä löytää oikea tasapaino riittävän ohjauksen ja ylivoimaisen monimutkaisuuden välttämisen välillä.
Siksi tehokkaiden kehotteiden luominen kuvan luomista varten on aikaa vievää, mikä vaatii iteratiivista kokeilua ja jalostusta oikean tasapainon löytämiseksi tarkkuuden ja luovuuden välillä, mikä tekee siitä resursseja vaativan tehtävän, joka riippuu suuresti ihmisen asiantuntemuksesta.
- CLIP Interrogator on automaattinen kehotteiden suunnittelutyökalu kuville, joka yhdistää CLIP:n ja BLIP:n optimoimaan tekstikehotteet vastaamaan tiettyä kuvaa. Voit käyttää tuloksena olevia kehotteita tekstistä kuvaksi -mallien kanssa, kuten Vakaa diffuusio luoda siistiä taidetta. CLIP Interrogatorin luomat kehotteet tarjoavat kattavan kuvauksen kuvasta, joka kattaa paitsi sen peruselementit, myös taiteellisen tyylin, kuvan mahdollisen inspiraation, median, jossa kuvaa olisi voitu käyttää tai saatetaan käyttää, ja sen jälkeen. Voit helposti ottaa käyttöön CLIP Interrogator -ratkaisun SageMakerissa virtaviivaistaaksesi käyttöönottoprosessia ja hyödyntääksesi täysin hallitun palvelun tarjoamaa skaalautuvuutta, kustannustehokkuutta ja vankkaa tietoturvaa. Seuraavassa kaaviossa näkyy tämän ratkaisun virtauslogiikka.
Voit käyttää seuraavaa muistikirja ottaaksesi CLIP Interrogator -ratkaisun käyttöön SageMakerissa. Vastaavasti CLIP-mallin isännöinnissä käytämme SageMaker LMI -säilöä ratkaisun isännöimiseen SageMakerissa DJL Servingin avulla. Tässä esimerkissä toimitimme ylimääräisen syöttötiedoston, jossa on malliartefaktit, joka määrittää SageMaker-päätepisteeseen käyttöönotetut mallit. Voit valita erilaisia CLIP- tai BLIP-malleja välittämällä kuvatekstimallin nimen ja leikkeen mallin nimen model_name.json
tiedosto, joka on luotu seuraavalla koodilla:
Päätelmäkäsikirjoitus model.py
sisältää hallintatoiminnon, jonka avulla DJL Serving suorittaa pyyntösi käynnistämällä tämän toiminnon. Tämän aloituskohdan komentosarjan valmistelemiseksi otettiin käyttöön koodi alkuperäisestä clip_interrogator.py tiedosto ja muokattu sitä toimimaan DJL Servingin kanssa SageMaker-isännöinnissä. Yksi päivitys on BLIP-mallin lataaminen. BLIP- ja CLIP-mallit ladataan kautta load_caption_model()
ja load_clip_model()
toimintoa Interrogator-objektin alustuksen aikana. Ladataksemme BLIP-mallin lataamalla ensin mallin artefaktit Hugging Facesta ja ladannut ne Amazon S3:een model_id
ominaisuustiedostossa. Tämä johtuu siitä, että BLIP-malli voi olla suuri tiedosto, kuten blip2-opt-2.7b malli, jonka koko on yli 15 Gt. Mallin lataaminen Hugging Facesta mallin käyttöönoton aikana vaatii enemmän aikaa päätepisteen luomiseen. Siksi osoitamme model_id
BLIP3-mallin Amazon S2 -sijaintiin ja lataa malli ominaisuustiedostossa määritetystä mallipolusta. Huomaa, että käyttöönoton aikana mallipolku vaihdetaan paikalliseen säilöpolkuun, jolle DJL Serving latasi mallin artefaktit Amazon S3 -sijainnista. Katso seuraava koodi:
Koska CLIP-malli ei ole kooltaan kovin suuri, käytämme open_clip
ladataksesi mallin suoraan Hugging Facesta, joka on sama kuin alkuperäinen clip_interrogator
toteutus:
Käytämme samanlaista koodia ottaaksemme käyttöön CLIP Interrogator -ratkaisun SageMaker-päätepisteeseen ja kutsuaksemme päätepisteen syötekuvalla saadaksemme kehotteet, joita voidaan käyttää samanlaisten kuvien luomiseen.
Otetaan esimerkkinä seuraava kuva. Käyttämällä SageMakerissa käyttöön otettua CLIP Interrogator -päätepistettä se luo seuraavan tekstikuvauksen: croissant on a plate, pexels contest winner, aspect ratio 16:9, cgsocietywlop, 8 h, golden cracks, the artist has used bright, picture of a loft in morning, object features, stylized border, pastry, french emperor.
Voimme edelleen yhdistää CLIP Interrogator -ratkaisun vakaaseen diffuusioon ja nopeisiin suunnittelutekniikoihin – luovien mahdollisuuksien kokonaan uusi ulottuvuus ilmaantuu. Tämän integroinnin avulla voimme paitsi kuvata kuvia tekstillä, myös käsitellä ja luoda erilaisia muunnelmia alkuperäisistä kuvista. Vakaa diffuusio varmistaa hallitun kuvasynteesin tarkentamalla tuotettua tulosta iteratiivisesti, ja strateginen nopea suunnittelu ohjaa generointiprosessia kohti haluttuja tuloksia.
In muistikirjan toinen osa, kerromme yksityiskohtaisesti vaiheet nopean suunnittelun käyttämiseksi kuvien uudelleenmuotoilussa Stable Diffusion -mallilla (Stable Diffusion XL 1.0). Käytämme Vakaus AI SDK ottaa tämän mallin käyttöön SageMaker JumpStartista sen jälkeen, kun olet tilannut tämän mallin AWS:ssä markkinat. Koska tämä on uudempi ja parempi versio kuvan luomiseen Vakaus AI, voimme saada korkealaatuisia kuvia alkuperäisen syöttökuvan perusteella. Lisäksi, jos liitämme edellisen kuvauksen eteen ja lisäämme ylimääräisen kehotteen, jossa mainitaan tunnettu taiteilija ja yksi hänen teoksistaan, saamme upeita tuloksia uudelleentyylillä. Seuraava kuva käyttää kehotetta: This scene is a Van Gogh painting with The Starry Night style, croissant on a plate, pexels contest winner, aspect ratio 16:9, cgsocietywlop, 8 h, golden cracks, the artist has used bright, picture of a loft in morning, object features, stylized border, pastry, french emperor.
Seuraava kuva käyttää kehotetta: This scene is a Hokusai painting with The Great Wave off Kanagawa style, croissant on a plate, pexels contest winner, aspect ratio 16:9, cgsocietywlop, 8 h, golden cracks, the artist has used bright, picture of a loft in morning, object features, stylized border, pastry, french emperor.
Yhteenveto
Multimodaalisuusmallit, kuten CLIP ja BLIP, ja niiden sovellukset muuttavat nopeasti kuvasta tekstiksi muuntamisen maisemaa. Siltana visuaalisen ja semanttisen tiedon välistä kuilua, ne tarjoavat meille työkalut, joilla voimme vapauttaa visuaalisen datan valtavan potentiaalin ja hyödyntää sitä tavoilla, joita ei aiemmin ollut kuviteltu.
Tässä postauksessa havainnollistimme multimodaalisuusmallien erilaisia sovelluksia. Nämä vaihtelevat haun tehokkuuden ja tarkkuuden parantamisesta verkkokauppaalustoilla automaattiseen koodaukseen ja luokitteluun kehotteiden luomiseen tekstistä kuvaksi -malleille, kuten Stable Diffusion. Nämä sovellukset avaavat uusia näköaloja ainutlaatuisen ja kiinnostavan sisällön luomiseen. Kannustamme sinua oppimaan lisää tutustumalla SageMakerin erilaisiin multimodaalisuusmalleihin ja rakentamaan yrityksellesi innovatiivinen ratkaisu.
Tietoja Tekijät
Yanwei Cui, PhD, on vanhempi koneoppimisen asiantuntijaratkaisuarkkitehti AWS:ssä. Hän aloitti koneoppimistutkimuksen IRISAssa (Research Institute of Computer Science and Random Systems), ja hänellä on useiden vuosien kokemus tekoälypohjaisten teollisten sovellusten rakentamisesta tietokonenäön, luonnollisen kielen käsittelyn ja online-käyttäjien käyttäytymisen ennustamisessa. AWS:ssä hän jakaa verkkoalueen asiantuntemustaan ja auttaa asiakkaita avaamaan liiketoimintamahdollisuuksia ja saavuttamaan toimivia tuloksia laajan koneoppimisen avulla. Työn ulkopuolella hän nauttii lukemisesta ja matkustamisesta.
Raghu Ramesha on vanhempi ML-ratkaisuarkkitehti Amazon SageMaker Service -tiimissä. Hän keskittyy auttamaan asiakkaita rakentamaan, ottamaan käyttöön ja siirtämään ML-tuotannon työmäärät SageMakeriin suuressa mittakaavassa. Hän on erikoistunut koneoppimiseen, tekoälyyn ja tietokonenäköalueisiin, ja hänellä on tietojenkäsittelytieteen maisterin tutkinto UT Dallasista. Vapaa-ajallaan hän nauttii matkustamisesta ja valokuvaamisesta.
Sam Edwards, on pilvi-insinööri (AI/ML) AWS Sydneyssä ja on erikoistunut koneoppimiseen ja Amazon SageMakeriin. Hän haluaa auttaa asiakkaita ratkaisemaan koneoppimisen työnkulkuihin liittyviä ongelmia ja luomaan heille uusia ratkaisuja. Työn ulkopuolella hän harrastaa mailaurheilua ja matkustamista.
Melanie Li, PhD, on vanhempi AI/ML-asiantuntija TAM AWS:ssä Sydneyssä, Australiassa. Hän auttaa yritysasiakkaita rakentamaan ratkaisuja uusimpien AI/ML-työkalujen avulla AWS:ssä ja opastaa ML-ratkaisujen suunnittelussa ja toteuttamisessa parhaiden käytäntöjen avulla. Vapaa-ajallaan hän rakastaa tutkia luontoa ja viettää aikaa perheen ja ystävien kanssa.
Gordon Wang on AWS:n vanhempi AI/ML-asiantuntija TAM. Hän tukee strategisia asiakkaita AI/ML parhailla käytännöillä monilla toimialoilla. Hän on intohimoinen tietokonenäöstä, NLP:stä, generatiivisesta tekoälystä ja MLOpsista. Vapaa-ajallaan hän rakastaa juoksemista ja patikointia.
Dhawal Patel on AWS:n koneoppimisarkkitehti. Hän on työskennellyt organisaatioiden kanssa suurista yrityksistä keskikokoisiin startup-yrityksiin hajautettuun tietojenkäsittelyyn ja tekoälyyn liittyvien ongelmien parissa. Hän keskittyy syväoppimiseen, mukaan lukien NLP- ja Computer Vision -alueet. Hän auttaa asiakkaita tekemään korkean suorituskyvyn mallipäätelmiä SageMakerissa.
- SEO-pohjainen sisällön ja PR-jakelu. Vahvista jo tänään.
- PlatoData.Network Vertical Generatiivinen Ai. Vahvista itseäsi. Pääsy tästä.
- PlatoAiStream. Web3 Intelligence. Tietoa laajennettu. Pääsy tästä.
- PlatoESG. hiili, CleanTech, energia, ympäristö, Aurinko, Jätehuolto. Pääsy tästä.
- PlatonHealth. Biotekniikan ja kliinisten kokeiden älykkyys. Pääsy tästä.
- Lähde: https://aws.amazon.com/blogs/machine-learning/build-an-image-to-text-generative-ai-application-using-multimodality-models-on-amazon-sagemaker/
- :on
- :On
- :ei
- :missä
- 1
- 10
- 100
- 12
- 15%
- 16
- 400
- 7
- 8
- 9
- 97
- a
- kyky
- Meistä
- TIIVISTELMÄ
- sen mukaisesti
- tarkkuus
- tarkasti
- Saavuttaa
- saavutettu
- poikki
- todellinen
- lisätä
- lisä-
- Lisäksi
- osoitettu
- oikaisut
- hyväksytty
- kehittynyt
- edistysaskeleet
- Etu
- vaikuttavat
- Jälkeen
- AI
- AI-käyttöinen
- AI / ML
- algoritmit
- linjassa
- Kaikki
- mahdollistaa
- yksin
- Myös
- hämmästyttävä
- Amazon
- Amazon Sage Maker
- Amazon Web Services
- an
- analysointi
- ja
- Kaikki
- Hakemus
- sovellukset
- lähestymistavat
- sopiva
- arkkitehtuuri
- OVAT
- Art
- keinotekoinen
- tekoäly
- taiteilija
- taiteellinen
- AS
- ulkomuoto
- auttaa
- At
- huomio
- attribuutteja
- Australia
- automatisoida
- Automatisoitu
- automaattisesti
- automatisointi
- saatavissa
- välttämällä
- AWS
- Balance
- perustua
- BE
- koska
- ollut
- käyttäytyminen
- takana
- Hyödyt
- PARAS
- parhaat käytännöt
- Paremmin
- välillä
- Jälkeen
- Iso
- Tukkia
- elin
- edistää
- reunus
- siltana
- Kirkas
- laajempaa
- rakentaa
- Rakentaminen
- liiketoiminta
- mutta
- by
- CAN
- Voi saada
- kyvyt
- kykenee
- Kaappaaminen
- tapaus
- KISSA
- luokat
- Kategoria
- Kissat
- haaste
- haasteet
- haastava
- valinta
- Valita
- luokat
- luokittelu
- luokiteltu
- lähellä
- pilvi
- koodi
- väri
- yhdistää
- yhdistää
- tulee
- Yhteinen
- viestiä
- verrattuna
- monimutkainen
- monimutkaisuus
- kattava
- tietokone
- Tietojenkäsittelyoppi
- Tietokoneen visio
- tietojenkäsittely
- käsitteet
- Konfigurointi
- harkittu
- muodostuu
- sisälsi
- Kontti
- Kontit
- sisältää
- pitoisuus
- Sisällön luominen
- tausta
- hallinnassa
- Muuntaminen
- Viileä
- vastaava
- voisi
- päällyste
- luoda
- luotu
- Luominen
- luominen
- Luova
- luovuus
- kriittinen
- Ylittää
- asiakas
- Asiakastyytyväisyys
- Asiakkaat
- Dallas
- tiedot
- syvä
- syvä oppiminen
- syvempää
- Aste
- kaivaa
- osoittaa
- osoittaa
- Riippuen
- sijoittaa
- käyttöön
- käyttöönotto
- kuvata
- kuvaus
- haluttu
- yksityiskohta
- yksityiskohdat
- Määrittää
- Kehitys
- laite
- Vuoropuhelu
- eri
- vaikea
- Diffuusio
- digitaalinen
- Ulottuvuus
- suoraan
- pohtia
- etäisyys
- jaettu
- hajautettu laskenta
- useat
- verkkotunnuksen
- verkkotunnuksia
- tehty
- download
- ajaa
- kaksi
- aikana
- dynaaminen
- kukin
- helposti
- verkkokaupan
- Tehokas
- tehokkuus
- tehokkaasti
- Kehittää
- elementtejä
- muu
- upottamisen
- syntyminen
- syntyy
- työllistää
- mahdollistaa
- kannustaa
- päätepiste
- harjoittaa
- Moottori
- insinööri
- Tekniikka
- parantaa
- parantaa
- varmistaa
- yritys
- yrityksille
- merkintä
- Aikakausi
- olennainen
- olennaisesti
- esimerkki
- Esimerkit
- näyttely
- olla
- experience
- asiantuntemus
- tutkia
- Tutkiminen
- lauseke
- Kasvot
- helpottamaan
- perhe
- Ominaisuus
- Ominaisuudet
- Fed
- harvat
- Fields
- Kuva
- filee
- Asiakirjat
- Etunimi
- virtaus
- keskittyy
- tarkennus
- seurata
- jälkeen
- varten
- muoto
- muoto
- lomakkeet
- löytyi
- Ilmainen
- Ranskan
- ystäviä
- alkaen
- etuosa
- täysin
- toiminto
- perus-
- edelleen
- Lisäksi
- fuusio
- saadut
- kuilu
- tuottaa
- syntyy
- synnyttää
- tuottaa
- sukupolvi
- generatiivinen
- Generatiivinen AI
- saada
- tietty
- tavoite
- Kultainen
- suuri
- ohjaus
- Oppaat
- kahva
- Vetimet
- valjaat
- valjastaminen
- Olla
- he
- raskaasti
- auttaa
- auttaa
- hänen
- Korkea
- korkealaatuisia
- hänen
- pitää
- Horizons
- isäntä
- isännöi
- hotellit
- Miten
- Miten
- HTML
- http
- HTTPS
- ihmisen
- ID
- ihannetapauksessa
- ideoita
- if
- kuva
- Kuvaluokitus
- kuvien
- täytäntöönpano
- täytäntöönpanosta
- tuoda
- parantaa
- parantaminen
- in
- mukana
- sisältää
- Mukaan lukien
- lisää
- osoittaa
- teollinen
- teollisuuden
- tiedot
- informatiivinen
- innovatiivinen
- panos
- tuloa
- sisällä
- Inspiraatio
- asentaa
- esimerkki
- Instituutti
- ohjeet
- yhdistää
- integraatio
- Älykkyys
- vuorovaikutteinen
- Internet
- tulee
- Esittelee
- aiheuttaa
- johon
- kysymykset
- IT
- SEN
- jpg
- json
- avain
- tunnettu
- Merkki
- tarrat
- Landschaft
- Kieli
- suuri
- Suuret yritykset
- johtaa
- OPPIA
- oppiminen
- Li
- kirjastot
- piilee
- pitää
- todennäköisyys
- linjat
- Lista
- lueteltu
- kuormitus
- lastaus
- paikallinen
- sijainti
- logiikka
- logo
- pois
- rakastaa
- Matala
- kone
- koneoppiminen
- tehdä
- Tekeminen
- onnistui
- monet
- kartta
- markkinapaikkojen
- maisterin
- ottelu
- Hyväksytty
- matching
- mielekäs
- keskikokoinen
- vain
- ehkä
- vaeltaa
- miljoona
- miljoonia
- ML
- MLOps
- malli
- mallit
- maltillisuus
- muokattu
- lisää
- Lisäksi
- Aamu
- eniten
- moninkertainen
- nimi
- Luonnollinen
- Luonnollinen kielen käsittely
- luonto
- Tarve
- verkot
- Uusi
- uusia näköaloja
- yön
- NLP
- Ei eristetty
- muistikirja
- romaani
- objekti
- of
- pois
- kampanja
- Tarjoukset
- usein
- on
- ONE
- verkossa
- vain
- avata
- Operations
- optimointi
- Optimoida
- optimoimalla
- Vaihtoehto
- Vaihtoehdot
- or
- organisaatioiden
- alkuperäinen
- OS
- Muut
- meidän
- tuloksiin
- ulostulo
- ulkopuolella
- erinomainen
- yleiskatsaus
- ylivoimainen
- oma
- maalaus
- pari
- paria
- paletti
- Parallel
- parametri
- osa
- erityisesti
- Ohimenevä
- intohimoinen
- polku
- suorituskyky
- yksilöllinen
- phd
- kuva
- valokuvaus
- kuva
- keskeinen
- foorumi
- Platforms
- Platon
- Platonin tietotieto
- PlatonData
- pelaa
- pistoke
- Kohta
- Suosittu
- aiheuttaa
- mahdollisuuksia
- Kirje
- mahdollinen
- potentiaalit
- teho
- käytännöt
- tarkka
- Tarkkuus
- ennustus
- mieltymykset
- Valmistella
- valmis
- estää
- edellinen
- aiemmin
- Pääasiallinen
- ongelmia
- prosessi
- Prosessit
- käsittely
- Tuotteet
- tuotanto
- Tuotteemme
- huomattava asema
- lupaava
- ominaisuudet
- omaisuus
- ehdotettu
- toimittaa
- mikäli
- tarjoaa
- tarjoamalla
- julkisesti
- ostot
- kysymys
- satunnainen
- alue
- alainen
- nopeasti
- suhde
- Lukeminen
- todellinen maailma
- äskettäin
- Suositus
- vähentää
- katso
- viittaa
- jalostus
- heijastava
- alue
- liittyvä
- Ihmissuhteet
- suhteellinen
- suhteellisesti
- Merkitys
- merkityksellinen
- huomattava
- säilytyspaikka
- edustus
- pyyntö
- pyynnöt
- edellyttää
- Vaatii
- tutkimus
- resursseja kuluttava
- ne
- vastaus
- vasteet
- Saatu ja
- tulokset
- palata
- mullistaa
- oikein
- luja
- ajaa
- juoksu
- sagemaker
- sama
- tyytyväisyys
- skaalautuvuus
- Asteikko
- skenaariot
- kohtaus
- kohtaukset
- tiede
- käsikirjoitus
- Haku
- hakukone
- haku
- Osa
- turvallisuus
- nähdä
- SELF
- semantiikka
- vanhempi
- tuomita
- palvella
- palvelu
- Palvelut
- palvelevat
- setti
- useat
- osakkeet
- hän
- Ostokset
- shouldnt
- esitetty
- Näytä
- merkittävä
- merkittävästi
- samankaltainen
- samalla lailla
- Yksinkertainen
- single
- Koko
- pätkä
- ratkaisu
- Ratkaisumme
- SOLVE
- jonkin verran
- joskus
- lähde
- Lähteet
- Tila
- asiantuntija
- erikoistunut
- erikoistunut
- erityinen
- määritelty
- spektri
- nopeus
- viettää
- Urheilu
- vakaa
- tähtikirkas
- alkoi
- Aloita
- Startups
- huippu-
- Askeleet
- Levytila
- verkkokaupasta
- tallennettu
- suora
- Strateginen
- tehostaa
- lakko
- tyyli
- merkittävästi
- niin
- riittävä
- ehdottaa
- Tukee
- vaihtaa
- nopeasti
- sydney
- järjestelmä
- järjestelmät
- TAG
- ottaa
- vie
- Kohde
- Tehtävä
- tehtävät
- joukkue-
- tekniikka
- Technologies
- sapluuna
- teksti
- teksti-
- kuin
- että
- -
- Maisema
- heidän
- Niitä
- sitten
- Siellä.
- siten
- siksi
- Nämä
- ne
- tätä
- Kautta
- aika
- otsikot
- että
- työkalu
- työkalut
- kohti
- koulutettu
- koulutus
- siirtää
- muuntaja
- muuttamassa
- muunnoksia
- Matkustaminen
- kaksi
- tyyppi
- ymmärtäminen
- käsittämättömän
- unique
- avata
- Päivitykset
- ladattu
- URL
- us
- käyttää
- käytetty
- käyttäjä
- Käyttäjäkokemus
- käyttötarkoituksiin
- käyttämällä
- arvo
- lajike
- eri
- valtava
- versio
- hyvin
- kautta
- visio
- W
- haluta
- Aalto
- tavalla
- we
- Rikkaus
- verkko
- verkkopalvelut
- olivat
- Mitä
- kun
- joka
- vaikka
- koko
- jonka
- tulee
- voittaja
- with
- sanamuoto
- sanoja
- Referenssit
- työskenteli
- työnkulkuja
- toimii
- olisi
- vuotta
- Voit
- Sinun
- zephyrnet