Ideogram on uusi AI-kuvageneraattori, joka poistaa kilpailun, ylittää MidJourneyn ja Dall-E 3:n - Pura salaus

Ideogram on uusi AI-kuvageneraattori, joka poistaa kilpailun, ylittää MidJourneyn ja Dall-E 3:n – Pura salaus

Ideogram AI – startup, jonka perustivat entiset Googlen insinöörit sekä jäseniä arvostetuista oppilaitoksista, kuten UC Berkeley, Carnegie Mellon University ja Toronton yliopisto – on ilmoittanut julkaisevansa ensimmäisen täyden version samannimisestä kuvageneraattoristaan.

"Olemme innoissamme voidessamme julkaista Ideogram 1.0:n, joka on tähän mennessä edistynein tekstistä kuvaksi -mallimme", Ideogram AI sanoi virallisessa blogi. "Nullasta opetettu, kuten kaikki Ideogram-mallit, Ideogram 1.0 tarjoaa huippuluokan tekstintoiston, ennennäkemättömän fotorealismin ja nopean kiinnittymisen - sekä uuden ominaisuuden nimeltä Magic Prompt, jonka avulla voit kirjoittaa yksityiskohtaisia ​​kehotteita kauniita, luovia kuvia varten."

Julkaisuun liittyy uutisia 80 miljoonan dollarin A-sarjan varainkeruusta, jota johti Andreessen Horowitz yhdessä Redpoint Venturesin, Pear VC:n ja SV Angelin kanssa.

Pura pystyi testaamaan mallia, ja Ideogram AI:n väitteet eivät ole villisti liioiteltuja - rinnakkainen vertailu löytyy alta. Ideogramin versio yksi on selkeä parannus sen edeltäjiin v0.1 ja v0.2: se on erinomainen nopean kiinnittymisen, kuvanlaadun ja tekstin luontiominaisuuksien suhteen.

Malli ei ole avoimen lähdekoodin lähde, joten sen putkistojen näkyvyys on rajallinen, eikä arvioitavaa tutkimuspaperia ole. Mutta mallilla saadut tulokset puhuivat puolestaan, mikä saattaa tehdä siitä parhaan tällä hetkellä saatavilla olevan mallin - ainakin tähän asti Vakaa diffuusio 3 julkaistaan ​​julkisesti.

Uusi malli on luultavasti tehokkain kuvageneraattori tekstiominaisuuksien suhteen, ja se tuottaa pidempiä tekstijonoja vähemmillä virheillä kuin Dall-E 3 tai MidJourney. Nykyinen ilmainen taso antaa sille myös etulyöntiaseman kilpailijoihin, kuten Dall-E 3 ja MidJourney, nähden, joista jälkimmäisellä ei ole vapaata tasoa. Microsoft Copilot käyttää myös Dall-E 3:a, mutta se luo vain neliömäisiä 1:1-kuvia, kun taas Ideogram tukee laajempaa kuvasuhdetta.

Ideogrammi tarjoaa myös kaksi maksettua suunnitelmaa 7 dollaria ja 15 dollaria kuukaudessa, jotka tarjoavat pääsyn yli 400 sukupolveen päivässä sekä muita etuja, kuten kuvankäsittelyohjelma, laadukkaammat lataukset, img2img, joka mahdollistaa olemassa olevan kuvan muokkaukset tai muunnelmat, sekä yksityisiä sukupolvia. Kaikki alemmat tasot näyttävät pyydetyt kuvat julkisesti.

Ideogrammi pystyy ymmärtämään pitkiä kehotteita, siirtymään varpaisiin Stable Diffusion 3:lla ja päihittämään kaikki muut tämän alan kuvageneraattorit.

Yksi Ideogrammin erottuvista ominaisuuksista on "Prompt Magic", joka voidaan kytkeä päälle ja pois päältä. Tämä ominaisuus analysoi kehotteen ja parantaa sitä luomaan parempilaatuisia kuvia, mikä antaa mallille kyvyn ymmärtää luonnollista kieltä, kuten Dall-E 3. Ideogrammi on kuitenkin monipuolisempi, koska tämä ominaisuus on valinnainen. Se on aina päällä ChatGPT Plus:lla, mikä joskus johtaa epätarkkuuksiin.

Lopuksi Ideogrammia sensuroidaan vähemmän aggressiivisesti kuin MidJourney ja Dall-E 3, ja se pystyy toistaiseksi luomaan kuvia kuuluisista ihmisistä, yritysten logoista ja taidetyyleistä. Se ei mene täysin NSFW:hen, mutta se on diskreettimpi sensurointikehotteiden suhteen.

Ja varhaiset testaajat näyttävät suosivan Ideogrammia muihin malleihin verrattuna. "Käyttäen DALL·E 3:n kaltaista arviointiprotokollaa huomaamme, että arvioijat pitävät Ideogram 1.0:aa parempana kuin DALL·E 3:a ja Midjourney V6:ta nopean kohdistuksen, kuvan koherenssin, yleisen mieltymyksen ja tekstin toiston laadun suhteen", startup sanoi.

Side by Side -vertailu: Ideogrammi vs MidJourney vs Dall-E 3

Pura testasi Ideogramin ominaisuuksia ja vertasi sitä sen huippukilpailijoihin MidJourney ja Dall-E 3. Stable Diffusion 3 ja Googlen huippu ImageFX ei arvioida täällä, koska SD3:a ei ole vielä julkaistu eikä ImageFX ole laajalti saatavilla.

Pitkien tekstijonojen luominen

Kehote: Futuristinen Android Cyberpunk Cityssä, jossa on kyltti, jossa lukee "Älä myöhästy tekoälytrendissä: Emerge by Decrypt"

Sukupolvet Ideogrammilla (vasemmalla), MidJourneylla (keskellä) ja Dall-e 3:lla (oikealla)
Sukupolvet Ideogrammilla (vasemmalla), MidJourneylla (keskellä) ja Dall-E 3:lla (oikealla).

Ideogram AI pystyi esittämään sekä pyydetyn estetiikan että tekstin. Siinä oli kuitenkin kirjoitusvirhe, joka loi sanan "thee" sanan "the" sijaan.

MidJourney ei pystynyt luomaan johdonmukaista tekstiä ollenkaan ja keskittyi luomaan futuristisen androidin yksityiskohtaisesti. Se on koko sävellyksen pääaihe. Kaupunki ei ole lainkaan kyberpunkia.

Dall-E 3 on keskellä. Se pystyi luomaan futuristisen robotin, kaupunki on kyberpunk, mutta kyltissä ei ollut sanaa "Emerge".

Mielenkiintoista kyllä, Ideogram ymmärsi, että robotti oli kaupungissa ja liittyi kylttiin, kun taas Dall-E oletti, että kyltti oli osa kaupunkikuvaa.

Pitkät kehotteet ja tilaominaisuudet

Kehotus: Surrealistinen ja kiehtova kohtaus, jossa kissa istuu television päällä "Emerge" -kyltin vieressä. Taustalla toisella puolella seisoo futuristinen androidi ja toisella astronautti. Huoneen seiniä koristaa silmiinpistävä kuva molekyylistä ja DNA-ketjusta.

Ideogram on uusi tekoälykuvageneraattori, joka hävittää kilpailun, ylittää MidJourneyn ja Dall-E 3:n - Pura PlatoBlockchain Data Intelligence -salauksen. Pystysuuntainen haku. Ai.
Sukupolvet Ideogrammilla (ylhäällä), MidJourneylla (vasemmalla alhaalla) ja Dall-e 3:lla (alhaalla oikealla)

Ideogrammi oli ylivoimaisesti paras yleisgeneraattori. Se ymmärsi kehotteen jokaisen osan, loi tekstin ilman kirjoitusvirheitä, ymmärsi jokaisen elementin sijainnin kissa television päällä, kyltti sen vieressä, androidi ja astronautti kummallakin puolella ja jopa ymmärsi, että taustalla täytyy olla molekyyli ja DNA-ketju.

MidJourneyn estetiikka ei ollut surrealistinen, vaan pikemminkin hyperrealistinen. Se loi sanan "Emerge", mutta laittoi sen televisioon, eikä luonut merkkiä. Kissa on myös television vieressä eikä sen päällä. Se ei luonut Androidia eikä noudattanut taustakehotetta, vaan loi sen sijaan sellaisen, joka sopi paremmin sävellyksen estetiikkaan ja antoi aiheelle (kissalle) enemmän painoarvoa kokonaiskuvaan nähden.

Dall-E 3 säilytti tyypillisen sarjakuvatyylinsä eikä pystynyt noudattamaan kehotusta täysin. Sillä on enemmän tilan ymmärtämistä ja nopeaa kiinnittymistä kuin MidJourneylla, mutta paljon vähemmän kuin Ideogrammilla. Se kuitenkin häviää tyylin suhteen. Se loi kissan television päälle, mutta ei onnistunut luomaan Emerge-merkkiä kissan viereen. Se ei luonut Androidia, eikä seurannut kehotteita luodessaan taustaa.

Sensuuri

Kehotus: Kuuma, seksikäs tyttö.

Sukupolvet Ideogrammilla (vasemmalla), MidJourneylla (keskellä) ja Dall-e 3:lla (oikealla)
Sukupolvet Ideogrammilla (vasemmalla), MidJourneylla (keskellä) ja Dall-e 3:lla (oikealla)

Kehote ei sisällä kieltä, joka voitaisiin tulkita vihapuheeksi tai herjaukseksi, saati erityisesti seksuaaliseksi. Loppujen lopuksi "kuuma, seksikäs tyttö" voi olla täysin pukeutunut, eikä sitä seksualisoida aggressiivisesti.

Ideogram AI ymmärsi kehotteen ja loi kuvan, joka vastasi ohjeita. Ideogrammissa on kuitenkin tekoälymoderaattori, joka laukeaa, kun käytetään selvempiä sanoja, jotka johtavat välittömästi sensuroituun sukupolveen (esimerkiksi sukuelinten slangisanat tai tunnisteet, kuten alaston, alaston jne.).

Sekä MidJourney että Dall-E 3 eivät puolestaan ​​onnistuneet luomaan kuvaa ja kielsivät sanat, vaikka ne eivät olisi johtaneet NSFW-sukupolveen.

Ideogrammi näyttää olevan sensuurin kohdennetumpi, ja luotu kuva - NSFW tai muuten kyseenalainen - on mahdollista nähdä ennen kuin sovellus nappaa sen.

Kuuluisia ihmisiä ja tekijänoikeuksilla suojattuja kuvia

Kehotus: Onnellinen Joe Biden ja Vladimir Putin seinän edessä, jossa on teksti "Poista salaus" kädestä pitäen.

Sukupolvet Ideogrammilla (ylhäällä), Dall-e 3:lla (vasemmalla alhaalla) ja MidJourneylla (alhaalla oikealla)
Sukupolvet Ideogrammilla (ylhäällä), Dall-e 3:lla (vasemmalla alhaalla) ja MidJourneylla (alhaalla oikealla)

Ideogram AI loi kuvan, teksti on oikea, skenaario on realistinen ja hahmot ovat helposti tunnistettavissa (vaikka ei 100% tarkkoja.

Dall-E 3 loi kuvan, mutta Bideniä ei ole helppo tunnistaa, ja Trump voidaan tunnistaa vain hänen ominaisen hiustyylinsä perusteella. Teksti ei ole oikea, ja maisemat eivät ole realistisia, vaan ovat sarjakuvallisia.

MidJourney kieltäytyi luomasta kuvaa.

Yhteenveto

Ilmainen ja laajalti portin ulkopuolella saatavilla oleva Ideogram saattaa olla markkinoiden paras kuvageneraattori. Se on erinomainen luonnollisen kielen ymmärtämisessä, ja sillä on erinomaiset tilaominaisuudet ja nopea sitoutuminen. Se on myös paras tällä hetkellä saatavilla oleva tekstigeneraattori.

Jos estetiikka on tärkein näkökohta – siihen pisteeseen, jossa kiinnitys ja teksti ovat vähemmän tärkeitä – MidJourney saattaa pysyä vakaana kilpailijana tietyissä käyttötapauksissa. Vaikka Dall-E 3 ei ole erityisen vahva ja sensuroitu, se voi silti olla järkevä osana ChatGPT Plus -tilausta.

Ideogram AI on toistaiseksi kärjessä kuvageneraattoreiden työkalupakkissamme.

Muokannut Ryan Ozawa.

Pysy ajan tasalla kryptouutisista, saat päivittäiset päivitykset postilaatikkoosi.

Aikaleima:

Lisää aiheesta Pura