Taide ei ole kuollut, se on vain koneella valmistettua

Julkaissut Platon

seuraajia: 0

Miksi tekoälymallit korvaavat taiteilijat kauan ennen kuin ne korvaavat ohjelmoijia

Kenties järkyttävin oivallus, jonka näemme generatiivisesta tekoälystä, on se, että toisin kuin yleinen näkemys, jonka mukaan luovuus on viimeinen ihmisen kekseliäisyyden linnake automaation edessä, se itse asiassa näyttää olevan paljon helpompaa automatisoida melko vaikeita luovia tehtäviä kuin automatisoida suhteellisen yksinkertaisia ohjelmointitehtäviä. Saadaksemme käsityksen tästä vertaamme kahta suositumpaa generatiivisen tekoälyn käyttötapausta: koodin luominen ja kuvan luominen. Mutta uskomme väitteen pätevän yleisemminkin, vaikka generatiiviset mallit laajenevat monimutkaisempiin sovelluksiin.

Väitteen lyhyt versio (jota käsittelemme tarkemmin alla) on, että vaikka tuote pitää GitHub Copilot, nykyisessä muodossaan, voi tehdä koodauksesta jonkin verran tehokkaampaa, se ei poista tarvetta osaaville ohjelmistokehittäjille, joilla on ohjelmointiosaamista. Yksi suuri syy on se, että kun on kyse ohjelman rakentamisesta, oikeellisuus on todella tärkeää. Jos tekoäly luo ohjelman, se vaatii silti ihmisen varmistamaan sen oikeellisuuden – ponnistus on lähes samalla tasolla kuin sen luominen alun perin.

Toisaalta jokainen, joka osaa kirjoittaa, voi käyttää mallia, kuten Vakaa diffuusio tuottaa korkealaatuisia, ainutlaatuisia kuvia minuuteissa, useita suuruusluokkaa pienemmillä kustannuksilla. Luovan työn tuotteilla ei useinkaan ole tiukkoja oikeellisuusrajoituksia, ja mallien tuotokset ovat hämmästyttävän täydellisiä. On vaikea olla näkemättä täydellistä vaihemuutosta luoviin visuaaleihin luotettavilla aloilla, koska moniin käyttötarkoituksiin tekoälyn tuottamat visuaalit ovat jo riittävät, ja olemme vielä tekniikan alkuvaiheessa.

Myönnämme täysin, että on vaikea luottaa mihinkään ennusteisiin kentän etenemisvauhdilla. Tällä hetkellä näyttää kuitenkin siltä, että näemme paljon todennäköisemmin sovelluksia, jotka ovat täynnä tiukasti ohjelmoijien luomia luovia kuvia, kuin sovelluksia, joissa on ihmisten suunnittelemaa taidetta, jonka tekijät ovat tiukasti rakentaneet.

Miksi hype ja miksi nyt?

Ennen kuin käsittelemme koodin luomisen ja kuvan luomisen erityispiirteitä, on hyödyllistä saada käsitys siitä, kuinka suosittu tekoäly yleisesti ja erityisesti generatiivinen tekoäly ovat tällä hetkellä.

Generatiivinen tekoäly on nopeimmin omaksumassa kehittäjät, joita olemme koskaan nähneet. Tätä kirjoittaessamme Stable Diffusion on helposti GitHub-arkistojen trendilistojen kärjessä laajalla marginaalilla. Sen kasvu on paljon edellä mitään viimeaikaista infrastruktuuri- tai kryptoteknologiaa (katso yllä oleva kuva). Teknologiaa käyttävien startup-yritysten lanseeraus- ja rahoitusilmoituksia tulee lähes päivittäin, ja online-sosiaaliset verkostot tulvii generatiivisten mallien luomaa sisältöä.

Tekoälyinvestointien yleistä tasoa viimeisen vuosikymmenen aikana on myös vaikea yliarvioida. Pelkästään julkaisujen määrä on kasvanut eksponentiaalisesti 2010-luvun puolivälistä lähtien (katso alla oleva kuva). Nykyään noin 20 % kaikista arXiviin lähetetyistä artikkeleista koskee tekoälyä, ML:tä ja NLP:tä. Tärkeää on, että teoreettiset tulokset ovat ylittäneet kriittisen kynnyksen, jossa ne ovat tulleet helposti kulutettaviksi ja laukaisivat uusien tekniikoiden, ohjelmistojen ja startup-yritysten kambrikauden räjähdyksen.

Viimeisin piikki yllä olevassa kuvassa johtuu suurelta osin generatiivisesta tekoälystä. Yhdessä vuosikymmenessä olemme siirtyneet asiantuntijoille tarkoitetuista tekoälymalleista, jotka pystyivät luokittelemaan kuvia ja luomaan sanan upotuksia, julkisiin malleihin, jotka voivat kirjoittaa tehokasta koodia ja luoda erittäin tarkkoja kuvia käyttämällä luonnollisen kielen kehotteita. Ei ole yllätys, että innovaatiovauhti on vain kiihtynyt, eikä pitäisi olla yllätys, kun generatiiviset mallit alkavat tunkeutua muille ihmisille aikoinaan hallitsemille alueille.

Generatiivinen tekoäly ja ohjelmointi

Yksi varhaisimmista generatiivisen tekoälyn käytöstä on ollut ohjelmoijan apuväline. Se toimii siten, että malli opetetaan suurelle koodikokoelmalle (esim. kaikki julkiset repot GitHubissa) ja tekee sitten ohjelmoijalle ehdotuksen, kun he koodaavat. Tulokset ovat erinomaisia. Niin paljon, että on järkevää, että tästä lähestymistavasta tulee jatkossa ohjelmoinnin synonyymi.

Taide ei ole kuollut, se on vain koneella luotua PlatoBlockchain-tietoälyä. Pystysuuntainen haku. Ai. — Luotu koodi: suojattu hyökkäyksiltä, jotka eivät käytä puolipisteitä.

Tuottavuuden kasvu on kuitenkin ollut vaatimatonta suhteessa kuvan tuottamiseen, jota käsittelemme alla. Osa syy tähän, kuten edellä mainittiin, on se, että ohjelmoinnissa oikein on kriittinen merkitys (ja itse asiassa suunnitteluongelmissa laajemminkin, mutta tässä viestissä keskitymme ohjelmointiin). Esimerkiksi, äskettäin löydetty tutkimus että skenaarioissa, jotka vastaavat suurta riskiä CWE:t (yleiset heikkouksien luettelot)40 % tekoälyn luomasta koodista sisälsi haavoittuvuuksia.

Siten käyttäjän on löydettävä tasapaino sen välillä, että hän tuottaa tarpeeksi koodia tuottavuuden lisäämiseksi, mutta silti rajoittaa sitä, jotta on mahdollista tarkistaa asian oikeellisuus. Tämän seurauksena Copilotilla on auttanut parantaa kehittäjien tuottavuutta – viimeaikaiset tutkimukset (tätä ja tätä) tuo voittoja luokkaa 2x tai vähemmän – mutta samalla tasolla kuin olemme nähneet aiemmissa kehittäjäkielissä ja työkaluissa. Esimerkiksi hyppy kokoonpanosta C:hen paransi tuottavuutta joidenkin arvioiden mukaan 2-5x.

Kokeneemman ohjelmoijan huolenaiheet saattavat ulottua koodin oikeellisuuden lisäksi koodin yleiseen laatuun. Kuten nopeasti.aion Jeremy Howard on selittänyt mitä tulee OpenAI Codex -mallin uusimpiin versioihin, "[En] kirjoita monisanaista koodia, koska se tuottaa keskimäärin koodi. Minulle keskimääräisen koodin ottaminen ja tekeminen sellaiseksi koodiksi, josta pidän ja jonka tiedän olevan oikea, on paljon hitaampaa kuin pelkkä sen kirjoittaminen tyhjästä - ainakin niillä kielillä, jotka tunnen hyvin."

Joten vaikka on selvää, että generatiivinen ohjelmointi on askelfunktio kehittäjien tuottavuudessa, ei ole selvää, että parannus eroaa dramaattisesti aiemmin havaituista. Generatiivinen tekoäly tekee parempia ohjelmoijia, mutta silti heidän täytyy ohjelmoida.

Generatiivinen tekoäly ja visuaalisuus

Toisaalta generatiivisten mallien vaikutus luovan työn tuottoon, kuten kuvan luomiseen, on äärimmäinen. Se on johtanut useisiin suuruusluokkiin tehokkuuden ja kustannusten parannuksiin, ja on vaikea olla huomaamatta, että se johtaa alan laajuiseen vaiheen muutokseen.

Tapa, jolla generatiivinen tekoäly toimii tässä tilassa, on ottaa käyttäjältä yksinkertaisia tekstisyötteitä, joita kutsutaan kehotteiksi, ja sitten malli luo visuaalisen tulosteen. Tällä hetkellä on olemassa malleja monien tulostusmuotojen luomiseen, mukaan lukien kuvat, videot, 3D-mallit ja tekstuurit.

Erityisen mielenkiintoista on se, kuinka näitä malleja voidaan laajentaa luomaan uusia tai verkkoaluekohtaisia kuvia lähes ilman luovaa puuttumista. Esimerkiksi Guido (yksi kirjoittajista) otti esikoulutetun kuvamallin ja koulutti sen uudelleen muutamaan tusinaan itsestään. Sieltä hän pystyi luomaan kuvia käyttämällä kehotteessa. Alla on kuvia, jotka on luotu seuraavista kehotteista: ” kapteenina Amerikka"," Pariisissa"," maalauksessa".

Kun kuvien luominen on valtava poikkeama koodin luomisesta liiketoiminnassa, on se, missä määrin generatiivinen tekoäly muuttaa taloudellista laskentaa. Yllä olevien kuvien luomiseksi Guido koulutti mallin kouralliseen valokuviin, joiden infrastruktuuriresurssit maksoivat noin 50 dollaria.. Koulutuksen jälkeen kuvien luominen maksaa noin 0.001 dollaria laskentaresursseissa ja se voidaan tehdä pilvessä tai uusimman sukupolven kannettavassa tietokoneessa. Lisäksi kuvan luominen vie vain muutaman sekunnin.

Ilman generatiivista tekoälyä ainoa tapa saada mukautettu kuva on joko palkata taiteilija tai tehdä se itse. Vaikka aloitamme olettamuksesta, että henkilö voisi luoda täysin mukautetun, fotorealistisen kuvan tunnin sisällä 10 dollarilla, generatiivinen AI-lähestymistapa on helposti neljä suuruusluokkaa halvempi ja suuruusluokkaa nopeampi. Todellisemmin sanottuna mikä tahansa mukautettu taideteos tai graafinen suunnitteluprojekti kestää todennäköisesti päiviä tai viikkoja ja maksaa satoja, ellei tuhansia dollareita.

Samanlainen kuin yllä olevat ohjelmointiapuvälineet, generatiivinen tekoäly on hyväksytty työkaluksi taiteilijoiden ja molemmat vaativat jonkinasteista käyttäjän valvontaa. Mutta on vaikea liioitella sitä taloudellista eroa, joka syntyy kuvamallin kyvystä jäljitellä taiteilijan koko tuotantoa. Koodinluontimallin avulla jopa hyvin yksinkertaisen toiminnallisen ohjelman kirjoittaminen, joka suorittaa tavallisen laskentatehtävän, vaatii monien koodinpätkien tarkistamista, muokkaamista ja lisäämistä. Mutta peruskuvassa kehotteen syöttäminen ja kuvan valitseminen kymmenien ehdotusten joukosta voidaan tehdä alle minuutissa.

Otetaan esimerkiksi ikioma sarjakuvapiirtäjä (ja sijoituskumppanimme) Yoko Li (@stuffyokodraws). Koulutimme mallin käyttämällä 70 hänen aikaisempaa kuvaansa, ja malli pystyi luomaan kuvia, joissa oli aavemainen matkimistaso. Jokaisen taiteilijan on keksittävä, mitä hän luo seuraavaksi, ja hän jopa havaitsi, että koulutetut mallit voivat tuoda esiin enemmän vaihtoehtoja kuin mitä hänellä oli mielessään - ainakin silloin, kun niitä painetaan tuottamaan jotain tietyn ajanjakson aikana. On satoja tapoja piirtää sama objekti, mutta generatiiviset mallit tekivät heti selväksi, mitkä polut ovat tutkimisen arvoisia.

Joten kun kyse on tällaisista tehtävistä, emme väitä, että tietokoneet ovat välttämättä paremmin kuin ihmiset suhteella 1:1. Mutta kuten monet muutkin tehtävät, kun tietokoneet voivat tuottaa täydellisen työn, ne vain tappavat meidät asteikko.

Kokeile ja arvaa, mitkä alla olevista piirustuksista ovat Yokon suoraan piirtämiä ja mitkä luotuja.

Taloustieteen valtava parannus, joustavuus uusien tyylien ja konseptien luomisessa sekä kyky tuottaa täydellinen tai lähes täydellinen työtulos viittaavat siihen, että olemme valmiita näkemään merkittävän muutoksen kaikilla aloilla, joilla luova omaisuus on suurin osa liiketoiminnasta. Ja tämä ei rajoitu kuviin, vaan koskee koko suunnittelukenttää. Esimerkiksi:

Generatiivinen tekoäly voi luoda 2D-taidetta, tekstuureja, 3D-malleja ja auttaa pelien tasosuunnittelussa.
Markkinoinnissa se näyttää olevan valmis korvaamaan varastotaidetta, tuotevalokuvausta ja kuvitusta.
Näemme jo sovelluksia verkkosuunnittelussa, sisustussuunnittelussa ja maisemasuunnittelussa.

Ja todellakin olemme vasta alussa. Jos käyttötapaus edellyttää sisällön luovaa luomista, on vaikea nähdä argumenttia, miksi generatiivinen tekoäly ei häiritse sitä tai ei ainakaan tule osaksi prosessia.

Okei, mikä tämän postauksen pointti on? Vaikka se keskittyy hieman kapeasti koodin ja kuvien luomiseen, epäilemme, että tulokset pätevät laajemmin. Erityisesti se, että tekoäly häiritsee kaikkia luovia pyrkimyksiä – olivatpa ne visuaalisia, tekstillisiä tai musiikillisia – todennäköisesti kauan ennen järjestelmien rakentamista.

Yllä käyttämämme oikeellisuusargumentin lisäksi voi myös olla niin, että kaiken tunnetun tekniikan yhdistäminen ja yhdistäminen voi olla riittävää luovien tulosten käytännölliseen valikoimaan. Esimerkiksi musiikki- ja elokuvateollisuus on historiallisesti tuottanut lukemattomia suosittuja albumeita ja elokuvia. On täysin mahdollista, että generatiiviset mallit voivat auttaa automatisoimaan nämä toiminnot ajan myötä. Merkittävä asia niin monissa Stable Diffusionin ja DALL-E 2:n tuottamissa kuvissa on kuitenkin se, että ne ovat todella hyviä ja todella mielenkiintoista. Ei ole vaikea kuvitella tekoälymallia, joka tuottaa aidosti mielenkiintoisia musiikkityylien fuusioita tai jopa "kirjoittaa" pitkäkestoisia elokuvia, jotka ovat kiehtovia siinä, miten ne yhdistävät käsitteitä ja tyylejä.

Päinvastoin, on vaikea kuvitella, että aiemmat järjestelmät sisältävät kaikki työkalut, joita tarvitsemme kaikkien tulevien järjestelmien kehittämiseen. Tai jopa monimutkaisia järjestelmiä voitaisiin yhdistää yhtä helposti kuin eri taiteen tai musiikin tyylejä. Usein järjestelmän arvo ja miksi niitä on niin vaikea rakentaa, on yksityiskohtien pitkässä pyrstössä – kaikki kompromissit, kiertotavat, optimoinnit tietylle suunnittelutilalle ja institutionaalinen/piilevä tietämys. Joten meidän on jatkettava rakentamista.

Vastustamme tarvetta ennustaa täsmälleen kuinka luova tekoäly vaikuttaa luovaan alaan. Kuitenkin, historia viittaa siihen, että uusilla työkaluilla on tapana laajentaa sen sijaan, että supistuisi taiteen määritelmäja tehdä siitä uudentyyppisten taiteilijoiden ulottuvilla. Tässä tapauksessa uudet taiteilijat ovat järjestelmien rakentajia. Niin, teknologian perustajille uskomme, että generatiivinen tekoäly on ehdottomasti myönteinen työkalu ohjelmistojen ulottuvuuden laajentamiseksi – pelistä tulee kauniimpia, markkinoinnista houkuttelevampaa, kirjoitettua sisältöä kiinnostavampaa ja elokuvista inspiroivampaa.

Kuka tietää: Eräänä päivänä vuoden 2022 lopulla olevaa Internet-arkistoa voidaan pitää yhtenä viimeisistä enimmäkseen ihmisten luomista sisältövarastoista. Ainakin tämän artikkelin teksti on kokonaan ihmisten luoma.

***

Tässä esitetyt näkemykset ovat yksittäisen AH Capital Management, LLC:n ("a16z") lainaaman henkilöstön näkemyksiä, eivätkä ne ole a16z:n tai sen tytäryhtiöiden näkemyksiä. Tietyt tähän sisältyvät tiedot on saatu kolmansien osapuolien lähteistä, mukaan lukien a16z:n hallinnoimien rahastojen kohdeyrityksiltä. Vaikka a16z on otettu luotettavilta uskotuista lähteistä, se ei ole itsenäisesti tarkistanut tällaisia tietoja, eikä se esitä tietojen nykyistä tai pysyvää tarkkuutta tai sen soveltuvuutta tiettyyn tilanteeseen. Lisäksi tämä sisältö voi sisältää kolmannen osapuolen mainoksia; a16z ei ole tarkistanut tällaisia mainoksia eikä tue mitään niiden sisältämää mainossisältöä.

Tämä sisältö on tarkoitettu vain tiedoksi, eikä siihen tule luottaa lainopillisena, liike-, sijoitus- tai veroneuvona. Näissä asioissa kannattaa kysyä neuvojanne. Viittaukset arvopapereihin tai digitaaliseen omaisuuteen ovat vain havainnollistavia, eivätkä ne ole sijoitussuositus tai tarjous tarjota sijoitusneuvontapalveluita. Lisäksi tämä sisältö ei ole suunnattu eikä tarkoitettu sijoittajien tai mahdollisten sijoittajien käytettäväksi, eikä siihen voida missään olosuhteissa luottaa tehdessään sijoituspäätöstä mihinkään a16z:n hallinnoimaan rahastoon. (A16z-rahastoon sijoitustarjous tehdään vain minkä tahansa tällaisen rahaston suunnatun osakeannin muistion, merkintäsopimuksen ja muiden asiaankuuluvien asiakirjojen perusteella, ja ne tulee lukea kokonaisuudessaan.) Kaikki mainitut sijoitukset tai kohdeyritykset, joihin viitataan, tai kuvatut eivät edusta kaikkia investointeja a16z:n hallinnoimiin ajoneuvoihin, eikä voi olla varmuutta siitä, että investoinnit ovat kannattavia tai että muilla tulevaisuudessa tehtävillä investoinneilla on samanlaisia ominaisuuksia tai tuloksia. Luettelo Andreessen Horowitzin hallinnoimien rahastojen tekemistä sijoituksista (lukuun ottamatta sijoituksia, joiden osalta liikkeeseenlaskija ei ole antanut a16z:lle lupaa julkistaa, sekä ennalta ilmoittamattomat sijoitukset julkisesti noteerattuihin digitaalisiin omaisuuseriin) on saatavilla osoitteessa https://a16z.com/investments /.

Kaaviot ja kaaviot ovat vain tiedoksi, eikä niihin tule luottaa sijoituspäätöstä tehtäessä. Aiempi kehitys ei kerro tulevista tuloksista. Sisältö puhuu vain ilmoitetun päivämäärän mukaan. Kaikki näissä materiaaleissa esitetyt ennusteet, arviot, ennusteet, tavoitteet, näkymät ja/tai mielipiteet voivat muuttua ilman erillistä ilmoitusta ja voivat poiketa tai olla ristiriidassa muiden ilmaisemien mielipiteiden kanssa. Tärkeitä lisätietoja on osoitteessa https://a16z.com/disclosures.

Aikaleima: Marraskuussa 16, 2022Marraskuussa 16, 2022