Kunsten er ikke død, den er bare maskingenerert

Publisert av Platon

Følgere: 0

Hvorfor AI-modeller vil erstatte artister lenge før de erstatter programmerere

Den kanskje mest tankevekkende implikasjonen vi ser fra generativ AI er at, i motsetning til det vanlige synet om at kreativitet vil være den siste bastionen for menneskelig oppfinnsomhet i møte med automatisering, ser det faktisk ut til å være langt enklere å automatisere ganske vanskelige kreative oppgaver enn å automatisere relativt enkle programmeringsoppgaver. For å få en følelse av dette sammenligner vi to av de mer populære brukstilfellene for generativ AI: kodegenerering og bildegenerering. Men vi tror påstanden holder mer generelt, selv når generative modeller utvides til mer komplekse applikasjoner.

Den korte versjonen av argumentet (som vi tar for oss mer detaljert nedenfor) er at selv om et produkt som GitHub Copilot, i sin nåværende form, kan gjøre koding noe mer effektiv, det unngår ikke behovet for dyktige programvareutviklere med programmeringskunnskap. En stor grunn er at når det gjelder å bygge et program, er riktigheten virkelig viktig. Hvis AI genererer et program, krever det fortsatt et menneske for å bekrefte at det er riktig - en innsats på nesten samme nivå som å lage det til å begynne med.

På den annen side kan alle som kan skrive bruke en modell som Stabil diffusjon å produsere enestående bilder av høy kvalitet på få minutter, til mange størrelsesordener mindre kostnader. Kreative arbeidsprodukter har ofte ikke strenge korrekthetsbegrensninger, og utdataene til modellene er slående komplette. Det er vanskelig å ikke se et fullstendig faseskifte i bransjer som er avhengige av kreative visuelle elementer fordi, for mange bruksområder, er det visuelle som AI er i stand til å produsere nå, allerede tilstrekkelig, og vi er fortsatt i de aller tidligste omgangene av teknologien.

Vi erkjenner fullt ut at det er vanskelig å være trygg på noen spådommer i det tempoet feltet beveger seg. Akkurat nå ser det imidlertid ut til at vi er mye mer sannsynlig å se applikasjoner fulle av kreative bilder laget strengt av programmerere enn applikasjoner med menneskeskapt kunst bygget av skaperne.

Hvorfor hypen, og hvorfor nå?

Før vi kommer inn på detaljene om kodegenerering versus bildegenerering, er det nyttig å få en følelse av hvor populær AI generelt og generativ AI, spesifikt, er for øyeblikket.

Generativ AI ser det raskeste opptaket av utviklere vi noen gang har sett. Mens vi skriver dette, topper Stable Diffusion lett trenddiagrammene til GitHub-lagre med bred margin. Veksten er langt foran enhver nyere teknologi innen infrastruktur eller krypto (se figuren over). Det er nesten daglig lansering og finansieringskunngjøringer av startups som bruker teknologien, og sosiale nettverk på nettet blir oversvømmet med innhold skapt av generative modeller.

Det generelle investeringsnivået i kunstig intelligens det siste tiåret er også vanskelig å overvurdere. Vi har sett en eksponentiell økning i publikasjoner alene siden midten av 2010-tallet (se figuren nedenfor). I dag handler om lag 20 % av alle artikler som legges ut på arXiv om AI, ML og NLP. Viktigere, de teoretiske resultatene har krysset en kritisk terskel der de har blitt lett forbrukbare og utløst en kambrisk eksplosjon av nye teknikker, programvare og oppstart.

Den siste toppen i figuren ovenfor skyldes i stor grad generativ AI. I løpet av et enkelt tiår har vi gått fra AI-modeller som kun er for eksperter som kan klassifisere bilder og lage ordinnbygginger til offentlig brukbare modeller som kan skrive effektiv kode og lage bemerkelsesverdig nøyaktige bilder ved hjelp av naturlige språkoppfordringer. Det er ingen overraskelse at innovasjonstakten bare har økt, og det burde ikke være noen overraskelse når generative modeller begynner å gjøre inntog i andre områder som en gang var dominert av mennesker.

Generativ AI og programmering

En av de tidligste bruken av generativ AI har vært som hjelpemiddel til programmerere. Måten det fungerer på er at en modell trenes på et stort kodekorpus (f.eks. alle de offentlige reposene i GitHub) og deretter kommer med et forslag til en programmerer mens de koder. Resultatene er enestående. Så mye at det er rimelig at denne tilnærmingen vil bli synonymt med programmering fremover.

Kunsten er ikke død, det er bare maskingenerert PlatoBlockchain-dataintelligens. Vertikalt søk. Ai. — Generert kode: sikre mot angrep som ikke bruker semikolon.

Produktivitetsgevinsten har imidlertid vært beskjeden i forhold til bildegenerering, som vi dekker nedenfor. Noe av grunnen til dette, som nevnt ovenfor, er at korrekthet er kritisk i programmering (og faktisk tekniske problemer bredere, men vi fokuserer på programmering i dette innlegget). For eksempel, en ny studie funnet det for scenarier som samsvarer med høyrisiko CWE-er (vanlige svakhetsoppregninger), 40 % av AI-generert kode inneholdt sårbarheter.

Dermed må brukeren finne en balanse mellom å generere nok kode til å gi en meningsfull produktivitetsøkning, samtidig som den begrenser den slik at det er mulig å sjekke om det er korrekt. Som et resultat har Copilot hjulpet forbedre utviklerproduktiviteten – nyere studier (her. og her.) sette gevinster i størrelsesorden 2x eller mindre - men til et nivå på nivå med det vi har sett i tidligere fremskritt av utviklerspråk og verktøy. Hoppet fra montering til C, for eksempel, forbedret produktiviteten 2-5 ganger etter noen anslag.

For mer erfarne programmerere kan bekymringer strekke seg utover kodekorrekthet og inn i generell kodekvalitet. Som fort.aier Jeremy Howard har forklart med hensyn til nyere versjoner av OpenAI Codex-modellen, "[I]t skriver utførlig kode fordi den genererer gjennomsnittlig kode. For meg er det mye tregere å ta gjennomsnittlig kode og lage den til kode som jeg liker og jeg vet er riktig enn å skrive den fra bunnen av – i hvert fall på språk jeg kan godt.»

Så selv om det er klart generativ programmering er en trinnfunksjon i utviklerproduktiviteten, er det ikke klart at forbedringen er dramatisk forskjellig fra de vi har sett før. Generativ AI gjør bedre programmerere, men de må fortsatt programmere.

Generativ AI og visuals

På den annen side er generative modellers innvirkning på kreativt arbeid, slik som bildegenerering, ekstrem. Det har resultert i mange størrelsesordensforbedringer i effektivitet og kostnader, og det er vanskelig å ikke se det innlede et bransjeomfattende faseskifte.

Måten generativ AI fungerer på i dette rommet er å ta enkle tekstinndata fra brukeren, kalt ledetekster, og deretter genererer modellen en visuell utgang. For tiden finnes det modeller for å lage mange utdataformater, inkludert bilder, videoer, 3D-modeller og teksturer.

Det som er spesielt interessant er hvordan disse modellene kan utvides til å generere nye eller domenespesifikke bilder med nesten ingen kreativ intervensjon. Guido (en av forfatterne) tok for eksempel en forhåndstrent bildemodell og trente den på nytt på noen dusin bilder av seg selv. Derfra kunne han generere bilder ved hjelp av i ledeteksten. Nedenfor er bilder generert fra følgende forespørsler: " som kaptein amerika"," i paris"," i et maleri".

Der bildegenerering er en massiv avvik fra kodegenerering i forretningssammenheng, er i hvilken grad generativ AI endrer den økonomiske beregningen. For å lage bildene ovenfor, trente Guido modellen på en håndfull bilder som koster rundt $50 i infrastrukturressurser. Når du er trent, koster det å generere bilder omtrent $ 0.001 i dataressurser og kan gjøres i skyen eller på en siste generasjons bærbar PC. Videre tar det bare noen få sekunder å generere bildet.

Uten generativ AI er den eneste måten å få et tilpasset bilde på enten å ansette en artist eller gjøre det selv. Selv om vi starter med antagelsen om at en person kan lage et helt tilpasset, fotorealistisk bilde innen en time for $10, den generative AI-tilnærmingen er lett fire størrelsesordener billigere og en størrelsesorden raskere. Mer realistisk vil ethvert tilpasset kunstverk eller grafisk designprosjekt sannsynligvis ta dager eller uker, og vil koste hundrevis, om ikke tusenvis, av dollar.

I likhet med programmeringshjelpemidlene ovenfor, vil generativ AI være tatt i bruk som et verktøy av kunstnere og begge krever en viss grad av brukertilsyn. Men det er vanskelig å overvurdere forskjellen i økonomi som skapes av en bildemodells evne til å etterligne hele artistproduksjonen. Ved å bruke en kodegenereringsmodell krever å skrive til og med et veldig grunnleggende funksjonelt program som utfører en standard dataoppgave gjennomgang, redigering og legge til tester for mange kodebiter. Men for et grunnleggende bilde kan det gjøres på under ett minutt å skrive inn en melding og velge et bilde fra et dusin forslag.

Ta for eksempel vår egen tegneserieskaper (og investeringspartner) Yoko Li (@stuffyokodraws). Vi trente en modell ved å bruke 70 av hennes tidligere bilder, og modellen var i stand til å generere bilder med et uhyggelig nivå av mimikk. Hver kunstner må finne ut hva de skal lage neste gang, og hun fant til og med ut at de trente modellene kan dukke opp flere alternativer enn det hun hadde i tankene - i hvert fall når de trykkes for å produsere noe under en gitt tidsperiode. Det er hundrevis av måter å tegne det samme objektet på, men generative modeller gjorde det åpenbart med en gang hvilke stier som er verdt å utforske.

Så når det kommer til slike oppgaver, argumenterer vi ikke for at datamaskiner nødvendigvis er det bedre enn mennesker på 1:1-basis. Men som med så mange andre oppgaver, når datamaskiner kan produsere komplette arbeidsresultater, dreper de oss bare på skala.

Prøv å gjett hvilke av tegningene nedenfor som ble tegnet direkte av Yoko og hvilke som ble generert.

Den massive forbedringen i økonomi, fleksibiliteten i å kunne lage nye stiler og konsepter, og evnen til å generere fullstendig eller nesten fullstendig arbeidsproduksjon antyder for oss at vi er klar til å se en markant endring på tvers av alle bransjer der kreative eiendeler er en hoveddelen av virksomheten. Og dette er ikke begrenset til bilder, men gjelder hele designfeltet. For eksempel:

Generativ AI kan lage 2D-kunst, teksturer, 3D-modeller og hjelpe med nivådesign for spill.
I markedsføring ser det ut til å erstatte lagerkunst, produktfotografering og illustrasjon.
Vi ser allerede applikasjoner innen webdesign, interiørdesign og landskapsdesign.

Og vi er egentlig bare helt i starten. Hvis en brukssak krever kreativ generering av innhold, er det vanskelig å se argumentet for hvorfor generativ AI ikke vil forstyrre den eller i det minste bli en del av prosessen.

OK, så hva er poenget med dette innlegget? Selv om det er noe snevert fokusert på kodegenerering og bildegenerering, mistenker vi at resultatene holder bredere. Spesielt at kreative bestrebelser over hele linja - enten visuelle, tekstlige eller musikalske - sannsynligvis vil bli forstyrret av AI lenge før systembygging.

I tillegg til korrekthetsargumentet vi bruker ovenfor, kan det også være tilfelle at å kombinere og rekombinere all kjent teknikk kan være tilstrekkelig for det praktiske spekteret av kreative utganger. Musikk- og filmindustrien har for eksempel historisk sett produsert utallige utslag av populære album og filmer. Det er fullt tenkelig at generative modeller kan bidra til å automatisere disse funksjonene over tid. Det bemerkelsesverdige med så mange av bildene produsert av Stable Diffusion og DALL-E 2 er imidlertid at de er veldig gode og genuint interessant. Det er ikke vanskelig å se for seg en AI-modell som produserer genuint interessante fusjoner av musikalske stiler eller til og med "skriver" langfilmer som er spennende i hvordan de binder sammen konsepter og stiler.

Tvert imot er det vanskelig å forestille seg at tidligere systemer vil inneholde alle verktøyene vi trenger for å utvikle alle fremtidige systemer. Eller til og med at komplekse systemer like lett kan kombineres som ulike stiler av kunst eller musikk. Så ofte ligger verdien av et system, og hvorfor de er så vanskelige å bygge, i den lange halen av detaljer - alle avveininger, løsninger, optimaliseringer for et gitt designområde og institusjonell/latent kunnskap de inneholder. Så fortsette å bygge må vi.

Vi vil motstå trangen til å forutsi nøyaktig hvor generativ kunstig intelligens vil påvirke den kreative industrien. Derimot, historien antyder at nye verktøy har en tendens til det utvide heller enn å trekke inn definisjonen av kunst, og for å gjøre det tilgjengelig for nye typer artister. I dette tilfellet er de nye kunstnerne systembyggere. Så, for teknologigründere tror vi generativ kunstig intelligens er strengt tatt et positivt verktøy for å utvide rekkevidden til programvare – spill blir vakrere, markedsføring mer overbevisende, skrevet innhold mer engasjerende, filmer mer inspirerende.

Hvem vet: En dag kan et arkiv av internett fra slutten av 2022 bli verdsatt som et av de siste mest menneskeskapte innholdslagrene. Denne teksten til denne artikkelen, i det minste, ble generert utelukkende av mennesker.

***

Synspunktene som er uttrykt her, er de fra individuelle AH Capital Management, LLC (“a16z”) personell som er sitert og er ikke synspunktene til a16z eller dets tilknyttede selskaper. Visse opplysninger her er innhentet fra tredjepartskilder, inkludert fra porteføljeselskaper av fond forvaltet av a16z. Selv om a16z er hentet fra kilder som antas å være pålitelige, har ikke a16z uavhengig verifisert slik informasjon og gir ingen representasjoner om den nåværende eller varige nøyaktigheten til informasjonen eller dens hensiktsmessighet for en gitt situasjon. I tillegg kan dette innholdet inkludere tredjepartsannonser; aXNUMXz har ikke vurdert slike annonser og støtter ikke noe reklameinnhold som finnes deri.

Dette innholdet er kun gitt for informasjonsformål, og bør ikke stoles på som juridisk, forretningsmessig, investerings- eller skatterådgivning. Du bør rådføre deg med dine egne rådgivere om disse sakene. Referanser til verdipapirer eller digitale eiendeler er kun for illustrasjonsformål, og utgjør ikke en investeringsanbefaling eller tilbud om å tilby investeringsrådgivningstjenester. Videre er dette innholdet ikke rettet mot eller ment for bruk av noen investorer eller potensielle investorer, og kan ikke under noen omstendigheter stoles på når du tar en beslutning om å investere i et fond som forvaltes av a16z. (Et tilbud om å investere i et a16z-fond vil kun gis av det private emisjonsmemorandumet, tegningsavtalen og annen relevant dokumentasjon for et slikt fond og bør leses i sin helhet.) Eventuelle investeringer eller porteføljeselskaper nevnt, referert til, eller beskrevet er ikke representative for alle investeringer i kjøretøy forvaltet av a16z, og det kan ikke gis noen garanti for at investeringene vil være lønnsomme eller at andre investeringer som gjøres i fremtiden vil ha lignende egenskaper eller resultater. En liste over investeringer foretatt av fond forvaltet av Andreessen Horowitz (unntatt investeringer som utstederen ikke har gitt tillatelse til at a16z kan offentliggjøre så vel som uanmeldte investeringer i børsnoterte digitale eiendeler) er tilgjengelig på https://a16z.com/investments /.

Diagrammer og grafer gitt i er kun for informasjonsformål og bør ikke stoles på når du tar investeringsbeslutninger. Tidligere resultater er ikke en indikasjon på fremtidige resultater. Innholdet taler kun fra den angitte datoen. Eventuelle anslag, estimater, prognoser, mål, prospekter og/eller meninger uttrykt i dette materialet kan endres uten varsel og kan avvike eller være i strid med meninger uttrykt av andre. Vennligst se https://a16z.com/disclosures for ytterligere viktig informasjon.

Tidstempel: November 16, 2022November 16, 2022