Art Isn't Dead, It's Just Machine-Genereret

Genudgivet af Platon

Abonnenter: 0

Hvorfor AI-modeller vil erstatte kunstnere længe før de erstatter programmører

Den måske mest åndssvage implikation, vi ser fra generativ AI, er, at i modsætning til den almindelige opfattelse, at kreativitet vil være den sidste bastion af menneskelig opfindsomhed i lyset af automatisering, ser det faktisk ud til at være langt lettere at automatisere ret vanskelige kreative opgaver end at automatisere relativt simple programmeringsopgaver. For at få en fornemmelse af dette sammenligner vi to af de mere populære use cases for generativ AI: kodegenerering og billedgenerering. Men vi mener, at påstanden holder mere generelt, selvom generative modeller udvides til mere komplekse applikationer.

Den korte version af argumentet (som vi behandler mere detaljeret nedenfor) er, at selvom et produkt som GitHub Copilot, i sin nuværende form, kan gøre kodning noget mere effektiv, det overflødiggør ikke behovet for dygtige softwareudviklere med programmeringsviden. En stor grund er, at når det kommer til at opbygge et program, er korrekthed virkelig vigtigt. Hvis AI genererer et program, kræver det stadig, at et menneske bekræfter, at det er korrekt - en indsats på næsten samme niveau som at skabe det til at begynde med.

På den anden side kan alle, der kan skrive, bruge en model som f.eks Stabil diffusion at producere enestående billeder af høj kvalitet på få minutter til mange størrelsesordener mindre omkostninger. Kreative arbejdsprodukter har ofte ikke strenge korrekthedsbegrænsninger, og modellernes output er forbløffende komplette. Det er svært ikke at se et fuldfaseskifte i industrier, der er afhængige af kreative billeder, fordi til mange anvendelser er det visuelle, som AI er i stand til at producere nu, allerede tilstrækkeligt, og vi er stadig i den meget tidlige omgang med teknologien.

Vi anerkender fuldt ud, at det er svært at være sikker på nogen forudsigelser i det tempo, feltet bevæger sig. Lige nu ser det dog ud til, at vi er meget mere tilbøjelige til at se applikationer fulde af kreative billeder skabt udelukkende af programmører end applikationer med menneskedesignet kunst, som udelukkende er bygget af skabere.

Hvorfor hypen, og hvorfor nu?

Inden vi kommer ind på det specifikke ved kodegenerering versus billedgenerering, er det nyttigt at få en fornemmelse af, hvor populær AI overordnet og generativ AI specifikt er i øjeblikket.

Generativ AI oplever den hurtigste optagelse af udviklere, vi nogensinde har set. Mens vi skriver dette, topper Stable Diffusion nemt trenddiagrammet for GitHub-lagre med bred margin. Dens vækst er langt foran enhver nyere teknologi inden for infrastruktur eller krypto (se figuren ovenfor). Der er næsten daglige lanceringer og meddelelser om finansiering af startups, der bruger teknologien, og online sociale netværk bliver oversvømmet med indhold skabt af generative modeller.

Det overordnede investeringsniveau i kunstig intelligens i det sidste årti er også svært at overvurdere. Vi har set en eksponentiel stigning i publikationer alene siden midten af 2010'erne (se figur nedenfor). I dag handler omkring 20 % af alle artikler på arXiv om AI, ML og NLP. Det er vigtigt, at de teoretiske resultater har krydset en kritisk tærskel, hvor de er blevet lette at forbruge og udløste en kambrisk eksplosion af nye teknikker, software og startups.

Den seneste stigning i figuren ovenfor skyldes i høj grad generativ AI. På et enkelt årti er vi gået fra AI-modeller, der kun er eksperter, der kunne klassificere billeder og skabe ordindlejringer til offentligt anvendelige modeller, der kan skrive effektiv kode og skabe bemærkelsesværdigt nøjagtige billeder ved hjælp af naturlige sprogprompter. Det er ingen overraskelse, at innovationstempoet kun er steget, og det burde ikke være nogen overraskelse, når generative modeller begynder at gøre indtog i andre områder, der engang var domineret af mennesker.

Generativ AI og programmering

En af de tidligste anvendelser af generativ AI har været som en programmørs hjælp. Måden det fungerer på er, at en model trænes på et stort korpus af kode (f.eks. alle de offentlige reposer i GitHub) og derefter kommer med et forslag til en programmør, mens de koder. Resultaterne er enestående. Så meget, at det er rimeligt, at denne tilgang vil blive synonym med programmering fremover.

Art Isn't Dead, It's Just Machine-Generated PlatoBlockchain Data Intelligence. Lodret søgning. Ai. — Genereret kode: sikker mod angreb, der ikke bruger semikolon.

Produktivitetsgevinsterne har dog været beskedne i forhold til billedgenerering, som vi dækker nedenfor. En del af årsagen til dette, som nævnt ovenfor, er, at korrekthed er kritisk i programmering (og faktisk tekniske problemer mere bredt, men vi fokuserer på programmering i dette indlæg). For eksempel, en nylig undersøgelse fundet det for scenarier, der matcher højrisiko CWE'er (almindelige svaghedsopregninger)40 % af AI-genereret kode indeholdt sårbarheder.

Derfor skal brugeren finde en balance mellem at generere nok kode til at give et meningsfuldt produktivitetsboost, mens den stadig begrænses, så det er muligt at kontrollere korrektheden. Som et resultat har Copilot hjulpet forbedre udviklerproduktiviteten — nyere undersøgelser (link. , link.) sætte gevinster i størrelsesordenen 2x eller mindre - men på et niveau på niveau med det, vi har set i tidligere fremskridt inden for udviklersprog og -værktøjer. Springet fra montage til C forbedrede f.eks. produktiviteten 2-5x med nogle skøn.

For mere erfarne programmører kan bekymringer strække sig ud over kodekorrekthed og overordnet kodekvalitet. Som hurtigt.aier Jeremy Howard har forklaret med hensyn til nyere versioner af OpenAI Codex-modellen, "[I]t skriver udførlig kode, fordi den genererer gennemsnit kode. For mig er det meget langsommere at tage gennemsnitlig kode og lave den til kode, som jeg kan lide, og som jeg ved er korrekt, end bare at skrive den fra bunden - i hvert fald på sprog, jeg kender godt."

Så selvom det er klart, at generativ programmering er en trinfunktion i udviklerproduktiviteten, er det ikke klart, at forbedringen er dramatisk anderledes end dem, vi har set før. Generativ AI gør bedre programmører, men de skal stadig programmere.

Generativ AI og visuals

På den anden side er generative modellers indflydelse på kreativt arbejdsoutput, såsom billedgenerering, ekstrem. Det har resulteret i mange størrelsesordensforbedringer i effektivitet og omkostninger, og det er svært ikke at se det indlede et branchedækkende faseskift.

Den måde, generativ AI fungerer på i dette rum, er at tage simple tekstinput fra brugeren, kaldet prompter, og derefter genererer modellen et visuelt output. I øjeblikket er der modeller til at skabe mange outputformater, herunder billeder, videoer, 3D-modeller og teksturer.

Det, der er særligt interessant, er, hvordan disse modeller kan udvides til at generere nye eller domænespecifikke billeder uden næsten ingen kreativ indgriben. For eksempel tog Guido (en af forfatterne) en fortrænet billedmodel og genoplærte den på et par dusin billeder af sig selv. Derfra var han i stand til at generere billeder vha i prompten. Nedenfor er billeder genereret fra følgende prompter: " as captain america"," in paris"," i et maleri".

Hvor billedgenerering er en massiv afvigelse fra kodegenerering i en forretningssammenhæng, er det omfang, i hvilket generativ AI ændrer den økonomiske beregning. For at lave ovenstående billeder trænede Guido modellen på en håndfuld fotos, der kostede omkring 50 USD i infrastrukturressourcer. Når du er trænet, koster det omkring $0.001 at generere billeder i computerressourcer og kan gøres i skyen eller på en nyeste generation af bærbar computer. Desuden tager det kun et par sekunder at generere billedet.

Uden generativ AI er den eneste måde at få et tilpasset billede på enten at hyre en kunstner eller gøre det selv. Selv hvis vi starter med antagelsen om, at en person kunne skabe et helt brugerdefineret, fotorealistisk billede inden for en time for $10, den generative AI-tilgang er nemt fire størrelsesordener billigere og en størrelsesorden hurtigere. Mere realistisk vil ethvert brugerdefineret kunstværk eller grafisk designprojekt sandsynligvis tage dage eller uger og vil koste hundredvis, hvis ikke tusindvis, af dollars.

I lighed med programmeringshjælpemidlerne ovenfor vil generativ AI være taget som værktøj af kunstnere og begge kræver en vis grad af brugertilsyn. Men det er svært at overvurdere forskellen i økonomi, der skabes af en billedmodels evne til at efterligne hele kunstnerens output. Ved at bruge en kodegenereringsmodel kræver det at skrive selv et meget grundlæggende funktionelt program, der udfører en standard computeropgave, gennemgang, redigering og tilføjelse af tests for mange kodestykker. Men for et grundlæggende billede kan det gøres på under et minut at indtaste en prompt og vælge et billede fra et dusin forslag.

Tag for eksempel vores helt egen tegneserieskaber (og investeringspartner) Yoko Li (@stuffyokodraws). Vi trænede en model ved at bruge 70 af hendes tidligere billeder, og modellen var i stand til at generere billeder med et uhyggeligt niveau af mimik. Hver kunstner skal finde ud af, hvad der skal skabes næste gang, og hun fandt endda ud af, at de trænede modeller kan få flere muligheder, end hun havde i tankerne - i det mindste når de bliver presset til at producere noget under en given tidsperiode. Der er hundredvis af måder at tegne det samme objekt på, men generative modeller gjorde det klart med det samme, hvilke stier der er værd at udforske.

Så når det kommer til sådanne opgaver, argumenterer vi ikke for, at computere nødvendigvis er det bedre end mennesker på 1:1-basis. Men som med så mange andre opgaver, når computere kan producere komplet arbejdsoutput, slår de os bare ihjel skala.

Prøv at gætte, hvilke af tegningerne nedenfor, der blev tegnet direkte af Yoko, og hvilke der blev genereret.

Den massive forbedring af økonomien, fleksibiliteten i at være i stand til at skabe nye stilarter og koncepter og evnen til at generere komplet eller næsten fuldstændig arbejdsoutput antyder for os, at vi er klar til at se en markant ændring på tværs af alle brancher, hvor kreative aktiver er et største del af forretningen. Og dette er ikke begrænset til billeder, men gælder for hele designfeltet. For eksempel:

Generativ AI kan skabe 2D-kunst, teksturer, 3D-modeller og hjælpe med niveaudesign til spil.
Inden for markedsføring ser det ud til at være klar til at erstatte stock art, produktfotografering og illustration.
Vi ser allerede applikationer inden for webdesign, interiørdesign og landskabsdesign.

Og vi er egentlig kun lige ved starten. Hvis en use case kræver kreativ generering af indhold, er det svært at se argumentet for, hvorfor generativ AI ikke vil forstyrre det eller i det mindste blive en del af processen.

—

OK, så hvad er meningen med dette indlæg? Selvom det er noget snævert fokuseret på kodegenerering og billedgenerering, formoder vi, at resultaterne holder bredere. Især at kreative bestræbelser over hele linjen - hvad enten de er visuelle, tekstmæssige eller musikalske - sandsynligvis vil blive forstyrret af AI længe før systemopbygning.

Ud over korrekthedsargumentet, vi bruger ovenfor, kan det også være tilfældet, at kombination og rekombination af al kendt teknik kan være tilstrækkeligt til den praktiske række af kreative output. Musik- og filmindustrien har f.eks. historisk produceret utallige afslag på populære albums og film. Det er helt tænkeligt, at generative modeller kan hjælpe med at automatisere disse funktioner over tid. Men det bemærkelsesværdige ved så mange af billederne produceret af Stable Diffusion og DALL-E 2 er, at de er rigtig gode , virkelig interessant. Det er ikke svært at forestille sig en AI-model, der producerer virkelig interessante fusioner af musikalske stilarter eller endda "skriver" spillefilm, der er spændende i, hvordan de binder koncepter og stilarter sammen.

Tværtimod er det svært at forestille sig, at tidligere systemer vil indeholde alle de værktøjer, vi skal bruge for at udvikle alle fremtidige systemer. Eller endda at komplekse systemer lige så let kunne kombineres som forskellige stilarter af kunst eller musik. Så ofte er værdien af et system, og hvorfor de er så svære at bygge, i den lange hale af detaljer - alle de afvejninger, løsninger, optimeringer til et givet designrum og institutionel/latent viden, de indeholder. Så fortsætte med at bygge skal vi.

Vi vil modstå trangen til at forudsige præcist nok hvordan generativ kunstig intelligens vil påvirke den kreative industri. Imidlertid, historien tyder på, at nye værktøjer har tendens til udvide snarere end at kontrahere definitionen af kunst, og at gøre det tilgængeligt for nye typer kunstnere. I dette tilfælde er de nye kunstnere systembyggere. Så, for teknologigrundlæggere mener vi, at generativ kunstig intelligens udelukkende er et positivt værktøj for at udvide rækkevidden af software – spil bliver smukkere, markedsføring mere overbevisende, skrevet indhold mere engagerende, film mere inspirerende.

Hvem ved: En dag kan et arkiv af internettet i slutningen af 2022 blive værdsat som et af de sidste hovedsagelig menneskeskabte indholdslagre. Denne tekst til denne artikel er i det mindste udelukkende genereret af mennesker.

***

De synspunkter, der er udtrykt her, er dem fra det enkelte AH Capital Management, LLC ("a16z") personale, der er citeret, og er ikke synspunkter fra a16z eller dets tilknyttede selskaber. Visse oplysninger indeholdt heri er indhentet fra tredjepartskilder, herunder fra porteføljeselskaber af fonde forvaltet af a16z. Selvom det er taget fra kilder, der menes at være pålidelige, har a16z ikke uafhængigt verificeret sådanne oplysninger og fremsætter ingen repræsentationer om den aktuelle eller vedvarende nøjagtighed af oplysningerne eller dens passende for en given situation. Derudover kan dette indhold omfatte tredjepartsreklamer; a16z har ikke gennemgået sådanne annoncer og støtter ikke noget reklameindhold indeholdt deri.

Dette indhold er kun givet til informationsformål og bør ikke påberåbes som juridisk, forretningsmæssig, investerings- eller skatterådgivning. Du bør rådføre dig med dine egne rådgivere om disse spørgsmål. Henvisninger til værdipapirer eller digitale aktiver er kun til illustrationsformål og udgør ikke en investeringsanbefaling eller tilbud om at levere investeringsrådgivningstjenester. Ydermere er dette indhold ikke rettet mod eller beregnet til brug af nogen investorer eller potentielle investorer og kan under ingen omstændigheder stoles på, når der træffes en beslutning om at investere i en fond, der administreres af a16z. (Et tilbud om at investere i en a16z-fond vil kun blive givet af private placement-memorandummet, tegningsaftalen og anden relevant dokumentation for en sådan fond og bør læses i deres helhed.) Eventuelle investeringer eller porteføljeselskaber nævnt, refereret til eller beskrevne er ikke repræsentative for alle investeringer i køretøjer, der administreres af a16z, og der kan ikke gives sikkerhed for, at investeringerne vil være rentable, eller at andre investeringer foretaget i fremtiden vil have lignende karakteristika eller resultater. En liste over investeringer foretaget af fonde forvaltet af Andreessen Horowitz (undtagen investeringer, hvortil udstederen ikke har givet tilladelse til, at a16z offentliggør såvel som uanmeldte investeringer i offentligt handlede digitale aktiver) er tilgængelig på https://a16z.com/investments /.

Diagrammer og grafer, der er angivet i, er udelukkende til informationsformål og bør ikke stoles på, når der træffes nogen investeringsbeslutning. Tidligere resultater er ikke vejledende for fremtidige resultater. Indholdet taler kun fra den angivne dato. Alle fremskrivninger, estimater, prognoser, mål, udsigter og/eller meninger udtrykt i disse materialer kan ændres uden varsel og kan afvige fra eller være i modstrid med andres meninger. Se venligst https://a16z.com/disclosures for yderligere vigtige oplysninger.

Tidsstempel: November 16, 2022November 16, 2022