Arta nu este moartă, este doar inteligență de date PlatoBlockchain generată de mașini. Căutare verticală. Ai.

Arta nu este moartă, este doar generată de mașini

De ce modelele AI vor înlocui artiștii cu mult înainte de a înlocui programatorii

Poate cea mai captivantă implicație pe care o vedem de la IA generativă este că, spre deosebire de opinia comună că creativitatea va fi ultimul bastion al ingeniozității umane în fața automatizării, de fapt pare a fi mult mai ușor pentru a automatiza sarcini creative destul de dificile decât pentru a automatiza sarcini de programare relativ simple. Pentru a înțelege acest lucru, comparăm două dintre cele mai populare cazuri de utilizare pentru AI generativă: generarea de cod și generarea de imagini. Dar credem că afirmația este valabilă în general, chiar dacă modelele generative se extind în aplicații mai complexe.

Versiunea scurtă a argumentului (pe care o abordăm mai detaliat mai jos) este că, deși un produs ca Copilotul GitHub, în forma sa actuală, poate face codarea oarecum mai eficientă, nu evită nevoia de dezvoltatori de software capabili și cu cunoștințe de programare. Un mare motiv este că, atunci când vine vorba de construirea unui program, corectitudinea contează cu adevărat. Dacă AI generează un program, totuși este nevoie de un om pentru a verifica că este corect - un efort aproape la același nivel cu crearea lui pentru început.

Pe de altă parte, oricine poate tasta poate folosi un model similar Difuzie stabilă pentru a produce imagini unice, de înaltă calitate, în câteva minute, cu multe ordine de mărime mai mici. Produsele de lucru creative nu au adesea constrângeri stricte de corectitudine, iar rezultatele modelelor sunt uimitor de complete. Este greu să nu vedem o schimbare completă de fază în industriile care se bazează pe imagini creative, deoarece, pentru multe utilizări, imaginile pe care AI este capabilă să le producă acum sunt deja suficiente și ne aflăm încă la începuturile tehnologiei.

Recunoaștem pe deplin că este greu să fii încrezător în orice predicții în ritmul în care se mișcă terenul. În acest moment, totuși, se pare că avem mult mai multe șanse să vedem aplicații pline de imagini creative create strict de programatori decât aplicații cu artă proiectată de om, construite strict de creatori. 

De ce hype și de ce acum?

Înainte de a intra în specificul generării de cod versus generarea de imagini, este util să ne facem o idee despre cât de populară sunt AI în general și AI generativă, în special, în acest moment.

Inteligența artificială generativă înregistrează cea mai rapidă acceptare de către dezvoltatori pe care i-am văzut vreodată. În timp ce scriem acest lucru, Stable Diffusion depășește cu ușurință topurile de tendințe ale depozitelor GitHub cu o marjă largă. Creșterea sa este cu mult înaintea oricărei tehnologii recente din infrastructură sau cripto (vezi figura de mai sus). Există aproape zilnic anunțuri de lansare și finanțare ale startup-urilor care folosesc tehnologia, iar rețelele sociale online sunt inundate cu conținut creat de modele generative.

Nivelul general al investițiilor în IA în ultimul deceniu este, de asemenea, greu de supraestimat. Am observat o creștere exponențială a publicațiilor numai de la mijlocul anilor 2010 (a se vedea figura de mai jos). Astăzi, aproximativ 20% din toate articolele postate pe arXiv sunt despre AI, ML și NLP. Este important că rezultatele teoretice au depășit un prag critic în care au devenit ușor de consumat și au declanșat o explozie cambriană de noi tehnici, software și startup-uri. 

Arta nu este moartă, este doar inteligență de date PlatoBlockchain generată de mașini. Căutare verticală. Ai.

Cel mai recent vârf din figura de mai sus se datorează în mare parte IA generativă. Într-un singur deceniu, am trecut de la modele AI doar pentru experți, care ar putea clasifica imagini și să creeze înglobări de cuvinte, la modele utilizabile public, care pot scrie cod eficient și pot crea imagini remarcabil de precise folosind instrucțiuni în limbaj natural. Nu este deloc surprinzător faptul că ritmul de inovare a crescut și nu ar trebui să fie surprinzător când modelele generative încep să facă incursiuni în alte domenii, cândva dominate de oameni.

AI generativă și programare

Una dintre cele mai timpurii utilizări ale AI generativă a fost ca ajutor pentru programator. Modul în care funcționează este că un model este antrenat pe un corp mare de cod (de exemplu, toate repozițiile publice din GitHub) și apoi face o sugestie unui programator în timp ce codifică. Rezultatele sunt remarcabile. Atât de mult încât este rezonabil că această abordare va deveni sinonimă cu programarea în viitor.

Arta nu este moartă, este doar inteligență de date PlatoBlockchain generată de mașini. Căutare verticală. Ai.
Cod generat: securizat împotriva atacurilor care nu folosesc punct și virgulă.

Cu toate acestea, câștigurile de productivitate au fost modeste în raport cu generarea de imagini, pe care o acoperim mai jos. O parte din motivul acestui lucru, așa cum am menționat mai sus, este că corectitudinea este esențială în programare (și într-adevăr problemele de inginerie mai larg, dar ne concentrăm pe programare în această postare). De exemplu, un studiu recent descoperit asta pentru scenarii care se potrivesc cu risc ridicat CWE (enumerări comune ale punctelor slabe), 40% din codul generat de AI conținea vulnerabilități.

Astfel, utilizatorul trebuie să găsească un echilibru între generarea de cod suficient pentru a oferi o creștere semnificativă a productivității, limitându-l în același timp, astfel încât să fie posibil să verifice corectitudinea. Drept urmare, Copilotul are a ajutat îmbunătățirea productivității dezvoltatorilor — studii recente (aici și aici) puneți câștiguri de ordinul a 2x sau mai puțin, dar la un nivel egal cu ceea ce am văzut în avansurile anterioare ale limbajelor și instrumentelor pentru dezvoltatori. Trecerea de la asamblare la C, de exemplu, a îmbunătățit productivitatea de 2-5 ori după unele estimări.

Pentru programatorii mai experimentați, preocupările se pot extinde dincolo de corectitudinea codului și în calitatea generală a codului. La fel de repede.aieste Jeremy Howard a explicat în ceea ce privește versiunile recente ale modelului OpenAI Codex, „[Eu] nu scriu cod detaliat pentru că se generează in medie cod. Pentru mine, să iau cod mediu și să îl transform în cod care îmi place și știu că este corect este mult mai lent decât să-l scriu de la zero - cel puțin în limbile pe care le cunosc bine.”

Deci, deși este clar că programarea generativă este o funcție pas în productivitatea dezvoltatorului, nu este clar că îmbunătățirea este dramatic diferită de cele pe care le-am văzut înainte. AI generativ face programatori mai buni, dar totuși trebuie să programeze.

AI generativ și elemente vizuale

Pe de altă parte, impactul modelelor generative asupra rezultatelor muncii creative, cum ar fi generarea de imagini, este extrem. A avut ca rezultat îmbunătățiri de ordin de mărime în ceea ce privește eficiența și costurile și este greu să nu-l vezi inaugurând o schimbare de fază la nivelul întregii industrie.

Modul în care funcționează IA generativă în acest spațiu este să preia intrări textuale simple de la utilizator, numite prompturi, iar apoi modelul generează o ieșire vizuală. În prezent, există modele pentru crearea multor formate de ieșire, inclusiv imagini, videoclipuri, modele 3D și texturi.

Ceea ce este deosebit de interesant este modul în care aceste modele pot fi extinse pentru a genera imagini noi sau specifice domeniului, fără aproape nicio intervenție creativă. De exemplu, Guido (unul dintre autori) a luat un model de imagine pre-antrenat și l-a re-antrenat pe câteva zeci de fotografii cu el însuși. De acolo, a putut genera imagini folosind în prompt. Mai jos sunt fotografii generate din următoarele solicitări: ” as captain america"," in paris"," in a painting".

Arta nu este moartă, este doar inteligență de date PlatoBlockchain generată de mașini. Căutare verticală. Ai.
În cazul în care generarea de imagini este o abatere masivă de la generarea de cod într-un context de afaceri, este măsura în care AI generativă modifică calculul economic. Pentru a crea imaginile de mai sus, Guido a antrenat modelul pe o mână de fotografii care costă aproximativ 50 USD în resurse de infrastructură. Odată antrenat, generarea imaginilor costă aproximativ 0.001 USD în resurse de calcul și se poate face în cloud sau pe un laptop de ultimă generație. În plus, generarea imaginii durează doar câteva secunde. 

Fără IA generativă, singura modalitate de a obține o imagine personalizată este fie să angajezi un artist, fie să o faci singur. Chiar dacă pornim de la presupunerea că o persoană ar putea crea o imagine complet personalizată, fotorealistă într-o oră pentru 10 USD, abordarea AI generativă este cu patru ordine de mărime mai ieftină și cu un ordin de mărime mai rapidă. Mai realist, orice opera de artă personalizată sau proiect de design grafic va dura probabil zile sau săptămâni și va costa sute, dacă nu mii, de dolari. 

Similar cu ajutoarele de programare de mai sus, IA generativă va fi adoptat ca instrument de către artiști și ambele necesită un anumit grad de supraveghere a utilizatorului. Dar este greu de exagerat diferența de economie care este creată de capacitatea unui model de imagine de a imita întreaga producție a artistului. Folosind un model de generare de cod, scrierea chiar și a unui program funcțional de bază care îndeplinește o sarcină de calcul standard necesită revizuirea, editarea și adăugarea de teste pentru multe fragmente de cod. Dar pentru o imagine de bază, introducerea unui prompt și alegerea unei imagini dintr-o duzină de sugestii se poate face în mai puțin de un minut.

Luați de exemplu propriul nostru desenator (și partener de investiții) Yoko Li (@stuffyokodraws). Am antrenat un model folosind 70 de imagini anterioare, iar modelul a reușit să genereze imagini cu un nivel ciudat de mimă. Fiecare artist trebuie să-și dea seama ce să creeze în continuare și chiar a descoperit că modelele antrenate pot scoate la iveală mai multe opțiuni decât ceea ce avea în minte - cel puțin atunci când este presată să producă ceva într-o anumită perioadă de timp. Există sute de moduri de a desena același obiect, dar modelele generative au făcut evident imediat ce căi merită explorate. 

Deci, când vine vorba de astfel de sarcini, nu argumentăm că computerele sunt neapărat mai bine decât oamenii pe o bază 1:1. Dar, la fel ca în multe alte sarcini, atunci când computerele pot produce rezultate complete de lucru, ele doar ne ucid scară

Încercați să ghiciți care dintre desenele de mai jos au fost desenate direct de Yoko și care au fost generate. 

Arta nu este moartă, este doar inteligență de date PlatoBlockchain generată de mașini. Căutare verticală. Ai.
Răspuns: Modelul AI a generat imaginile cu un fundal non-alb.

Îmbunătățirea masivă a economiei, flexibilitatea în a putea crea noi stiluri și concepte și capacitatea de a genera rezultate complete sau aproape complete ne sugerează că suntem gata să vedem o schimbare semnificativă în toate industriile în care activele creative sunt un cea mai mare parte a afacerii. Și acest lucru nu se limitează la imagini, ci se aplică întregului domeniu de design. De exemplu:

  • AI generativ poate crea artă 2D, texturi, modele 3D și poate ajuta la proiectarea nivelurilor pentru jocuri. 
  • În marketing, pare gata să înlocuiască arta de stoc, fotografia de produs și ilustrația. 
  • Vedem deja aplicații în design web, design interior și design peisagistic.

Și suntem chiar la început. Dacă un caz de utilizare necesită generarea creativă de conținut, este greu de înțeles argumentul pentru care AI generativă nu îl va perturba sau cel puțin nu va deveni parte a procesului.

-

OK, deci ce rost are această postare? Deși este oarecum concentrat pe generarea de cod și generarea de imagini, bănuim că rezultatele sunt valabile mai larg. În special, acele eforturi creative în toate domeniile - indiferent dacă sunt vizuale, textuale sau muzicale - sunt susceptibile să fie perturbate de AI cu mult înainte de construirea sistemelor. 

În plus față de argumentul corectitudinii pe care îl folosim mai sus, poate fi și cazul în care combinarea și recombinarea tuturor stadiului tehnicii ar putea fi suficientă pentru gama practică de rezultate creative. Industriile muzicale și cinematografice, de exemplu, au produs istoric nenumărate imitații de albume și filme populare. Este complet de imaginat că modelele generative ar putea ajuta la automatizarea acestor funcții în timp. Cu toate acestea, lucrul remarcabil la atât de multe dintre imaginile produse de Stable Diffusion și DALL-E 2 este că sunt chiar buni și cu adevărat interesant. Nu este greu să ne imaginăm un model AI care să producă fuziuni cu adevărat interesante de stiluri muzicale sau chiar „scriind” filme de lungmetraj care sunt intrigant în modul în care leagă concepte și stiluri. 

Dimpotrivă, este greu de imaginat că sistemele anterioare vor conține toate instrumentele de care am avea nevoie pentru a dezvolta toate sistemele viitoare. Sau chiar că sistemele complexe ar putea fi la fel de ușor combinate ca diferite stiluri de artă sau muzică. Adesea, valoarea unui sistem și de ce sunt atât de greu de construit, se află în coada lungă a detaliilor - toate compromisurile, soluțiile alternative, optimizările pentru un anumit spațiu de proiectare și cunoștințele instituționale/latente pe care le conțin. Așa că trebuie să continuăm să construim.

Vom rezista nevoii de a prezice exact cât de generativă va avea IA asupra industriei creative. In orice caz, istoria sugerează că noile instrumente tind să extinde mai degrabă decât contract definiția art, și pentru a-l face accesibil noilor tipuri de artiști. În acest caz, noii artiști sunt constructori de sisteme. Asa de, pentru fondatorii tehnologiei, credem că AI generativă este strict un instrument pozitiv pentru extinderea acoperirii software-ului – jocurile vor fi mai frumoase, marketingul mai convingător, conținutul scris mai captivant, filmele mai inspirate.

Cine știe: Într-o zi, o arhivă de la sfârșitul anului 2022 a internetului ar putea fi prețuită ca unul dintre ultimele depozite de conținut generate în mare parte de oameni. Acest text pentru acest articol, cel puțin, a fost generat în întregime de oameni. 

Arta nu este moartă, este doar inteligență de date PlatoBlockchain generată de mașini. Căutare verticală. Ai.
Această piesă a fost scrisă de echipa a16z infra, cu autorii principali Guido Appenzeller, Matt Bornstein, Martin Casado și Yoko Li și contribuția semnificativă a restului echipei.

***

Părerile exprimate aici sunt cele ale personalului individual AH Capital Management, LLC („a16z”) citat și nu sunt punctele de vedere ale a16z sau ale afiliaților săi. Anumite informații conținute aici au fost obținute din surse terțe, inclusiv de la companii de portofoliu de fonduri administrate de a16z. Deși este luat din surse considerate a fi de încredere, a16z nu a verificat în mod independent astfel de informații și nu face nicio declarație cu privire la acuratețea actuală sau de durată a informațiilor sau adecvarea acestora pentru o situație dată. În plus, acest conținut poate include reclame de la terți; a16z nu a revizuit astfel de reclame și nu aprobă niciun conținut publicitar conținut în acestea.

Acest conținut este furnizat doar în scop informativ și nu ar trebui să fie bazat pe consiliere juridică, de afaceri, de investiții sau fiscală. Ar trebui să vă consultați propriii consilieri cu privire la aceste aspecte. Referințele la orice titluri de valoare sau active digitale au doar scop ilustrativ și nu constituie o recomandare de investiții sau o ofertă de a oferi servicii de consiliere în materie de investiții. În plus, acest conținut nu este îndreptat și nici nu este destinat utilizării de către niciun investitor sau potențial investitor și nu poate fi bazat în nicio circumstanță atunci când se ia o decizie de a investi într-un fond administrat de a16z. (Ofertă de a investi într-un fond a16z va fi făcută numai prin memoriul de plasament privat, acordul de subscriere și alte documente relevante ale oricărui astfel de fond și trebuie citită în întregime.) Orice investiții sau companii de portofoliu menționate, la care se face referire sau descrise nu sunt reprezentative pentru toate investițiile în vehicule administrate de a16z și nu poate exista nicio asigurare că investițiile vor fi profitabile sau că alte investiții realizate în viitor vor avea caracteristici sau rezultate similare. O listă a investițiilor realizate de fondurile gestionate de Andreessen Horowitz (excluzând investițiile pentru care emitentul nu a oferit permisiunea ca a16z să dezvăluie public, precum și investițiile neanunțate în active digitale tranzacționate public) este disponibilă la https://a16z.com/investments /.

Diagramele și graficele furnizate în cadrul sunt doar în scop informativ și nu trebuie să se bazeze pe acestea atunci când se ia vreo decizie de investiție. Performanța trecută nu indică rezultatele viitoare. Conținutul vorbește doar de la data indicată. Orice previziuni, estimări, prognoze, obiective, perspective și/sau opinii exprimate în aceste materiale pot fi modificate fără notificare și pot diferi sau pot fi contrare opiniilor exprimate de alții. Vă rugăm să consultați https://a16z.com/disclosures pentru informații suplimentare importante.

Timestamp-ul:

Mai mult de la Andreessen Horowitz