L'arte non è morta, è solo data intelligence PlatoBlockchain generata dalle macchine. Ricerca verticale. Ai.

L'arte non è morta, è solo generata da una macchina

Perché i modelli di intelligenza artificiale sostituiranno gli artisti molto prima che sostituiscano i programmatori

Forse l'implicazione più strabiliante che stiamo vedendo dall'IA generativa è che, contrariamente all'opinione comune secondo cui la creatività sarà l'ultimo baluardo dell'ingegnosità umana di fronte all'automazione, in realtà sembra essere molto più facile automatizzare attività creative piuttosto difficili piuttosto che automatizzare attività di programmazione relativamente semplici. Per avere un'idea di ciò, confrontiamo due dei casi d'uso più popolari per l'IA generativa: generazione di codice e generazione di immagini. Ma crediamo che l'affermazione regga più in generale, anche se i modelli generativi si espandono in applicazioni più complesse.

La versione breve dell'argomento (che affronteremo più dettagliatamente di seguito) è che sebbene un prodotto piace Copilota GitHub, nella sua forma attuale, può rendere la codifica in qualche modo più efficiente, non elimina la necessità di sviluppatori di software capaci con conoscenze di programmazione. Uno dei motivi principali è che, quando si tratta di creare un programma, la correttezza conta davvero. Se l'intelligenza artificiale genera un programma, richiede comunque a un essere umano di verificare che sia corretto, uno sforzo quasi allo stesso livello della sua creazione per cominciare.

D'altra parte, chiunque sappia digitare può usare un modello come Diffusione stabile per produrre immagini uniche e di alta qualità in pochi minuti, a costi di molti ordini di grandezza inferiori. I prodotti del lavoro creativo spesso non hanno rigidi vincoli di correttezza e gli output dei modelli sono straordinariamente completi. È difficile non assistere a un completo cambiamento di fase nei settori che si affidano alle immagini creative perché, per molti usi, le immagini che l'IA è in grado di produrre ora sono già sufficienti e siamo ancora agli inizi della tecnologia.

Riconosciamo pienamente che è difficile essere fiduciosi in qualsiasi previsione al ritmo in cui si sta muovendo il campo. In questo momento, tuttavia, sembra che sia molto più probabile vedere applicazioni piene di immagini creative create rigorosamente da programmatori rispetto ad applicazioni con arte disegnata dall'uomo e costruite rigorosamente da creatori. 

Perché l'hype, e perché ora?

Prima di entrare nello specifico della generazione di codice rispetto alla generazione di immagini, è utile avere un'idea di quanto siano popolari l'IA in generale e l'IA generativa, in particolare, al momento.

L'IA generativa sta assistendo all'adozione più rapida da parte degli sviluppatori che abbiamo mai visto. Mentre scriviamo, Stable Diffusion supera facilmente le classifiche di tendenza dei repository GitHub con un ampio margine. La sua crescita è molto più avanzata di qualsiasi tecnologia recente in infrastrutture o criptovalute (vedi la figura sopra). Ci sono quasi quotidianamente annunci di lancio e finanziamento di startup che utilizzano la tecnologia e i social network online vengono inondati di contenuti creati da modelli generativi.

Anche il livello complessivo degli investimenti nell'IA nell'ultimo decennio è difficile da sopravvalutare. Abbiamo assistito a un aumento esponenziale delle sole pubblicazioni dalla metà degli anni 2010 (vedi figura sotto). Oggi, circa il 20% di tutti gli articoli pubblicati su arXiv riguarda AI, ML e PNL. È importante sottolineare che i risultati teorici hanno superato una soglia critica in cui sono diventati facilmente consumabili e hanno innescato un'esplosione cambriana di nuove tecniche, software e startup. 

L'arte non è morta, è solo data intelligence PlatoBlockchain generata dalle macchine. Ricerca verticale. Ai.

Il picco più recente nella figura sopra è in gran parte dovuto all'IA generativa. In un solo decennio, siamo passati da modelli di intelligenza artificiale riservati agli esperti, in grado di classificare immagini e creare incorporamenti di parole, a modelli utilizzabili pubblicamente, in grado di scrivere codice efficace e creare immagini straordinariamente accurate utilizzando prompt del linguaggio naturale. Non sorprende che il ritmo dell'innovazione sia solo aumentato e non dovrebbe sorprendere quando i modelli generativi iniziano a farsi strada in altre aree un tempo dominate dagli esseri umani.

IA generativa e programmazione

Uno dei primi usi dell'IA generativa è stato come aiuto per i programmatori. Il modo in cui funziona è che un modello viene addestrato su un ampio corpus di codice (ad esempio tutti i repository pubblici in GitHub) e quindi fornisce un suggerimento a un programmatore mentre codifica. I risultati sono eccezionali. Tanto che è ragionevole che questo approccio diventi sinonimo di programmazione in futuro.

L'arte non è morta, è solo data intelligence PlatoBlockchain generata dalle macchine. Ricerca verticale. Ai.
Codice generato: sicuro contro gli attacchi che non utilizzano il punto e virgola.

Tuttavia, i guadagni di produttività sono stati modesti rispetto alla generazione di immagini, che tratteremo di seguito. Parte della ragione di ciò, come accennato in precedenza, è che la correttezza è fondamentale nella programmazione (e in effetti i problemi di ingegneria più in generale, ma in questo post ci concentreremo sulla programmazione). Per esempio, uno studio recente trovato quello per scenari corrispondenti ad alto rischio CWE (enumerazione dei punti deboli comuni), il 40% del codice generato dall'IA conteneva vulnerabilità.

Pertanto, l'utente deve trovare un equilibrio tra la generazione di codice sufficiente per fornire un aumento significativo della produttività, pur limitandolo in modo che sia possibile verificarne la correttezza. Di conseguenza, Copilot ha aiutato migliorare la produttività degli sviluppatori — studi recenti (qui ed qui) mettere guadagni nell'ordine di 2x o meno, ma a un livello pari a quello che abbiamo visto nei precedenti progressi dei linguaggi e degli strumenti per sviluppatori. Il passaggio dall'assemblaggio a C, ad esempio, ha migliorato la produttività di 2-5 volte secondo alcune stime.

Per i programmatori più esperti, le preoccupazioni potrebbero estendersi oltre la correttezza del codice e la qualità complessiva del codice. Come veloce.aiè Jeremy Howard ha spiegato per quanto riguarda le recenti versioni del modello OpenAI Codex, “[I] t scrive codice dettagliato perché sta generando media codice. Per me, prendere un codice medio e trasformarlo in un codice che mi piace e che so essere corretto è molto più lento che scriverlo da zero, almeno nelle lingue che conosco bene".

Quindi, mentre è chiaro che la programmazione generativa è una funzione graduale nella produttività degli sviluppatori, non è chiaro che il miglioramento sia radicalmente diverso da quelli che abbiamo visto prima. L'intelligenza artificiale generativa rende i programmatori migliori, ma devono comunque programmare.

IA generativa e immagini

D'altra parte, l'impatto dei modelli generativi sull'output del lavoro creativo, come la generazione di immagini, è estremo. Ha portato a miglioramenti di molti ordini di grandezza in termini di efficienza e costi ed è difficile non vederlo inaugurare un cambiamento di fase a livello di settore.

Il modo in cui l'IA generativa funziona in questo spazio è prendere semplici input testuali dall'utente, chiamati prompt, e quindi il modello genera un output visivo. Attualmente esistono modelli per la creazione di molti formati di output, tra cui immagini, video, modelli 3D e texture.

Ciò che è particolarmente interessante è il modo in cui questi modelli possono essere estesi per generare immagini nuove o specifiche del dominio con quasi nessun intervento creativo. Ad esempio, Guido (uno degli autori) ha preso un modello di immagine pre-addestrato e lo ha riaddestrato su alcune dozzine di foto di se stesso. Da lì, è stato in grado di generare immagini utilizzando nel prompt. Di seguito sono riportate le foto generate dalle seguenti richieste: " nel ruolo di Capitan America"," a Parigi"," in un dipinto".

L'arte non è morta, è solo data intelligence PlatoBlockchain generata dalle macchine. Ricerca verticale. Ai.
Dove la generazione di immagini è un enorme allontanamento dalla generazione di codice in un contesto aziendale è la misura in cui l'IA generativa cambia il calcolo economico. Per creare le immagini di cui sopra, Guido ha addestrato il modello su una manciata di foto che costano circa $ 50 in risorse infrastrutturali. Una volta addestrato, la generazione di immagini costa circa $ 0.001 nelle risorse di calcolo e può essere eseguito nel cloud o su un laptop di ultima generazione. Inoltre, la generazione dell'immagine richiede solo pochi secondi. 

Senza l'intelligenza artificiale generativa, l'unico modo per ottenere un'immagine personalizzata è assumere un artista o farlo da soli. Anche se partiamo dal presupposto che una persona potrebbe creare un'immagine fotorealistica completamente personalizzata entro un'ora per $ 10, l'approccio dell'IA generativa è facilmente quattro ordini di grandezza più economico e un ordine di grandezza più veloce. Più realisticamente, qualsiasi opera d'arte personalizzata o progetto di progettazione grafica richiederà probabilmente giorni o settimane e costerà centinaia, se non migliaia, di dollari. 

Simile agli aiuti alla programmazione di cui sopra, l'IA generativa lo sarà adottato come strumento da artisti ed entrambi richiedono un certo grado di supervisione da parte dell'utente. Ma è difficile sopravvalutare la differenza economica creata dalla capacità di un modello di immagine di imitare l'intera produzione dell'artista. Utilizzando un modello di generazione del codice, anche la scrittura di un programma funzionale di base che esegue un'attività di elaborazione standard richiede la revisione, la modifica e l'aggiunta di test per molti frammenti di codice. Ma per un'immagine di base, inserire un prompt e scegliere un'immagine da una dozzina di suggerimenti può essere fatto in meno di un minuto.

Prendiamo ad esempio la nostra vignettista (e partner di investimento) Yoko Li (@stuffyokodraws). Abbiamo addestrato un modello utilizzando 70 delle sue immagini precedenti e il modello è stato in grado di generare immagini con un inquietante livello di mimetismo. Ogni artista deve capire cosa creare dopo, e ha persino scoperto che i modelli addestrati possono far emergere più opzioni di quelle che aveva in mente, almeno quando viene premuto per produrre qualcosa in un determinato periodo di tempo. Esistono centinaia di modi per disegnare lo stesso oggetto, ma i modelli generativi hanno reso subito evidente quali percorsi vale la pena esplorare. 

Quindi, quando si tratta di tali compiti, non stiamo sostenendo che i computer lo siano necessariamente better rispetto agli esseri umani su base 1:1. Ma come con tante altre attività, quando i computer possono produrre un output di lavoro completo, ci uccidono scala

Prova a indovinare quali dei disegni qui sotto sono stati disegnati direttamente da Yoko e quali invece sono stati generati. 

L'arte non è morta, è solo data intelligence PlatoBlockchain generata dalle macchine. Ricerca verticale. Ai.
Risposta: Il modello AI ha generato le immagini con uno sfondo non bianco.

Il massiccio miglioramento dell'economia, la flessibilità nella possibilità di creare nuovi stili e concetti e la capacità di generare un output di lavoro completo o quasi completo ci suggerisce che siamo pronti a vedere un cambiamento marcato in tutti i settori in cui le risorse creative sono un gran parte dell'attività. E questo non è limitato alle immagini, ma vale per l'intero campo del design. Per esempio:

  • L'intelligenza artificiale generativa può creare arte 2D, trame, modelli 3D e aiutare con la progettazione dei livelli per i giochi. 
  • Nel marketing, sembra pronto a sostituire stock art, fotografie di prodotti e illustrazioni. 
  • Stiamo già vedendo applicazioni nel web design, nell'interior design e nel landscape design.

E siamo davvero solo all'inizio. Se un caso d'uso richiede la generazione creativa di contenuti, è difficile capire perché l'IA generativa non lo interrompa o almeno non diventi parte del processo.

-

OK, quindi qual è il punto di questo post? Sebbene sia in qualche modo focalizzato sulla generazione di codice e sulla generazione di immagini, sospettiamo che i risultati valgano più in generale. In particolare, è probabile che gli sforzi creativi su tutta la linea, siano essi visivi, testuali o musicali, vengano interrotti dall'IA molto prima della costruzione dei sistemi. 

Oltre all'argomentazione sulla correttezza che usiamo sopra, può anche darsi che combinare e ricombinare tutta l'arte precedente possa essere sufficiente per la gamma pratica di risultati creativi. Le industrie della musica e del cinema, ad esempio, hanno storicamente prodotto innumerevoli imitazioni di album e film popolari. È del tutto concepibile che i modelli generativi possano aiutare ad automatizzare tali funzioni nel tempo. Tuttavia, la cosa straordinaria di così tante immagini prodotte da Stable Diffusion e DALL-E 2 è che sono davvero buoni ed veramente interessante. Non è difficile immaginare un modello di intelligenza artificiale che produca fusioni veramente interessanti di stili musicali o addirittura "scriva" lungometraggi che siano intriganti nel modo in cui legano insieme concetti e stili. 

Al contrario, è difficile immaginare che i sistemi precedenti conterranno tutti gli strumenti di cui avremmo bisogno per sviluppare tutti i sistemi futuri. O anche che sistemi complessi potrebbero essere facilmente combinati come vari stili artistici o musicali. Molto spesso il valore di un sistema, e il motivo per cui sono così difficili da costruire, sta nella lunga coda di dettagli: tutti i compromessi, le soluzioni alternative, le ottimizzazioni per un dato spazio di progettazione e la conoscenza istituzionale/latente che contengono. Quindi continuare a costruire dobbiamo.

Resisteremo all'impulso di prevedere di preciso in che modo l'IA generativa avrà un impatto sull'industria creativa. Tuttavia, la storia suggerisce che i nuovi strumenti tendono a espandere piuttosto che contrattare la definizione dell'arte per renderlo accessibile a nuovi tipi di artisti. In questo caso, i nuovi artisti sono costruttori di sistemi. Così, per i fondatori di tecnologia, crediamo che l'IA generativa sia uno strumento strettamente positivo per estendere la portata del software: i giochi saranno più belli, il marketing più avvincente, i contenuti scritti più coinvolgenti, i film più stimolanti.

Chissà: un giorno, un archivio di Internet della fine del 2022 potrebbe essere apprezzato come uno degli ultimi repository di contenuti per lo più generati dall'uomo. Questo testo per questo articolo, almeno, è stato generato interamente da esseri umani. 

L'arte non è morta, è solo data intelligence PlatoBlockchain generata dalle macchine. Ricerca verticale. Ai.
Questo pezzo è stato scritto dal team di a16z infra, con gli autori principali Guido Appenzeller, Matt Bornstein, Martin Casado e Yoko Li, e il forte contributo del resto del team.

***

Le opinioni qui espresse sono quelle del personale di AH Capital Management, LLC ("a16z") citato e non sono le opinioni di a16z o delle sue affiliate. Alcune informazioni qui contenute sono state ottenute da fonti di terze parti, incluse società in portafoglio di fondi gestiti da a16z. Sebbene tratti da fonti ritenute affidabili, a16z non ha verificato in modo indipendente tali informazioni e non fornisce dichiarazioni sull'accuratezza attuale o duratura delle informazioni o sulla sua adeguatezza per una determinata situazione. Inoltre, questo contenuto può includere pubblicità di terze parti; a16z non ha esaminato tali annunci pubblicitari e non approva alcun contenuto pubblicitario in essi contenuto.

Questo contenuto viene fornito solo a scopo informativo e non deve essere considerato come consulenza legale, commerciale, di investimento o fiscale. Dovresti consultare i tuoi consulenti in merito a tali questioni. I riferimenti a qualsiasi titolo o risorsa digitale sono solo a scopo illustrativo e non costituiscono una raccomandazione di investimento o un'offerta per fornire servizi di consulenza in materia di investimenti. Inoltre, questo contenuto non è diretto né destinato all'uso da parte di investitori o potenziali investitori e non può in alcun caso essere invocato quando si decide di investire in qualsiasi fondo gestito da a16z. (Un'offerta per investire in un fondo a16z sarà fatta solo dal memorandum di collocamento privato, dal contratto di sottoscrizione e da altra documentazione pertinente di tale fondo e dovrebbe essere letta nella sua interezza.) Eventuali investimenti o società in portafoglio menzionati, citati o descritti non sono rappresentativi di tutti gli investimenti in veicoli gestiti da a16z, e non si può garantire che gli investimenti saranno redditizi o che altri investimenti effettuati in futuro avranno caratteristiche o risultati simili. Un elenco degli investimenti effettuati da fondi gestiti da Andreessen Horowitz (esclusi gli investimenti per i quali l'emittente non ha autorizzato a16z a divulgare pubblicamente e gli investimenti non annunciati in asset digitali quotati in borsa) è disponibile all'indirizzo https://a16z.com/investments /.

Grafici e grafici forniti all'interno sono esclusivamente a scopo informativo e non dovrebbero essere presi in considerazione quando si prende una decisione di investimento. I rendimenti passati non sono indicativi di risultati futuri. Il contenuto parla solo a partire dalla data indicata. Eventuali proiezioni, stime, previsioni, obiettivi, prospettive e/o opinioni espresse in questi materiali sono soggette a modifiche senza preavviso e possono differire o essere contrarie alle opinioni espresse da altri. Si prega di consultare https://a16z.com/disclosures per ulteriori informazioni importanti.

Timestamp:

Di più da Andreessen Horowitz