Il pioniere dell'informatica che aiuta l'intelligenza artificiale Vedi | Rivista Quanti

Il pioniere dell'informatica che aiuta l'intelligenza artificiale Vedi | Rivista Quanti

Il pioniere dell'informatica che aiuta l'intelligenza artificiale Vedi | Quanta Magazine PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

Introduzione

Quando Alessio Efros si trasferì con la famiglia dalla Russia alla California da adolescente negli anni '1980, portò con sé il suo personal computer di fabbricazione sovietica, un Elektronika BK-0010. La macchina non aveva memoria esterna e si surriscaldava ogni poche ore, quindi per giocare ai videogiochi doveva scrivere codice, risolvere problemi e giocare velocemente, prima che la macchina si spegnesse. Quel ciclo, ripetuto quasi tutti i giorni, ha accelerato il suo apprendimento.

"Sono stato molto fortunato che questo computer sovietico non fosse molto buono!" ha detto Efros, che ride facilmente e parla con un lieve accento russo. Al giorno d'oggi non gioca più a tanti giochi, ma rimane la volontà di esplorare e sfruttare al meglio i suoi strumenti.

Durante la scuola di specializzazione presso l'Università della California, Berkeley, Efros iniziò a fare escursioni ed esplorare le bellezze naturali della Bay Area. Non passò molto tempo prima che iniziasse a combinare la sua passione per i computer con il piacere di questi luoghi. Ha sviluppato un modo per riparare perfettamente i buchi nelle fotografie, ad esempio sostituendo un cassonetto errante in una foto di una foresta di sequoie con alberi dall'aspetto naturale. Adobe Photoshop ha successivamente adottato una versione della tecnica per il suo strumento di “riempimento consapevole del contenuto”.

Ora scienziato informatico presso il Berkeley Artificial Intelligence Research Lab, Efros combina enormi set di dati online con algoritmi di apprendimento automatico per comprendere, modellare e ricreare il mondo visivo. Nel 2016 l'Association for Computing Machinery gli ha assegnato il premio Premio per l'informatica per il suo lavoro nel creare immagini sintetiche realistiche, definendolo un “alchimista dell'immagine. "

Introduzione

Efros afferma che, nonostante i migliori sforzi dei ricercatori, le macchine vedono ancora in modo fondamentalmente diverso da noi. "Le macchie di colore e luminosità ci impongono di collegare ciò che stiamo vedendo ora alla nostra memoria di dove abbiamo già visto queste cose in precedenza", ha detto Efros. "Questa connessione dà significato a ciò che stiamo vedendo." Troppo spesso le macchine vedono ciò che c’è in questo momento senza collegarlo a ciò che hanno visto prima.

Ma la differenza può avere dei vantaggi. Nella visione artificiale, Efros apprezza l'immediatezza di sapere se un algoritmo progettato per riconoscere oggetti e scene funziona su un'immagine. Alcune delle sue domande sulla visione artificiale, come "Cosa fa sembrare Parigi come Parigi?"- hanno un'inclinazione filosofica. Altri, ad esempio come affrontare persistent bias nei set di dati, sono pratici e pressanti.

“Ci sono molte persone che fanno intelligenza artificiale con il linguaggio in questo momento”, ha detto Efros. "Voglio osservare i modelli interamente visivi che vengono lasciati indietro." Migliorando la visione artificiale, non solo spera in migliori applicazioni pratiche, come le auto a guida autonoma; vuole anche estrarre quelle intuizioni per comprendere meglio quella che chiama “intelligenza visiva umana” – come le persone danno un senso a ciò che vedono.

Quanta Magazine ha incontrato Efros nel suo ufficio di Berkeley per parlare dei superpoteri scientifici, della difficoltà di descrivere le immagini e di quanto sia davvero pericolosa l'intelligenza artificiale. L'intervista è stata condensata e modificata per chiarezza.

Introduzione

Come è migliorata la visione artificiale da quando eri studente?

Quando ho iniziato il mio dottorato di ricerca, non c’era quasi nulla di utile. Alcuni robot avvitavano alcune viti utilizzando la visione artificiale, ma ciò era limitato a questo tipo di ambiente industriale molto controllato. Poi, all'improvviso, la mia fotocamera ha rilevato i volti e li ha resi più nitidi.

Ora, la visione artificiale trova applicazione in un gran numero di applicazioni, come ad esempio le auto a guida autonoma. Ci vuole più tempo di quanto alcune persone pensassero inizialmente, ma ci sono comunque dei progressi. Per qualcuno che non guida, questo è estremamente emozionante.

Aspetta, non guidi?

No, non ci vedo abbastanza bene per guidare! [Ride.] Per me, questo sarebbe un vero punto di svolta: avere un'auto che mi porti in posti.

Non avevo capito che la tua vista ti impediva di guidare. Riesci a vedere le immagini con cui lavori sul monitor di un computer?

Se li faccio abbastanza grandi. Puoi vedere che i miei caratteri sono piuttosto grandi. Sono nato non vedendo bene. Penso che tutti gli altri siano strani perché hanno una vista pazzesca.

Il tuo status di non-strano ha influenzato la tua direzione di ricerca?

Chi lo sa? Sicuramente non c'era la sensazione di "Oh, non vedo bene, quindi creerò computer che vedano meglio". No, non l'ho mai avuto come motivazione.

Per essere un bravo scienziato, hai bisogno di un superpotere segreto. Devi fare qualcosa meglio di chiunque altro. Il bello della scienza è che non tutti abbiamo lo stesso superpotere. Forse il mio superpotere è stato che, poiché non vedo molto bene, potrei avere una visione più approfondita del problema della vista.

Introduzione

Ho capito presto l'importanza dei dati precedenti quando guardo il mondo. Anch'io non riuscivo a vedere molto bene, ma la mia memoria di esperienze precedenti riempiva i buchi abbastanza da permettermi di funzionare sostanzialmente come una persona normale. La maggior parte delle persone non sa che non vedo bene. Questo mi ha dato, credo, questa intuizione unica che potrebbe riguardare meno i pixel e più la memoria.

I computer vedono solo quello che c'è adesso, mentre noi vediamo il momento connesso all'arazzo di tutto ciò che abbiamo visto prima.

È possibile esprimere a parole i sottili schemi visivi che, ad esempio, fanno sembrare Parigi come Parigi?

Quando sei in una città particolare, a volte sai semplicemente in che città ti trovi: ecco questo devi solo, anche se non sei mai stato a quell'angolo di strada in particolare. È estremamente difficile da descrivere a parole, ma è proprio lì, nei pixel.

[Per Parigi], potresti parlare di come di solito ci siano edifici a sei piani, e di solito ci sono balconi al quarto piano. Potresti esprimere parte di questo a parole, ma molto non è linguistico. Per me è emozionante.

Il tuo lavoro recente riguarda l'insegnamento dei computer acquisire dati visivi in modi che imitano la vista umana. Come funziona?

Al momento, i computer dispongono di un enorme set di dati: miliardi di immagini casuali raschiate da Internet. Prendono immagini casuali, elaborano un'immagine, quindi prendono un'altra immagine casuale, la elaborano, ecc. Alleni il tuo sistema [visivo del computer] esaminando ripetutamente questo set di dati.

Il modo in cui noi, agenti biologici, assorbiamo i dati è molto diverso. Quando ci troviamo di fronte a una situazione nuova, è l’unico momento in cui questi dati saranno a nostra disposizione. Non siamo mai stati in questa esatta situazione, in questa stanza, con questa illuminazione, vestiti in questo modo. Innanzitutto, utilizziamo questi dati per fare ciò di cui abbiamo bisogno, per comprendere il mondo. Quindi, utilizziamo questi dati per imparare da essi, [per prevedere] il futuro.

Introduzione

Inoltre, i dati che vediamo non sono casuali. Ciò che vedi ora è molto correlato a ciò che hai visto pochi secondi fa. Puoi considerarlo come un video. Tutti i fotogrammi del video sono correlati tra loro, il che è molto diverso da come i computer elaborano i dati.

Mi interessa che il nostro approccio all'apprendimento sia quello in cui i computer vedono i dati man mano che arrivano, li elaborano e imparano da essi mentre vanno.

Immagino che non sia così semplice come far guardare ai computer i video invece delle immagini fisse.

No, hai ancora bisogno dei computer per adattarti. Mi interessa apprendere approcci che vedano i dati man mano che arrivano, quindi li elaborano e imparano da essi man mano che procedono. Un approccio che abbiamo è noto come formazione in fase di prova. L'idea è che, mentre guardi una sequenza di immagini come un video, le cose potrebbero cambiare. Quindi non vuoi che il tuo modello venga corretto. Proprio come un agente biologico si adatta continuamente all’ambiente circostante, noi vogliamo che il computer si adatti continuamente.

Il paradigma standard prevede la formazione prima su un set di big data e poi la distribuzione. Dall·E e ChatGPT si sono formati su Internet intorno al 2021, e poi [la loro conoscenza] si è congelata. Poi vomita quello che già sa. Un modo più naturale è [la formazione in fase di prova], per cercare di assorbire i dati e apprendere sul lavoro, senza avere fasi separate di formazione e implementazione.

Esiste sicuramente un problema con i computer, chiamato spostamento del dominio o bias del set di dati: questa idea secondo cui, se i dati di addestramento sono molto diversi dai dati che stai utilizzando durante la distribuzione del sistema, le cose non funzioneranno ottimo. Stiamo facendo dei progressi, ma non siamo ancora arrivati ​​a quel punto.

Introduzione

Il problema è simile a quello con cui le banche avvertono gli investitori che le performance passate potrebbero non prevedere i guadagni futuri?

E' proprio questo il problema. Nel mondo reale le cose cambiano. Ad esempio, se un topo finisce in una casa, andrà bene. Non ti libererai mai di quel topo! [Ride.] È nato in un campo, non è mai stato in una casa prima, eppure troverà e mangerà tutte le tue provviste. Si adatta molto rapidamente, impara e si adatta al nuovo ambiente.

Questa capacità non è presente negli attuali sistemi [di visione artificiale]. Con la guida autonoma, se alleni un’auto in California e poi la provi in ​​Minnesota – boom! - c'è la neve. Non ha mai visto la neve. Si confonde.

Ora le persone affrontano questo problema ottenendo così tanti dati che [il sistema] ha praticamente visto tutto. Quindi non ha bisogno di adattarsi. Ma a questo mancano ancora eventi rari.

Sembra quindi che i sistemi di intelligenza artificiale siano la strada da seguire. Dove finisce questo per gli esseri umani?

Il lavoro uscito da OpenAI sia sul fronte del testo (ChatGPT) che su quello delle immagini (Dall·E) è stato incredibilmente emozionante e sorprendente. Riafferma l'idea che, una volta che si hanno dati sufficienti, metodi ragionevolmente semplici possono produrre risultati sorprendentemente buoni.

Introduzione

Ma ChatGPT mi ha fatto capire che gli esseri umani non sono così creativi ed eccezionali come ci piace vedere noi stessi. Nella maggior parte dei casi, i riconoscitori di schemi presenti in noi potrebbero prendere il sopravvento. Parliamo con frasi composte da frasi o frasi che abbiamo già sentito prima. Naturalmente, abbiamo voli di fantasia e creatività. Siamo in grado di fare cose che i computer non possono fare, almeno per ora. Ma nella maggior parte dei casi potremmo essere sostituiti da ChatGPT e la maggior parte delle persone non se ne accorgerebbe.

È umiliante. Ma è anche una motivazione per uscire da questi schemi, per provare ad avere più voli di fantasia, per non rimanere bloccati nei cliché e nei pastiche.

Alcuni scienziati hanno espresso preoccupazione per i rischi che l’intelligenza artificiale comporta per l’umanità. Sei preoccupato?

Molti ricercatori che rispetto molto hanno messo in guardia sull’intelligenza artificiale. Non voglio minimizzare quelle parole. Molti di questi sono punti validi. Ma bisogna mettere le cose in prospettiva.

In questo momento, il pericolo più grande per la civiltà non viene dai computer ma dagli esseri umani. L’Armageddon nucleare e il cambiamento climatico sono preoccupazioni molto più urgenti. La Federazione Russa ha attaccato il suo vicino del tutto innocente. Sono nato in Russia ed è particolarmente terrificante che i miei ex connazionali possano fare una cosa del genere. Sto facendo tutto il possibile per assicurarmi che questo rimanga l'argomento numero uno.

Potremmo pensare che la rivoluzione dell’intelligenza artificiale sia l’evento più importante della nostra vita. Ma la rivoluzione dell’IA non servirà a niente se non salviamo il mondo libero.

Quindi non ti preoccupi affatto dell'intelligenza artificiale?

No. Sai, mi piace preoccuparmi. Sono molto preoccupato! Ma se Putin che distrugge il mondo è qui [alza la mano alla testa] e il cambiamento climatico è qui [abbassa la mano sulle spalle], allora l’intelligenza artificiale è quaggiù [abbassa la mano ai piedi]. Sono frazioni di percentuale della mia preoccupazione rispetto a Putin e al cambiamento climatico.

Timestamp:

Di più da Quantamagazine