L'intelligenza artificiale di oggi è l'intelligenza artificiale artificiale

Ripubblicato da Platone

Seguaci: 0

L'intelligenza artificiale di oggi è l'intelligenza artificiale artificiale PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

I lavoratori assunti tramite servizi di crowdsourcing come Amazon Mechanical Turk utilizzano modelli linguistici di grandi dimensioni per completare le loro attività, il che potrebbe avere effetti a catena negativi sui modelli di intelligenza artificiale in futuro.

I dati sono fondamentali per l'IA. Gli sviluppatori hanno bisogno di set di dati puliti e di alta qualità per creare sistemi di machine learning accurati e affidabili. La compilazione di dati preziosi e di prim'ordine, tuttavia, può essere noiosa. Le aziende spesso si rivolgono a piattaforme di terze parti come Amazon Mechanical Turk per istruire gruppi di lavoratori a basso costo a svolgere attività ripetitive, come etichettare oggetti, descrivere situazioni, trascrivere passaggi e annotare il testo.

Il loro output può essere ripulito e inserito in un modello per addestrarlo a riprodurre quel lavoro su una scala molto più ampia e automatizzata.

I modelli di intelligenza artificiale sono quindi costruiti sulle spalle del lavoro umano: persone che lavorano duramente, fornendo montagne di esempi di addestramento per i sistemi di intelligenza artificiale che le aziende possono utilizzare per guadagnare miliardi di dollari.

Ma un esperimento condotto dai ricercatori dell'École polytechnique fédérale de Lausanne (EPFL) in Svizzera ha concluso che questi lavoratori in crowdsourcing utilizzano sistemi di intelligenza artificiale, come il chatbot ChatGPT di OpenAI, per svolgere lavori saltuari online.

Non è consigliabile addestrare un modello sul proprio output. Potremmo vedere modelli di intelligenza artificiale addestrati su dati generati non da persone, ma da altri modelli di intelligenza artificiale, forse anche gli stessi modelli. Ciò potrebbe portare a una qualità dell'output disastrosa, più bias e altri effetti indesiderati.

L'esperimento

Gli accademici hanno reclutato 44 servi turchi meccanici per riassumere gli abstract di 16 documenti di ricerca medica e hanno stimato che dal 33 al 46 percento dei passaggi di testo inviati dai lavoratori sono stati generati utilizzando modelli di linguaggio di grandi dimensioni. I lavoratori della folla sono spesso pagati con salari bassi: l'uso dell'intelligenza artificiale per generare automaticamente risposte consente loro di lavorare più velocemente e accettare più lavori per aumentare la retribuzione.

Il team svizzero ha addestrato un classificatore per prevedere se le osservazioni dei turchi fossero generate dall'uomo o dall'intelligenza artificiale. Gli accademici hanno anche registrato le sequenze di tasti dei loro lavoratori per rilevare se i servi hanno copiato e incollato il testo sulla piattaforma o digitato loro stessi le voci. C'è sempre la possibilità che qualcuno utilizzi un chatbot e quindi digiti manualmente l'output, ma supponiamo che sia improbabile.

"Abbiamo sviluppato una metodologia molto specifica che ha funzionato molto bene per rilevare il testo sintetico nel nostro scenario", Manoel Ribeiro, coautore di lo studio e uno studente di dottorato all'EPFL, ha detto Il registro questa settimana.

"Mentre i metodi tradizionali cercano di rilevare il testo sintetico 'in qualsiasi contesto', il nostro approccio si concentra sul rilevamento del testo sintetico nel nostro scenario specifico."

Il classificatore non è perfetto per identificare se qualcuno ha utilizzato un sistema di intelligenza artificiale o ha prodotto il proprio lavoro. Gli accademici hanno combinato l'output del loro classificatore con i dati di battitura per essere più certi quando qualcuno ha copiato e incollato da un bot o ha prodotto il proprio materiale.

I dati umani sono il gold standard, perché sono gli umani a cui teniamo

"Siamo riusciti a convalidare i nostri risultati utilizzando i dati di battitura che abbiamo anche raccolto da MTurk", ci ha detto Ribeiro. "Ad esempio, abbiamo scoperto che tutti i testi che non sono stati copiati e incollati sono stati da noi classificati come 'reali', il che suggerisce che ci sono pochi falsi positivi."

Il codice e i dati utilizzati per eseguire il test può essere trovato qui, su GitHub.

C'è un altro motivo per cui è improbabile che l'esperimento sia una rappresentazione completamente corretta di quanti lavoratori stanno effettivamente utilizzando l'intelligenza artificiale per automatizzare le attività di crowdsourcing. Gli autori osservano che l'attività di riepilogo del testo è adatta a modelli linguistici di grandi dimensioni rispetto ad altri tipi di lavoro, il che significa che i loro risultati potrebbero essere più distorti verso un numero maggiore di lavoratori che utilizzano strumenti come ChatGPT.

Anche il loro set di dati di 46 risposte di 44 lavoratori è piccolo. I lavoratori sono stati pagati $ 1 per ogni riassunto di testo, che ancora una volta può solo incoraggiare l'uso dell'intelligenza artificiale.

I modelli di linguaggio di grandi dimensioni peggioreranno se saranno sempre più addestrati su contenuti falsi generati dall'intelligenza artificiale raccolti da piattaforme crowdsource, hanno sostenuto i ricercatori. Abiti come OpenAI mantengono segreto il modo in cui addestrano i loro ultimi modelli e potrebbero non fare molto affidamento su cose come Mechanical Turk, se non del tutto. Detto questo, molti altri modelli possono fare affidamento su lavoratori umani, che a loro volta possono utilizzare i robot per generare dati di addestramento, il che è un problema.

Mechanical Turk, per esempio, è commercializzato come fornitore di "soluzioni di etichettatura dei dati per potenziare i modelli di apprendimento automatico".

"I dati umani sono il gold standard, perché sono gli esseri umani che ci interessano, non i grandi modelli linguistici", ha affermato Riberio. "Non prenderei una medicina che è stata testata solo in un modello biologico di Drosophila", ha detto come esempio.

Le risposte generate dai modelli di intelligenza artificiale di oggi sono generalmente piuttosto blande o banali e non catturano la complessità e la diversità della creatività umana, hanno sostenuto i ricercatori.

"A volte ciò che vogliamo studiare con i dati raccolti in crowdsourcing sono proprio i modi in cui gli esseri umani sono imperfetti", ci ha detto Robert West, coautore dell'articolo e assistente professore presso la scuola di informatica e scienze della comunicazione dell'EPFL.

Man mano che l'intelligenza artificiale continua a migliorare, è probabile che il lavoro in crowdsourcing cambierà. Riberio ha ipotizzato che modelli linguistici di grandi dimensioni potrebbero sostituire alcuni lavoratori in compiti specifici. "Tuttavia, paradossalmente, i dati umani potrebbero essere più preziosi che mai e quindi potrebbe essere che queste piattaforme saranno in grado di implementare modi per prevenire l'utilizzo di modelli di linguaggio di grandi dimensioni e garantire che rimangano una fonte di dati umani".

Chissà, forse anche gli esseri umani potrebbero finire per collaborare con grandi modelli linguistici per generare risposte, ha aggiunto. ®

Distribuzione di contenuti basati su SEO e PR. Ricevi amplificazione oggi.
EVM Finance. Interfaccia unificata per la finanza decentralizzata. Accedi qui.
Quantum Media Group. IR/PR amplificato. Accedi qui.
PlatoAiStream. Intelligenza dei dati Web3. Conoscenza amplificata. Accedi qui.
Fonte: https://go.theregister.com/feed/www.theregister.com/2023/06/16/crowd_workers_bots_ai_training/

Timestamp: 16 Giugno 2023

Timestamp: Novembre 16, 2022

L'intelligenza artificiale di oggi è un'intelligenza artificiale artificiale artificiale

Ripubblicato da Platone

L'esperimento

Di più da Il registro

3 motivi comuni per i fallimenti dei progetti di analisi e intelligenza artificiale

Hyundai sceglie Palantir per aiutarla a costruire navi militari automatizzate

Tesla frena sull'implementazione del codice Full Self-Driving per i nuovi utenti

FTC ha esortato a congelare il GPT-4 "di parte e ingannevole" di OpenAI

L’intelligenza artificiale non ci toglierà il lavoro ma potrebbe salvare la classe media

Gli investimenti aziendali nell'intelligenza artificiale diminuiscono per la prima volta in un decennio

Il quotidiano nazionale è stato indotto con l'inganno a pubblicare un articolo scritto da AI

Google presenterà le funzionalità di ricerca basate sull'intelligenza artificiale la prossima settimana in un evento dal vivo

IBM Software impone il rientro in carica per coloro che si trovano nel raggio di 80 km

OpenAI afferma che GPT-4 batterà il 90% di te in un esame

DeepMind allena i giocatori di calcio robot a segnare, male

Tesla segnala altri due incidenti mortali con il pilota automatico all'NHTSA

Chi siamo

Ricerca verticale e Ai

Piattaforma

Rimani in contatto

Il mio account