Portare l'intelligenza artificiale alla realtà

Portare l'intelligenza artificiale alla realtà

Portare l'intelligenza artificiale nella realtà PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

Funzionalità sponsorizzata Un nuovo strumento affilato utilizzato sempre di più dai team IT aziendali creativi è l’intelligenza artificiale generativa, che ha il potenziale per consentire importanti progressi nel modo in cui un’impresa conduce la propria attività. Questo perché il suo valore può essere utilizzato in numerose applicazioni e servizi interni ed esterni, inclusi elementi come chatbot di vendita, processi HR e video di formazione, istruzione e marketing guidati da avatar.

Combinando questo intrigante software di intelligenza artificiale con un veloce hardware server di nuova generazione, le startup più informate stanno progettando, costruendo e distribuendo nuove applicazioni sul mercato, in molti casi prima del previsto.

Una di queste startup è Deep Brain, uno specialista della tecnologia AI incentrato sull'uomo. DeepBrain è un membro del Programma Lenovo AI Innovators, che fornisce alle startup l'accesso alle competenze, alle risorse e all'hardware dei server di Lenovo per aiutarle a creare prodotti e accelerare la crescita aziendale.

Il prodotto di punta di DeepBrain è AI Avatar, che può essere utilizzato per creare video guidati da avatar ultrarealistici che possono essere utilizzati per vari scopi, tra cui vendite, formazione e marketing. L'Avatar AI utilizza la sintesi video AI generativa proprietaria di DeepBrain per combinare sintesi vocale e modelli linguistici di grandi dimensioni (LLM) per creare esseri umani IA quasi indistinguibili dalle persone reali.

"Un elemento chiave di differenziazione dei nostri avatar è ciò che chiamiamo iperrealistico", afferma Joe Murphy, responsabile dello sviluppo aziendale di DeepBrain. "Se ti mostro la persona reale e creo video uno accanto all'altro, non dovresti essere in grado di notare la differenza e abbiamo dati a sostegno di ciò. Abbiamo una misura chiamata indice di somiglianza strutturale, dove il 100% equivale al 100% simile alla persona reale; arriviamo a 96.5 su quella scala. DeepBrain in realtà clona la voce della persona reale in ogni produzione, ha detto Murphy.

I conduttori delle notizie AI hanno fatto notizia

Uno dei primi clienti di Murphy è stato MBN, una rete di notizie di Seul, Corea del Sud. "Hanno lanciato il primo conduttore di notizie basato sull'intelligenza artificiale utilizzando la nostra tecnologia", ha detto Murphy. “Hanno identificato quello che chiamano il 'volto in franchising' della rete – come Anderson Cooper sulla CNN o Sean Hannity su Fox. Il suo nome era Kim Joo Ha: il volto di un marchio fidato con una voce fidata. L'abbiamo portata in studio e abbiamo registrato il suo talento per circa quattro ore in un ambiente con schermo verde. Questi sono i dati di addestramento che utilizziamo per costruire il nostro modello."

L'avatar di Kim Joo Ha non viene utilizzato ogni giorno nei notiziari di MBN, ha detto Murphy. Invece, sostituisce la persona reale nelle apparizioni di routine come spot promozionali e pubblicitari, in modo che la conduttrice stessa possa concentrarsi su ciò che sa fare meglio: fornire le notizie. "Questo ovviamente si rivela un uso molto migliore del suo tempo", ha detto Murphy.

Nel corso degli anni, DeepBrain ha rafforzato il proprio processo di produzione ed è in costante miglioramento, ha affermato Murphy.

"Quindi ora siamo scesi a circa quattro ore di video, seguite da tre settimane di tempo di apprendimento automatico", ha affermato. “E poi il modello è pronto. Essenzialmente, è un modello di ingresso testo/uscita video. Inietti il ​​testo che desideri, quindi premi Esporta. Il modello genera quindi il video di quella persona che consegna lo script che hai digitato. Quindi è semplice: ingresso script, uscita video."

Il processo di compilazione di file video e audio ricchi di dati, che spesso richiede ore per essere completato e renderizzato, è stato lento per le aziende pioniere dell’intelligenza artificiale. DeepBrain ha risolto questo problema.

"La velocità di sintesi è il nostro secondo elemento di differenziazione", ha affermato Murphy. “Questo è ciò che ci consente di avere esseri umani con intelligenza artificiale conversazionale; possiamo sintetizzare video velocemente quanto in tempo reale. Ciò consente video interattivi in ​​cui puoi porre una domanda e l'intelligenza artificiale umana può quindi rispondere. Questo è qualcosa che abbiamo implementato nel 711 (minimarket) in Corea e nell'hotel Novotel in Corea. Quindi queste sono situazioni in cui i clienti possono avvicinarsi a un chiosco, fare domande e poi l'intelligenza artificiale umana risponde alla domanda. Fondamentalmente si tratta di prendere un chatbot e mettere un avatar come volto umano."

DeepBrain utilizza la “caching intelligente” in questi chioschi interattivi, ha affermato Murphy, per gestire le domande ripetitive. “Quando le persone fanno le stesse domande, ricorda quella risposta. Quando arriva quella domanda, è tutto in coda, pronto a partire”, ha detto.

Altri casi d'uso: chatbot e video di formazione

Più recentemente, DeepBrain si è connesso a modelli linguistici di grandi dimensioni, come ChatGPT e Llama 2.

“Non possiamo anticipare cosa diranno questi modelli”, ha detto Murphy, “quindi lo stiamo trasmettendo il più velocemente possibile. Ciò richiede un tempo di inizio di un secondo, quindi la risposta inizia ad arrivare. È come quando parli con un altoparlante intelligente come Siri o Alexa, c'è un po' di pausa. Per noi è la stessa cosa, ma ora stiamo sintetizzando il video sopra l'audio."

Gli avatar AI di DeepBrain vengono trasmessi in streaming in tempo reale con bassa latenza, garantendo che possano fornire risposte tempestive e conversazionali alle domande. Ciò li rende ideali per un'ampia gamma di applicazioni, tra cui il servizio clienti, la formazione e il marketing.

Alcuni altri esempi di come utilizzare gli avatar AI di DeepBrain includono video di formazione, che per loro stessa natura sono più coinvolgenti e interattivi rispetto ai video standard, e video di istruzioni che sono più divertenti da guardare rispetto ai video tradizionali. Ad esempio, un avatar AI potrebbe essere utilizzato per fornire istruzioni passo passo su come utilizzare un nuovo programma software o su come eseguire un'attività complessa, e magari aggiungere qualche battuta lungo il percorso.

I video di marketing possono fare un passo avanti essendo più personalizzati e coinvolgenti rispetto ai video tradizionali. Ad esempio, un avatar AI potrebbe essere utilizzato per creare un videomessaggio personalizzato per ciascun cliente o per fornire ai clienti supporto e assistenza in tempo reale.

Come l'hardware giusto rende l'alta qualità

Questa altissima qualità non è possibile senza un eccezionale supporto backend. Ha aiutato DeepBrain fornendogli l'accesso a soluzioni infrastrutturali pronte per l'implementazione basate sui server Lenovo ThinkSystem SR675 V3 di fascia alta dell'azienda. Questo hardware è essenziale per l'esecuzione dei LLM ad alta intensità di calcolo di DeepBrain.

ThinkSystem SR675 V3 è dotato di un massimo di due processori scalabili Intel Xeon di quarta generazione e fino a 4 TB di memoria, ideali per gestire modelli linguistici di grandi dimensioni (LLM). Non trovi così tanta memoria disponibile in qualsiasi server.

Di conseguenza, questo server pronto per la distribuzione è particolarmente adatto per applicazioni AI come DeepBrain. Inoltre, presenta una varietà di opzioni di archiviazione veloci, come gli SSD NVMe, che possono fornire le prestazioni necessarie per carichi di lavoro AI impegnativi. Supporta anche reti ad alta velocità, come InfiniBand ed Ethernet. I clienti possono decidere su queste opzioni.

Maggiori informazioni sul programma AI Innovators

Oltre a fornire l'accesso all'hardware, il file Programma Lenovo AI Innovators offre alle startup l'accesso ai centri di eccellenza Lenovo AI. Questi centri forniscono alle startup le competenze e le risorse in materia di cui hanno bisogno per creare prove di concetto personalizzate per potenziali clienti.

"Il programma AI Innovators è stato molto importante per il nostro piano quando abbiamo iniziato (con il progetto avatar del conduttore di notizie MBN)", ha affermato Murphy. "Ci ha aiutato a dettagliare la visione strategica del nostro CEO negli Stati Uniti per sbarcare ed espanderci, prendere ciò che abbiamo fatto in Corea e poi portarlo in Nord America."

Nel frattempo, DeepBrain sta ora lavorando con più di una dozzina di stazioni di notizie in Cina e Corea con conduttori di notizie AI, e stanno tutti utilizzando il prodotto AI Studios mostrato sul sito Web dell'azienda, ha affermato Murphy.

I centri di eccellenza servono 180 paesi e più di 20,000 partner commerciali, aiutandoli quotidianamente a costruire le loro prove di concetto personalizzate per potenziali clienti.

Lenovo presenterà molte delle sue soluzioni di prossima generazione, incluso il caso d'uso DeepBrain Conferenza Lenovo Tech World su ottobre 24.

Sponsorizzato da Lenovo.

Timestamp:

Di più da Il registro