Aducerea AI la realitate

Aducerea AI la realitate

Aducerea AI în realitate PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Funcție sponsorizată Un nou instrument puternic folosit din ce în ce mai mult de echipele IT creative ale întreprinderilor este Generative AI, care are potențialul de a permite progrese majore în modul în care o întreprindere își desfășoară activitatea. Acest lucru se datorează faptului că valoarea sa poate fi utilizată în numeroase aplicații și servicii interne și externe, inclusiv articole precum chatbot-uri de vânzări, procese de resurse umane și formare, instruire și videoclipuri de marketing conduse de avatar.

Combinând acest software AI intrigant cu hardware de server rapid de nouă generație, startup-urile aflate în cunoștință de cauză proiectează, construiesc și livrează noi aplicații pe piață – înainte de termen, în multe cazuri.

Un astfel de startup este DeepBrain, un specialist în tehnologie AI centrat pe om. DeepBrain este membru al Programul Lenovo AI Inovators, care oferă startup-urilor acces la expertiza, resursele și hardware-ul serverului Lenovo pentru a le ajuta să creeze produse și să accelereze creșterea corporativă.

Produsul emblematic al DeepBrain este AI Avatar, care poate fi folosit pentru a crea videoclipuri ultra-realiste conduse de avatar, care pot fi folosite în diverse scopuri, inclusiv vânzări, instruire și marketing. AI Avatar folosește sinteza video AI generativă proprie DeepBrain pentru a combina modele text-to-speech și modele de limbă mare (LLM) pentru a crea oameni AI care sunt aproape imposibil de distins de oamenii reali.

„Un element cheie de diferențiere pentru avatarurile noastre este ceea ce numim hiper-realist”, spune Joe Murphy, ofițerul de dezvoltare a afacerilor DeepBrain. „Dacă vă arăt persoana reală și generez videoclipuri una lângă alta, nu ar trebui să puteți face diferența și avem date pentru a susține asta. Avem o măsurătoare numită indice de similaritate structurală, unde 100% este egal cu 100% similar cu persoana reală; ajungem la 96.5 pe această scară.” DeepBrain clonează de fapt vocea persoanei reale în fiecare producție, a spus Murphy.

Prezentatorii de știri AI au ajuns pe titluri

Unul dintre primii clienți ai lui Murphy a fost MBN, o rețea de știri din Seul, Coreea de Sud. „Au lansat primul prezentator de știri AI folosind tehnologia noastră”, a spus Murphy. „Au identificat ceea ce ei numesc „fața de franciză” a rețelei – cum ar fi Anderson Cooper de la CNN sau Sean Hannity de la Fox. Numele ei era Kim Joo Ha – un chip de marcă de încredere cu o voce de încredere. Am adus-o în studio și i-am înregistrat talentul timp de aproximativ patru ore într-un mediu cu ecran verde. Acestea sunt datele de antrenament pe care le folosim pentru a ne construi modelul.”

Avatarul Kim Joo Ha nu este folosit în emisiunea de știri MBN în fiecare zi, a spus Murphy. În schimb, înlocuiește persoana reală în aparițiile de rutină, cum ar fi spoturile promoționale și publicitare, astfel încât prezentatorul ea însăși se poate concentra pe ceea ce face cel mai bine - să livreze știrile. „În mod evident, se dovedește a fi o utilizare mult mai bună a timpului ei”, a spus Murphy.

De-a lungul anilor, DeepBrain și-a înăsprit procesul de producție și se îmbunătățește constant, a spus Murphy.

„Deci acum ne-am redus la aproximativ patru ore de video, urmate de trei săptămâni de timp de învățare automată”, a spus el. „Și atunci modelul este gata. În esență, este un model de text-in/video-out. Injectați orice text doriți, apoi apăsați Export. Modelul generează apoi videoclipul acelei persoane care livrează scenariul pe care l-ați tastat. Deci, este simplu: introducere script, ieșire video.”

Procesul de compilare a fișierelor video și audio bogate în date – care durează adesea ore pentru a finaliza și a reda – a fost lent pentru companiile de pionierat în domeniul inteligenței artificiale. DeepBrain a rezolvat această problemă.

„Viteza de sinteză este al doilea factor de diferențiere”, a spus Murphy. „Asta este ceea ce ne permite să avem oameni conversaționali cu inteligență artificială; putem sintetiza videoclipuri la fel de repede ca în timp real. Așadar, acest lucru permite videoclipuri interactive în care puteți pune o întrebare, iar umanul AI poate răspunde. Acesta este un lucru pe care l-am lansat în 711 (magazine de proximitate) din Coreea și hotelul Novotel din Coreea. Deci, acestea sunt situații în care clienții pot merge la un chioșc, pot pune întrebări, iar apoi omul AI răspunde la întrebare. Practic, este să luați un chatbot și să puneți un avatar ca chip uman.”

DeepBrain folosește „caching inteligent” în aceste chioșcuri interactive, a spus Murphy, pentru a gestiona întrebările repetitive. „Acolo unde oamenii pun aceleași întrebări, își amintește răspunsul. Când apare această întrebare, totul este pus la coadă, gata de plecare”, a spus el.

Alte cazuri de utilizare: chatbot și videoclipuri de instruire

Mai recent, DeepBrain s-a conectat la modele de limbaj mari, cum ar fi ChatGPT și Llama 2.

„Nu putem anticipa ce vor spune acele modele”, a spus Murphy, „deci îl transmitem cât de repede putem. Aceasta durează o secundă de pornire, apoi începe să iasă răspunsul. Este ca și cum atunci când vorbești cu un difuzor inteligent precum Siri sau Alexa, există o mică pauză. Este același lucru pentru noi, dar acum sintetizăm video pe deasupra audio.”

Avatarurile DeepBrain AI sunt transmise în timp real cu o latență scăzută, asigurându-se că pot oferi răspunsuri conversaționale la întrebări în timp util. Acest lucru le face ideale pentru o gamă largă de aplicații, inclusiv servicii pentru clienți, educație și marketing.

Alte exemple despre cum pot fi folosite avatarurile DeepBrain AI includ videoclipuri de antrenament, care prin natura lor sunt mai captivante și mai interactive decât videoclipurile standard și videoclipuri cu instrucțiuni care sunt mai distractiv de vizionat decât videoclipurile tradiționale. De exemplu, un avatar AI ar putea fi folosit pentru a oferi instrucțiuni pas cu pas despre cum să utilizați un nou program software sau cum să efectuați o sarcină complexă și poate adăuga câteva glume pe parcurs.

Videoclipurile de marketing pot face un pas înainte, fiind mai personalizate și mai captivante decât videoclipurile tradiționale. De exemplu, un avatar AI ar putea fi folosit pentru a crea un mesaj video personalizat pentru fiecare client sau pentru a oferi clienților asistență și asistență în timp real.

Cum hardware-ul potrivit oferă calitate înaltă

Această calitate super-înaltă nu se întâmplă fără suport remarcabil pentru backend. A ajutat DeepBrain oferindu-i acces la soluții de infrastructură gata de implementat bazate pe serverele de ultimă generație Lenovo ThinkSystem SR675 V3 ale companiei. Acest hardware este esențial pentru rularea LLM-urilor intensive din punct de vedere computațional de la DeepBrain.

ThinkSystem SR675 V3 este echipat cu până la două procesoare scalabile Intel Xeon de a patra generație și până la 4 TB de memorie, ideală pentru manipularea modelelor de limbaj mari (LLM). Nu găsiți atât de multă memorie disponibilă pe orice server.

Ca rezultat, acest server gata de implementare este potrivit pentru aplicații AI, cum ar fi DeepBrain. În plus, oferă o varietate de opțiuni de stocare rapidă, cum ar fi SSD-urile NVMe, care pot oferi performanța necesară pentru sarcinile de lucru AI solicitante. De asemenea, acceptă rețele de mare viteză, cum ar fi InfiniBand și Ethernet. Clienții au dreptul de a pune în aplicare aceste opțiuni.

Mai multe despre Programul AI Inovators

Pe lângă faptul că oferă acces la hardware, Programul Lenovo AI Inovators oferă startup-urilor acces la centrele de excelență Lenovo AI. Aceste centre oferă startup-urilor expertiza în domeniu și resursele de care au nevoie pentru a construi dovezi de concept personalizate pentru clienții potențiali.

„Programul de inovatori AI a fost foarte important pentru planul nostru atunci când am început (cu proiectul avatar de prezentare a știrilor MBN)”, a spus Murphy. „Ne-a ajutat să detaliem viziunea strategică a CEO-ului nostru în SUA de a ateriza și de a ne extinde, să luăm ceea ce am făcut în Coreea și apoi să-l aducem în America de Nord.”

Între timp, DeepBrain lucrează acum cu mai mult de o duzină de posturi de știri din China și Coreea, cu prezentatori de știri AI, și toți folosesc produsul AI Studios care este demonstrat pe site-ul companiei, a spus Murphy.

Centrele de excelență deservesc 180 de țări și peste 20,000 de parteneri de afaceri, ajutându-i zilnic să-și construiască dovezile de concept personalizate pentru potențialii clienți.

Lenovo va demonstra multe dintre soluțiile sale de ultimă generație, inclusiv cazul de utilizare DeepBrain Conferința Lenovo Tech World pe Octombrie 24.

Sponsorizat de Lenovo.

Timestamp-ul:

Mai mult de la Registrul