AI naar de realiteit brengen

AI naar de realiteit brengen

AI tot werkelijkheid brengen PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.

Gesponsorde functie Een scherp nieuw hulpmiddel dat steeds vaker wordt gebruikt door creatieve IT-teams in ondernemingen is generatieve AI, die het potentieel heeft om grote vooruitgang mogelijk te maken in de manier waarop een onderneming zaken doet. Dit komt omdat de waarde ervan kan worden benut in tal van interne en externe toepassingen en diensten, waaronder items als verkoopchatbots, HR-processen en door avatars geleide trainings-, instructie- en marketingvideo’s.

Door deze intrigerende AI-software te combineren met snelle serverhardware van de nieuwe generatie, ontwerpen, bouwen en leveren startups nieuwe applicaties op de markt – in veel gevallen eerder dan gepland.

Eén zo'n startup is DiepBrain, een mensgerichte AI-technologiespecialist. DeepBrain is lid van de Lenovo AI Innovators-programma, dat startups toegang geeft tot de expertise, middelen en serverhardware van Lenovo om hen te helpen producten te creëren en de bedrijfsgroei te versnellen.

Het vlaggenschipproduct van DeepBrain is de AI Avatar, die kan worden gebruikt om ultrarealistische, door avatars geleide video's te maken die voor verschillende doeleinden kunnen worden gebruikt, waaronder verkoop, training en marketing. De AI Avatar maakt gebruik van de eigen generatieve AI-videosynthese van DeepBrain om tekst-naar-spraak en grote taalmodellen (LLM's) te combineren om AI-mensen te creëren die bijna niet te onderscheiden zijn van echte mensen.

“Een belangrijke onderscheidende factor voor onze avatars is wat wij hyperrealistisch noemen”, zegt Joe Murphy, Business Development Officer van DeepBrain. “Als ik je de echte persoon laat zien en video's naast elkaar genereer, zou je het verschil niet moeten kunnen zien, en we hebben gegevens om dat te ondersteunen. We hebben een meting die de structurele gelijkenis-index wordt genoemd, waarbij 100% gelijk is aan 100% vergelijkbaar met de echte persoon; op die schaal komen we uit op 96.5.” DeepBrain kloont feitelijk de stem van de echte persoon in elke productie, zei Murphy.

AI-nieuwsankers haalden de krantenkoppen

Een van Murphy's eerste klanten was MBN, een nieuwsnetwerk in Seoul, Zuid-Korea. “Ze lanceerden het eerste AI-nieuwsanker met behulp van onze technologie”, zei Murphy. “Ze identificeerden wat zij het 'franchisegezicht' van het netwerk noemen – zoals Anderson Cooper op CNN of Sean Hannity op Fox. Haar naam was Kim Joo Ha – een vertrouwd merkgezicht met een vertrouwde stem. We haalden haar de studio in en legden haar talent ongeveer vier uur lang vast in een greenscreen-omgeving. Dat zijn de trainingsgegevens die we gebruiken om ons model te bouwen.”

De Kim Joo Ha-avatar wordt niet elke dag gebruikt in de nieuwsshow van MBN, zei Murphy. In plaats daarvan vervangt het de echte persoon in routinematige optredens zoals promotie- en reclamespots, zodat de presentator zelf zich kan concentreren op waar ze goed in is: het nieuws brengen. 'Dit blijkt duidelijk een veel betere besteding van haar tijd', zei Murphy.

Door de jaren heen heeft DeepBrain zijn productieproces aangescherpt en voortdurend verbeterd, aldus Murphy.

"Dus nu hebben we nog ongeveer vier uur video, gevolgd door drie weken machine learning-tijd", zei hij. “En dan is het model klaar. In wezen is het een tekst-in/video-uit-model. Je injecteert de gewenste tekst en drukt vervolgens op Exporteren. Het model genereert vervolgens de video van die persoon die het script aflevert dat u hebt getypt. Het is dus simpel: script in, video uit.”

Het proces van het samenstellen van video- en audiobestanden die veel gegevens bevatten – wat vaak uren in beslag neemt om te voltooien en weer te geven – is traag verlopen voor baanbrekende AI-bedrijven. DeepBrain heeft dat probleem opgelost.

"De snelheid van de synthese is onze tweede onderscheidende factor", zei Murphy. “Dat is wat ons in staat stelt om conversatie-AI-mensen te hebben; we kunnen video net zo snel als realtime synthetiseren. Dat maakt dus interactieve video mogelijk waarbij je een vraag kunt stellen en de AI-mens vervolgens kan reageren. Dat is iets dat we hebben uitgerold in 711 (supermarkten) in Korea en het Novotel-hotel in Korea. Dit zijn dus situaties waarin klanten naar een kiosk kunnen lopen, vragen kunnen stellen, en vervolgens beantwoordt de AI-mens de vraag. Eigenlijk neem je een chatbot en zet je een avatar als menselijk gezicht.”

DeepBrain gebruikt ‘slimme caching’ in deze interactieve kiosken, zei Murphy, om de repetitieve vragen af ​​te handelen. “Als mensen dezelfde vragen stellen, onthoudt het dat antwoord. Als die vraag binnenkomt, staat alles in de rij, klaar om te gaan,' zei hij.

Andere gebruiksscenario's: chatbots en trainingsvideo's

Meer recentelijk heeft DeepBrain verbinding gemaakt met grote taalmodellen, zoals ChatGPT en Llama 2.

'We kunnen niet anticiperen op wat die modellen gaan zeggen,' zei Murphy, 'dus streamen we het zo snel als we kunnen. Dat duurt een starttijd van één seconde, waarna het antwoord naar buiten komt. Het is alsof je tegen een slimme luidspreker zoals Siri of Alexa praat, er een korte pauze is. Voor ons geldt hetzelfde, maar nu synthetiseren we video bovenop de audio.”

DeepBrain AI-avatars worden in realtime gestreamd met een lage latentie, zodat ze tijdig, gemoedelijk kunnen reageren op vragen. Dit maakt ze ideaal voor een breed scala aan toepassingen, waaronder klantenservice, onderwijs en marketing.

Enkele andere voorbeelden van hoe DeepBrain AI-avatars kunnen worden gebruikt, zijn onder meer trainingsvideo's, die door hun aard boeiender en interactiever zijn dan standaardvideo's, en instructievideo's die leuker zijn om naar te kijken dan traditionele video's. Een AI-avatar kan bijvoorbeeld worden gebruikt om stapsgewijze instructies te geven over het gebruik van een nieuw softwareprogramma of om een ​​complexe taak uit te voeren, en onderweg misschien een paar grappen toe te voegen.

Marketingvideo's kunnen een stap verder gaan doordat ze persoonlijker en boeiender zijn dan traditionele video's. Een AI-avatar kan bijvoorbeeld worden gebruikt om voor elke klant een gepersonaliseerde videoboodschap te creëren of om klanten in realtime ondersteuning en assistentie te bieden.

Hoe de juiste hardware hoge kwaliteit oplevert

Deze superhoge kwaliteit is niet mogelijk zonder uitstekende backend-ondersteuning. Het heeft DeepBrain geholpen door het toegang te bieden tot kant-en-klare infrastructuuroplossingen op basis van de hoogwaardige Lenovo ThinkSystem SR675 V3-servers van het bedrijf. Deze hardware is essentieel voor het uitvoeren van de rekenintensieve LLM's van DeepBrain.

De ThinkSystem SR675 V3 is uitgerust met maximaal twee 4e generatie Intel Xeon schaalbare processors en maar liefst 6 TB geheugen, ideaal voor het verwerken van grote taalmodellen (LLM's). Er is niet op elke server zoveel geheugen beschikbaar.

Hierdoor is deze kant-en-klare server zeer geschikt voor AI-toepassingen zoals DeepBrain. Daarnaast beschikt het over een verscheidenheid aan snelle opslagopties, zoals NVMe SSD's, die de prestaties kunnen leveren die nodig zijn voor veeleisende AI-workloads. Het ondersteunt ook snelle netwerken, zoals InfiniBand en Ethernet. Klanten mogen de baas zijn over deze opties.

Meer over het AI Innovators-programma

Naast het bieden van toegang tot de hardware, biedt de Lenovo AI Innovators-programma biedt startups toegang tot Lenovo AI-centra van uitmuntendheid. Deze centra bieden startups de inhoudelijke expertise en middelen die ze nodig hebben om op maat gemaakte proofs of concept voor potentiële klanten te bouwen.

"Het AI Innovators-programma was erg belangrijk voor ons plan toen we begonnen (met het MBN-nieuwsanker-avatarproject)", zei Murphy. “Het hielp ons de strategische visie van onze CEO in de VS uit te werken om te landen en uit te breiden, wat we in Korea deden en dit vervolgens naar Noord-Amerika te brengen.”

In de tussentijd werkt DeepBrain nu samen met meer dan een dozijn nieuwszenders in China en Korea met AI-nieuwsankers, en ze gebruiken allemaal het AI Studios-product dat op de bedrijfswebsite wordt gedemonstreerd, zei Murphy.

De expertisecentra bedienen 180 landen en meer dan 20,000 zakenpartners en helpen hen dagelijks bij het bouwen van hun gepersonaliseerde proofs of concept voor potentiële klanten.

Lenovo zal op zijn beurs veel van zijn oplossingen van de volgende generatie demonstreren, waaronder de DeepBrain-use case Lenovo Tech World-conferentie op 24 oktober.

Gesponsord door Lenovo.

Tijdstempel:

Meer van Het register