At bringe AI til virkelighed

At bringe AI til virkelighed

Bringing AI to reality PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Sponsoreret funktion Et skarpt nyt værktøj, der bliver brugt mere og mere af kreative virksomheds IT-teams, er Generative AI, som har potentialet til at muliggøre store fremskridt i den måde, en virksomhed driver sin forretning på. Dette skyldes, at dets værdi kan udnyttes i adskillige interne og eksterne applikationer og tjenester, herunder elementer som salgschatbots, HR-processer og avatar-ledede trænings-, instruktions- og marketingvideoer.

Ved at kombinere denne spændende AI-software med hurtig, ny generation af serverhardware, designer, bygger og leverer in-the-know startups nye applikationer til markedet – før tidsplanen i mange tilfælde.

En sådan opstart er DeepBrain, en menneskefokuseret AI-teknologispecialist. DeepBrain er medlem af Lenovo AI Innovators Program, som giver startups adgang til Lenovos ekspertise, ressourcer og serverhardware for at hjælpe dem med at skabe produkter og accelerere virksomhedens vækst.

DeepBrains flagskibsprodukt er AI Avatar, som kan bruges til at skabe ultrarealistiske avatar-ledede videoer, der kan bruges til forskellige formål, herunder salg, træning og markedsføring. AI Avatar bruger DeepBrains proprietære generative AI-videosyntese til at kombinere tekst-til-tale og store sprogmodeller (LLM'er) for at skabe AI-mennesker, der næsten ikke kan skelnes fra rigtige mennesker.

"En vigtig differentiator for vores avatarer er, hvad vi kalder hyperrealistiske," siger Joe Murphy, DeepBrains forretningsudviklingsmedarbejder. "Hvis jeg viser dig den rigtige person og genererer videoer side om side, burde du ikke kunne kende forskel, og vi har data til at understøtte det. Vi har en måling kaldet det strukturelle lighedsindeks, hvor 100 % er lig med 100 % lig den virkelige person; vi kommer ind på 96.5 på den skala." DeepBrain kloner faktisk den rigtige persons stemme i hver produktion, sagde Murphy.

AI-nyhedsankre rammer overskrifterne

En af Murphys første kunder var MBN, et nyhedsnetværk i Seoul, Sydkorea. "De lancerede det første AI-nyhedsanker ved hjælp af vores teknologi," sagde Murphy. "De identificerede, hvad de kalder netværkets 'franchise-ansigt' - som Anderson Cooper på CNN eller Sean Hannity på Fox. Hendes navn var Kim Joo Ha – et betroet mærkeansigt med en betroet stemme. Vi bragte hende ind i studiet og optog hendes talent i cirka fire timer i et greenscreen-miljø. Det er de træningsdata, vi bruger til at bygge vores model."

Kim Joo Ha-avataren bruges ikke i MBNs nyhedsshow hver dag, sagde Murphy. I stedet erstatter det den rigtige person i rutinemæssige optrædener såsom reklame- og reklamespots, så ankeret selv kan fokusere på det, hun er bedst til – at levere nyhederne. "Dette viser sig åbenbart at være en meget bedre udnyttelse af hendes tid," sagde Murphy.

Gennem årene har DeepBrain strammet op på sin produktionsproces og forbedres konstant, sagde Murphy.

"Så nu er vi nede på omkring fire timers video, efterfulgt af tre ugers maskinlæringstid," sagde han. ”Og så er modellen klar. Grundlæggende er det en tekst-ind/video-ud-model. Du injicerer den tekst, du ønsker, og derefter trykker du på Eksporter. Modellen genererer derefter videoen af ​​den person, der leverer det script, du har skrevet. Så det er enkelt: Script ind, video ud."

Processen med at kompilere de datatunge filer af video og lyd – som ofte tager timer at færdiggøre og gengive – har været langsom for banebrydende AI-virksomheder. DeepBrain har løst det problem.

"Syntesehastigheden er vores anden differentiator," sagde Murphy. “Det er det, der gør os i stand til at have konverserende AI-mennesker; vi kan syntetisere video så hurtigt som i realtid. Så det muliggør interaktiv video, hvor du kan stille et spørgsmål, og AI-mennesket derefter kan svare. Det er noget, vi har rullet ud i 711 (nærbutikker) i Korea og Novotel-hotellet i Korea. Så det er situationer, hvor kunder kan gå hen til en kiosk, stille spørgsmål, og så svarer AI-mennesket på spørgsmålet. Det er dybest set at tage en chatbot og sætte en avatar som det menneskelige ansigt."

DeepBrain bruger "smart caching" i disse interaktive kiosker, sagde Murphy, til at håndtere de gentagne spørgsmål. "Hvor folk stiller de samme spørgsmål, husker den det svar. Når det spørgsmål kommer ind, står det hele i kø, klar til at gå,” sagde han.

Andre use cases: Chatbots og træningsvideoer

For nylig har DeepBrain oprettet forbindelse til store sprogmodeller, såsom ChatGPT og Llama 2.

"Vi kan ikke forudse, hvad disse modeller kommer til at sige," sagde Murphy, "så vi streamer det så hurtigt som vi kan. Det tager en starttid på et sekund, så begynder svaret at komme ud. Det er ligesom når du taler til en smart højttaler som Siri eller Alexa, der er lidt af en pause. Det er det samme for os, men nu syntetiserer vi video oven på lyden.”

DeepBrain AI-avatarer streames i realtid med lav latenstid, hvilket sikrer, at de kan give rettidige samtalesvar på spørgsmål. Dette gør dem ideelle til en lang række applikationer, herunder kundeservice, uddannelse og markedsføring.

Nogle andre eksempler på, hvordan DeepBrain AI-avatarer kan bruges, omfatter træningsvideoer, som i sagens natur er mere engagerende og interaktive end standardvideoer, og instruktionsvideoer, der er sjovere at se end traditionelle videoer. For eksempel kunne en AI-avatar bruges til at give trin-for-trin instruktioner om, hvordan man bruger et nyt softwareprogram eller hvordan man udfører en kompleks opgave, og måske tilføje et par vittigheder undervejs.

Marketingvideoer kan tage et skridt op ved at være mere personlige og engagerende end traditionelle videoer. For eksempel kan en AI-avatar bruges til at skabe en personlig videobesked til hver kunde eller til at give kunderne support og assistance i realtid.

Hvordan den rigtige hardware giver høj kvalitet

Denne super-høje kvalitet sker ikke uden enestående backend-support. Det har hjulpet DeepBrain ved at give det adgang til klar-til-at-installere infrastrukturløsninger baseret på virksomhedens avancerede Lenovo ThinkSystem SR675 V3-servere. Denne hardware er afgørende for at køre DeepBrains beregningsintensive LLM'er.

ThinkSystem SR675 V3 er udstyret med op til to 4. generations Intel Xeon Scalable-processorer og så meget som 6 TB hukommelse, ideel til håndtering af store sprogmodeller (LLM'er). Du finder ikke så meget hukommelse tilgængelig på en hvilken som helst server.

Som et resultat er denne klar-til-deploy-server velegnet til AI-applikationer såsom DeepBrain. Derudover har den en række hurtige lagringsmuligheder, såsom NVMe SSD'er, som kan give den ydeevne, der er nødvendig for krævende AI-arbejdsbelastninger. Det understøtter også højhastighedsnetværk, såsom InfiniBand og Ethernet. Kunderne får lov til at tage stilling til disse muligheder.

Mere om AI Innovators Program

Ud over at give adgang til hardwaren Lenovo AI Innovators Program giver nystartede virksomheder adgang til Lenovo AI centre of excellence. Disse centre giver startups den faglige ekspertise og de ressourcer, de har brug for til at bygge skræddersyede proofs of concept til potentielle kunder.

"AI Innovators-programmet var meget vigtigt for vores plan, da vi startede (med MBN-nyhedsanker-avatar-projektet)," sagde Murphy. "Det hjalp os med at detaljere vores administrerende direktørs strategiske vision i USA om at lande og ekspandere, tage det, vi gjorde i Korea, og derefter bringe det til Nordamerika."

I mellemtiden arbejder DeepBrain nu med mere end et dusin nyhedsstationer over hele Kina og Korea med AI-nyhedsankre, og de bruger alle AI Studios-produktet, der er demonstreret på virksomhedens hjemmeside, sagde Murphy.

Ekspertisecentrene betjener 180 lande og mere end 20,000 forretningspartnere og hjælper dem dagligt med at opbygge deres personlige proofs of concept til potentielle kunder.

Lenovo vil demonstrere mange af sine næste generations løsninger – inklusive DeepBrain use case – på sin plads Lenovo Tech World konference i oktober 24.

Sponsoreret af Lenovo.

Tidsstempel:

Mere fra Registret