Å bringe AI til virkelighet

Å bringe AI til virkelighet

Gjør AI til virkelighet PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Sponset funksjon Et skarpt nytt verktøy som brukes mer og mer av kreative IT-team for bedrifter er Generative AI, som har potensialet til å muliggjøre store fremskritt i måten en bedrift driver sin virksomhet på. Dette er fordi verdien kan brukes i en rekke interne og eksterne applikasjoner og tjenester, inkludert elementer som salgschatboter, HR-prosesser og avatarledede opplærings-, instruksjons- og markedsføringsvideoer.

Ved å kombinere denne spennende AI-programvaren med rask ny generasjons servermaskinvare, designer, bygger og leverer nye oppstartsbedrifter nye applikasjoner til markedet – foran skjema, i mange tilfeller.

En slik oppstart er DeepBrain, en menneskefokusert AI-teknologispesialist. DeepBrain er medlem av Lenovo AI Innovators Program, som gir startups tilgang til Lenovos ekspertise, ressurser og servermaskinvare for å hjelpe dem med å lage produkter og akselerere bedriftsvekst.

DeepBrains flaggskipprodukt er AI Avatar, som kan brukes til å lage ultrarealistiske avatarledede videoer som kan brukes til ulike formål, inkludert salg, opplæring og markedsføring. AI Avatar bruker DeepBrains proprietære generative AI-videosyntese for å kombinere tekst-til-tale og store språkmodeller (LLM) for å lage AI-mennesker som nesten ikke kan skilles fra ekte mennesker.

"En nøkkeldifferensiator for våre avatarer er det vi kaller hyperrealistisk," sier Joe Murphy, DeepBrains forretningsutviklingsansvarlig. "Hvis jeg viser deg den virkelige personen og genererer videoer side ved side, bør du ikke kunne se forskjellen, og vi har data for å sikkerhetskopiere det. Vi har en måling som kalles den strukturelle likhetsindeksen, hvor 100 % tilsvarer 100 % lik den virkelige personen; vi kommer inn på 96.5 på den skalaen.» DeepBrain kloner faktisk den virkelige personens stemme i hver produksjon, sa Murphy.

AI-nyhetsankere traff overskriftene

En av Murphys første kunder var MBN, et nyhetsnettverk i Seoul, Sør-Korea. "De lanserte det første AI-nyhetsankeret ved å bruke teknologien vår," sa Murphy. "De identifiserte det de kaller "franchise-ansiktet" til nettverket - som Anderson Cooper på CNN eller Sean Hannity på Fox. Hennes navn var Kim Joo Ha – et pålitelig merkeansikt med en pålitelig stemme. Vi tok henne med inn i studio og spilte inn talentet hennes i omtrent fire timer i et greenscreen-miljø. Det er treningsdataene vi bruker for å bygge vår modell.»

Kim Joo Ha-avataren brukes ikke i MBNs nyhetsprogram hver dag, sa Murphy. I stedet erstatter den den virkelige personen i rutinemessige opptredener som reklame- og reklamespots, slik at ankeret selv kan fokusere på det hun gjør best – å levere nyhetene. "Dette viser seg åpenbart å være en mye bedre bruk av tiden hennes," sa Murphy.

Gjennom årene har DeepBrain strammet opp produksjonsprosessen og forbedrer seg stadig, sa Murphy.

"Så nå er vi nede på omtrent fire timer med video, etterfulgt av tre ukers maskinlæringstid," sa han. «Og da er modellen klar. I hovedsak er det en tekst-inn/video-ut-modell. Du injiserer hvilken tekst du vil, så trykker du Eksporter. Modellen genererer deretter videoen av personen som leverer skriptet du har skrevet. Så det er enkelt: skript inn, video ut.»

Prosessen med å kompilere de datatunge filene av video og lyd – som ofte tar timer å fullføre og gjengi – har vært treg for banebrytende AI-selskaper. DeepBrain har løst det problemet.

"Syntesehastigheten er vår andre differensiator," sa Murphy. «Det er det som gjør oss i stand til å ha samtale-AI-mennesker; vi kan syntetisere video så raskt som i sanntid. Så det muliggjør interaktiv video hvor du kan stille et spørsmål og AI-mennesket kan svare. Det er noe vi har rullet ut i 711 (nærbutikker) i Korea og Novotel-hotellet i Korea. Så dette er situasjoner der kunder kan gå opp til en kiosk, stille spørsmål, og så svarer AI-mennesket på spørsmålet. Det er i utgangspunktet å ta en chatbot og sette en avatar som det menneskelige ansiktet.»

DeepBrain bruker "smart caching" i disse interaktive kioskene, sa Murphy, for å håndtere de repeterende spørsmålene. "Der folk stiller de samme spørsmålene, husker den det svaret. Når det spørsmålet kommer inn, står alt i kø, klart til å gå, sa han.

Andre brukstilfeller: Chatbots og treningsvideoer

Nylig har DeepBrain koblet seg til store språkmodeller, som ChatGPT og Llama 2.

"Vi kan ikke forutse hva disse modellene kommer til å si," sa Murphy, "så vi streamer det ut så fort vi kan. Det tar en starttid på ett sekund, så begynner svaret å komme ut. Det er som når du snakker med en smart høyttaler som Siri eller Alexa, det er litt av en pause. Det er det samme for oss, men nå syntetiserer vi video på toppen av lyden.»

DeepBrain AI-avatarer streames i sanntid med lav ventetid, noe som sikrer at de kan gi rettidige, samtalesvar på spørsmål. Dette gjør dem ideelle for et bredt spekter av applikasjoner, inkludert kundeservice, utdanning og markedsføring.

Noen andre eksempler på hvordan DeepBrain AI-avatarer kan brukes inkluderer treningsvideoer, som i sin natur er mer engasjerende og interaktive enn standardvideoer, og instruksjonsvideoer som er morsommere å se enn tradisjonelle videoer. For eksempel kan en AI-avatar brukes til å gi trinnvise instruksjoner om hvordan du bruker et nytt program eller hvordan du utfører en kompleks oppgave, og kanskje legge til noen vitser underveis.

Markedsføringsvideoer kan ta et steg opp ved å være mer personlig og engasjerende enn tradisjonelle videoer. For eksempel kan en AI-avatar brukes til å lage en personlig videomelding for hver kunde eller for å gi kundene støtte og assistanse i sanntid.

Hvordan riktig maskinvare gir høy kvalitet

Denne superhøye kvaliteten skjer ikke uten enestående backend-støtte. De har hjulpet DeepBrain ved å gi den tilgang til ferdige infrastrukturløsninger basert på selskapets avanserte Lenovo ThinkSystem SR675 V3-servere. Denne maskinvaren er avgjørende for å kjøre DeepBrains beregningsintensive LLM-er.

ThinkSystem SR675 V3 er utstyrt med opptil to 4. generasjons Intel Xeon Scalable-prosessorer og så mye som 6 TB minne, ideelt for håndtering av store språkmodeller (LLM). Du finner ikke så mye minne tilgjengelig på en hvilken som helst server.

Som et resultat er denne klar til å distribuere serveren godt egnet for AI-applikasjoner som DeepBrain. I tillegg har den en rekke raske lagringsalternativer, for eksempel NVMe SSD-er, som kan gi ytelsen som trengs for krevende AI-arbeidsbelastninger. Den støtter også høyhastighetsnettverk, som InfiniBand og Ethernet. Kundene får prøve disse alternativene.

Mer om AI Innovators Program

I tillegg til å gi tilgang til maskinvaren, er Lenovo AI Innovators Program tilbyr nystartede bedrifter tilgang til Lenovo AI-sentre for fremragende forskning. Disse sentrene gir nystartede bedrifter fagekspertisen og ressursene de trenger for å bygge tilpassede proofs of concept for potensielle kunder.

"AI Innovators-programmet var veldig viktig for planen vår da vi startet (med MBN-nyhetsankeravatarprosjektet)," sa Murphy. "Det hjalp oss å detaljere vår administrerende direktørs strategiske visjon i USA om å lande og utvide, ta det vi gjorde i Korea, og deretter bringe det til Nord-Amerika."

I mellomtiden jobber DeepBrain nå med mer enn et dusin nyhetsstasjoner over hele Kina og Korea med AI-nyhetsankere, og de bruker alle AI Studios-produktet som er demonstrert på selskapets nettsted, sa Murphy.

Sentrene for fortreffelighet betjener 180 land og mer enn 20,000 XNUMX forretningspartnere, og hjelper dem daglig med å bygge sine personlige proofs of concept for potensielle kunder.

Lenovo vil demonstrere mange av neste generasjons løsninger – inkludert DeepBrain-brukssaken – på sitt Lenovo Tech World-konferansen i oktober 24.

Sponset av Lenovo.

Tidstempel:

Mer fra Registeret