Att föra AI till verklighet

Att föra AI till verklighet

Förverkliga AI PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

Sponsrad funktion Ett skarpt nytt verktyg som används mer och mer av kreativa IT-team för företag är Generative AI, som har potential att möjliggöra stora framsteg i hur ett företag bedriver sin verksamhet. Detta beror på att dess värde kan användas i många interna och externa applikationer och tjänster, inklusive artiklar som säljchatbotar, HR-processer och avatarledda utbildnings-, instruktions- och marknadsföringsvideor.

Genom att kombinera denna spännande AI-mjukvara med snabb ny generations serverhårdvara, designar, bygger och levererar nystartade företag nya applikationer till marknaden – i många fall före schemat.

En sådan start är DeepBrain, en människofokuserad AI-teknikspecialist. DeepBrain är medlem i Lenovo AI Innovators Program, som ger nystartade företag tillgång till Lenovos expertis, resurser och serverhårdvara för att hjälpa dem att skapa produkter och påskynda företagstillväxten.

DeepBrains flaggskeppsprodukt är AI Avatar, som kan användas för att skapa ultrarealistiska avatarledda videor som kan användas för olika ändamål, inklusive försäljning, utbildning och marknadsföring. AI Avatar använder DeepBrains egen generativa AI-videosyntes för att kombinera text-till-tal och stora språkmodeller (LLM) för att skapa AI-människor som nästan inte går att skilja från riktiga människor.

"En viktig skillnad för våra avatarer är vad vi kallar hyperrealistiska", säger Joe Murphy, DeepBrains affärsutvecklingsansvarig. "Om jag visar dig den riktiga personen och genererar videor sida vid sida, borde du inte kunna se skillnaden, och vi har data för att backa upp det. Vi har ett mått som kallas det strukturella likhetsindexet, där 100 % motsvarar 100 % lik den verkliga personen; vi kommer in på 96.5 på den skalan.” DeepBrain klonar faktiskt den verkliga personens röst i varje produktion, sa Murphy.

AI-nyhetsankare slog till rubrikerna

En av Murphys första kunder var MBN, ett nyhetsnätverk i Seoul, Sydkorea. "De lanserade det första AI-nyhetsankaret med vår teknik," sa Murphy. "De identifierade vad de kallar "franchise-ansiktet" för nätverket – som Anderson Cooper på CNN eller Sean Hannity på Fox. Hennes namn var Kim Joo Ha – ett pålitligt varumärkesansikte med en pålitlig röst. Vi tog med henne in i studion och spelade in hennes talang i cirka fyra timmar i en miljö med grön skärm. Det är utbildningsdata som vi använder för att bygga vår modell.”

Kim Joo Ha-avataren används inte i MBN:s nyhetsprogram varje dag, sa Murphy. Istället ersätter det den riktiga personen i rutinmässiga framträdanden som reklam- och reklamspots, så att ankaret själv kan fokusera på det hon är bäst på – att leverera nyheter. "Detta visar sig uppenbarligen vara en mycket bättre användning av hennes tid," sa Murphy.

Under åren har DeepBrain stramat upp sin produktionsprocess och förbättras ständigt, sa Murphy.

"Så nu är vi nere på cirka fyra timmars video, följt av tre veckors maskininlärningstid", sa han. ”Och då är modellen klar. I huvudsak är det en text-in/video-out-modell. Du injicerar vilken text du vill, sedan trycker du på Exportera. Modellen genererar sedan videon av den personen som levererar manuset som du har skrivit. Så det är enkelt: skript in, video ut.”

Processen att kompilera de datatunga filerna av video och ljud – som ofta tar timmar att slutföra och rendera – har varit långsam för banbrytande AI-företag. DeepBrain har löst det problemet.

"Synteshastigheten är vår andra differentiator," sa Murphy. "Det är det som gör det möjligt för oss att ha konverserande AI-människor; vi kan syntetisera video så snabbt som i realtid. Så det möjliggör interaktiv video där du kan ställa en fråga och AI-människan sedan kan svara. Det är något som vi har lanserat i 711 (närbutiker) i Korea och Novotel-hotellet i Korea. Så det här är situationer där kunder kan gå fram till en kiosk, ställa frågor och sedan AI-människan svarar på frågan. Det är i princip att ta en chatbot och sätta en avatar som det mänskliga ansiktet.”

DeepBrain använder "smart caching" i dessa interaktiva kiosker, sade Murphy, för att hantera de upprepade frågorna. "Där folk ställer samma frågor kommer den ihåg det svaret. När den frågan kommer in står allt i kö, redo att gå”, sa han.

Andra användningsfall: Chatbots och träningsvideor

På senare tid har DeepBrain anslutit till stora språkmodeller, som ChatGPT och Llama 2.

"Vi kan inte förutse vad dessa modeller kommer att säga," sa Murphy, "så vi streamar det så fort vi kan. Det tar en starttid på en sekund, sedan börjar svaret komma ut. Det är som när du pratar med en smart högtalare som Siri eller Alexa, det blir lite av en paus. Det är samma sak för oss, men nu syntetiserar vi video ovanpå ljudet.”

DeepBrain AI-avatarer streamas i realtid med låg latens, vilket säkerställer att de kan ge snabba, konversationssvar på frågor. Detta gör dem idealiska för ett brett spektrum av applikationer, inklusive kundservice, utbildning och marknadsföring.

Några andra exempel på hur DeepBrain AI-avatarer kan användas inkluderar träningsvideor, som till sin natur är mer engagerande och interaktiva än vanliga videor, och instruktionsvideor som är roligare att titta på än traditionella videor. Till exempel kan en AI-avatar användas för att ge steg-för-steg-instruktioner om hur man använder ett nytt program eller hur man utför en komplex uppgift, och kanske lägga till några skämt på vägen.

Marknadsföringsvideor kan ta ett steg upp genom att vara mer personliga och engagerande än traditionella videor. Till exempel kan en AI-avatar användas för att skapa ett personligt videomeddelande för varje kund eller för att ge kunderna support och assistans i realtid.

Hur rätt hårdvara ger hög kvalitet

Denna superhöga kvalitet sker inte utan enastående backend-stöd. De har hjälpt DeepBrain genom att ge det tillgång till färdiga att distribuera infrastrukturlösningar baserade på företagets avancerade Lenovo ThinkSystem SR675 V3-servrar. Denna hårdvara är nödvändig för att köra DeepBrains beräkningsintensiva LLM:er.

ThinkSystem SR675 V3 är utrustad med upp till två 4:e generationens Intel Xeon Scalable-processorer och så mycket som 6 TB minne, idealiskt för att hantera stora språkmodeller (LLM). Du hittar inte så mycket minne tillgängligt på vilken server som helst.

Som ett resultat är denna färdiga att distribuera server väl lämpad för AI-applikationer som DeepBrain. Dessutom har den en mängd snabba lagringsalternativ, såsom NVMe SSD:er, som kan ge den prestanda som behövs för krävande AI-arbetsbelastningar. Den stöder även höghastighetsnätverk, såsom InfiniBand och Ethernet. Kunderna får ta ställning till dessa alternativ.

Mer om AI Innovators Program

Förutom att ge tillgång till hårdvaran, Lenovo AI Innovators Program ger nystartade företag tillgång till Lenovo AI-centers of excellence. Dessa center förser startups med ämnesexpertis och resurser de behöver för att bygga skräddarsydda proof of concept för potentiella kunder.

"AI Innovators-programmet var mycket viktigt för vår plan när vi började (med MBN-nyhetsankare-avatarprojektet)", sa Murphy. "Det hjälpte oss att detaljera vår vd:s strategiska vision i USA att landa och expandera, ta det vi gjorde i Korea och sedan ta det till Nordamerika."

Under tiden arbetar DeepBrain nu med mer än ett dussin nyhetsstationer över hela Kina och Korea med AI-nyhetsankare, och de använder alla AI Studios-produkten som visas på företagets webbplats, sa Murphy.

Center of Excellence betjänar 180 länder och mer än 20,000 XNUMX affärspartners, och hjälper dem dagligen att bygga sina personliga proof of concept för potentiella kunder.

Lenovo kommer att demonstrera många av sina nästa generations lösningar – inklusive användningsfallet DeepBrain – på sin plats Lenovo Tech World-konferens på oktober 24.

Sponsras av Lenovo.

Tidsstämpel:

Mer från Registret