Wprowadzanie sztucznej inteligencji w rzeczywistość

Wprowadzanie sztucznej inteligencji w rzeczywistość

Wprowadzanie sztucznej inteligencji w rzeczywistość PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Sponsorowana funkcja Nowym, nowatorskim narzędziem coraz częściej używanym przez kreatywne zespoły IT w przedsiębiorstwach jest Generatywna sztuczna inteligencja, która ma potencjał umożliwienia znaczących postępów w sposobie prowadzenia działalności przez przedsiębiorstwo. Dzieje się tak dlatego, że jego wartość można wykorzystać w wielu aplikacjach i usługach wewnętrznych i zewnętrznych, w tym w takich elementach, jak chatboty sprzedażowe, procesy HR oraz szkolenia, instruktaże i filmy marketingowe sterowane awatarami.

Łącząc to intrygujące oprogramowanie AI z szybkim sprzętem serwerowym nowej generacji, znane start-upy projektują, budują i dostarczają na rynek nowe aplikacje – w wielu przypadkach przed terminem.

Jednym z takich startupów jest Głęboki Mózg, specjalista w dziedzinie technologii sztucznej inteligencji skoncentrowanej na człowieku. DeepBrain jest członkiem Program dla innowatorów AI Lenovo, która zapewnia start-upom dostęp do wiedzy specjalistycznej, zasobów i sprzętu serwerowego Lenovo, aby pomóc im w tworzeniu produktów i przyspieszaniu rozwoju firmy.

Flagowym produktem DeepBrain jest AI Avatar, którego można używać do tworzenia ultrarealistycznych filmów z awatarami, które można wykorzystać do różnych celów, w tym do sprzedaży, szkoleń i marketingu. AI Avatar wykorzystuje zastrzeżoną przez DeepBrain generatywną syntezę wideo AI w celu łączenia zamiany tekstu na mowę i dużych modeli językowych (LLM) w celu stworzenia ludzi AI, których prawie nie można odróżnić od prawdziwych ludzi.

„Kluczowym wyróżnikiem naszych awatarów jest to, co nazywamy hiperrealistycznym” – mówi Joe Murphy, specjalista ds. rozwoju biznesu w DeepBrain. „Jeśli pokażę ci prawdziwą osobę i wygeneruję filmy obok siebie, nie powinieneś być w stanie dostrzec różnicy, a mamy na to dane. Mamy miarę zwaną wskaźnikiem podobieństwa strukturalnego, gdzie 100% równa się 100% podobieństwa do prawdziwej osoby; w tej skali osiągamy wynik 96.5”. Murphy powiedział, że DeepBrain faktycznie klonuje głos prawdziwej osoby w każdej produkcji.

Prezenterzy wiadomości AI trafili na pierwsze strony gazet

Jednym z pierwszych klientów Murphy'ego była MBN, sieć informacyjna z Seulu w Korei Południowej. „Uruchomili pierwszego prezentera wiadomości AI, korzystając z naszej technologii” – powiedział Murphy. „Zidentyfikowali, jak to nazywają, „twarz franczyzy” sieci – jak Anderson Cooper w CNN czy Sean Hannity w Fox. Nazywała się Kim Joo Ha – zaufana twarz marki o zaufanym głosie. Zaprosiliśmy ją do studia i nagrywaliśmy jej talent przez około cztery godziny w środowisku zielonego ekranu. To dane szkoleniowe, których używamy do budowy naszego modelu.

Murphy powiedział, że awatar Kim Joo Ha nie jest codziennie używany w programach informacyjnych MBN. Zamiast tego zastępuje prawdziwą osobę w rutynowych wystąpieniach, takich jak spoty promocyjne i reklamowe, dzięki czemu sama prezenterka może skupić się na tym, co robi najlepiej – dostarczaniu wiadomości. „Oczywiście okazuje się, że pozwala to na znacznie lepsze wykorzystanie jej czasu” – stwierdziła Murphy.

„Z biegiem lat DeepBrain udoskonalił swój proces produkcyjny i stale go udoskonala”, powiedział Murphy.

„Teraz mamy więc około czterech godzin nagrań wideo, a po nich następują trzy tygodnie uczenia maszynowego” – powiedział. „I wtedy model jest gotowy. Zasadniczo jest to model z wejściem tekstowym/wyjściem wideo. Wstrzykujesz dowolny tekst, a następnie naciskasz Eksportuj. Następnie model generuje wideo przedstawiające osobę dostarczającą wpisany przez Ciebie scenariusz. To proste: wejście skryptu, wyjście wideo.”

Proces kompilacji plików wideo i audio zawierających dużo danych – którego ukończenie i renderowanie często zajmuje wiele godzin – był powolny w przypadku pionierskich firm zajmujących się sztuczną inteligencją. DeepBrain rozwiązał ten problem.

„Szybkość syntezy jest naszym drugim wyróżnikiem” – powiedział Murphy. „To właśnie umożliwia nam konwersację między ludźmi AI; możemy syntetyzować wideo tak szybko, jak w czasie rzeczywistym. Dzięki temu możliwe jest interaktywne wideo, w którym można zadać pytanie, a człowiek AI może następnie odpowiedzieć. To coś, co wdrożyliśmy w 711 (sklepach ogólnospożywczych) w Korei i hotelu Novotel w Korei. Są to więc sytuacje, w których klienci mogą podejść do kiosku, zadać pytania, a następnie człowiek AI odpowiada na pytanie. Zasadniczo polega to na wykorzystaniu chatbota i umieszczeniu awatara jako ludzkiej twarzy.”

Murphy powiedział, że DeepBrain wykorzystuje w tych interaktywnych kioskach „inteligentne buforowanie”, aby odpowiedzieć na powtarzające się pytania. „Gdy ludzie zadają te same pytania, zapamiętuje tę odpowiedź. Kiedy pojawia się to pytanie, wszystko jest ustawione w kolejce i gotowe do pracy” – powiedział.

Inne przypadki użycia: Chatboty i filmy szkoleniowe

Niedawno DeepBrain łączy się z dużymi modelami językowymi, takimi jak ChatGPT i Llama 2.

„Nie jesteśmy w stanie przewidzieć, co powiedzą te modele” – powiedział Murphy – „dlatego udostępniamy to tak szybko, jak to możliwe. Rozpoczęcie trwa jedną sekundę, po czym zaczyna pojawiać się odpowiedź. To tak, jakbyś rozmawiał z inteligentnym głośnikiem, takim jak Siri lub Alexa, następowała krótka pauza. U nas jest tak samo, ale teraz syntezujemy wideo na podstawie dźwięku”.

Awatary DeepBrain AI są przesyłane strumieniowo w czasie rzeczywistym z niskim opóźnieniem, dzięki czemu mogą zapewniać terminowe i konwersacyjne odpowiedzi na pytania. Dzięki temu idealnie nadają się do szerokiego zakresu zastosowań, w tym do obsługi klienta, edukacji i marketingu.

Inne przykłady wykorzystania awatarów DeepBrain AI obejmują filmy szkoleniowe, które ze swej natury są bardziej wciągające i interaktywne niż standardowe filmy, oraz filmy instruktażowe, których oglądanie jest przyjemniejsze niż tradycyjne filmy. Na przykład awatar AI może zostać użyty do dostarczenia instrukcji krok po kroku dotyczących korzystania z nowego programu lub wykonania złożonego zadania, a przy okazji może dodać kilka żartów.

Filmy marketingowe mogą pójść o krok dalej, ponieważ są bardziej spersonalizowane i wciągające niż tradycyjne filmy. Na przykład awatar AI można wykorzystać do stworzenia spersonalizowanej wiadomości wideo dla każdego klienta lub do zapewnienia klientom wsparcia i pomocy w czasie rzeczywistym.

Jak odpowiedni sprzęt zapewnia wysoką jakość

Ta superwysoka jakość nie jest możliwa bez doskonałego wsparcia backendowego. Pomogło DeepBrain, zapewniając mu dostęp do gotowych do wdrożenia rozwiązań infrastrukturalnych opartych na najwyższej klasy serwerach firmy Lenovo ThinkSystem SR675 V3. Ten sprzęt jest niezbędny do obsługi intensywnych obliczeniowo LLM DeepBrain.

ThinkSystem SR675 V3 jest wyposażony w maksymalnie dwa procesory Intel Xeon Scalable czwartej generacji i aż 4 TB pamięci, co idealnie nadaje się do obsługi dużych modeli językowych (LLM). Nie znajdziesz tak dużej ilości dostępnej pamięci na żadnym serwerze.

W rezultacie ten gotowy do wdrożenia serwer dobrze nadaje się do zastosowań AI, takich jak DeepBrain. Ponadto oferuje różnorodne opcje szybkiego przechowywania, takie jak dyski SSD NVMe, które mogą zapewnić wydajność wymaganą w przypadku wymagających obciążeń AI. Obsługuje także szybkie sieci, takie jak InfiniBand i Ethernet. Klienci mogą decydować o tych opcjach.

Więcej o programie AI Innovators

Oprócz zapewnienia dostępu do sprzętu, Program dla innowatorów AI Lenovo oferuje start-upom dostęp do centrów doskonałości Lenovo AI. Centra te zapewniają start-upom specjalistyczną wiedzę merytoryczną i zasoby potrzebne do tworzenia niestandardowych dowodów koncepcji dla potencjalnych klientów.

„Program AI Innovators był bardzo ważny w naszym planie na początku (projekt awatara prezentera wiadomości MBN)” – powiedział Murphy. „Pomogło nam to szczegółowo opisać strategiczną wizję naszego dyrektora generalnego w USA dotyczącą lądowania i ekspansji, wykorzystania tego, co zrobiliśmy w Korei, a następnie wprowadzenia tego do Ameryki Północnej”.

W międzyczasie DeepBrain współpracuje obecnie z kilkunastu stacjami informacyjnymi w Chinach i Korei z prezenterami wiadomości AI i wszyscy oni korzystają z produktu AI Studios zaprezentowanego na stronie internetowej firmy, powiedział Murphy.

Centra doskonałości obsługują 180 krajów i ponad 20,000 XNUMX partnerów biznesowych, pomagając im codziennie w tworzeniu spersonalizowanych dowodów koncepcji dla potencjalnych klientów.

Lenovo zaprezentuje podczas swoich targów wiele rozwiązań nowej generacji, w tym rozwiązanie DeepBrain Konferencja Lenovo Tech World w październiku 24.

Sponsorowane przez Lenovo.

Znak czasu:

Więcej z Rejestr