KI in die Realität umsetzen

KI in die Realität umsetzen

KI in die Realität umsetzen PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.

Gesponserte Funktion Ein innovatives neues Tool, das immer häufiger von kreativen IT-Teams in Unternehmen eingesetzt wird, ist die generative KI, die das Potenzial hat, große Fortschritte in der Art und Weise zu ermöglichen, wie ein Unternehmen seine Geschäfte führt. Dies liegt daran, dass sein Wert in zahlreichen internen und externen Anwendungen und Diensten genutzt werden kann, darunter beispielsweise Vertriebs-Chatbots, HR-Prozesse und von Avataren geleitete Schulungs-, Anleitungs- und Marketingvideos.

Durch die Kombination dieser faszinierenden KI-Software mit schneller Serverhardware der neuen Generation können erfahrene Startups neue Anwendungen entwerfen, erstellen und auf den Markt bringen – und das in vielen Fällen früher als geplant.

Ein solcher Start ist DeepBrain, ein auf den Menschen ausgerichteter Spezialist für KI-Technologie. DeepBrain ist Mitglied der Lenovo AI Innovators-Programm, das Startups Zugriff auf das Fachwissen, die Ressourcen und die Serverhardware von Lenovo bietet, um ihnen bei der Entwicklung von Produkten und der Beschleunigung des Unternehmenswachstums zu helfen.

Das Flaggschiffprodukt von DeepBrain ist der KI-Avatar, mit dem sich ultrarealistische Avatar-geführte Videos erstellen lassen, die für verschiedene Zwecke verwendet werden können, darunter Vertrieb, Schulung und Marketing. Der KI-Avatar nutzt die proprietäre generative KI-Videosynthese von DeepBrain, um Text-to-Speech und Large Language Models (LLMs) zu kombinieren, um KI-Menschen zu erschaffen, die von echten Menschen kaum zu unterscheiden sind.

„Ein wesentliches Unterscheidungsmerkmal unserer Avatare ist das, was wir als hyperrealistisch bezeichnen“, sagt Joe Murphy, Business Development Officer bei DeepBrain. „Wenn ich Ihnen die reale Person zeige und gleichzeitig Videos erstelle, sollten Sie den Unterschied nicht erkennen können, und wir haben Daten, die das belegen. Wir haben ein Maß namens struktureller Ähnlichkeitsindex, bei dem 100 % 100 % Ähnlichkeit mit der realen Person bedeutet; Auf dieser Skala kommen wir auf einen Wert von 96.5.“ DeepBrain klont tatsächlich in jeder Produktion die Stimme der realen Person, sagte Murphy.

KI-Nachrichtensprecher sorgen für Schlagzeilen

Einer von Murphys ersten Kunden war MBN, ein Nachrichtensender aus Seoul, Südkorea. „Sie haben den ersten KI-Nachrichtensprecher gestartet, der unsere Technologie nutzt“, sagte Murphy. „Sie identifizierten das, was sie das ‚Franchise-Gesicht‘ des Netzwerks nennen – wie Anderson Cooper bei CNN oder Sean Hannity bei Fox. Ihr Name war Kim Joo Ha – ein vertrauenswürdiges Markengesicht mit einer vertrauenswürdigen Stimme. Wir brachten sie ins Studio und zeichneten ihr Talent etwa vier Stunden lang in einer Greenscreen-Umgebung auf. Das sind die Trainingsdaten, die wir zum Aufbau unseres Modells verwenden.“

Der Kim Joo Ha-Avatar werde nicht jeden Tag in der Nachrichtensendung von MBN verwendet, sagte Murphy. Stattdessen ersetzt es die reale Person bei routinemäßigen Auftritten wie Promotion- und Werbespots, sodass sich die Moderatorin selbst auf das konzentrieren kann, was sie am besten kann – die Nachrichten zu überbringen. „Das erweist sich offensichtlich als eine viel bessere Nutzung ihrer Zeit“, sagte Murphy.

Im Laufe der Jahre hat DeepBrain seinen Produktionsprozess verschärft und verbessert sich ständig, sagte Murphy.

„Jetzt haben wir also nur noch etwa vier Stunden Video, gefolgt von drei Wochen maschinellem Lernen“, sagte er. „Und dann ist das Modell fertig. Im Wesentlichen handelt es sich um ein Text-In/Video-Out-Modell. Sie fügen den gewünschten Text ein und klicken dann auf „Exportieren“. Das Modell generiert dann das Video dieser Person, die das von Ihnen eingegebene Skript vorträgt. Es ist also ganz einfach: Skript rein, Video raus.“

Der Prozess des Zusammenstellens der datenintensiven Video- und Audiodateien – dessen Fertigstellung und Rendern oft Stunden in Anspruch nimmt – war für wegweisende KI-Unternehmen langsam. DeepBrain hat dieses Problem gelöst.

„Die Geschwindigkeit der Synthese ist unser zweites Unterscheidungsmerkmal“, sagte Murphy. „Das ist es, was es uns ermöglicht, gesprächige KI-Menschen zu haben; Wir können Videos so schnell wie in Echtzeit synthetisieren. Dadurch wird ein interaktives Video ermöglicht, bei dem Sie eine Frage stellen können und der KI-Mensch dann antworten kann. Das ist etwas, was wir in 711 (Convenience-Stores) in Korea und im Novotel Hotel in Korea eingeführt haben. Das sind also Situationen, in denen Kunden an einen Kiosk gehen, Fragen stellen können und der KI-Mensch dann die Frage beantwortet. Im Grunde genommen nimmt man einen Chatbot und setzt einen Avatar als menschliches Gesicht ein.“

Laut Murphy nutzt DeepBrain in diesen interaktiven Kiosken „intelligentes Caching“, um die sich wiederholenden Fragen zu beantworten. „Wenn Leute die gleichen Fragen stellen, merkt es sich diese Antwort. Wenn diese Frage eingeht, steht alles in der Warteschlange und ist einsatzbereit“, sagte er.

Weitere Anwendungsfälle: Chatbots und Schulungsvideos

In jüngerer Zeit hat DeepBrain eine Verbindung zu großen Sprachmodellen wie ChatGPT und Llama 2 hergestellt.

„Wir können nicht vorhersehen, was diese Modelle sagen werden“, sagte Murphy, „also streamen wir es so schnell wie möglich.“ Das dauert eine Sekunde, dann kommt die Antwort. Es ist so, als gäbe es eine kleine Pause, wenn man mit einem intelligenten Lautsprecher wie Siri oder Alexa spricht. Bei uns ist es dasselbe, aber jetzt synthetisieren wir Video zusätzlich zum Audio.“

DeepBrain AI-Avatare werden in Echtzeit mit geringer Latenz gestreamt, um sicherzustellen, dass sie zeitnahe, gesprächige Antworten auf Fragen geben können. Dadurch eignen sie sich ideal für eine Vielzahl von Anwendungen, darunter Kundenservice, Bildung und Marketing.

Weitere Beispiele dafür, wie DeepBrain AI-Avatare eingesetzt werden können, sind Schulungsvideos, die von Natur aus ansprechender und interaktiver sind als Standardvideos, und Anleitungsvideos, deren Ansehen mehr Spaß macht als herkömmliche Videos. Beispielsweise könnte ein KI-Avatar verwendet werden, um Schritt-für-Schritt-Anleitungen zur Verwendung eines neuen Softwareprogramms oder zur Ausführung einer komplexen Aufgabe bereitzustellen und nebenbei vielleicht ein paar Witze hinzuzufügen.

Marketingvideos können einen Schritt weitergehen, da sie personalisierter und ansprechender sind als herkömmliche Videos. Beispielsweise könnte ein KI-Avatar genutzt werden, um für jeden Kunden eine personalisierte Videobotschaft zu erstellen oder Kunden in Echtzeit Unterstützung und Hilfe zu bieten.

Wie die richtige Hardware für hohe Qualität sorgt

Diese superhohe Qualität ist ohne hervorragende Backend-Unterstützung nicht möglich. Das hat DeepBrain geholfen, indem es ihm Zugriff auf einsatzbereite Infrastrukturlösungen gewährt hat, die auf den High-End-Servern des Unternehmens Lenovo ThinkSystem SR675 V3 basieren. Diese Hardware ist für den Betrieb der rechenintensiven LLMs von DeepBrain unerlässlich.

Das ThinkSystem SR675 V3 ist mit bis zu zwei skalierbaren Intel Xeon Prozessoren der 4. Generation und bis zu 6 TB Arbeitsspeicher ausgestattet, ideal für die Verarbeitung großer Sprachmodelle (LLMs). So viel Speicher ist nicht auf jedem Server verfügbar.

Dadurch eignet sich dieser sofort einsatzbereite Server gut für KI-Anwendungen wie DeepBrain. Darüber hinaus verfügt es über eine Vielzahl schneller Speicheroptionen, wie z. B. NVMe-SSDs, die die erforderliche Leistung für anspruchsvolle KI-Workloads bereitstellen können. Es unterstützt auch Hochgeschwindigkeitsnetzwerke wie InfiniBand und Ethernet. Kunden können diese Optionen selbst bestimmen.

Mehr über das AI Innovators Program

Neben der Bereitstellung des Zugriffs auf die Hardware bietet die Lenovo AI Innovators-Programm bietet Start-ups Zugang zu den KI-Kompetenzzentren von Lenovo. Diese Zentren stellen Startups die Fachkompetenz und Ressourcen zur Verfügung, die sie benötigen, um maßgeschneiderte Proofs of Concept für potenzielle Kunden zu erstellen.

„Das AI Innovators Program war für unseren Plan zu Beginn (mit dem Avatar-Projekt des MBN-Nachrichtensprechers) sehr wichtig“, sagte Murphy. „Es hat uns geholfen, die strategische Vision unseres CEOs in den USA näher zu erläutern, nämlich dort zu landen und zu expandieren, das, was wir in Korea gemacht haben, zu übernehmen und es dann nach Nordamerika zu bringen.“

Mittlerweile arbeitet DeepBrain mit mehr als einem Dutzend Nachrichtensendern in ganz China und Korea mit KI-Nachrichtensprechern zusammen, und alle nutzen das AI Studios-Produkt, das auf der Unternehmenswebsite vorgestellt wird, sagte Murphy.

Die Kompetenzzentren beliefern 180 Länder und mehr als 20,000 Geschäftspartner und helfen ihnen täglich dabei, ihre personalisierten Konzeptnachweise für potenzielle Kunden zu erstellen.

Lenovo wird auf seiner Messe viele seiner Lösungen der nächsten Generation vorführen – darunter auch den DeepBrain-Anwendungsfall Lenovo Tech World-Konferenz am Okt. 24.

Gesponsert von Lenovo.

Zeitstempel:

Mehr von Das Register