Faire de l'IA une réalité

Faire de l'IA une réalité

Faire de l'IA une réalité PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

Fonctionnalité sponsorisée L'IA générative est un nouvel outil performant de plus en plus utilisé par les équipes informatiques des entreprises créatives. Il a le potentiel de permettre des avancées majeures dans la manière dont une entreprise mène ses activités. En effet, sa valeur peut être utilisée dans de nombreuses applications et services internes et externes, notamment des éléments tels que les chatbots de vente, les processus RH et les vidéos de formation, d'instructions et de marketing dirigées par des avatars.

En combinant ce logiciel d’IA intrigant avec du matériel serveur rapide de nouvelle génération, des startups bien informées conçoivent, construisent et commercialisent de nouvelles applications – dans de nombreux cas avant la date prévue.

Une telle startup est Cerveau profond, spécialiste des technologies d'IA centrée sur l'humain. DeepBrain est membre du Programme Lenovo pour les innovateurs en IA, qui permet aux startups d'accéder à l'expertise, aux ressources et au matériel serveur de Lenovo pour les aider à créer des produits et à accélérer la croissance de l'entreprise.

Le produit phare de DeepBrain est AI Avatar, qui peut être utilisé pour créer des vidéos ultra-réalistes dirigées par un avatar pouvant être utilisées à diverses fins, notamment la vente, la formation et le marketing. L'AI Avatar utilise la synthèse vidéo d'IA générative exclusive de DeepBrain pour combiner la synthèse vocale et les grands modèles de langage (LLM) afin de créer des humains IA presque impossibles à distinguer des personnes réelles.

« L'un des principaux différenciateurs de nos avatars est ce que nous appelons l'hyperréalisme », explique Joe Murphy, responsable du développement commercial de DeepBrain. « Si je vous montre la vraie personne et que je génère des vidéos côte à côte, vous ne devriez pas être en mesure de faire la différence, et nous avons des données pour le confirmer. Nous avons une mesure appelée indice de similarité structurelle, où 100 % équivaut à 100 % similaire à la personne réelle ; nous arrivons à 96.5 sur cette échelle. DeepBrain clone en fait la voix de la vraie personne dans chaque production, a déclaré Murphy.

Les présentateurs de nouvelles sur l’IA font la une des journaux

L'un des premiers clients de Murphy était MBN, un réseau d'information de Séoul, en Corée du Sud. "Ils ont lancé le premier présentateur de nouvelles sur l'IA utilisant notre technologie", a déclaré Murphy. « Ils ont identifié ce qu'ils appellent le « visage de la franchise » du réseau – comme Anderson Cooper sur CNN ou Sean Hannity sur Fox. Son nom était Kim Joo Ha – un visage de marque de confiance avec une voix de confiance. Nous l'avons amenée en studio et avons enregistré son talent pendant environ quatre heures sur un écran vert. Ce sont les données de formation que nous utilisons pour construire notre modèle.

L'avatar de Kim Joo Ha n'est pas utilisé quotidiennement dans l'émission d'information de MBN, a déclaré Murphy. Au lieu de cela, il remplace la personne réelle dans les apparitions de routine telles que les spots promotionnels et publicitaires, afin que la présentatrice elle-même puisse se concentrer sur ce qu'elle fait le mieux : diffuser l'information. "Cela s'avère évidemment être une bien meilleure utilisation de son temps", a déclaré Murphy.

Au fil des années, DeepBrain a resserré son processus de production et s'améliore constamment, a déclaré Murphy.

"Nous en sommes maintenant à environ quatre heures de vidéo, suivies de trois semaines de temps d'apprentissage automatique", a-t-il déclaré. « Et puis le modèle est prêt. Il s’agit essentiellement d’un modèle d’entrée texte/sortie vidéo. Vous injectez le texte de votre choix, puis vous appuyez sur Exporter. Le modèle génère ensuite la vidéo de cette personne livrant le script que vous avez tapé. C'est donc simple : entrée du script, sortie vidéo.

Le processus de compilation de fichiers vidéo et audio volumineux – qui prend souvent des heures pour être terminé et rendu – a été lent pour les entreprises pionnières de l’IA. DeepBrain a résolu ce problème.

"La vitesse de synthèse est notre deuxième différenciateur", a déclaré Murphy. « C'est ce qui nous permet d'avoir des humains IA conversationnels ; nous pouvons synthétiser la vidéo aussi rapidement qu'en temps réel. Cela permet donc une vidéo interactive dans laquelle vous pouvez poser une question et l'IA humaine peut ensuite répondre. C'est quelque chose que nous avons déployé dans le 711 (magasins de proximité) en Corée et à l'hôtel Novotel en Corée. Ce sont donc des situations dans lesquelles les clients peuvent se rendre à un kiosque, poser des questions, puis l'IA humaine répond à la question. Il s'agit essentiellement de prendre un chatbot et de mettre un avatar comme visage humain.

DeepBrain utilise une « mise en cache intelligente » dans ces kiosques interactifs, a déclaré Murphy, pour gérer les questions répétitives. «Là où les gens posent les mêmes questions, il se souvient de cette réponse. Lorsque cette question arrive, tout est mis en file d'attente, prêt à démarrer », a-t-il déclaré.

Autres cas d'utilisation : chatbots et vidéos de formation

Plus récemment, DeepBrain s'est connecté à de grands modèles de langage, tels que ChatGPT et Llama 2.

"Nous ne pouvons pas anticiper ce que ces modèles vont dire", a déclaré Murphy, "c'est pourquoi nous le diffusons aussi vite que possible. Cela prend un temps de démarrage d’une seconde, puis la réponse commence à sortir. C'est comme si vous parliez à un haut-parleur intelligent comme Siri ou Alexa, il y avait une petite pause. C'est la même chose pour nous, mais maintenant nous synthétisons la vidéo en plus de l'audio.

Les avatars DeepBrain AI sont diffusés en temps réel avec une faible latence, garantissant ainsi qu'ils peuvent fournir des réponses conversationnelles en temps opportun aux questions. Cela les rend idéaux pour un large éventail d’applications, notamment le service client, l’éducation et le marketing.

Parmi d’autres exemples d’utilisation des avatars DeepBrain AI, citons les vidéos de formation, qui, de par leur nature même, sont plus engageantes et interactives que les vidéos standard, et les vidéos d’instructions qui sont plus amusantes à regarder que les vidéos traditionnelles. Par exemple, un avatar IA pourrait être utilisé pour fournir des instructions étape par étape sur la façon d'utiliser un nouveau logiciel ou sur la façon d'effectuer une tâche complexe, et peut-être d'ajouter quelques blagues en cours de route.

Les vidéos marketing peuvent franchir une étape supplémentaire en étant plus personnalisées et plus attrayantes que les vidéos traditionnelles. Par exemple, un avatar IA pourrait être utilisé pour créer un message vidéo personnalisé pour chaque client ou pour fournir aux clients une assistance et une assistance en temps réel.

Comment le bon matériel permet d'obtenir une haute qualité

Cette très haute qualité ne se produit pas sans un support back-end exceptionnel. Le a aidé DeepBrain en lui donnant accès à des solutions d'infrastructure prêtes à être déployées basées sur les serveurs haut de gamme Lenovo ThinkSystem SR675 V3 de l'entreprise. Ce matériel est essentiel pour exécuter les LLM à forte intensité de calcul de DeepBrain.

Le ThinkSystem SR675 V3 est équipé de jusqu'à deux processeurs Intel Xeon Scalable de 4e génération et de jusqu'à 6 To de mémoire, idéal pour gérer les grands modèles de langage (LLM). Vous ne trouvez pas autant de mémoire disponible sur n’importe quel serveur.

De ce fait, ce serveur prêt à déployer est bien adapté aux applications d’IA telles que DeepBrain. De plus, il propose une variété d'options de stockage rapide, telles que les SSD NVMe, qui peuvent fournir les performances nécessaires aux charges de travail d'IA exigeantes. Il prend également en charge les réseaux haut débit, tels qu'InfiniBand et Ethernet. Les clients peuvent prendre les devants sur ces options.

En savoir plus sur le programme Innovateurs en IA

En plus de fournir un accès au matériel, le Programme Lenovo pour les innovateurs en IA offre aux startups un accès aux centres d'excellence Lenovo AI. Ces centres fournissent aux startups l'expertise et les ressources dont elles ont besoin pour créer des preuves de concept personnalisées pour les clients potentiels.

"Le programme AI Innovators était très important pour notre plan lorsque nous avons commencé (avec le projet d'avatar du présentateur de nouvelles MBN)", a déclaré Murphy. « Cela nous a aidé à détailler la vision stratégique de notre PDG aux États-Unis : atterrir et s'étendre, prendre ce que nous avons fait en Corée, puis l'introduire en Amérique du Nord. »

Entre-temps, DeepBrain travaille désormais avec plus d'une douzaine de chaînes d'information en Chine et en Corée avec des présentateurs d'informations sur l'IA, et elles utilisent toutes le produit AI Studios présenté sur le site Web de l'entreprise, a déclaré Murphy.

Les centres d'excellence servent 180 pays et plus de 20,000 XNUMX partenaires commerciaux, les aidant quotidiennement à construire leurs preuves de concept personnalisées pour des clients potentiels.

Lenovo présentera bon nombre de ses solutions de nouvelle génération – y compris le cas d'utilisation DeepBrain – lors de son Conférence Lenovo Tech World en octobre 24.

Commandité par Lenovo.

Horodatage:

Plus de Le registre