Trazendo a IA para a realidade

Trazendo a IA para a realidade

Trazendo a IA para a realidade PlatoBlockchain Data Intelligence. Pesquisa vertical. Ai.

Recurso patrocinado Uma nova ferramenta que está sendo cada vez mais usada por equipes de TI empresariais criativas é a IA generativa, que tem o potencial de permitir grandes avanços na forma como uma empresa conduz seus negócios. Isso ocorre porque seu valor pode ser utilizado em vários aplicativos e serviços internos e externos, incluindo itens como chatbots de vendas, processos de RH e treinamento, instruções e vídeos de marketing conduzidos por avatares.

Ao combinar este intrigante software de IA com hardware de servidor rápido de nova geração, startups bem informadas estão projetando, construindo e entregando novos aplicativos ao mercado – antes do previsto, em muitos casos.

Uma dessas startups é DeepBrain, um especialista em tecnologia de IA com foco humano. DeepBrain é membro do Programa de Inovadores de IA da Lenovo, que fornece às startups acesso à experiência, recursos e hardware de servidor da Lenovo para ajudá-las a criar produtos e acelerar o crescimento corporativo.

O principal produto da DeepBrain é o AI Avatar, que pode ser usado para criar vídeos ultra-realistas liderados por avatares que podem ser usados ​​para diversos fins, incluindo vendas, treinamento e marketing. O AI Avatar usa a síntese de vídeo generativa de IA proprietária da DeepBrain para combinar conversão de texto em fala e modelos de linguagem grande (LLMs) para criar humanos de IA que são quase indistinguíveis de pessoas reais.

“Um diferencial importante para nossos avatares é o que chamamos de hiper-realista”, diz Joe Murphy, diretor de desenvolvimento de negócios da DeepBrain. “Se eu mostrar a pessoa real e gerar vídeos lado a lado, você não conseguirá perceber a diferença, e temos dados para comprovar isso. Temos uma medida chamada índice de similaridade estrutural, onde 100% equivale a 100% semelhante à pessoa real; chegamos a 96.5 nessa escala.” Na verdade, o DeepBrain clona a voz da pessoa real em cada produção, disse Murphy.

Âncoras de notícias sobre IA chegaram às manchetes

Um dos primeiros clientes de Murphy foi a MBN, uma rede de notícias de Seul, Coreia do Sul. “Eles lançaram o primeiro âncora de notícias de IA usando nossa tecnologia”, disse Murphy. “Eles identificaram o que chamam de 'cara da franquia' da rede – como Anderson Cooper na CNN ou Sean Hannity na Fox. O nome dela era Kim Joo Ha – um rosto de marca confiável com uma voz confiável. Nós a trouxemos para o estúdio e gravamos seu talento por cerca de quatro horas em um ambiente de tela verde. Esses são os dados de treinamento que usamos para construir nosso modelo.”

O avatar de Kim Joo Ha não é usado diariamente no noticiário da MBN, disse Murphy. Em vez disso, substitui a pessoa real em aparições rotineiras, como anúncios promocionais e publicitários, para que a própria âncora possa se concentrar no que faz de melhor – transmitir as notícias. “Isso obviamente acaba sendo um uso muito melhor do tempo dela”, disse Murphy.

Ao longo dos anos, a DeepBrain reforçou seu processo de produção e está melhorando constantemente, disse Murphy.

“Portanto, agora temos cerca de quatro horas de vídeo, seguidas de três semanas de aprendizado de máquina”, disse ele. “E então o modelo está pronto. Essencialmente, é um modelo de entrada de texto/saída de vídeo. Você injeta o texto que quiser e clica em Exportar. O modelo então gera o vídeo daquela pessoa entregando o roteiro que você digitou. Então é simples: entrada de script, saída de vídeo.”

O processo de compilação de arquivos de vídeo e áudio com muitos dados – que muitas vezes leva horas para terminar e renderizar – tem sido lento para as empresas pioneiras de IA. DeepBrain resolveu esse problema.

“A velocidade de síntese é o nosso segundo diferencial”, disse Murphy. “É isso que nos permite ter humanos conversacionais com IA; podemos sintetizar vídeo tão rápido quanto em tempo real. Isso permite um vídeo interativo onde você pode fazer uma pergunta e o humano da IA ​​pode então responder. Isso é algo que implementamos nas 711 (lojas de conveniência) na Coreia e no hotel Novotel na Coreia. Portanto, essas são situações em que os clientes podem ir até um quiosque, fazer perguntas e então o humano da IA ​​responde à pergunta. É basicamente pegar um chatbot e colocar um avatar como rosto humano.”

DeepBrain usa “cache inteligente” nesses quiosques interativos, disse Murphy, para lidar com perguntas repetitivas. “Onde as pessoas fazem as mesmas perguntas, ele se lembra dessa resposta. Quando surge essa pergunta, está tudo na fila, pronto para começar”, disse ele.

Outros casos de uso: Chatbots e vídeos de treinamento

Mais recentemente, o DeepBrain tem se conectado a grandes modelos de linguagem, como ChatGPT e Llama 2.

“Não podemos prever o que esses modelos vão dizer”, disse Murphy, “então estamos divulgando isso o mais rápido que podemos. Isso leva um segundo para começar e então a resposta começa a aparecer. É como quando você fala com um alto-falante inteligente como Siri ou Alexa, há uma pequena pausa. É a mesma coisa para nós, mas agora estamos sintetizando vídeo em cima do áudio.”

Os avatares DeepBrain AI são transmitidos em tempo real com baixa latência, garantindo que possam fornecer respostas de conversação oportunas às perguntas. Isso os torna ideais para uma ampla gama de aplicações, incluindo atendimento ao cliente, educação e marketing.

Alguns outros exemplos de como os avatares DeepBrain AI podem ser usados ​​incluem vídeos de treinamento, que por sua própria natureza são mais envolventes e interativos do que os vídeos padrão, e vídeos de instrução que são mais divertidos de assistir do que os vídeos tradicionais. Por exemplo, um Avatar de IA poderia ser usado para fornecer instruções passo a passo sobre como usar um novo programa de software ou como executar uma tarefa complexa, e talvez adicionar algumas piadas ao longo do caminho.

Os vídeos de marketing podem dar um passo à frente ao serem mais personalizados e envolventes do que os vídeos tradicionais. Por exemplo, um Avatar AI pode ser usado para criar uma mensagem de vídeo personalizada para cada cliente ou para fornecer suporte e assistência aos clientes em tempo real.

Como o hardware certo proporciona alta qualidade

Essa qualidade altíssima não acontece sem excelente suporte de back-end. O ajudou a DeepBrain, fornecendo-lhe acesso a soluções de infraestrutura prontas para implantação baseadas nos servidores Lenovo ThinkSystem SR675 V3 de última geração da empresa. Este hardware é essencial para executar os LLMs computacionalmente intensivos do DeepBrain.

O ThinkSystem SR675 V3 está equipado com até dois processadores escaláveis ​​Intel Xeon de 4ª geração e até 6 TB de memória, ideal para lidar com modelos de linguagem grande (LLMs). Você não encontra tanta memória disponível em qualquer servidor.

Como resultado, este servidor pronto para implantação é adequado para aplicações de IA, como DeepBrain. Além disso, apresenta uma variedade de opções de armazenamento rápido, como SSDs NVMe, que podem fornecer o desempenho necessário para cargas de trabalho exigentes de IA. Ele também oferece suporte a redes de alta velocidade, como InfiniBand e Ethernet. Os clientes podem decidir sobre essas opções.

Mais sobre o Programa Inovadores de IA

Além de fornecer acesso ao hardware, o Programa de Inovadores de IA da Lenovo oferece às startups acesso aos centros de excelência de IA da Lenovo. Esses centros fornecem às startups o conhecimento especializado e os recursos necessários para criar provas de conceito personalizadas para clientes em potencial.

“O Programa Inovadores de IA foi muito importante para o nosso plano quando começamos (com o projeto de avatar de âncora de notícias da MBN)”, disse Murphy. “Isso nos ajudou a detalhar a visão estratégica do nosso CEO nos EUA para pousar e expandir, pegar o que fizemos na Coreia e depois trazê-lo para a América do Norte.”

Enquanto isso, o DeepBrain está agora trabalhando com mais de uma dúzia de estações de notícias na China e na Coréia com âncoras de notícias de IA, e todos eles estão usando o produto AI Studios demonstrado no site da empresa, disse Murphy.

Os centros de excelência atendem 180 países e mais de 20,000 mil parceiros de negócios, ajudando-os diariamente a construir suas provas de conceito personalizadas para potenciais clientes.

A Lenovo demonstrará muitas de suas soluções de próxima geração – incluindo o caso de uso DeepBrain – em seu Conferência Lenovo Tech World em outubro 24.

Patrocinado pela Lenovo.

Carimbo de hora:

Mais de O registro