A criatividade impulsionada pela IA dá aos PCs superpoderosos algo que vale a pena fazer, finalmente PlatoBlockchain Data Intelligence. Pesquisa vertical. Ai.

A criatividade orientada por IA dá aos PCs sobrecarregados algo que vale a pena fazer, finalmente

Coluna Até recentemente, o hardware do computador pessoal parecia ter superado qualquer demanda que o software pudesse colocar sobre ele. Mesmo os jogos de ponta – tradicionalmente a vanguarda das demandas dos usuários em desempenho – mal cobravam o silício de ponta massivamente sobrecarregado disponível. Então veio a arte da IA.

O microprocessador M1 Ultra da Apple ostenta uma contagem de transistores ao norte de 100 bilhões. A Nvidia acaba de lançar seu GPU RTX 4090 principal, com 76 bilhões de transistores - um aumento de três vezes em relação à geração anterior, o produto do nó de processo mais recente e uma atitude despreocupada em relação ao consumo de energia. Quase 500W TDP? Aumente a temperatura e aqueça sua casa neste inverno.

Mas com que propósito? Um battle royale de Fortnite de 300fps? Em abril Escrevi: “Esses monstros precisam ser domados, treinados e colocados em ação.” A tecnologia abomina o vácuo – quatro décadas no campo me ensinaram isso. Onde houver capacidade, algo virá para empregá-la.

Esse outro sapato caiu no início de setembro, quando HuggingFace AI – uma empresa privada que cria ferramentas de software que exploram técnicas de inteligência artificial de ponta – lançado Difusão Estável.

Semelhante a sistemas como DALL•E e Meio da jornada, a difusão estável reduz e reduz bilhões de imagens a tokens simbolicamente ponderados que podem ser conjurados de volta à visibilidade com um prompt de texto adequadamente criado. A coisa toda fica deste lado da feitiçaria – mas funciona notavelmente bem.

Ao contrário de DALL•E ou Midjourney, Stable Diffusion é totalmente independente – capaz de rodar em qualquer máquina suficientemente poderosa – e puro FOSS. Isso significava que, embora o lançamento inicial exigisse algumas das GPUs de ponta da Nvidia, em uma semana os colaboradores do projeto tinham retirou seu código e reduziu seus requisitos de hardware. A versão atual pode rodar confortavelmente no PC robusto que comprei há seis anos para explorar o mundo recém-renascido da realidade virtual – assim como em praticamente qualquer Mac baseado em M1. Muitos PCs e laptops para jogos podem executar o Stable Diffusion bem o suficiente para usá-lo para necessidades criativas baseadas em projetos – ou apenas por diversão.

Em seguida, um grupo de pesquisadores publicou um artigo em algo que eles chamaram de Dreamfusion – capaz de conjurar uma série infinita de modelos 3D totalmente realizados a partir de prompts de texto. Digitar pineapple, e o computador pensará e, em seguida, gerará sua melhor aproximação de como esse modelo deve ser. Embora esse grupo ainda não tenha divulgado seu código, o jornal forneceu um plano suficiente para um codificador ambicioso adaptar a base de código Stable Diffusion para criar Dreamfusion estável – o que, novamente, requer hardware bastante poderoso.

Uma imagem produzida por Stable Diffusion a partir do prompt de texto 'Um robô pintando um quadro enquanto corre em uma esteira' … Clique para ampliar

Para não ficar atrás, outro grupo da Universidade de Tel Aviv surpreendeu o mundo com a Modelo de Difusão de Movimento Humano. Este artigo mostrou como os pesquisadores usaram técnicas de IA baseadas em difusão para converter um prompt como “the person walks forward two steps and does a cartwheel” em uma animação humaniforme. Uma semana depois, os próprios pesquisadores liberou seu código como FOSS.

Ainda estamos um pouco no início desse crescimento exponencial dos recursos de IA para saber aonde isso levará. Tanto o Canva quanto a Microsoft já integraram geradores de imagem baseados em prompt em suas ferramentas criativas. Meta, Google, e outros demonstraram geradores de prompt para vídeo proprietários. Na tendência atual, não teremos que esperar muito até que tenhamos equivalentes FOSS para brincar.

As artes visuais têm novas ferramentas poderosas que não são de domínio exclusivo de gigantes como Google ou OpenAI – esta última uma empresa que prometeu democratizar a IA em sua fundação, mas perversamente parece ter se concentrado em criar seu próprio império proprietário com a Microsoft como seu proprietário não oficial.

Em uma das minhas primeiras colunas para O registro eu apontei para o fim do ciclo interminável de atualização para PCs. Chega de esteira: bom o suficiente, eles só seriam substituídos quando se desgastassem. Com exceção de uma enxurrada de atualizações para acomodar videoconferência com pandemia essa previsão se provou correta.

Mas o computador pessoal mudou de pele, revelando sua nova forma elegante como um supercomputador criativo: alimentado por difusão e criativamente capaz de maneiras que o PC antigo não poderia começar a se aproximar. Em vez de oferecer outra nova caneta ou pincel, essas ferramentas qualitativamente diferentes criam um novo tipo de parceria criativa.

Em junho, comprei um laptop PC de alta especificação – e imediatamente me senti culpado por isso, pensando que nunca o colocaria para funcionar. Hoje, faço pleno uso de uma máquina que pode fazer tanto o cotidiano quanto o incrível. Em retrospecto, essa compra parece uma barganha inteligente – um prenúncio de um verdadeiro renascimento – à medida que o PC, renascido, começa a funcionar. ®

Carimbo de hora:

Mais de O registro