Recapitulação de promessas e armadilhas – Parte Quatro »Blog CCC

Recapitulação de promessas e armadilhas – Parte Quatro »Blog CCC

O CCC apoiou três sessões científicas na Conferência Anual da AAAS deste ano. Esta semana, resumiremos os destaques da sessão, “IA generativa na ciência: promessas e armadilhas.” Este painel, moderado por Dr., presidente do Toyota Technological Institute em Chicago), apresentou Dra., professor de estatística e ciência da computação na Universidade de Chicago, Dr., professor de engenharia do Instituto de Tecnologia de Massachusetts, e Dr. Duncan Watson-Parris, professor assistente do Scripps Institution of Oceanography e do Halıcıoğlu Data Science Institute da UC San Diego. Na Parte Quatro, resumimos a parte de perguntas e respostas do painel. 

Uma sessão de perguntas e respostas seguiu-se às apresentações do painelista e o Dr. Matthew Turk iniciou a discussão. “'Promessas e Armadilhas' está no título deste painel. Discutimos muitas das promessas, mas não abordamos muitas das armadilhas. O que o preocupa sobre o futuro da IA ​​generativa?”

“A confiabilidade e a confiabilidade desses modelos são uma grande preocupação”, começou a Dra. Rebecca Wilett. “Esses modelos podem prever coisas que são plausíveis, mas faltam elementos-chave e salientes; Posso, como humano, reconhecer que há algo faltando aí?”

Dr. Markus Buehler acrescentou que a previsão real de um modelo pode levar um segundo, mas o processo experimental de validação pode levar meses ou um ano, ou mais. Então, como devemos agir nesse ínterim, quando ainda não verificamos os resultados? “Também precisamos educar a próxima geração de desenvolvedores de IA generativa para que eles projetem modelos que sejam confiáveis ​​e verificáveis, e que possamos usar insights baseados na física na construção desses modelos.”

O Dr. Duncan Watson-Parris baseou-se em ambos os pontos anteriores, dizendo: “Como esses modelos são projetados para gerar resultados plausíveis, não podemos apenas olhar para os resultados para verificar sua precisão. Os investigadores de IA generativa precisam de ter uma compreensão profunda de como estes modelos funcionam para verificar os seus resultados, e é por isso que educar corretamente a próxima geração é tão importante.”

Membro do Público: “Na ciência dos materiais, sabemos a direção a seguir para estudar alguns materiais, mas para outros, como supercondutores à temperatura ambiente, não sabemos como avançar. Como você acha que será o caminho a seguir no estudo desses materiais desconhecidos? E como esse tipo de pesquisa deve ser viabilizado do ponto de vista regulatório?”

“Bem, não sou um especialista em pesquisa de supercondutores”, disse o Dr. Buehler, “então não vou falar diretamente sobre isso, mas posso falar de maneira geral sobre como fazemos avanços na ciência dos materiais, especificamente na minha área de proteínas. e desenvolvimento de biomateriais. A forma como avançamos é ter a capacidade de ir além. Realizamos novos experimentos e testamos ideias e teorias bizarras e vemos quais funcionam e por quê. Quanto à forma como devemos permitir esta investigação, precisamos de mais modelos de código aberto com acesso colectivo. Encorajaria os políticos a não regulamentarem excessivamente estas tecnologias, de modo a que os investigadores e o público tenham acesso a estes tipos de modelos. Não creio que seja uma boa ideia impedir que as pessoas utilizem estes modelos, especialmente quando podemos reunir ideias e desenvolvimentos e introduzir conhecimentos de diversos campos da actividade humana. Por exemplo, quando a imprensa foi inventada, as autoridades tentaram limitar a disponibilidade desta tecnologia para que poucos livros pudessem ser lidos em massa, mas este esforço falhou miseravelmente. A melhor forma de proteger o público é facilitar o acesso a estes modelos de tal forma que possamos desenvolvê-los, explorá-los e avaliá-los extensivamente para o máximo benefício da sociedade.”

Membro do público: “A maioria dos modelos generativos de IA hoje são modelos de regressão que se concentram na simulação ou emulação de diferentes cenários. No entanto, a descoberta na ciência é alimentada pelas hipóteses e previsões que sonhamos. Então, como podemos criar modelos que se destinam a conceber novas previsões, em vez dos modelos atuais que são usados ​​principalmente para experimentação?”

Buehler respondeu primeiro, dizendo: “Você está certo, a maioria dos modelos tradicionais de aprendizado de máquina geralmente são baseados em regressão, mas os modelos sobre os quais falamos hoje funcionam de maneira diferente. Quando você monta sistemas multiagentes com muitos recursos, eles realmente começam a explorar novos cenários e a raciocinar e fazer previsões com base nos experimentos que realizaram. Eles se tornam mais humanos. Você, como pesquisador, não faria um experimento e simplesmente terminaria - você faria um experimento e então começaria a olhar para os dados e validá-los e fazer novas previsões com base nesses dados, para conectar os pontos e extrapolar por fazendo hipóteses e imaginando como um novo cenário se desenrolaria. Você experimentaria, coletaria novos dados, desenvolveria uma teoria e talvez proporia uma estrutura integrada sobre um assunto de interesse específico. Então você defenderia suas ideias contra as críticas de seus colegas e talvez revisaria sua hipótese quando novas informações fossem usadas. É assim que funcionam os novos sistemas adversários multiagentes, mas é claro que complementam as competências humanas com uma capacidade muito maior de raciocinar sobre vastas quantidades de dados e representações de conhecimento. Esses modelos já podem gerar novas hipóteses que vão muito além do que já foi estudado, contribuindo para o processo científico de descoberta e inovação.”

“Eu complementaria isso”, interveio o Dr. Willett, “com a área de descoberta de conclusão e regressão simbólica como sendo outra área muito mais voltada para a geração de hipóteses. Há muito trabalho em andamento neste espaço.”

Membro do Público: “Como podemos aumentar o acesso a esses tipos de modelos e superar obstáculos, como a maioria dos modelos sendo criados para falantes de inglês?”

A Dra. Rebecca Willett respondeu, dizendo: “Muitas pessoas têm acesso ao uso desses modelos, mas projetá-los e treiná-los custa muitos milhões de dólares. Se apenas um pequeno conjunto de organizações é capaz de estabelecer estes modelos, então apenas um pequeno conjunto de pessoas está a tomar as decisões e a definir prioridades na comunidade científica. E muitas vezes as prioridades destas organizações e indivíduos são orientadas para o lucro. Dito isto, penso que esse cenário está a começar a mudar. Organizações como a NSF estão a tentar construir infra-estruturas que possam ser acedidas pela comunidade científica mais ampla. Este esforço assemelha-se ao desenvolvimento inicial dos supercomputadores. No início, os pesquisadores tiveram que apresentar propostas extensas para ter acesso a um supercomputador. Acho que veremos paradigmas emergentes semelhantes na IA e na IA generativa.”

“Eu concordo”, disse o Dr. Watson-Parris. “Acrescentando a isso do lado regulatório, não creio que devamos regulamentar a investigação básica, talvez os espaços de aplicação, mas não a investigação em si.”

Muito obrigado pela leitura e fique atento às recapitulações dos nossos outros dois painéis na AAAS 2024.

Carimbo de hora:

Mais de Blogue CCC