Récapitulatif des promesses et des pièges – Quatrième partie » Blog CCC

Récapitulatif des promesses et des pièges – Quatrième partie » Blog CCC

Le CCC a soutenu trois séances scientifiques lors de la conférence annuelle de l'AAAS de cette année. Cette semaine, nous résumerons les moments forts de la séance, »L'IA générative en science : promesses et pièges.» Ce panel, modéré par Dr Matthieu Turk, président du Toyota Technological Institute de Chicago), en vedette Dr Rebecca Willett, professeur de statistiques et d'informatique à l'Université de Chicago, Dr Markus Buehler, professeur d'ingénierie au Massachusetts Institute of Technology, et Dr Duncan Watson-Parris, professeur adjoint à la Scripps Institution of Oceanography et au Halıcıoğlu Data Science Institute de l'UC San Diego. Dans la quatrième partie, nous résumons la partie questions-réponses du panel. 

Une séance de questions et réponses a suivi les présentations des panélistes, et le Dr Matthew Turk a lancé la discussion. « « Promesses et pièges » figure dans le titre de ce panel. Nous avons discuté de nombreuses promesses, mais nous n’avons pas abordé bon nombre des pièges. Qu’est-ce qui vous inquiète concernant l’avenir de l’IA générative ? »

"La fiabilité et la fiabilité de ces modèles constituent une grande préoccupation", a commencé le Dr Rebecca Wilett. « Ces modèles peuvent prédire des choses qui sont plausibles, mais il manque des éléments clés et saillants ; Puis-je, en tant qu’humain, reconnaître qu’il manque quelque chose ?

Le Dr Markus Buehler a ajouté que la prédiction réelle d'un modèle peut prendre une seconde, mais que le processus expérimental de validation peut prendre des mois, un an, voire plus. Alors, comment devrions-nous opérer dans l’intervalle lorsque nous n’avons pas vérifié les résultats ? « Nous devons également former la prochaine génération de développeurs d’IA générative afin qu’ils conçoivent des modèles fiables et vérifiables, et que nous puissions utiliser des informations basées sur la physique dans la construction de ces modèles. »

Le Dr Duncan Watson-Parris s'est appuyé sur les deux points précédents en déclarant : « Puisque ces modèles sont conçus pour générer des résultats plausibles, nous ne pouvons pas simplement examiner les résultats pour vérifier leur exactitude. Les chercheurs en IA générative doivent avoir une compréhension approfondie du fonctionnement de ces modèles afin de vérifier leurs résultats, c’est pourquoi il est si important d’éduquer correctement la prochaine génération.

Membre du public : « En science des matériaux, nous connaissons la direction à suivre pour étudier certains matériaux, mais pour d'autres, comme les supraconducteurs à température ambiante, nous ne savons pas comment aller de l'avant. À votre avis, à quoi ressemblera la voie à suivre dans l’étude de ces matériaux inconnus ? Et comment ce type de recherche devrait-il être rendu possible d’un point de vue réglementaire ? »

« Eh bien, je ne suis pas un expert en recherche sur les supraconducteurs », a déclaré le Dr Buehler, « donc je ne parlerai pas directement de cela, mais je peux parler de manière générale de la façon dont nous faisons des progrès dans la science des matériaux, en particulier dans mon domaine des protéines. et le développement de biomatériaux. La façon dont nous progressons est d’avoir la capacité de repousser les limites. Nous menons de nouvelles expériences, testons des idées et des théories farfelues et voyons lesquelles fonctionnent et pourquoi. Quant à la manière dont nous devrions permettre cette recherche, nous avons besoin de davantage de modèles open source avec accès collectif. J'encouragerais les politiciens à ne pas trop réglementer ces technologies, de manière à ce que les chercheurs et le public aient accès à ce type de modèles. Je ne pense pas que ce soit une bonne idée d'empêcher les gens d'utiliser ces modèles, surtout lorsque nous pouvons rassembler des idées et des développements et introduire des connaissances provenant de divers domaines de l'activité humaine. Par exemple, lorsque l’imprimerie a été inventée, les autorités ont tenté de limiter la disponibilité de cette technologie afin que peu de livres puissent être lus en masse, mais cet effort a lamentablement échoué. La meilleure façon de protéger le public est de faciliter l’accès à ces modèles de manière à ce que nous puissions les développer, les explorer et les évaluer de manière approfondie pour le bénéfice maximal de la société.

Membre du public : « La plupart des modèles d'IA génératifs d'aujourd'hui sont des modèles de régression qui se concentrent sur la simulation ou l'émulation de différents scénarios. Cependant, les découvertes scientifiques sont alimentées par les hypothèses et les prédictions que nous imaginons. Alors, comment pouvons-nous créer des modèles destinés à concevoir de nouvelles prédictions au lieu des modèles actuels qui sont principalement utilisés à des fins d’expérimentation ? »

Le Dr Buehler a répondu le premier en disant : « Vous avez raison, la plupart des modèles d'apprentissage automatique traditionnels sont souvent basés sur la régression, mais les modèles dont nous avons parlé aujourd'hui fonctionnent différemment. Lorsque vous assemblez des systèmes multi-agents dotés de nombreuses fonctionnalités, ils commencent réellement à explorer de nouveaux scénarios et commencent à raisonner et à faire des prédictions sur la base des expériences qu'ils ont menées. Ils deviennent plus humains. En tant que chercheur, vous ne mèneriez pas une expérience et vous en auriez simplement terminé – vous mèneriez une expérience, puis commenceriez à examiner les données, à les valider et à faire de nouvelles prédictions basées sur ces données, pour relier les points et extrapoler par faire des hypothèses et imaginer comment un nouveau scénario se déroulerait. Vous expérimenterez, collecterez de nouvelles données, développerez une théorie et proposerez peut-être un cadre intégré sur un sujet d’intérêt particulier. Ensuite, vous défendriez vos idées contre les critiques de vos collègues et réviserez peut-être votre hypothèse lorsque de nouvelles informations seront utilisées. C’est ainsi que fonctionnent les nouveaux systèmes contradictoires multi-agents, mais ils complètent bien sûr les compétences humaines par une bien plus grande capacité à raisonner sur de grandes quantités de données et de représentations de connaissances. Ces modèles peuvent déjà générer de nouvelles hypothèses qui repoussent les limites bien au-delà de ce qui a déjà été étudié, renforçant ainsi le processus scientifique de découverte et d’innovation.

"Je compléterais cela", intervint le Dr Willett, "avec le domaine de la découverte par complétion et de la régression symbolique comme étant un autre domaine beaucoup plus ciblé vers la génération d'hypothèses. Il y a beaucoup de travail en cours dans cet espace.

Membre du public : « Comment pouvons-nous accroître l'accès à ces types de modèles et surmonter les obstacles, tels que la plupart des modèles créés pour les anglophones ? »

Le Dr Rebecca Willett a répondu : « De nombreuses personnes ont accès à ces modèles, mais leur conception et leur formation coûtent plusieurs millions de dollars. Si seul un petit groupe d’organisations est capable de mettre en place ces modèles, alors seul un très petit nombre de personnes prennent les décisions et fixent les priorités au sein de la communauté scientifique. Et souvent, les priorités de ces organisations et individus sont axées sur le profit. Cela dit, je pense que ce paysage commence à changer. Des organisations comme la NSF tentent de construire une infrastructure accessible à la communauté scientifique au sens large. Cet effort ressemble au développement précoce des supercalculateurs. Au début, les chercheurs devaient soumettre de longues propositions pour avoir accès à un supercalculateur. Je pense que nous allons voir émerger des paradigmes similaires en matière d’IA et d’IA générative.

«Je suis d'accord», a déclaré le Dr Watson-Parris. "En outre, du point de vue réglementaire, je ne pense pas que nous devrions réglementer la recherche fondamentale, peut-être les espaces d'application, mais pas la recherche elle-même."

Merci beaucoup d'avoir lu et restez à l'écoute pour les récapitulatifs de nos deux autres panels à l'AAAS 2024.

Horodatage:

Plus de Blogue du CCC