CCC responde à solicitação da NTIA de informações sobre modelos de IA de base de uso duplo com pesos de modelo amplamente disponíveis » Blog do CCC

CCC responde à solicitação da NTIA de informações sobre modelos de IA de base de uso duplo com pesos de modelo amplamente disponíveis » Blog do CCC

Na semana passada, o CCC respondeu ao pedido da Administração Nacional de Telecomunicações e Informação Solicitação de informações sobre modelos de inteligência artificial de base de uso duplo com pesos de modelo amplamente disponíveis. Os próprios Daniel Lopresti do CCC (Presidente do CCC e Lehigh University) e David Danks (Comitê Executivo do CCC e Universidade da Califórnia, San Diego) ajudaram a redigir esta resposta junto com vários outros membros da comunidade de computação. Markus Buehler (Instituto de Tecnologia de Massachusetts) e Duncan Watson-Parris (Universidade da Califórnia, San Diego), que falaram no painel AAAS patrocinado pelo CCC este ano, intitulado, IA generativa na ciência: promessas e armadilhas, ambos contribuíram para a resposta da RFI, juntamente com Casey Fiesler (Universidade do Colorado, Boulder), que participou do CCC's Futuro da Pesquisa em Tecnologias Sociais oficina em novembro.

Na sua resposta, os autores centraram-se em algumas questões específicas do RFI, uma das quais questionou como os riscos associados à disponibilização ampla dos pesos dos modelos se comparam aos associados aos pesos dos modelos não públicos. Os autores responderam que a maioria dos riscos associados aos modelos generativos são minimamente exacerbados pela disponibilização ampla dos pesos dos modelos. A maioria dos riscos relacionados com modelos generativos são inerentes a estes modelos, devido à sua capacidade de gerar rapidamente enormes quantidades de conteúdo credível com base nas entradas do utilizador e às suas áreas de aplicação quase ilimitadas. A disponibilização pública dos pesos dos modelos não afeta a funcionalidade dos modelos generativos e, portanto, atualmente há poucas evidências de que a disponibilização ampla dos pesos crie um risco adicional significativo além do que já poderia ser feito com sistemas proprietários ou fechados. Um risco que poderia ser potencialmente agravado se os pesos dos modelos proprietários fossem amplamente disponibilizados é a possibilidade de exposição dos dados de treinamento. É improvável que os pesos dos modelos possam sofrer engenharia reversa para expor dados de treinamento, mas isso não se mostrou matematicamente impossível. No entanto, na nossa resposta enfatizámos que, como os modelos generativos provavelmente continuarão a ser fortemente utilizados pelo público em geral, os maiores riscos, na nossa opinião, advêm de não disponibilizar abertamente ponderações para modelos de fundação representativos. Negar aos investigadores e aos membros interessados ​​da comunidade o acesso a alguns pesos de modelo para modelos proprietários impedirá a sociedade de obter uma melhor compreensão de como estes modelos funcionam e de como conceber modelos mais inclusivos e acessíveis.

A continuação da prática de divulgação de modelos fechados continuará a perpetuar a falta de diversidade na tecnologia e impedirá a realização de certos tipos de investigação, tais como auditorias tendenciosas destes modelos, que as grandes empresas tecnológicas não são incentivadas a realizar. A educação da futura força de trabalho é outra consideração extremamente importante. Os Estados Unidos não podem esperar manter a liderança no campo da IA ​​generativa sem treinar a futura geração de desenvolvedores nestes tipos de modelos na educação de graduação e pós-graduação. É importante que os alunos possam explorar estes modelos durante a sua educação para compreender a sua funcionalidade básica e aprender como incorporar considerações éticas no desenvolvimento de novos modelos. Permitir que apenas as grandes empresas tecnológicas possuam as ferramentas para formar a próxima geração também poderia resultar num pensamento isolado, e estas organizações podem ignorar uma educação holística que o acesso a estes modelos pode proporcionar em favor de um quadro mais eficiente de aprendizagem conforme necessário. Na nossa resposta, também realçámos a importância de estabelecer uma cultura de abertura em torno do desenvolvimento destes modelos, enfatizando que estabelecer tal cultura pode ser tão importante como regular estas tecnologias. Se houver uma expectativa de que as empresas tecnológicas criem modelos generativos de forma transparente, então a regulamentação futura tornar-se-á muito mais fácil de conduzir.

Finalmente, o CCC sublinhou a necessidade de investigação adicional sobre modelos fundamentais, citando a actual falta de conhecimento do público sobre como estes modelos realmente funcionam e como chegam aos resultados que produzem. Na nossa resposta, listámos uma série de questões de investigação não respondidas que investigadores, cientistas, académicos e especialistas em questões sociais estão preparados para começar a responder, desde que recebam o acesso aberto de que necessitam aos tipos de grandes modelos de fundação que a indústria está agora a explorar. . Nosso sucesso contínuo como sociedade depende disso.

Leia a resposta completa do CCC aqui.

Carimbo de hora:

Mais de Blogue CCC