Modelo de linguagem grande SauLM-7B visa aplicações legais

Republicado por Platão

seguidores: 0

Pesquisadores de aprendizado de máquina e especialistas jurídicos lançaram o SauLM-7B, que afirmam ser o primeiro modelo de linguagem grande de código aberto gerador de texto especificamente focado em trabalhos e aplicações jurídicas.

À luz dos erros recentes de grande repercussão em que a IA generativa citou casos inexistentes em processos judiciais apresentados – Mata x Avianca e Park x Kim – isso pode parecer imprudente. A tendência dos modelos de IA para alucinar e a sua proveniência incerta de dados parecem ser factores decisivos numa indústria onde os riscos são significativos.

Mas os criadores do SauLM-7B, afiliados à startup Igualdade.ai, Université Paris-Saclay e Sorbonne Université em França, e Universidade de Lisboa e NOVA School of Law em Portugal, argumentam que há lugar para a ajuda da inteligência artificial no direito.

“Os LLMs e, de forma mais ampla, os sistemas de IA terão um impacto transformador na prática do direito que inclui, mas vai além da produtividade marginal”, disse um porta-voz da Equall.ai em um e-mail para O registro. “Nosso foco está na criação de sistemas jurídicos de IA de ponta a ponta, guiados e controlados por advogados.

Acreditamos que os sistemas especializados no domínio jurídico terão melhor desempenho do que os generalistas

“Nossa crença – baseada em dados e experiência – é que os sistemas especializados no domínio jurídico terão melhor desempenho do que os generalistas. Isto inclui maior precisão e ferramentas mais úteis para ajudar os advogados a concentrarem-se naquilo de que mais gostam e fazem melhor, que é exercer o julgamento jurídico e ajudar os seus clientes com aconselhamento”.

Outras organizações estão igualmente optimistas quanto à utilidade da assistência da IA. Goldman Sachs no ano passado estimado [PDF] que “um quarto das tarefas de trabalho atuais poderiam ser automatizadas por IA nos EUA, com exposições particularmente altas em profissões administrativas (46%) e jurídicas (44%)…” E startups como QI de banco, Harvey.ai e Tecnologias de sinalização segura vejo uma oportunidade de mercado nesse tipo de previsão.

Equall.ai, fundada por Jorge Mattamouros, ex-sócio da White & Case LLP, argumenta que quase todo o trabalho jurídico – pesquisa, revisão e análise de documentos, resumo e identificação de passagens importantes em documentos – pode se beneficiar da IA.

“Acreditamos que os LLMs abrem muitos outros caminhos, alguns que vemos hoje, muitos ainda por descobrir”, continuou o porta-voz da Equall.ai. “Por exemplo, acreditamos que os LLMs mudarão drasticamente a forma como abordamos tanto os pipelines de processamento de dados quanto a geração de dados, o que será crítico para aplicações jurídicas onde a obtenção de dados de alta qualidade é cara e difícil de fazer.”

A opinião da Equall.ai é que as imprecisões dos modelos de IA podem ser mitigadas.

“LLMs continuam sendo modelos probabilísticos”, disse-nos o negócio. “As alucinações são geralmente o sintoma de LLMs operando fora de distribuição. Em outras palavras, quando solicitados a gerar texto sobre tópicos e dados semelhantes aos dados nos quais o LLM foi treinado, os LLMs tendem a ter alucinações significativamente menos do que quando solicitados sobre coisas sobre as quais aprenderam pouco.

“Por exemplo, ao longo da nossa avaliação de Saul com advogados reais, pudemos confirmar que ele era menos sujeito a alucinações ao discutir conceitos jurídicos específicos. Em suma, esperamos que os LLMs que são especificamente treinados em dados jurídicos tenham muito menos alucinações sobre temas jurídicos do que os seus homólogos generalistas.”

Dito isto, o iniciante adverte que não se deve confiar nos modelos de IA como se fossem um banco de dados legal e que é aconselhável verificar novamente o resultado dos LLMs. Diríamos: A verificação é obrigatória.

Os especialistas por trás do SauLM-7B – Pierre Colombo, Telmo Pessoa Pires, Malik Boudiaf, Dominic Culver, Rui Melo, Caio Corro, Andre FT Martins, Fabrizio Esposito, Vera Lúcia Raposo, Sofia Morgado e Michael Desa – descrevem o seu trabalho em um papel intitulado “SaulLM-7B: Um modelo pioneiro de linguagem ampla para o direito”.

Disponível no site da comunidade de modelos de IA HuggingFace, SaulLM-7B é baseado no modelo Mistral 7B de código aberto, ambos com 7 bilhões de parâmetros. Isso é significativamente menos do que modelos como Lhama 2, que pode ser baseado em até 70 bilhões de parâmetros. Mas os criadores do SauLM-7B observam que este é apenas o primeiro marco e que o trabalho está sendo feito com modelos de diferentes tamanhos.

Como seria de esperar de um LLM, o SauLM-7B funciona recebendo perguntas ou instruções em linguagem natural e tenta respondê-las ou respondê-las; neste caso, está focado na lei e nas questões jurídicas.

Jonathan Schwarz, cofundador e cientista-chefe da startup jurídica de IA com sede no Reino Unido, Safe Sign Technologies, disse O registro que os fabricantes do SauLM-7B adotaram uma abordagem sensata para especializar LLMs gerais.

“É uma boa oferta como alternativa de código aberto para técnicas mais proprietárias”, disse ele. “No entanto, há trabalho que precisa ser feito.”

É uma boa oferta como alternativa de código aberto para técnicas mais proprietárias

Schwarz apontou a necessidade de modelos de red-teaming, algo que ele disse que sua empresa está fazendo internamente.

Fomos informados de que a Safe Sign Technologies criou um protótipo de um LLM legal e pretende ter uma segunda iteração pronta para implantação através de parceiros ainda este ano ou depois.

Schwarz disse que a empresa ainda não está pronta para comentar até que ponto sua oferta será de código aberto ou proprietária. Mas ele afirmou que, embora o SaulLM-7B-Instruct – uma versão aprimorada com base em instruções gerais e legais – tenha conseguido uma pontuação média de 0.61 no benchmark LegalBench-Instruct, “estamos chegando perto de 0.77”. Essa porcentagem de precisão é semelhante ao GPT-4, embora recomendamos que você se preocupe com os benchmarks de aprendizado de máquina.

“Nossa ambição aqui era criar uma solução de IA que oferecesse instantaneamente a cada pessoa aconselhamento jurídico de muito boa qualidade”, disse Alexander (Sami) Kardos-Nyheim, cofundador e CEO da Safe Sign Technologies em entrevista ao O registro. “Aconselhamento jurídico não confiável do ChatGPT ou algo parecido. Mas aconselhamento jurídico sério que você pode realmente usar e confiar por meio da IA.”

Você meio que evita esse problema de aprender todo esse comportamento tóxico que você está tentando desfazer mais tarde

“Muito, muito grosso modo, a maneira como essas técnicas ou métodos geralmente são treinados é que você tem um enorme conjunto de dados que foi treinado na web e cada etapa de treinamento direto você amostra ou apenas escolhe um subconjunto aleatório disso”, explicou Schwarz. “Então você apenas treina nesse subconjunto e faz isso trilhões de vezes.

“Em vez de simplesmente escolher um subconjunto aleatório, temos novos métodos que, em cada ponto do treinamento, tentam determinar qual é o subconjunto ideal de dados para treinar neste momento, de modo que a melhoria dos modelos seja máxima. Esse é o primeiro passo. Dessa forma, você evita aquele problema de aprender todo esse comportamento tóxico que você está tentando desfazer mais tarde.

Schwarz sugeriu que a abordagem da Safe Sign é, bem, mais segura. “Em um caso em que há uma questão jurídica específica que o modelo simplesmente não sabe como responder, em vez de dar uma resposta incorreta com segurança, podemos simplesmente dizer que estamos nos segurando nessa questão.”

Ele continuou expressando ceticismo sobre a abordagem de ferver o oceano adotada pela OpenAI e pelo Google, que envolve focar em danos amplos, como preconceitos raciais e de gênero, e pagar prestadores de serviços baratos para classificar as respostas de seus modelos, para que possam treinar novamente as redes neurais para fazer menos respostas prejudiciais.

“Se você quer ser capaz de fazer tudo o que um ser humano pode fazer, você tem que testar tudo o que um ser humano pode fazer”, disse Schwarz. “Acho que é apenas uma estratégia perdedora se você estiver tentando fazer isso em todos os tópicos possíveis.”

“Não apenas na IA jurídica, mas de forma mais geral, na IA, não estamos vendo o foco na segurança e na robustez que permite sistemas sérios e confiáveis no contexto médico ou jurídico”, acrescentou Kardos-Nyheim. ®

Conteúdo com tecnologia de SEO e distribuição de relações públicas. Seja amplificado hoje.
PlatoData.Network Gerativa Vertical Ai. Capacite-se. Acesse aqui.
PlatoAiStream. Inteligência Web3. Conhecimento Amplificado. Acesse aqui.
PlatãoESG. Carbono Tecnologia Limpa, Energia, Ambiente, Solar, Gestão de resíduos. Acesse aqui.
PlatoHealth. Inteligência em Biotecnologia e Ensaios Clínicos. Acesse aqui.
Fonte: https://go.theregister.com/feed/www.theregister.com/2024/03/09/better_call_saul_llm/

Carimbo de hora: 9 de março de 2024

Carimbo de hora: 2 de Outubro, 2023

Modelo de linguagem grande SauLM-7B visa aplicações legais

Republicado por Platão

Mais de O registro

CEO do GitHub diz que EU AI Act não deve se aplicar a desenvolvedores de código aberto

Com a aquisição do Run:ai, a Nvidia pretende gerenciar seus AI K8s

É a sua arrogância humana impedindo a aceitação da IA

Para a loja de IA média, modelos esparsos e memória barata vencerão

Sobre Nós

Pesquisa vertical e IA

Plataforma

Fique Ligado

Conta