Modelo de incorporação novo e aprimorado

Republicado por Platão

seguidores: 0

Temos o prazer de anunciar um novo modelo de incorporação que é significativamente mais capaz, econômico e simples de usar. O novo modelo, text-embedding-ada-002, substitui cinco modelos separados para pesquisa de texto, similaridade de texto e pesquisa de código e supera nosso modelo anterior mais capaz, Davinci, na maioria das tarefas, com preço 99.8% menor.

Leia a documentação

Embeddings são representações numéricas de conceitos convertidos em sequências numéricas, o que torna mais fácil para os computadores entender as relações entre esses conceitos. Desde o lançamento inicial da OpenAI /incorporações endpoint, muitos aplicativos incorporaram incorporações para personalizar, recomendar e pesquisar conteúdo.

Você pode consultar o /incorporações endpoint para o novo modelo com duas linhas de código usando nosso Biblioteca Python OpenAI, assim como você poderia fazer com os modelos anteriores:

import openai
response = openai.Embedding.create(
  input="porcine pals say",
  model="text-embedding-ada-002"
)

Melhorias no modelo

Desempenho mais forte. text-embedding-ada-002 supera todos os antigos modelos de incorporação em tarefas de pesquisa de texto, pesquisa de código e similaridade de frases e obtém desempenho comparável na classificação de texto. Para cada categoria de tarefa, avaliamos os modelos nos conjuntos de dados usados em incorporações antigas.

Unificação de capacidades. Simplificamos significativamente a interface do /incorporações endpoint mesclando os cinco modelos separados mostrados acima (text-similarity, text-search-query, text-search-doc, code-search-text e code-search-code) em um único novo modelo. Essa representação única tem um desempenho melhor do que nossos modelos de incorporação anteriores em um conjunto diversificado de pesquisa de texto, similaridade de sentença e benchmarks de pesquisa de código.

Contexto mais longo. O comprimento do contexto do novo modelo é aumentado em um fator de quatro, de 2048 para 8192, tornando mais conveniente trabalhar com documentos longos.

Tamanho de incorporação menor. As novas incorporações têm apenas 1536 dimensões, um oitavo do tamanho davinci-001 incorporações, tornando as novas incorporações mais econômicas no trabalho com bancos de dados vetoriais.

Preço reduzido. Reduzimos o preço dos novos modelos de embutir em 90% em relação aos modelos antigos do mesmo tamanho. O novo modelo atinge um desempenho melhor ou semelhante aos antigos modelos Davinci a um preço 99.8% menor.

No geral, o novo modelo de incorporação é uma ferramenta muito mais poderosa para processamento de linguagem natural e tarefas de código. Estamos entusiasmados para ver como nossos clientes o usarão para criar aplicativos ainda mais capazes em seus respectivos campos.

Limitações

O novo text-embedding-ada-002 modelo não está superando text-similarity-davinci-001 no benchmark de classificação de sondagem linear SentEval. Para tarefas que exigem o treinamento de uma camada linear leve sobre a incorporação de vetores para previsão de classificação, sugerimos comparar o novo modelo com text-similarity-davinci-001 e escolher o modelo que oferece o desempenho ideal.

Verifique o Limitações & Riscos seção na documentação de incorporações para limitações gerais de nossos modelos de incorporação.

Exemplos de API de incorporação em ação

Calendário AI é um produto de alcance de vendas que usa incorporações para combinar o discurso de vendas certo para os clientes certos de um conjunto de dados contendo 340 milhões de perfis. Essa automação depende da semelhança entre a incorporação de perfis de clientes e argumentos de venda para classificar as correspondências mais adequadas, eliminando de 40 a 56% da segmentação indesejada em comparação com a abordagem antiga.

Noção, a empresa de espaço de trabalho on-line, usará as novas incorporações da OpenAI para melhorar a pesquisa do Notion além dos sistemas atuais de correspondência de palavras-chave.

Leia a documentação

Carimbo de hora: 15 de dezembro de 202215 de dezembro de 2022

Carimbo de hora: 1 Agosto , 2023

Modelo de incorporação novo e aprimorado

Republicado por Platão

Melhorias no modelo

Limitações

Exemplos de API de incorporação em ação

Mais de OpenAI

Point-E: Um sistema para gerar nuvens de pontos 3D a partir de prompts complexos

Usando GPT-4 para moderação de conteúdo

DALL·E agora disponível em versão beta

Previsão de possíveis usos indevidos de modelos de linguagem para campanhas de desinformação - e como reduzir o risco

Sora: primeiras impressões

Apresentando OpenAI Dublin

Apresentando o ChatGPT

Uma estrutura de análise de perigos para modelos de linguagem grandes de síntese de código

Memória e novos controles para ChatGPT

Disponibilidade geral da API GPT-4 e descontinuação de modelos mais antigos na API Completions

Sobre Nós

Pesquisa vertical e IA

Plataforma

Fique Ligado

Conta