Nuovo e migliorato modello di incorporamento PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

Modello di incorporamento nuovo e migliorato

Siamo entusiasti di annunciare un nuovo modello di incorporamento che è significativamente più capace, conveniente e più semplice da usare. Il nuovo modello, text-embedding-ada-002, sostituisce cinque modelli separati per la ricerca di testo, la somiglianza del testo e la ricerca di codice e supera il nostro precedente modello più capace, Davinci, nella maggior parte delle attività, pur avendo un prezzo inferiore del 99.8%.

Leggi la documentazione

Gli incorporamenti sono rappresentazioni numeriche di concetti convertiti in sequenze numeriche, che facilitano ai computer la comprensione delle relazioni tra quei concetti. Dal momento che il lancio iniziale dell'OpenAI /incorporamenti endpoint, molte applicazioni hanno incorporato incorporamenti per personalizzare, consigliare e cercare contenuti.

Puoi interrogare il /incorporamenti endpoint per il nuovo modello con due righe di codice utilizzando our Libreria OpenAI Python, proprio come potresti fare con i modelli precedenti:

import openai
response = openai.Embedding.create(
  input="porcine pals say",
  model="text-embedding-ada-002"
)

Miglioramenti del modello

Prestazioni più forti. text-embedding-ada-002 supera tutti i vecchi modelli di incorporamento nelle attività di ricerca di testo, ricerca di codice e somiglianza di frasi e ottiene prestazioni comparabili nella classificazione del testo. Per ogni categoria di attività, valutiamo i modelli sui set di dati utilizzati in vecchi incastri.





Unificazione delle capacità. Abbiamo notevolmente semplificato l'interfaccia del /incorporamenti endpoint unendo i cinque modelli separati mostrati sopra (text-similarity, text-search-query, text-search-doc, code-search-text ed code-search-code) in un unico nuovo modello. Questa singola rappresentazione ha prestazioni migliori rispetto ai nostri precedenti modelli di incorporamento in un insieme diversificato di benchmark di ricerca di testo, somiglianza di frasi e ricerca di codice.

Contesto più lungo. La lunghezza del contesto del nuovo modello è aumentata di un fattore quattro, da 2048 a 8192, rendendo più conveniente lavorare con documenti lunghi.

Dimensione di incorporamento più piccola. I nuovi incorporamenti hanno solo 1536 dimensioni, un ottavo delle dimensioni di davinci-001 incorporamenti, rendendo i nuovi incorporamenti più convenienti nell'utilizzo di database vettoriali.

Prezzo ridotto. Abbiamo ridotto il prezzo dei nuovi modelli da incasso del 90% rispetto ai vecchi modelli della stessa dimensione. Il nuovo modello raggiunge prestazioni migliori o simili ai vecchi modelli Davinci a un prezzo inferiore del 99.8%.

Nel complesso, il nuovo modello di incorporamento è uno strumento molto più potente per l'elaborazione del linguaggio naturale e le attività di codice. Siamo entusiasti di vedere come i nostri clienti lo utilizzeranno per creare applicazioni ancora più capaci nei rispettivi campi.

Limiti

Il nuovo text-embedding-ada-002 il modello non è performante text-similarity-davinci-001 sul benchmark di classificazione del sondaggio lineare SentEval. Per le attività che richiedono l'addestramento di uno strato lineare leggero sopra l'incorporamento di vettori per la previsione della classificazione, suggeriamo di confrontare il nuovo modello con text-similarity-davinci-001 e scegliendo il modello che offre prestazioni ottimali.

Controlla il Limitazioni e rischi sezione nella documentazione degli incorporamenti per le limitazioni generali dei nostri modelli di incorporamento.

Esempi di API di incorporamento in azione

Calendario AI è un prodotto di sensibilizzazione alle vendite che utilizza gli incorporamenti per abbinare la giusta presentazione di vendita ai clienti giusti da un set di dati contenente 340 milioni di profili. Questa automazione si basa sulla somiglianza tra l'incorporamento dei profili dei clienti e le proposte di vendita per classificare le corrispondenze più adatte, eliminando il 40-56% del targeting indesiderato rispetto al vecchio approccio.

Nozione, la società di spazi di lavoro online, utilizzerà i nuovi incorporamenti di OpenAI per migliorare la ricerca di Notion oltre i sistemi di corrispondenza delle parole chiave odierni.


Leggi la documentazione

Timestamp:

Di più da OpenAI