Ny och förbättrad inbäddningsmodell

Återutgiven av Platon

anhängare: 0

Vi är glada över att kunna presentera en ny inbäddningsmodell som är betydligt mer kapabel, kostnadseffektiv och enklare att använda. Den nya modellen, text-embedding-ada-002, ersätter fem separata modeller för textsökning, textlikhet och kodsökning, och överträffar vår tidigare mest kapabla modell, Davinci, vid de flesta uppgifter, samtidigt som den är prissatt 99.8 % lägre.

Läs dokumentation

Inbäddningar är numeriska representationer av begrepp omvandlade till nummersekvenser, vilket gör det lätt för datorer att förstå sambanden mellan dessa begrepp. Sedan första lanseringen av OpenAI /inbäddningar endpoint har många applikationer inbyggda inbäddningar för att anpassa, rekommendera och söka innehåll.

Du kan fråga /inbäddningar slutpunkt för den nya modellen med två rader kod med vår OpenAI Python Library, precis som du kunde med tidigare modeller:

import openai
response = openai.Embedding.create(
  input="porcine pals say",
  model="text-embedding-ada-002"
)

Modellförbättringar

Starkare prestanda. text-embedding-ada-002 överträffar alla gamla inbäddningsmodeller för textsökning, kodsökning och meningslikhet och får jämförbar prestanda för textklassificering. För varje uppgiftskategori utvärderar vi modellerna på de datamängder som används i gamla inbäddningar.

Förening av förmågor. Vi har avsevärt förenklat gränssnittet för /inbäddningar slutpunkt genom att slå samman de fem separata modellerna som visas ovan (text-similarity, text-search-query, text-search-doc, code-search-text och code-search-code) till en enda ny modell. Denna enskilda representation presterar bättre än våra tidigare inbäddningsmodeller över en mångfald av riktmärken för textsökning, meningslikhet och kodsökning.

Längre sammanhang. Kontextlängden för den nya modellen ökas med en faktor fyra, från 2048 till 8192, vilket gör det bekvämare att arbeta med långa dokument.

Mindre inbäddningsstorlek. De nya inbäddningarna har bara 1536 dimensioner, en åttondel av storleken davinci-001 inbäddningar, vilket gör de nya inbäddningarna mer kostnadseffektiva i arbetet med vektordatabaser.

Rabatterat pris. Vi har sänkt priset på nya inbäddningsmodeller med 90 % jämfört med gamla modeller av samma storlek. Den nya modellen uppnår bättre eller liknande prestanda som de gamla Davinci-modellerna till ett 99.8 % lägre pris.

Sammantaget är den nya inbäddningsmodellen ett mycket kraftfullare verktyg för naturlig språkbehandling och koduppgifter. Vi är spännande att se hur våra kunder kommer att använda det för att skapa ännu mer kapabla applikationer inom sina respektive områden.

Begränsningar

Den nya text-embedding-ada-002 modellen överträffar inte text-similarity-davinci-001 på SentEvals linjära sonderingsklassificeringsbenchmark. För uppgifter som kräver träning av ett lättviktigt linjärt lager ovanpå inbäddningsvektorer för klassificeringsförutsägelse, föreslår vi att du jämför den nya modellen med text-similarity-davinci-001 och att välja vilken modell som helst som ger optimal prestanda.

Kontrollera Begränsningar och risker avsnitt i inbäddningsdokumentationen för allmänna begränsningar för våra inbäddningsmodeller.

Exempel på Embeddings API i aktion

Kalendar AI är en försäljningsuppsökande produkt som använder inbäddningar för att matcha rätt försäljningsargument till rätt kunder ur en datauppsättning som innehåller 340 miljoner profiler. Denna automatisering förlitar sig på likheten mellan inbäddningar av kundprofiler och säljpresentationer för att rangordna de lämpligaste matchningarna, vilket eliminerar 40–56 % av oönskad inriktning jämfört med deras gamla tillvägagångssätt.

Begrepp, online-arbetsutrymmesföretaget, kommer att använda OpenAI:s nya inbäddningar för att förbättra Notion-sökning utöver dagens sökordsmatchningssystem.

Läs dokumentation

Tidsstämpel: December 15, 2022December 15, 2022

Tidsstämpel: Augusti 1, 2023

Ny och förbättrad inbäddningsmodell

Återutgiven av Platon

Modellförbättringar

Begränsningar

Exempel på Embeddings API i aktion

Mer från OpenAI

Point-E: Ett system för att generera 3D-punktmoln från komplexa uppmaningar

Använder GPT-4 för innehållsmoderering

DALL·E nu tillgänglig i betaversion

Prognostisera potentiellt missbruk av språkmodeller för desinformationskampanjer – och hur man kan minska risken

Sora: Första intryck

Vi presenterar OpenAI Dublin

Vi presenterar ChatGPT

Ett ramverk för riskanalys för kodsyntes av stora språkmodeller

Minne och nya kontroller för ChatGPT

GPT-4 API allmän tillgänglighet och utfasning av äldre modeller i Completions API

Om Oss

Vertikal sökning och Ai

plattform

Håll kontakten

Konto