Uus ja täiustatud manustamismudel PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.

Uus ja täiustatud manustamismudel

Meil on hea meel teatada uuest manustamismudelist, mis on oluliselt võimekam, kulutõhusam ja lihtsam kasutada. Uus mudel, text-embedding-ada-002, asendab tekstiotsingu, teksti sarnasuse ja koodiotsingu jaoks viis erinevat mudelit ning ületab enamiku ülesannete puhul meie varasemat kõige võimekamat mudelit Davinci, kuid selle hind on 99.8% madalam.

Lugege dokumentatsiooni

Manustused on mõistete arvulised esitused, mis on teisendatud numbrijadadeks, mis hõlbustavad arvutitel nende mõistete vaheliste seoste mõistmist. Alates esialgne käivitamine OpenAI-st /manused lõpp-punkti, paljud rakendused on sisu isikupärastamiseks, soovitamiseks ja otsimiseks kaasanud manuseid.

Saate küsida päringu /manused uue mudeli lõpp-punkt kahe koodireaga, kasutades meie OpenAI Pythoni raamatukogu, täpselt nagu eelmiste mudelite puhul:

import openai
response = openai.Embedding.create(
  input="porcine pals say",
  model="text-embedding-ada-002"
)

Mudeli täiustused

Tugevam jõudlus. text-embedding-ada-002 ületab tekstiotsingu, koodiotsingu ja lausete sarnasuse ülesannete puhul kõiki vanu manustamismudeleid ning saavutab võrreldava jõudluse teksti liigitamisel. Iga ülesandekategooria puhul hindame kasutatud andmekogumite mudeleid vanad manused.





Võimete ühendamine. Oleme kasutajaliidest oluliselt lihtsustanud /manused lõpp-punkt, ühendades ülaltoodud viis erinevat mudelit (text-similarity, text-search-query, text-search-doc, code-search-text ja code-search-code) üheks uueks mudeliks. See üksik esitus toimib paremini kui meie eelmised manustamismudelid mitmesuguste tekstiotsingu, lausete sarnasuse ja koodiotsingu võrdlusaluste puhul.

Pikem kontekst. Uue mudeli kontekstipikkust suurendatakse neli korda, 2048-lt 8192-le, muutes pikkade dokumentidega töötamise mugavamaks.

Väiksem manustamissuurus. Uutel manustustel on ainult 1536 mõõdet, mis on kaheksandik sellest davinci-001 manustamist, muutes uued manustused vektorandmebaasidega töötamisel kuluefektiivsemaks.

Vähendatud hind. Oleme uute manustamismudelite hinda langetanud 90% võrreldes vanade sama suurusega mudelitega. Uus mudel saavutab parema või sarnase jõudluse kui vanad Davinci mudelid 99.8% madalama hinnaga.

Üldiselt on uus manustamismudel loomuliku keele töötlemise ja koodiülesannete jaoks palju võimsam tööriist. Meil on hea meel näha, kuidas meie kliendid seda oma valdkondades veelgi võimekamate rakenduste loomiseks kasutavad.

Piirangud

Uus text-embedding-ada-002 mudel ei ole parem text-similarity-davinci-001 SentEvali lineaarse sondeerimise klassifikatsiooni võrdlusalusel. Ülesannete puhul, mis nõuavad klassifikatsiooni ennustamiseks manustatavate vektorite peal kerge kaalutud lineaarse kihi treenimist, soovitame võrrelda uut mudelit text-similarity-davinci-001 ja valides mudeli, mis tagab optimaalse jõudluse.

Vaata Piirangud ja riskid meie manustamismudelite üldiste piirangute kohta.

Manuste API näited töös

Kalender AI on müügiedendustoode, mis kasutab manustamist, et sobitada 340 miljonit profiili sisaldavast andmekogumist õige müügisamm õigetele klientidele. See automatiseerimine tugineb kõige sobivamate vastete järjestamisel kliendiprofiilide manustamise ja müügipakkumiste sarnasusele, välistades 40–56% soovimatust sihtimisest võrreldes nende vana lähenemisviisiga.

MõisteVeebitööruumi ettevõte , kasutab OpenAI uusi manuseid, et täiustada mõisteotsingut väljaspool tänapäevaseid märksõnade sobitamissüsteeme.


Lugege dokumentatsiooni

Ajatempel:

Veel alates OpenAI