Neues und verbessertes Einbettungsmodell PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.

Neues und verbessertes Einbettungsmodell

Wir freuen uns, ein neues Einbettungsmodell ankündigen zu können, das wesentlich leistungsfähiger, kostengünstiger und einfacher zu verwenden ist. Das neue Modell, text-embedding-ada-002, ersetzt fünf separate Modelle für Textsuche, Textähnlichkeit und Codesuche und übertrifft unser vorheriges leistungsfähigstes Modell, Davinci, bei den meisten Aufgaben, während der Preis um 99.8 % niedriger ist.

Dokumentation lesen

Einbettungen sind numerische Darstellungen von Konzepten, die in Zahlenfolgen umgewandelt wurden, die es Computern erleichtern, die Beziehungen zwischen diesen Konzepten zu verstehen. Seit der Erststart der OpenAI /Einbettungen Endpunkt haben viele Anwendungen Einbettungen integriert, um Inhalte zu personalisieren, zu empfehlen und zu durchsuchen.

Sie können die abfragen /Einbettungen Endpunkt für das neue Modell mit zwei Codezeilen unter Verwendung unseres OpenAI-Python-Bibliothek, genau wie bei früheren Modellen:

import openai
response = openai.Embedding.create(
  input="porcine pals say",
  model="text-embedding-ada-002"
)

Modellverbesserungen

Stärkere Leistung. text-embedding-ada-002 übertrifft alle alten Einbettungsmodelle bei Textsuche, Codesuche und Satzähnlichkeitsaufgaben und erzielt eine vergleichbare Leistung bei der Textklassifizierung. Für jede Aufgabenkategorie evaluieren wir die Modelle auf den verwendeten Datensätzen alte Einbettungen.





Vereinheitlichung der Fähigkeiten. Wir haben die Benutzeroberfläche der erheblich vereinfacht /Einbettungen Endpunkt durch Zusammenführen der fünf oben gezeigten separaten Modelle (text-similarity, text-search-query, text-search-doc, code-search-text und code-search-code) in ein einziges neues Modell. Diese einzelne Darstellung bietet eine bessere Leistung als unsere vorherigen Einbettungsmodelle bei einer Vielzahl von Benchmarks für Textsuche, Satzähnlichkeit und Codesuche.

Längerer Kontext. Die Kontextlänge des neuen Modells wurde von 2048 auf 8192 um den Faktor vier erhöht, was das Arbeiten mit langen Dokumenten komfortabler macht.

Kleinere Einbettungsgröße. Die neuen Einbettungen haben nur 1536 Abmessungen, ein Achtel der Größe von davinci-001 Einbettungen, wodurch die neuen Einbettungen bei der Arbeit mit Vektordatenbanken kostengünstiger werden.

Reduzierter Preis. Wir haben den Preis neuer Embedding-Modelle im Vergleich zu alten Modellen gleicher Größe um 90 % gesenkt. Das neue Modell erreicht eine bessere oder ähnliche Leistung wie die alten Davinci-Modelle zu einem um 99.8 % günstigeren Preis.

Insgesamt ist das neue Einbettungsmodell ein viel leistungsfähigeres Werkzeug für die Verarbeitung natürlicher Sprache und Codeaufgaben. Wir sind gespannt, wie unsere Kunden damit noch leistungsfähigere Anwendungen in ihren jeweiligen Bereichen erstellen werden.

Einschränkungen

The new text-embedding-ada-002 Modell ist nicht überragend text-similarity-davinci-001 auf dem SentEval-Klassifizierungs-Benchmark für lineare Sondierungen. Für Aufgaben, die das Training einer leicht gewichteten linearen Schicht auf Einbettungsvektoren für die Klassifizierungsvorhersage erfordern, empfehlen wir, das neue Modell mit zu vergleichen text-similarity-davinci-001 und die Wahl des Modells mit optimaler Leistung.

Prüfen Sie die Einschränkungen und Risiken Abschnitt in der Einbettungsdokumentation für allgemeine Einschränkungen unserer Einbettungsmodelle.

Beispiele für Einbettungs-API in Aktion

Kalender-KI ist ein Sales-Outreach-Produkt, das Einbettungen verwendet, um das richtige Verkaufsgespräch mit den richtigen Kunden aus einem Datensatz mit 340 Millionen Profilen abzugleichen. Diese Automatisierung beruht auf der Ähnlichkeit zwischen der Einbettung von Kundenprofilen und Verkaufsargumenten, um die am besten geeigneten Übereinstimmungen zu ermitteln, wodurch 40–56 % des unerwünschten Targetings im Vergleich zu ihrem alten Ansatz eliminiert werden.

Notion, das Unternehmen für Online-Workspaces, wird die neuen Einbettungen von OpenAI verwenden, um die Notion-Suche über die heutigen Keyword-Matching-Systeme hinaus zu verbessern.


Dokumentation lesen

Zeitstempel:

Mehr von OpenAI