Nouveau modèle d'intégration amélioré PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

Modèle d'intégration nouveau et amélioré

Nous sommes ravis d'annoncer un nouveau modèle d'intégration qui est beaucoup plus performant, rentable et plus simple à utiliser. Le nouveau modèle, text-embedding-ada-002, remplace cinq modèles distincts pour la recherche de texte, la similarité de texte et la recherche de code, et surpasse notre précédent modèle le plus performant, Davinci, dans la plupart des tâches, tout en étant proposé à un prix inférieur de 99.8 %.

Lire la documentation

Les incorporations sont des représentations numériques de concepts converties en séquences de nombres, ce qui permet aux ordinateurs de comprendre facilement les relations entre ces concepts. Depuis le lancement initial de l'OpenAI /encastrements endpoint, de nombreuses applications ont intégré des intégrations pour personnaliser, recommander et rechercher du contenu.

Vous pouvez interroger le /encastrements point de terminaison pour le nouveau modèle avec deux lignes de code utilisant notre Bibliothèque OpenAI Python, comme vous le pouviez avec les modèles précédents :

import openai
response = openai.Embedding.create(
  input="porcine pals say",
  model="text-embedding-ada-002"
)

Améliorations du modèle

Des performances plus solides. text-embedding-ada-002 surpasse tous les anciens modèles d'intégration sur les tâches de recherche de texte, de recherche de code et de similarité de phrases et obtient des performances comparables sur la classification de texte. Pour chaque catégorie de tâche, nous évaluons les modèles sur les jeux de données utilisés dans anciens encastrements.





Unification des capacités. Nous avons considérablement simplifié l'interface du /encastrements endpoint en fusionnant les cinq modèles distincts présentés ci-dessus (text-similarity, text-search-query, text-search-doc, code-search-text et les code-search-code) en un nouveau modèle unique. Cette représentation unique fonctionne mieux que nos modèles d'intégration précédents sur un ensemble diversifié de critères de recherche de texte, de similarité de phrases et de recherche de code.

Contexte plus long. La longueur de contexte du nouveau modèle est multipliée par quatre, de 2048 à 8192, ce qui facilite le travail avec de longs documents.

Taille d'encastrement plus petite. Les nouveaux plongements n'ont que 1536 dimensions, soit un huitième de la taille de davinci-001 embeddings, ce qui rend les nouveaux embeddings plus rentables pour travailler avec des bases de données vectorielles.

Prix ​​réduit. Nous avons réduit le prix des nouveaux modèles d'encastrement de 90% par rapport aux anciens modèles de même taille. Le nouveau modèle atteint des performances supérieures ou similaires à celles des anciens modèles Davinci à un prix inférieur de 99.8 %.

Dans l'ensemble, le nouveau modèle d'intégration est un outil beaucoup plus puissant pour le traitement du langage naturel et les tâches de code. Nous sommes ravis de voir comment nos clients l'utiliseront pour créer des applications encore plus performantes dans leurs domaines respectifs.

Limites

Le nouveau système d’ text-embedding-ada-002 le modèle n'est pas performant text-similarity-davinci-001 sur le benchmark de classification de sondage linéaire SentEval. Pour les tâches nécessitant l'entraînement d'une couche linéaire légère au-dessus des vecteurs d'intégration pour la prédiction de la classification, nous vous suggérons de comparer le nouveau modèle à text-similarity-davinci-001 et choisir le modèle offrant des performances optimales.

Vérifiez la Limites et risques section dans la documentation des intégrations pour les limitations générales de nos modèles d'intégration.

Exemples d'API Embeddings en action

Calendrier IA est un produit de sensibilisation des ventes qui utilise des incorporations pour faire correspondre le bon argumentaire de vente aux bons clients à partir d'un ensemble de données contenant 340 millions de profils. Cette automatisation repose sur la similarité entre les intégrations de profils de clients et les argumentaires de vente pour classer les correspondances les plus appropriées, éliminant 40 à 56 % du ciblage indésirable par rapport à leur ancienne approche.

Notion, la société d'espace de travail en ligne, utilisera les nouvelles incorporations d'OpenAI pour améliorer la recherche Notion au-delà des systèmes de correspondance de mots clés actuels.


Lire la documentation

Horodatage:

Plus de OpenAI