Новая и улучшенная модель внедрения PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.

Новая и улучшенная модель встраивания

Мы рады объявить о новой модели встраивания, которая значительно эффективнее, экономичнее и проще в использовании. Новая модель, text-embedding-ada-002, заменяет пять отдельных моделей для текстового поиска, подобия текста и поиска кода и превосходит нашу предыдущую наиболее мощную модель, Davinci, в большинстве задач, при этом цена на 99.8% ниже.

Читать документацию

Вложения — это числовые представления понятий, преобразованные в числовые последовательности, которые упрощают для компьютеров понимание взаимосвязей между этими понятиями. Поскольку первоначальный запуск OpenAI /вложения конечной точки, многие приложения включают встраивания для персонализации, рекомендации и поиска контента.

Вы можете запросить /вложения конечная точка для новой модели с двумя строками кода, используя наш Библиотека OpenAI Python, как и в предыдущих моделях:

import openai
response = openai.Embedding.create(
  input="porcine pals say",
  model="text-embedding-ada-002"
)

Улучшения модели

Более высокая производительность. text-embedding-ada-002 превосходит все старые модели встраивания в задачах текстового поиска, поиска кода и сходства предложений и обеспечивает сопоставимую производительность в классификации текста. Для каждой категории задач мы оцениваем модели на наборах данных, используемых в старые вложения.





Объединение возможностей. Мы значительно упростили интерфейс /вложения конечной точки путем слияния пяти отдельных моделей, показанных выше (text-similarity, text-search-query, text-search-doc, code-search-text и code-search-code) в единую новую модель. Это единое представление работает лучше, чем наши предыдущие модели встраивания, в разнообразном наборе тестов текстового поиска, схожести предложений и поиска кода.

Более длинный контекст. Длина контекста новой модели увеличена в четыре раза, с 2048 до 8192, что делает работу с длинными документами более удобной.

Меньший размер встраивания. Новые вложения имеют только 1536 размеров, что составляет одну восьмую размера davinci-001 вложения, что делает новые вложения более экономичными при работе с векторными базами данных.

Сниженная цена. Мы снизили цену на новые встраиваемые модели на 90% по сравнению со старыми моделями того же размера. Новая модель обеспечивает лучшую или аналогичную производительность по сравнению со старыми моделями Davinci при более низкой цене на 99.8%.

В целом, новая модель встраивания — гораздо более мощный инструмент для обработки естественного языка и задач кода. Мы рады видеть, как наши клиенты будут использовать его для создания еще более эффективных приложений в своих областях.

ограничения

Новый text-embedding-ada-002 модель не лучше text-similarity-davinci-001 на тесте классификации линейных зондов SentEval. Для задач, требующих обучения легковзвешенного линейного слоя поверх векторов встраивания для предсказания классификации, мы предлагаем сравнить новую модель с text-similarity-davinci-001 и выбрать любую модель, обеспечивающую оптимальную производительность.

Проверить Ограничения и риски раздел в документации по встраиванию для общих ограничений наших моделей встраивания.

Примеры Embeddings API в действии

Календарь ИИ — это продукт для расширения продаж, в котором используются встраивания для подбора правильного рекламного предложения нужным клиентам из набора данных, содержащего 340 млн профилей. Эта автоматизация основана на сходстве между встроенными профилями клиентов и рекламными объявлениями для ранжирования наиболее подходящих совпадений, устраняя 40–56% нежелательного таргетинга по сравнению с их старым подходом.

понятие, компания, занимающаяся онлайновым рабочим пространством, будет использовать новые встраивания OpenAI для улучшения поиска Notion за пределами сегодняшних систем сопоставления ключевых слов.


Читать документацию

Отметка времени:

Больше от OpenAI