Мы рады объявить о новой модели встраивания, которая значительно эффективнее, экономичнее и проще в использовании. Новая модель, text-embedding-ada-002
, заменяет пять отдельных моделей для текстового поиска, подобия текста и поиска кода и превосходит нашу предыдущую наиболее мощную модель, Davinci, в большинстве задач, при этом цена на 99.8% ниже.
Вложения — это числовые представления понятий, преобразованные в числовые последовательности, которые упрощают для компьютеров понимание взаимосвязей между этими понятиями. Поскольку первоначальный запуск OpenAI /вложения конечной точки, многие приложения включают встраивания для персонализации, рекомендации и поиска контента.
Вы можете запросить /вложения конечная точка для новой модели с двумя строками кода, используя наш Библиотека OpenAI Python, как и в предыдущих моделях:
import openai
response = openai.Embedding.create(
input="porcine pals say",
model="text-embedding-ada-002"
)
Улучшения модели
Более высокая производительность. text-embedding-ada-002
превосходит все старые модели встраивания в задачах текстового поиска, поиска кода и сходства предложений и обеспечивает сопоставимую производительность в классификации текста. Для каждой категории задач мы оцениваем модели на наборах данных, используемых в старые вложения.
Объединение возможностей. Мы значительно упростили интерфейс /вложения конечной точки путем слияния пяти отдельных моделей, показанных выше (text-similarity
, text-search-query
, text-search-doc
, code-search-text
и code-search-code
) в единую новую модель. Это единое представление работает лучше, чем наши предыдущие модели встраивания, в разнообразном наборе тестов текстового поиска, схожести предложений и поиска кода.
Более длинный контекст. Длина контекста новой модели увеличена в четыре раза, с 2048 до 8192, что делает работу с длинными документами более удобной.
Меньший размер встраивания. Новые вложения имеют только 1536 размеров, что составляет одну восьмую размера davinci-001
вложения, что делает новые вложения более экономичными при работе с векторными базами данных.
Сниженная цена. Мы снизили цену на новые встраиваемые модели на 90% по сравнению со старыми моделями того же размера. Новая модель обеспечивает лучшую или аналогичную производительность по сравнению со старыми моделями Davinci при более низкой цене на 99.8%.
В целом, новая модель встраивания — гораздо более мощный инструмент для обработки естественного языка и задач кода. Мы рады видеть, как наши клиенты будут использовать его для создания еще более эффективных приложений в своих областях.
ограничения
Новый text-embedding-ada-002
модель не лучше text-similarity-davinci-001
на тесте классификации линейных зондов SentEval. Для задач, требующих обучения легковзвешенного линейного слоя поверх векторов встраивания для предсказания классификации, мы предлагаем сравнить новую модель с text-similarity-davinci-001
и выбрать любую модель, обеспечивающую оптимальную производительность.
Проверить Ограничения и риски раздел в документации по встраиванию для общих ограничений наших моделей встраивания.
Примеры Embeddings API в действии
Календарь ИИ — это продукт для расширения продаж, в котором используются встраивания для подбора правильного рекламного предложения нужным клиентам из набора данных, содержащего 340 млн профилей. Эта автоматизация основана на сходстве между встроенными профилями клиентов и рекламными объявлениями для ранжирования наиболее подходящих совпадений, устраняя 40–56% нежелательного таргетинга по сравнению с их старым подходом.
понятие, компания, занимающаяся онлайновым рабочим пространством, будет использовать новые встраивания OpenAI для улучшения поиска Notion за пределами сегодняшних систем сопоставления ключевых слов.
- AI
- ай искусство
- генератор искусств ай
- искусственный интеллект
- Объявления
- API
- искусственный интеллект
- сертификация искусственного интеллекта
- искусственный интеллект в банковском деле
- робот с искусственным интеллектом
- роботы с искусственным интеллектом
- программное обеспечение искусственного интеллекта
- блокчейн
- конференция по блокчейну
- Coingenius
- разговорный искусственный интеллект
- криптоконференция ИИ
- дал-и
- глубокое обучение
- google ai
- обучение с помощью машины
- OpenAI
- Платон
- Платон Ай
- Платон Интеллектуальные данные
- Платон игра
- ПлатонДанные
- платогейминг
- масштаб ай
- синтаксис
- зефирнет