Yeni ve Geliştirilmiş Yerleştirme Modeli PlatoBlockchain Veri Zekası. Dikey Arama. Ai.

Yeni ve Geliştirilmiş Gömme Modeli

Önemli ölçüde daha yetenekli, uygun maliyetli ve kullanımı daha basit olan yeni bir yerleştirme modelini duyurmaktan heyecan duyuyoruz. Yeni model, text-embedding-ada-002, metin arama, metin benzerliği ve kod arama için beş ayrı modelin yerini alır ve %99.8 daha düşük fiyatla çoğu görevde önceki en yetenekli modelimiz Davinci'den daha iyi performans gösterir.

Belgeleri okuyun

Gömmeler, bilgisayarların bu kavramlar arasındaki ilişkileri anlamasını kolaylaştıran, kavramların sayı dizilerine dönüştürülmüş sayısal temsilleridir. Beri ilk başlatma OpenAI'nin /gömmeler Uç nokta, birçok uygulamada içeriği kişiselleştirmek, önermek ve aramak için yerleştirmeler bulunur.

sorgulayabilirsiniz /gömmeler yeni model için uç noktayı iki satır kodla kullanarak OpenAI Python Kütüphanesi, tıpkı önceki modellerde yapabildiğiniz gibi:

import openai
response = openai.Embedding.create(
  input="porcine pals say",
  model="text-embedding-ada-002"
)

Model İyileştirmeleri

Daha güçlü performans. text-embedding-ada-002 metin arama, kod arama ve cümle benzerliği görevlerinde tüm eski yerleştirme modellerinden daha iyi performans gösterir ve metin sınıflandırmada benzer bir performans elde eder. Her görev kategorisi için modelleri, kullanılan veri kümeleri üzerinde değerlendiriyoruz. eski gömmeler.





Yeteneklerin birleştirilmesi. Arayüzünü önemli ölçüde basitleştirdik. /gömmeler yukarıda gösterilen beş ayrı modeli birleştirerek uç nokta (text-similarity, text-search-query, text-search-doc, code-search-text ve code-search-code) tek bir yeni modele dönüştürün. Bu tek gösterim, çeşitli metin arama, cümle benzerliği ve kod arama kriterlerinde önceki yerleştirme modellerimizden daha iyi performans gösteriyor.

Daha uzun bağlam. Yeni modelin bağlam uzunluğu 2048'den 8192'ye dört kat artırılarak uzun belgelerle çalışmayı daha kolay hale getiriyor.

Daha küçük yerleştirme boyutu. Yeni yerleştirmeler yalnızca 1536 boyuta sahiptir; bu, boyutun sekizde biri kadardır. davinci-001 yeni yerleştirmeleri vektör veritabanlarıyla çalışırken daha uygun maliyetli hale getiriyor.

İndirimli fiyat. Yeni gömme modellerin fiyatını aynı boyuttaki eski modellere göre %90 oranında düşürdük. Yeni model, eski Davinci modellerine göre daha iyi veya benzer performansı %99.8 daha düşük fiyata sağlıyor.

Genel olarak yeni yerleştirme modeli, doğal dil işleme ve kod görevleri için çok daha güçlü bir araçtır. Müşterilerimizin bunu kendi alanlarında daha da yetenekli uygulamalar oluşturmak için nasıl kullanacaklarını görmekten heyecan duyuyoruz.

Sınırlamalar

Yeni text-embedding-ada-002 model daha iyi performans göstermiyor text-similarity-davinci-001 SentEval doğrusal problama sınıflandırma kriterine göre. Sınıflandırma tahmini için vektörlerin yerleştirilmesinin yanı sıra hafif ağırlıklı doğrusal bir katmanın eğitilmesini gerektiren görevler için, yeni modeli aşağıdaki modelle karşılaştırmanızı öneririz: text-similarity-davinci-001 ve hangi model en iyi performansı veriyorsa onu seçmek.

kontrol Sınırlamalar ve Riskler Gömme modellerimizin genel sınırlamaları için yerleştirme belgelerindeki bölüm.

Uygulamadaki Yerleştirme API'lerine Örnekler

Kalendar AI 340 milyon profil içeren bir veri kümesinden doğru satış konuşmasını doğru müşterilere eşleştirmek için yerleştirmeleri kullanan bir satış destek ürünüdür. Bu otomasyon, en uygun eşleşmeleri sıralamak için müşteri profilleri ve satış sunumları arasındaki benzerliğe dayanır ve eski yaklaşımlarına kıyasla istenmeyen hedeflemeyi %40-56 oranında ortadan kaldırır.

kavramÇevrimiçi çalışma alanı şirketi olan , Notion aramasını günümüzün anahtar kelime eşleme sistemlerinin ötesinde geliştirmek için OpenAI'nin yeni yerleştirmelerini kullanacak.


Belgeleri okuyun

Zaman Damgası:

Den fazla OpenAI