Dirichlet Proses Karışım Modeli PlatoBlockchain Veri Zekası. Dikey Arama. Ai.

Dirichlet Proses Karışım Modeli

Bu blog yazısı, hakkındaki dizinin dördüncü bölümüdür. Dirichlet Proses Karışım Modelleri ile Kümeleme. Önceki makalelerde Sonlu Dirichlet Karışım Modellerini tartıştık ve bizi Dirichlet Süreçlerinin tanıtımına götüren sonsuz k kümeleri için modellerinin sınırını aldık. Gördüğümüz gibi, hedefimiz baştan itibaren k küme / bileşen sayısını belirlememizi gerektirmeyen bir karışım modeli oluşturmaktır. Sonra Dirichlet Süreçlerinin farklı temsillerini sunmak, artık kümeleme yapmamızı sağlayan sonsuz bir Karışım Modeli oluşturmak için DP'leri fiilen kullanmanın zamanı geldi. Bu makalenin hedefi, Dirichlet Process Mixture Modellerini tanımlamak ve Chinese Restaurant Process ve Gibbs Sampling'in kullanımını tartışmaktır. Önceki yazıları okumadıysanız, konu biraz teorik olduğundan ve modelin yapımı hakkında iyi bir anlayış gerektirdiğinden bunu yapmanız şiddetle tavsiye edilir.

Güncelleme: Datumbox Machine Learning Framework artık açık kaynak kodlu ve ücretsiz indir. Java'da Dirichlet Proses Karışım Modellerinin uygulanmasını görmek için com.datumbox.framework.machinelearning.clustering paketini inceleyin.

1. Dirichlet Proses Karışım Modelinin Tanımı

Dirichlet Süreçlerini kullanmak, k için sonlu modelin sınırını sonsuza kadar almak olarak düşünülebilecek sonsuz bileşenli bir karışım modeline sahip olmamızı sağlar. Aşağıdaki modele sahip olduğumuzu varsayalım:

görüntü
görüntü
görüntü

Denklem 1: Dirichlet Süreci Karışım Modeli

G olarak tanımlandığında görüntü ve görüntü için kısa bir gösterim olarak kullanılır görüntü hangi delta işlevi 1 alırsa görüntü ve 0 başka yerde. Θi G'den örneklenen küme parametreleridir. Üretken dağıtım F, küme parametreleri ile yapılandırılır θi ve x oluşturmak için kullanılıri gözlemler. Son olarak bir Yoğunluk dağılımı tanımlayabiliriz görüntü karışım dağılımımız olan (sayılabilir sonsuz karışım) karışım oranları ile görüntü ve bileşenleri karıştırmak görüntü.

görüntü

Şekil 1: Dirichlet Proses Karışım Modelinin Grafik Modeli

Yukarıda DPMM'nin eşdeğer Grafik Modelini görebiliriz. G0 DP'nin temel dağıtımıdır ve hesaplamaları kolaylaştırmak ve çekici matematiksel özelliklerden yararlanmak için genellikle üretken dağıtımımız F'den önce eşlenik olarak seçilir. Α, Dirichlet Sürecinin skaler hiperparametresidir ve alacağımız küme sayısını etkiler. Α'nın değeri ne kadar büyükse, kümeler o kadar fazla olur; α ne kadar küçükse küme o kadar azdır. Α değerinin şunu ifade ettiğine dikkat etmeliyiz: inancın gücü G cinsinden0. Büyük bir değer, numunelerin çoğunun farklı olacağını ve G üzerinde konsantre değerlere sahip olacağını gösterir.0. G, parametrelere olasılıklar atayan DP'den örneklenen Θ parametre alanı üzerinden rastgele bir dağılımdır. Θi G dağılımından alınan ve kümenin parametrelerini içeren bir parametre vektörüdür, F dağılımı θ ile parametrelendiriliri ve xi Üretici Dağıtım F tarafından oluşturulan veri noktasıdır.

Unutulmamalıdır ki θi Θ parametre uzayının öğeleridir ve kümelerimizi "yapılandırırlar". Ayrıca x üzerinde gizli değişkenler olarak da görülebilirler.i bize hangi bileşen / kümeden x'ini nereden gelir ve bu bileşenin parametreleri nelerdir. Böylece her x içini gözlemlediğimizde, bir θ çiziyoruzi G dağılımından. Her çekilişte dağılım önceki seçimlere göre değişir. Blackwell-MacQueen urn şemasında gördüğümüz gibi, G dağıtımı entegre edilebilir ve gelecekteki θ seçimlerimizi sadece G'ye bağlıdır0: görüntü. Önceki formülden θi parametrelerinin tahmin edilmesi her zaman mümkün değildir çünkü birçok uygulama (Çin Restoranı Süreci gibi), katlanarak artan k bileşeni. Bu nedenle, Gibbs Örneklemesi gibi yaklaşık hesaplama yöntemleri kullanılır. Son olarak, k kümelerinin sonsuz olmasına rağmen, aktif küme sayısının görüntü. Böylece θi tekrar edecek ve bir kümeleme etkisi gösterecektir.

2. Bir Sonsuz Karışım Modeli tanımlamak için Çin Restoranı İşlemini Kullanma

Önceki bölümde tanımlanan model matematiksel olarak sağlamdır, ancak yine de büyük bir dezavantajı vardır: her yeni x içini gözlemlediğimiz için yeni bir θ örneklemeliyizi önceki of değerlerini dikkate alarak. Sorun şu ki, birçok durumda, bu parametreleri örneklemek zor ve hesaplama açısından pahalı bir görev olabilir.

Alternatif bir yaklaşım, gizli değişkenleri modellemek için Çin Restoranı Sürecini kullanmaktır zi küme atamaları. Bu şekilde θ kullanmak yerinei hem küme parametrelerini hem de küme atamalarını belirtmek için, gizli değişken z'yi kullanıyoruzi küme kimliğini belirtmek için ve ardından bu değeri küme parametrelerini atamak için kullanın. Sonuç olarak, artık her yeni gözlem aldığımızda a θ 'yi örneklememize gerek kalmaz, bunun yerine küme atamasını zi CRP'den. Bu şema ile yeni bir θ, yalnızca yeni bir küme oluşturmamız gerektiğinde örneklenir. Aşağıda bu yaklaşımın modelini sunuyoruz:

görüntü
görüntü
görüntü

Denklem 2: CRP ile Karışım Modeli

Yukarıdaki, x verilerinin nasıl olduğunu açıklayan üretici bir modeldir.i ve kümeler oluşturulur. Kümeleme analizini gerçekleştirmek için gözlemleri kullanmalıyız xi ve küme atamalarını tahmin edin zi.

3. Karışım Modeli Çıkarımı ve Gibbs Örneklemesi

Ne yazık ki Dirichlet Süreçleri parametrik olmadığından EM algoritmasını kullanamaz küme atamalarını depolayan gizli değişkenleri tahmin etmek. Atamaları tahmin etmek için kullanacağız Daraltılmış Gibbs Örneklemesi.

Daraltılmış Gibbs Örneklemesi, basit bir Markov Zinciri Monte Carlo (MCMC) algoritmasıdır. Hızlıdır ve başka bir değişkeni örneklerken bazı değişkenleri entegre etmemizi sağlar. Yine de bu algoritmalar bir G seçmemizi gerektirir.0 Denklemleri analitik olarak çözebilmek ve doğrudan örnekleyebilmek için F üretken dağılımından önceki eşlenik olan görüntü.

Küme atamalarını tahmin etmek için kullanacağımız Daraltılmış Gibbs Örneklemesinin adımları aşağıdaki gibidir:

  • Z'yi başlatıni rastgele küme atamaları
  • Yakınsamaya kadar tekrarlayın
    • Rastgele balta seçini
    • Diğerini koruj her j ≠ i için sabit: görüntü
    • Z'ye yeni bir değer atayıni z'ye bağlı "CRP olasılığını" hesaplayarakj ve xj tüm j ≠ i: görüntü

Bir sonraki makalede Dirichlet Process Mixture modellerini kullanarak küme analizinin nasıl gerçekleştirileceğine odaklanacağız. Sürekli veri kümeleri ve belgeler üzerinde kümeleme yapmak için Çin Restoran Süreci ve Daraltılmış Gibbs Örneklemesini kullanan iki farklı Dirichlet İşlem Karışımı Modeli tanımlayacağız.

Zaman Damgası:

Den fazla Veri kutusu