Dirichlet Dağılımına Dayalı Sonlu Karışım Modeli

Plato tarafından yeniden yayınlandı

İzleyiciler: 0

Bu blog gönderisi, Dirichlet Process karışım modelleri hakkındaki makale serisinin ikinci bölümüdür. Önceki yazıda bir çeşitli Küme Analizi tekniklerine genel bakış ve bunları kullanarak ortaya çıkan bazı sorunları / sınırlamaları tartıştık. Ayrıca Dirichlet Process Mixture Modellerini kısaca sunduk, neden faydalı olduklarından bahsettik ve bazı uygulamalarını sunduk.

Güncelleme: Datumbox Machine Learning Framework artık açık kaynak kodlu ve ücretsiz indir. Java'da Dirichlet Proses Karışım Modellerinin uygulanmasını görmek için com.datumbox.framework.machinelearning.clustering paketini inceleyin.

Dirichlet Process Mixture Modellerinin başlangıçta yutulması biraz zor olabilir çünkü bunlar birçok farklı gösterime sahip sonsuz karışım modelleridir. Neyse ki konuya yaklaşmanın iyi bir yolu, Dirichlet Dağılımlı Sonlu Karışım Modellerinden başlayıp sonra sonsuz olanlara geçmektir.

Sonuç olarak bu yazıda ihtiyaç duyacağımız bazı önemli dağılımları kısaca sunacağım, bunları Multinomial Olabilirlik modeli ile Dirichlet Önceliğini oluşturmak için kullanacağız ve ardından Dirichlet Dağılımına dayalı Sonlu Karışım Modeline geçeceğiz.

1. Beta Dağıtımı

The Beta dağıtımı [0,1] aralığında tanımlanan sürekli dağılımlar ailesidir. İki pozitif parametre a ve b ile parametrelendirilir ve formu büyük ölçüde bu iki parametrenin seçimine bağlıdır.

görüntü

Şekil 1: Farklı a, b parametreleri için Beta Dağılımı

Beta dağılımı, genellikle olasılıklar üzerinden bir dağılımı modellemek için kullanılır ve aşağıdaki olasılık yoğunluğuna sahiptir:

Denklem 1: Beta PDF

Γ (x) gama fonksiyonudur ve a, b dağılımın parametreleridir. Beta, genellikle olasılık değerlerinin dağılımı olarak kullanılır ve bize modellenen olasılığın belirli bir P = p0 değerine eşit olma olasılığını verir. Beta dağılımı, tanımı gereği doğru veya yanlış değerleri alan ikili sonuçların olasılığını modelleyebilir. A ve b parametreleri, sırasıyla başarı ve başarısızlığın sözde sayıları olarak kabul edilebilir. Böylelikle Beta Dağılımı, a başarılar ve b başarısızlıklar verilen başarı olasılığını modeller.

2. Dirichlet Dağıtımı

The Dirichlet Dağılımı Beta Dağılımının birden fazla sonuç için genelleştirilmesidir (veya başka bir deyişle, birden çok sonucu olan olaylar için kullanılır). K parametresi a ile parametrelendirilir_i bu olumlu olmalı. Dirichlet Dağılımı, değişken sayısı k = 2 olduğunda Beta Dağılımına eşittir.

görüntü

Şekil 2: Çeşitli a için Dirichlet Dağılımı_i parametreler

Dirichlet dağılımı genellikle olasılıklar üzerinden bir dağılımı modellemek için kullanılır ve aşağıdaki olasılık yoğunluğuna sahiptir:

Denklem 2: Dirichlet PDF

Γ (x) gama fonksiyonudur, p_i [0,1] ve Σp'deki değerleri alın_i= 1. Dirichlet dağılımı, p'nin ortak dağılımını modeller_i ve P olasılığını verir₁=p₁,P₂=p₂,…., P_k-1=p_k-1 P ile_k= 1 - ΣP_i. Beta'da olduğu gibi, a_i parametreler, her bir i olayının ortaya çıkışlarının sahte hesapları olarak düşünülebilir. Dirichlet dağılımı, meydana gelen k rakip olayların olasılığını modellemek için kullanılır ve genellikle Dirichlet (a) olarak gösterilir.

3. Multinomial Olasılıkla Önceden Dirichlet

Daha önce bahsedildiği gibi Dirichlet dağılımı, olasılık dağılımları üzerinden bir dağılım olarak görülebilir. K olayının meydana gelme olasılığını modellemek istediğimiz durumlarda, Bayesci bir yaklaşım kullanmak olacaktır. Çok Terimli Olabilirlik ve Dirichlet Öncülleri .

Aşağıda böyle bir modelin grafik modelini görebiliriz.

görüntü

Şekil 3: Çok Terimli Olasılıklı Dirichlet Öncüllerinin Grafik Modeli

Yukarıdaki grafik modelde α, Dirichlet öncüllerinin hiperparametrelerine sahip bir k boyutlu vektördür, p, olasılık değerleri ve x_i 1'den k'ye kadar skaler bir değerdir ve bize hangi olayın meydana geldiğini söyler. Son olarak, P'nin α vektörü ve dolayısıyla P ~ Dirichlet (α) ile parametrelenmiş Dirichlet dağılımını izlediğini ve x_i değişkenler, olasılıkların p vektörüyle parametrelendirilmiş Kesikli dağılımı (Çok terimli) izler. Benzer hiyerarşik modeller, farklı konulardaki anahtar kelime frekanslarının dağılımlarını temsil etmek için belge sınıflandırmasında kullanılabilir.

4. Dirichlet Dağılımlı Sonlu Karışım Modeli

Dirichlet Distribution kullanarak bir Sonlu Karışım Modeli kümeleme yapmak için kullanılabilir. Aşağıdaki modele sahip olduğumuzu varsayalım:

Denklem 3: Dirichlet Dağılımlı Sonlu Karışım Modeli

Yukarıdaki model aşağıdakileri varsayar: n gözlemli bir X veri kümesine sahibiz ve üzerinde küme analizi yapmak istiyoruz. K, kullanacağımız küme / bileşen sayısını gösteren sabit bir sonlu sayıdır. C_i değişkenler gözlemin küme atamasını saklar X_i1'den k'ye kadar olan değerleri alırlar ve bileşenlerin karışım olasılıkları olan p parametresi ile Kesikli Dağılımı takip ederler. F, X'imizin üretken dağılımıdır ve bir parametre ile parametrelendirilir. bu, her bir gözlemin küme atamasına bağlıdır. Toplamda k benzersiz parametreler kümelerimizin sayısına eşittir. değişken, üretken F Dağılımını parametrelendiren parametreleri depolar ve bunun temel bir G'yi izlediğini varsayarız.₀ dağıtım. P değişkeni, k kümelerinin her biri için karışım yüzdelerini depolar ve Dirichlet'i α / k parametreleriyle takip eder. Son olarak α, Dirichlet dağılımının [2] hiperparametrelerine (pseudocounts) sahip bir k boyutlu vektördür.

görüntü

Şekil 4: Dirichlet Dağılımlı Sonlu Karışım Modelinin Grafik Modeli

Modeli açıklamanın daha basit ve daha az matematiksel bir yolu şudur. Verilerimizin k kümeler halinde gruplanabileceğini varsayıyoruz. Her kümenin kendi parametreleri vardır ve bu parametreler verilerimizi oluşturmak için kullanılır. Parametreler bazı dağılımları takip ettiği varsayılmaktadır G₀. Her gözlem bir x vektörü ile temsil edilir_i ve ac_i ait olduğu kümeyi gösteren değer. Sonuç olarak c_i Kesikli Dağılımı, karışım olasılıklarından başka bir şey olmayan bir p parametresiyle, yani her kümenin meydana gelme olasılığıyla izleyen bir değişken olarak görülebilir. Problemimizi Bayesçi bir şekilde ele aldığımıza göre, p parametresini sabit bilinmeyen bir vektör olarak ele almıyoruz. Bunun yerine, P'nin hiperparametreler α / k ile parametreleştirilen Dirichlet'i takip ettiğini varsayıyoruz.

5. Sonsuz k kümeleriyle çalışmak

Önceki karışım modeli, denetimsiz öğrenme gerçekleştirmemize izin verir, Bayesci bir yaklaşımı izler ve hiyerarşik bir yapıya sahip olacak şekilde genişletilebilir. Yine de sonlu bir modeldir çünkü sabit bir önceden tanımlanmış k sayıda küme kullanır. Sonuç olarak, Küme Analizi gerçekleştirmeden önce bileşen sayısını tanımlamamızı gerektirir ve çoğu uygulamada daha önce tartıştığımız gibi bu bilinmemektedir ve kolayca tahmin edilemez.

Bunu çözmenin bir yolu, k'nin sonsuzluk eğilimi gösteren çok büyük bir değere sahip olduğunu hayal etmektir. Başka bir deyişle, k sonsuzluk eğilimi gösterdiğinde bu modelin sınırını hayal edebiliriz. Bu durumda, k kümelerinin sayısının sonsuz olmasına rağmen, aktif olan gerçek küme sayısının (en az bir gözlemi olanların) n'den büyük olamayacağını görebiliriz ( veri setimizdeki toplam gözlem sayısı). Aslında daha sonra göreceğimiz gibi, aktif küme sayısı n'den önemli ölçüde daha az olacak ve orantılı olacaktır. .

Elbette k sınırını sonsuza götürmek önemsiz değildir. Böyle bir sınır almanın mümkün olup olmadığı, bu modelin nasıl görüneceği ve nasıl inşa edebiliriz ve böyle bir model kullanın.

Bir sonraki makalede tam olarak şu sorulara odaklanacağız: Dirichlet Sürecini tanımlayacağız, DP'nin çeşitli temsillerini sunacağız ve son olarak bir Dirichlet Süreci oluşturmanın sezgisel ve verimli bir yolu olan Çin Restoran Süreci üzerine odaklanacağız.

Umarım bu yazıyı faydalı bulmuşsunuzdur. Yaptıysanız, lütfen makaleyi Facebook ve Twitter'da paylaşmak için bir dakikanızı ayırın. 🙂

Zaman Damgası: Mayıs 12, 2014Temmuz 17, 2022

Zaman Damgası: Kasım 9, 2014

Dirichlet Dağılımına Göre Sonlu Karışım Modeli

Plato tarafından yeniden yayınlandı

1. Beta Dağıtımı

2. Dirichlet Dağıtımı

3. Multinomial Olasılıkla Önceden Dirichlet

4. Dirichlet Dağılımlı Sonlu Karışım Modeli

5. Sonsuz k kümeleriyle çalışmak

Den fazla Veri kutusu

Linux dstat aracıyla NVIDIA kartlarının GPU kullanımını alma

JAVA'da DEA ile Sayfaların Sosyal Medya Popülerliğini Ölçme

Java ile yazılmış yeni açık kaynaklı Makine Öğrenimi Çerçevesi

JAVA'da Naif Bayes Metin Sınıflandırıcısı Geliştirme

Datumbox Machine Learning Framework 0.6.0 Yayımlandı

Kendi Facebook Duygu Analizi Aracınızı Oluşturma

Datumbox Machine Learning Framework sürüm 0.8.0 yayınlandı

Yeni Blog serisi – Bir TorchVision geliştiricisinin Anıları

Keras'ın Toplu Normalizasyon katmanı bozuk

Spark'ın ALS Öneri algoritmasına giriş

TorchVision'ı Modernleştirme Yolculuğu – Bir TorchVision geliştiricisinin Anıları – 3

Datumbox Machine Learning Framework nasıl kurulur ve kullanılır

Hakkımızda

Dikey Arama ve Ai

Platform

Bağlı Kal

Hesap