দিরিচলেট প্রসেস দ্য চাইনিজ রেস্তোরাঁ প্রক্রিয়া এবং অন্যান্য উপস্থাপনা PlatoBlockchain ডেটা ইন্টেলিজেন্স। উল্লম্ব অনুসন্ধান. আ.

ডিরিচলেট প্রক্রিয়া চাইনিজ রেস্তোঁরা প্রক্রিয়া এবং অন্যান্য উপস্থাপনা

এই নিবন্ধটি ডিরিচলেট প্রক্রিয়া মিশ্রণ মডেলগুলির সাথে ক্লাস্টারিংয়ের সিরিজের তৃতীয় অংশ। আগের বার আমরা ডিরিচলেট ডিস্ট্রিবিউশনের উপর ভিত্তি করে সীমাবদ্ধ মিশ্রণ মডেলটিকে সংজ্ঞায়িত করেছি এবং আমরা কীভাবে এই নির্দিষ্ট মডেলটিকে অসীম করতে পারি সে সম্পর্কে প্রশ্ন তুলেছিলাম। আমরা সংক্ষেপে মডেলের সীমা নেওয়ার ধারণা নিয়ে আলোচনা করেছি যখন ক্লাস্টারের k সংখ্যা অসীমতার দিকে ঝুঁকছে কিন্তু যেমন আমরা জোর দিয়েছি এই জাতীয় বস্তুর অস্তিত্ব তুচ্ছ নয় (অন্য কথায়, কীভাবে আমরা আসলে "একটি মডেলের সীমা নিতে পারি? ”?) একটি অনুস্মারক হিসাবে, আমরা কেন k কে অসীম করতে চাই কারণ এইভাবে আমাদের একটি নন-প্যারামেট্রিক মডেল থাকবে যার জন্য ডেটার মধ্যে মোট ক্লাস্টারের সংখ্যা পূর্বনির্ধারিত করার প্রয়োজন নেই।

আপডেট: Datumbox মেশিন লার্নিং ফ্রেমওয়ার্ক এখন ওপেন সোর্স এবং বিনামূল্যে ডাউনলোড. জাভাতে ডিরিচলেট প্রসেস মিক্সচার মডেলের বাস্তবায়ন দেখতে com.datumbox.framework.machinelearning.clustering প্যাকেজটি দেখুন।

যদিও আমাদের লক্ষ্য হল এমন একটি মডেল তৈরি করা যা ডেটাসেটগুলিতে ক্লাস্টারিং সম্পাদন করতে সক্ষম, তার আগে আমাদের অবশ্যই ডিরিচলেট প্রসেস সম্পর্কে আলোচনা করতে হবে। আমরা কঠোর গাণিতিক সংজ্ঞা এবং DP এর আরও স্বজ্ঞাত ব্যাখ্যা উভয়ই প্রদান করব এবং প্রক্রিয়াটি গঠনের উপায় নিয়ে আলোচনা করব। এই নির্মাণ/প্রতিনিধিগুলিকে "বাস্তব জীবনে" ডিরিচলেট প্রক্রিয়ার ঘটনাগুলি খুঁজে পাওয়ার উপায় হিসাবে দেখা যেতে পারে।

যদিও আমি আমার গবেষণা প্রতিবেদনটি এমনভাবে মানিয়ে নেওয়ার চেষ্টা করেছি যাতে এই ব্লগ পোস্টগুলি অনুসরণ করা সহজ হয়, আমরা মডেলগুলি ব্যবহার করার আগে প্রয়োজনীয় গাণিতিক সরঞ্জাম এবং বিতরণগুলি সংজ্ঞায়িত করা এখনও গুরুত্বপূর্ণ। ডিরিচলেট প্রসেস মডেলগুলি সক্রিয় গবেষণার একটি বিষয়, তবে তাদের ব্যবহার করার আগে পরিসংখ্যান এবং স্টোকাস্টিক প্রক্রিয়া সম্পর্কে ভাল বোঝার প্রয়োজন। আরেকটি সমস্যা হল যে আমরা এই নিবন্ধে দেখতে পাব, ডিরিচলেট প্রক্রিয়াগুলিকে অনেক উপায়ে উপস্থাপন/নির্মাণ করা যেতে পারে। ফলস্বরূপ বেশ কয়েকটি একাডেমিক কাগজপত্র সম্পূর্ণ ভিন্ন স্বরলিপি/প্রচলন ব্যবহার করে এবং বিভিন্ন দৃষ্টিকোণ থেকে সমস্যাটি পরীক্ষা করে। এই পোস্টে আমি তাদের যতটা সম্ভব সহজভাবে ব্যাখ্যা করার চেষ্টা করি এবং একই স্বরলিপি ব্যবহার করি। আশা করি যে দুটি আসন্ন নিবন্ধের মাধ্যমে বিষয়গুলি আরও স্পষ্ট হয়ে উঠবে যা ডিরিচলেট প্রক্রিয়া মিশ্রণ মডেলগুলির সংজ্ঞা এবং ক্লাস্টার বিশ্লেষণ সম্পাদন করার জন্য কীভাবে সেগুলিকে বাস্তবে ব্যবহার করতে হয় তার উপর ফোকাস করে৷

1. ডিরিচলেট প্রক্রিয়ার সংজ্ঞা

একটি Θ স্থানের উপর একটি ডিরিচলেট প্রক্রিয়া একটি স্টোকাস্টিক প্রক্রিয়া। এটি "Θ স্থানের উপর সম্ভাব্যতা বন্টন" এর উপর একটি সম্ভাব্যতা বন্টন এবং একটি এটা থেকে আঁকা একটি পৃথক বন্টন. আরও আনুষ্ঠানিকভাবে একটি ডিরিচলেট ডিস্ট্রিবিউশন হল সম্ভাব্যতা পরিমাপের উপর একটি বিতরণ। ক সম্ভাব্যতা পরিমাপ স্থান Θ থেকে [0,1] এর উপসেটের একটি ফাংশন। G হল একটি DP বিতরণ করা এলোমেলো সম্ভাব্যতা পরিমাপ, হিসাবে চিহ্নিত করা হয় ভাবমূর্তি, যদি কোন পার্টিশনের জন্য (A1,…এn) স্থান Θ আমাদের কাছে আছে ভাবমূর্তি.

ভাবমূর্তি

চিত্র 1: সীমাবদ্ধ পার্টিশনে প্রান্তিকগুলি ডিরিচলেট বিতরণ করা হয়।

ডিপির দুটি প্যারামিটার রয়েছে: প্রথমটি হল বেস ডিস্ট্রিবিউশন জি0 যা একটি গড় মত পরিবেশন করে ভাবমূর্তি. দ্বিতীয়টি হল শক্তি পরামিতি α যা কঠোরভাবে ধনাত্মক এবং বিপরীত-প্রকরণের মতো কাজ করে ভাবমূর্তি. এটি আউটপুট বিতরণের মানগুলির পুনরাবৃত্তির পরিমাণ নির্ধারণ করে। a-এর মান যত বেশি হবে, পুনরাবৃত্তি তত কম হবে; মান যত ছোট হবে, আউটপুট ডিস্ট্রিবিউশনের মানের পুনরাবৃত্তি তত বেশি হবে। অবশেষে Θ স্পেস হল প্যারামিটার স্পেস যার উপর আমরা DP সংজ্ঞায়িত করি। তাছাড়া স্থান Θ হল G এর সংজ্ঞা স্থান0 যা G-এর মতই।

একটি সহজ এবং আরো স্বজ্ঞাত উপায় একটি Dirichlet প্রক্রিয়া ব্যাখ্যা করার জন্য নিম্নলিখিত. ধরুন আমাদের একটি স্পেস Θ আছে যেটিকে যেকোনো সীমিত উপায়ে বিভাজন করা যেতে পারে (A1,…,এn) এবং একটি সম্ভাব্যতা বন্টন G যা তাদের সম্ভাব্যতা নির্ধারণ করে। G হল Θ এর উপর একটি নির্দিষ্ট সম্ভাব্যতা বন্টন কিন্তু আরও অনেকগুলি আছে। Θ মডেলগুলিতে ডিরিচলেট প্রক্রিয়া ঠিক এইরকম; এটি স্থান Θ এর সমস্ত সম্ভাব্য সম্ভাব্যতা বিতরণের উপর একটি বিতরণ। ডিরিচলেট প্রক্রিয়াটি জি দিয়ে প্যারামিটারাইজ করা হয়0 বেস ফাংশন এবং α ঘনত্ব পরামিতি। আমরা বলতে পারি যে α এবং G পরামিতি সহ DP অনুযায়ী G বিতরণ করা হয়0 যদি Θ-এর পার্টিশনগুলিতে G দ্বারা নির্ধারিত সম্ভাব্যতার যৌথ বন্টন ডিরিচলেট ডিস্ট্রিবিউশনকে অনুসরণ করে। বিকল্পভাবে আমরা বলতে পারি যে Θ-এর যেকোনো সীমিত বিভাজনে G যে সম্ভাব্যতা নির্ধারণ করে তা ডিরিচলেট ডিস্ট্রিবিউশনকে অনুসরণ করে।

ভাবমূর্তি

চিত্র 2: ডিরিচলেট প্রক্রিয়ার গ্রাফিক্যাল মডেল

অবশেষে উপরে আমরা দেখতে পারেন একটি DP এর গ্রাফিকাল মডেল. আমাদের লক্ষ্য করা উচিত যে α একটি স্কেলার হাইপারপ্যারামিটার, G0 DP-এর বেস ডিস্ট্রিবিউশন, G হল DP থেকে নমুনা করা Θ প্যারামিটার স্পেসের উপর একটি র্যান্ডম ডিস্ট্রিবিউশন যা পরামিতিগুলির সম্ভাব্যতা নির্ধারণ করে এবং θi একটি প্যারামিটার ভেক্টর যা G বিতরণ থেকে আঁকা হয় এবং এটি Θ স্থানের একটি উপাদান।

2. পোস্টেরিয়র ডিরিচলেট প্রসেস

পোস্টেরিয়র ডিরিচলেট প্রসেস নিয়ে আলোচনা করা হয়েছে ফার্গুসন. আমরা ডিরিচলেট প্রক্রিয়া থেকে একটি এলোমেলো সম্ভাব্যতা পরিমাপ G অঙ্কন করে শুরু করি, ভাবমূর্তি. যেহেতু G হল Θ এর উপর একটি সম্ভাব্যতা বণ্টন আমরা এই বন্টন থেকেও নমুনা নিতে পারি এবং স্বতন্ত্র অভিন্নভাবে বিতরণকৃত নমুনা আঁকতে পারি θ1,…, θn ~ G. যেহেতু ডিরিচলেট প্রক্রিয়া থেকে অঙ্কনগুলি বিচ্ছিন্ন বিতরণ, তাই আমরা প্রতিনিধিত্ব করতে পারি ভাবমূর্তি কোথায় ভাবমূর্তি জন্য একটি সংক্ষিপ্ত স্বরলিপি ভাবমূর্তি যা একটি ডেল্টা ফাংশন যা 1 যদি নেয় ভাবমূর্তি এবং অন্য কোথাও 0। এর একটি আকর্ষণীয় প্রভাব হল যে যেহেতু G এইভাবে সংজ্ঞায়িত করা হয়েছে, একই মান থাকা বিভিন্ন নমুনার একটি ইতিবাচক সম্ভাবনা রয়েছে ভাবমূর্তি. আমরা পরে দেখব, এটি একটি ক্লাস্টারিং প্রভাব তৈরি করে যা ডেটাসেটে ক্লাস্টার বিশ্লেষণ করতে ব্যবহার করা যেতে পারে।

উপরোক্ত সংজ্ঞা এবং পর্যবেক্ষণগুলি ব্যবহার করে আমরা নমুনা θ প্রদত্ত ডিরিচলেট প্রক্রিয়ার পশ্চাৎভাগ অনুমান করতে চাই। তবুও যেহেতু আমরা জানি ভাবমূর্তি এবং ভাবমূর্তি ডিরিচলেট এবং মাল্টিনমিয়ালের মধ্যে বেইস নিয়ম এবং কনজুগেসি ব্যবহার করে আমাদের কাছে এটি রয়েছে ভাবমূর্তিএবং ভাবমূর্তি.

ভাবমূর্তি

সমীকরণ 1: পোস্টেরিয়র ডিরিচলেট প্রক্রিয়া

এই সম্পত্তিটি অত্যন্ত গুরুত্বপূর্ণ এবং এটি বিভিন্ন ডিপি উপস্থাপনা দ্বারা ব্যবহৃত হয়।

3. ডিরিচলেট প্রক্রিয়া উপস্থাপনা

পূর্ববর্তী বিভাগে আমরা ডিরিচলেট প্রক্রিয়া সংজ্ঞায়িত করেছি এবং এর তাত্ত্বিক মডেল উপস্থাপন করেছি। একটি গুরুত্বপূর্ণ প্রশ্ন যা আমাদের অবশ্যই উত্তর দিতে হবে তা হল আমরা কিভাবে জানি যে এই ধরনের বস্তুর অস্তিত্ব আছে এবং আমরা কিভাবে পারি গঠন এবং প্রতিনিধিত্ব একটি ডিরিচলেট প্রক্রিয়া।

অস্তিত্বের প্রথম ইঙ্গিতগুলি দ্বারা সরবরাহ করা হয়েছিল ফার্গুসন যিনি কলমোগোরভ কনসিস্টেন্সি থিওরেম ব্যবহার করেছেন, ডিরিচলেট প্রক্রিয়ার সংজ্ঞা দিয়েছেন এবং পোস্টেরিয়র ডিরিচলেট প্রক্রিয়া বর্ণনা করেছেন। তার গবেষণা অব্যাহত, ব্ল্যাকওয়েল এবং ম্যাককুইন এই ধরনের একটি র্যান্ডম সম্ভাব্যতা পরিমাপের অস্তিত্ব প্রমাণ করতে ডি ফিনেটির উপপাদ্য ব্যবহার করেন এবং ব্ল্যাকওয়েল-ম্যাককুইন urn স্কিম প্রবর্তন করেন যা ডিরিচলেট প্রক্রিয়ার বৈশিষ্ট্যগুলিকে সন্তুষ্ট করে। 1994 সালে সেথুরমন স্টিক-ব্রেকিং কনস্ট্রাকশন প্রবর্তন করে একটি ডিপি নির্মাণের একটি অতিরিক্ত সহজ এবং সরাসরি উপায় প্রদান করেছে। অবশেষে অন্য প্রতিনিধিত্ব দ্বারা প্রদান করা হয় Aldous যিনি চাইনিজ রেস্তোরাঁ প্রক্রিয়াটিকে একটি ডিরিচলেট প্রক্রিয়া নির্মাণের কার্যকর উপায় হিসাবে প্রবর্তন করেছিলেন।

ডিরিচলেট প্রক্রিয়ার বিভিন্ন প্রতিনিধিত্ব গাণিতিকভাবে সমতুল্য কিন্তু তাদের গঠন ভিন্ন কারণ তারা সমস্যাটিকে বিভিন্ন দৃষ্টিকোণ থেকে পরীক্ষা করে। নীচে আমরা সাহিত্যে পাওয়া সবচেয়ে সাধারণ উপস্থাপনাগুলি উপস্থাপন করি এবং আমরা চাইনিজ রেস্তোরাঁ প্রক্রিয়ার উপর ফোকাস করি যা ডিরিচলেট প্রক্রিয়ার জন্য অনুমান অ্যালগরিদম তৈরি করার একটি সহজ এবং গণনামূলকভাবে কার্যকর উপায় প্রদান করে।

3.1 Blackwell-MacQueen urn স্কিম

ব্ল্যাকওয়েল-ম্যাককুইন urn স্কিমটি একটি ডিরিচলেট প্রক্রিয়ার প্রতিনিধিত্ব করতে ব্যবহার করা যেতে পারে এবং এটি প্রবর্তিত হয়েছিল ব্ল্যাকওয়েল এবং ম্যাককুইন. এটি Pólya urn স্কিমের উপর ভিত্তি করে যা প্রতিস্থাপন ছাড়াই নমুনার বিপরীত মডেল হিসাবে দেখা যেতে পারে। Pólya urn স্কিমে আমরা ধরে নিই যে আমাদের কাছে একটি অ-স্বচ্ছ কলস রয়েছে যাতে রঙিন বল থাকে এবং আমরা এলোমেলোভাবে বল আঁকি। যখন আমরা একটি বল আঁকি, আমরা তার রঙ পর্যবেক্ষণ করি, আমরা এটিকে আবার কলসে রাখি এবং আমরা একই রঙের একটি অতিরিক্ত বল যোগ করি। একটি অনুরূপ স্কিম ব্ল্যাকওয়েল এবং ম্যাককুইন একটি ডিরিচলেট প্রক্রিয়া তৈরি করতে ব্যবহার করে।

এই স্কিমটি θ এর একটি ক্রম তৈরি করে12,… সঙ্গে শর্তাধীন সম্ভাবনা ভাবমূর্তি. এই স্কিমে আমরা ধরে নিই যে জি0 রং এবং প্রতিটি θ এর উপর একটি বিতরণn কলশিতে রাখা বলের রঙের প্রতিনিধিত্ব করে। দ্য অ্যালগরিদম নিম্নরূপ:

· আমরা একটি খালি urn দিয়ে শুরু.

· সঙ্গে আনুপাতিক সম্ভাবনা α আমরা আঁকি ভাবমূর্তি এবং আমরা কলশিতে এই রঙের একটি বল যোগ করি।

· n-1-এর সমানুপাতিক সম্ভাবনার সাথে আমরা কলস থেকে একটি এলোমেলো বল আঁকি, আমরা এর রঙ পর্যবেক্ষণ করি, আমরা এটিকে আবার কলসে রাখি এবং আমরা একই রঙের একটি অতিরিক্ত বল যোগ করি।

পূর্বে আমরা একটি ডিরিচলেট প্রক্রিয়া দিয়ে শুরু করেছিলাম এবং ব্ল্যাকওয়েল-ম্যাককুইন স্কিম নিয়েছিলাম। এখন ব্ল্যাকওয়েল-ম্যাককুইন স্কিম থেকে বিপরীতভাবে শুরু করা যাক এবং ডিপি বের করা যাক। যেহেতু θi G থেকে একটি iid পদ্ধতিতে আঁকা হয়েছে, তাদের যৌথ বন্টন কোনো সীমিত স্থানচ্যুতিতে অপরিবর্তনীয় হবে এবং এইভাবে তারা বিনিময়যোগ্য। ফলস্বরূপ ডি ফিনেত্তির উপপাদ্য ব্যবহার করে, আমাদের আছে যে তাদের আইআইডি করার জন্য ব্যবস্থার উপর একটি বন্টন থাকতে হবে এবং এই বন্টনটি হল ডিরিচলেট প্রক্রিয়া। ফলস্বরূপ আমরা প্রমাণ করি যে ব্ল্যাকওয়েল-ম্যাককুইন urn স্কিমটি DP-এর একটি উপস্থাপনা এবং এটি আমাদের এটি নির্মাণের একটি সুনির্দিষ্ট উপায় দেয়। আমরা পরে দেখব, এই স্কিমটি গাণিতিকভাবে চাইনিজ রেস্তোরাঁ প্রক্রিয়ার সমতুল্য।

3.2 লাঠি ভাঙা নির্মাণ

স্টিক-ব্রেকিং নির্মাণ হল একটি ডিরিচলেট প্রক্রিয়া উপস্থাপন করার একটি বিকল্প উপায় যা প্রবর্তিত হয়েছিল সেথুরমন. এটি গঠনের একটি গঠনমূলক উপায় ভাবমূর্তি বিতরণ এবং ব্যবহার করে সাদৃশ্য অনুসরণ: আমরা অনুমান করি যে আমাদের দৈর্ঘ্য 1 এর একটি লাঠি আছে, আমরা এটিকে β অবস্থানে ভাঙ্গি1 এবং আমরা π বরাদ্দ করি1 লাঠির অংশের দৈর্ঘ্যের সমান যা আমরা ভেঙেছি। আমরা π পেতে একই প্রক্রিয়া পুনরাবৃত্তি করি2, পাই3,… ইত্যাদি; এই স্কিমটি যেভাবে সংজ্ঞায়িত করা হয়েছে তার কারণে আমরা এটি অসীম বার চালিয়ে যেতে পারি।

উপরের π এর উপর ভিত্তি করেk হিসাবে মডেল করা যেতে পারে ভাবমূর্তি, যেখানে ভাবমূর্তি আগের স্কিমগুলির মতো θ সরাসরি বেস ডিস্ট্রিবিউশন দ্বারা নমুনা করা হয় ভাবমূর্তি. ফলস্বরূপ G বণ্টনকে π দিয়ে ওজনযুক্ত ডেল্টা ফাংশনের যোগফল হিসাবে লেখা যেতে পারেk সম্ভাব্যতা যা সমান ভাবমূর্তি. এইভাবে স্টিক-ব্রেকিং নির্মাণ আমাদের একটি সহজ এবং স্বজ্ঞাতভাবে একটি ডিরিচলেট প্রক্রিয়া তৈরি করার উপায় দেয়।

3.3 চীনা রেস্টুরেন্ট প্রক্রিয়া

চাইনিজ রেস্তোরাঁ প্রসেস, যা প্রবর্তিত হয়েছিল Aldous, একটি Dirichlet প্রক্রিয়া প্রতিনিধিত্ব করার আরেকটি কার্যকর উপায় এবং এটি সরাসরি Blackwell-MacQueen urn স্কিমের সাথে লিঙ্ক করা যেতে পারে। এই স্কিম ব্যবহার করে সাদৃশ্য অনুসরণ: আমরা অনুমান করি যে অসীম অনেক টেবিল সহ একটি চাইনিজ রেস্টুরেন্ট আছে। গ্রাহকরা রেস্তোরাঁয় প্রবেশ করার সাথে সাথে তারা যেকোনও দখলকৃত টেবিলে এলোমেলোভাবে বসেন বা তারা প্রথম উপলব্ধ খালি টেবিলে বসতে পছন্দ করেন।

সিআরপি ধনাত্মক পূর্ণসংখ্যার পার্টিশনের স্থানের উপর একটি বন্টন সংজ্ঞায়িত করে। আমরা θ অঙ্কন করে শুরু করি1,…θn Blackwell-MacQueen urn স্কিম থেকে। যেমন আমরা পূর্ববর্তী সেগমেন্টে আলোচনা করেছি, আমরা আশা করি একটি ক্লাস্টারিং প্রভাব দেখতে পাব এবং এইভাবে অনন্য θ মানের মোট সংখ্যা k হবে n-এর থেকে উল্লেখযোগ্যভাবে কম। এইভাবে এটি k ক্লাস্টারে সেট {1,2,…,n} এর একটি পার্টিশন সংজ্ঞায়িত করে। ফলস্বরূপ ব্ল্যাকওয়েল-ম্যাককুইন urn স্কিম থেকে অঙ্কন {1,2,…,n} সেটের একটি র্যান্ডম পার্টিশনকে প্ররোচিত করে। চাইনিজ রেস্তোরাঁ প্রক্রিয়া এই প্ররোচিত হয় পার্টিশনের উপর বিতরণ. অ্যালগরিদম নিম্নরূপ:

· আমরা একটি খালি রেস্টুরেন্ট দিয়ে শুরু করি।

· 1st গ্রাহক সর্বদা 1 এ বসেনst টেবিল

· n+1th গ্রাহকের 2টি বিকল্প রয়েছে:

o সম্ভাব্যতা সহ 1ম খালি টেবিলে বসুন ভাবমূর্তি

o সম্ভাব্যতা সহ kth দখলকৃত টেবিলের যেকোনো একটিতে বসুন ভাবমূর্তি
কোথায় ভাবমূর্তি সেই টেবিলে বসে থাকা লোকের সংখ্যা

যেখানে α হল DP-এর বিচ্ছুরণ মান এবং n হল একটি নির্দিষ্ট সময়ে রেস্টুরেন্টে মোট গ্রাহকের সংখ্যা। সুপ্ত পরিবর্তনশীল zi i এর টেবিল নম্বর সংরক্ষণ করেth গ্রাহক এবং 1 থেকে k পর্যন্ত মান নেয়n যেখানে kn যখন n গ্রাহকরা রেস্তোরাঁয় থাকে তখন মোট দখলকৃত টেবিলের সংখ্যা। আমাদের লক্ষ্য করা উচিত যে kn সর্বদা n এর কম বা সমান হবে এবং গড়ে এটি প্রায় ভাবমূর্তি. সবশেষে আমাদের লক্ষ্য করা উচিত যে টেবিল বিন্যাসের সম্ভাবনা ভাবমূর্তি পরিবর্তনের জন্য অপরিবর্তনীয়। এইভাবে zi বিনিময়যোগ্য যা বোঝায় যে একই আকারের গ্রাহকদের টেবিলের একই সম্ভাবনা রয়েছে।

চাইনিজ রেস্তোরাঁর প্রক্রিয়াটি পলিয়া urn স্কিম এবং ডিরিচলেট প্রক্রিয়ার সাথে দৃঢ়ভাবে সংযুক্ত। সিআরপি একটি নির্দিষ্ট করার একটি উপায় পার্টিশনের উপর বিতরণ n পয়েন্টের (টেবিল অ্যাসাইনমেন্ট) এবং সুপ্ত পরিবর্তনশীল z-এর স্থানের পূর্বে ব্যবহার করা যেতে পারেi যে ক্লাস্টার অ্যাসাইনমেন্ট নির্ধারণ করে. CRP হল Pólya এর urn স্কিমের সমতুল্য শুধুমাত্র পার্থক্য যে এটি প্রতিটি টেবিল/ক্লাস্টারে পরামিতি বরাদ্দ করে না। যাও CRP থেকে Pólya এর urn স্কিম পর্যন্ত আমরা আঁকি ভাবমূর্তি সমস্ত টেবিলের জন্য k=1,2… এবং তারপর প্রতিটি x এর জন্যi যা টেবিল z-এ গোষ্ঠীবদ্ধi বরাদ্দ a ভাবমূর্তি. অন্য কথায় নতুন x এ বরাদ্দ করুনi টেবিলের প্যারামিটার θ। অবশেষে থেকে আমরা বরাদ্দ করতে পারি না শুরু থেকে θ থেকে অসীম টেবিল, আমরা প্রতিবার যখন কেউ একটি নতুন টেবিলে বসে তখন আমরা একটি নতুন θ বরাদ্দ করতে পারি। উপরের সমস্ত কারণে, CRP আমাদেরকে ডেটাসেটের উপর ক্লাস্টার বিশ্লেষণ করার জন্য গণনাগতভাবে দক্ষ অ্যালগরিদম তৈরি করতে সাহায্য করতে পারে।

এই পোস্টে, আমরা ডিরিচলেট প্রক্রিয়া এবং এটি নির্মাণের বিভিন্ন উপায় নিয়ে আলোচনা করেছি। আমরা পরবর্তী নিবন্ধে উপরের ধারণাগুলি ব্যবহার করব। আমরা ডিরিচলেট প্রক্রিয়া মিশ্রণ মডেলটি প্রবর্তন করব এবং ডিরিচলেট প্রক্রিয়া তৈরি করতে এবং ক্লাস্টার বিশ্লেষণের জন্য আমরা চাইনিজ রেস্তোরাঁর প্রতিনিধিত্ব ব্যবহার করব। আপনি যদি কয়েকটি পয়েন্ট মিস করেন তবে চিন্তা করবেন না কারণ পরবর্তী দুটি নিবন্ধের সাথে জিনিসগুলি আরও পরিষ্কার হতে শুরু করবে।

আমি আশা করি আপনি এই পোস্টটি আকর্ষণীয় খুঁজে পেয়েছেন। আপনি যদি তা করে থাকেন তবে এটি Facebook এবং Twitter-এ শেয়ার করার জন্য একটু সময় নিন। 🙂

সময় স্ট্যাম্প:

থেকে আরো ডেটাবক্স