Datumbox Machine Learning Framework 0.6.0 Relied PlatoBlockchain Data Intelligence. উল্লম্ব অনুসন্ধান. আ.

ডেটাবক্স মেশিন লার্নিং ফ্রেমওয়ার্ক 0.6.0 প্রকাশিত

Datumbox মেশিন লার্নিং ফ্রেমওয়ার্কের নতুন সংস্করণ প্রকাশিত হয়েছে! থেকে এখনই ডাউনলোড করুন গিটহাব or মাভেন সেন্ট্রাল রিপোজিটরি.

কি নতুন?

প্রধান ফোকাস 0.6.0 সংস্করণ ফ্রেমওয়ার্ক প্রসারিত করা হল বড় ডেটা পরিচালনা করতে, কোড আর্কিটেকচার এবং পাবলিক এপিআই উন্নত করা, ডেটা পার্সিংকে সহজ করা, ডকুমেন্টেশন উন্নত করা এবং একটি অনুমতিমূলক লাইসেন্সে চলে যাওয়া।

আসুন এই সংস্করণের পরিবর্তনগুলি বিস্তারিতভাবে দেখি:

  1. বড় ডেটা পরিচালনা করুন: উন্নত মেমরি ম্যানেজমেন্ট এবং নতুন অধ্যবসায় স্টোরেজ ইঞ্জিনগুলি ফ্রেমওয়ার্কটিকে বেশ কয়েকটি GB আকারের বড় ডেটাসেটগুলি পরিচালনা করতে সক্ষম করেছে। সমর্থন যোগ করা ম্যাপডিবি ডাটাবেস ইঞ্জিন মেমরিতে সমস্ত ডেটা সংরক্ষণ এড়াতে ফ্রেমওয়ার্ককে সক্ষম করে এবং এইভাবে বড় ডেটা পরিচালনা করতে সক্ষম হয়। ডিফল্ট InMemory ইঞ্জিনটি আরও দক্ষ হওয়ার জন্য পুনরায় ডিজাইন করা হয়েছে যখন কর্মক্ষমতা সমস্যার কারণে MongoDB ইঞ্জিনটি সরানো হয়েছিল।
  2. উন্নত এবং সরলীকৃত ফ্রেমওয়ার্ক আর্কিটেকচার: বিমূর্ততার স্তর উল্লেখযোগ্যভাবে হ্রাস করা হয়েছে এবং বেশ কয়েকটি মূল উপাদান পুনরায় ডিজাইন করা হয়েছে। বিশেষ করে অধ্যবসায় স্টোরেজ মেকানিজম পুনরায় লেখা হয় এবং বেশ কিছু অপ্রয়োজনীয় বৈশিষ্ট্য এবং ডেটা স্ট্রাকচার মুছে ফেলা হয়।
  3. নতুন "Scikit-Learn-like" পাবলিক API: অ্যালগরিদমের সমস্ত পাবলিক পদ্ধতি পরিবর্তন করা হয়েছে পাইথনের স্কিট-লার্ন এপিআই (ফিট/ভবিষ্যদ্বাণী/ট্রান্সফর্ম প্যারাডাইম) এর অনুরূপ। নতুন পাবলিক পদ্ধতিগুলি আরও নমনীয়, সহজ এবং ব্যবহার করার জন্য আরও বন্ধুত্বপূর্ণ।
  4. ডেটা পার্সিং সহজ করুন: নতুন ফ্রেমওয়ার্ক সুবিধার পদ্ধতির একটি সেটের সাথে আসে যা CSV বা টেক্সট ফাইলগুলির দ্রুত পার্সিং এবং ডেটাসেট অবজেক্টে তাদের রূপান্তর করার অনুমতি দেয়।
  5. উন্নত ডকুমেন্টেশন: ফ্রেমওয়ার্কের সমস্ত পাবলিক/সুরক্ষিত ক্লাস এবং পদ্ধতি Javadoc মন্তব্য ব্যবহার করে নথিভুক্ত করা হয়েছে। উপরন্তু নতুন সংস্করণ উন্নত JUnit পরীক্ষা প্রদান করে যা ফ্রেমওয়ার্কের প্রতিটি অ্যালগরিদম কীভাবে ব্যবহার করতে হয় তার দুর্দান্ত উদাহরণ।
  6. নতুন অ্যাপাচি লাইসেন্স: ফ্রেমওয়ার্কের সফ্টওয়্যার লাইসেন্স " থেকে পরিবর্তিত হয়েছেGNU সাধারণ পাবলিক লাইসেন্স v3.0"থেকে"অ্যাপাচি লাইসেন্স, সংস্করণ ২.০" নতুন লাইসেন্স অনুমোদনযোগ্য এবং এটি বাণিজ্যিক সফ্টওয়্যারের মধ্যে পুনরায় বিতরণের অনুমতি দেয়।

যেহেতু ফ্রেমওয়ার্কের একটি বড় অংশ এটিকে আরও দক্ষ এবং ব্যবহার করা সহজ করার জন্য পুনরায় লেখা হয়েছিল, সংস্করণ 0.6.0 হল পিছনের দিকে সামঞ্জস্যপূর্ণ নয় ফ্রেমওয়ার্কের পূর্ববর্তী সংস্করণগুলির সাথে। অবশেষে ফ্রেমওয়ার্কটি আলফা থেকে বিটা ডেভেলপমেন্ট ফেজে স্থানান্তরিত হয়েছে এবং এটিকে আরও স্থিতিশীল বিবেচনা করা উচিত।

এটি কিভাবে ব্যবহার করতে

আগের একটি ব্লগ পোস্টে, আমরা একটি প্রদান করেছি বিস্তারিত ইনস্টলেশন গাইড কিভাবে ফ্রেমওয়ার্ক ইনস্টল করতে হয়. এই নির্দেশিকাটি এখনও নতুন সংস্করণের জন্য বৈধ। অতিরিক্তভাবে এই নতুন সংস্করণে আপনি বেশ কয়েকটি খুঁজে পেতে পারেন কোড উদাহরণ ফ্রেমওয়ার্কের মডেল এবং অ্যালগরিদমগুলি কীভাবে ব্যবহার করবেন সে সম্পর্কে।

পরবর্তী পদক্ষেপ এবং রোডম্যাপ

ফ্রেমওয়ার্কের বিকাশ অব্যাহত থাকবে এবং সংস্করণ 1.0 প্রকাশের আগে নিম্নলিখিত বর্ধনগুলি করা উচিত:

  1. UsING কনসোল থেকে ফ্রেমওয়ার্ক: যদিও ফ্রেমওয়ার্কের মূল লক্ষ্য মেশিন লার্নিং অ্যাপ্লিকেশনগুলির বিকাশে সহায়তা করা, এটি অ-জাভা বিকাশকারীদের থেকে ব্যবহার করা আরও সহজ করা উচিত। মাহাউটের মতো অনুরূপ পদ্ধতি অনুসরণ করে, ফ্রেমওয়ার্কটি কনসোল কমান্ড ব্যবহার করে অ্যালগরিদমগুলিতে অ্যাক্সেস সরবরাহ করবে। ইন্টারফেসটি সহজ, ব্যবহার করা সহজ এবং বিভিন্ন অ্যালগরিদম সহজে একত্রিত হওয়া উচিত।
  2. মাল্টি-থ্রেডিং সমর্থন করুন: ফ্রেমওয়ার্ক বর্তমানে শুধুমাত্র ক্লিন-আপ প্রক্রিয়া এবং ডিস্কে অ্যাসিঙ্ক্রোনাস লেখার জন্য থ্রেড ব্যবহার করে। তবুও কিছু অ্যালগরিদম সমান্তরাল করা যেতে পারে এবং এটি কার্যকর করার সময় উল্লেখযোগ্যভাবে হ্রাস করবে। এই ক্ষেত্রে সমাধানটি মার্জিত হওয়া উচিত এবং মেশিন লার্নিং অ্যালগরিদমের অভ্যন্তরীণ যুক্তি/গণিত যতটা সম্ভব কম পরিবর্তন করা উচিত।
  3. 2d অ্যারে এবং ম্যাট্রিক্সের ব্যবহার হ্রাস করুন: অল্প সংখ্যক অ্যালগরিদম এখনও 2d অ্যারে এবং ম্যাট্রিক্স ব্যবহার করে। এর ফলে সমস্ত ডেটা মেমরিতে লোড হয় যা ব্যবহার করা যেতে পারে এমন ডেটাসেটের আকারকে সীমাবদ্ধ করে। ম্যাট্রিক্সের ব্যবহার এড়াতে কিছু অ্যালগরিদম (যেমন PCA) পুনরায় প্রয়োগ করা উচিত যখন অন্যদের জন্য (যেমন GaussianDPMM, MultinomialDPMM ইত্যাদি) আমাদের স্পার্স ম্যাট্রিক্স ব্যবহার করা উচিত।

অন্যান্য গুরুত্বপূর্ণ কাজগুলি যা আসন্ন সংস্করণগুলিতে করা উচিত:

  1. নতুন মেশিন লার্নিং অ্যালগরিদম অন্তর্ভুক্ত করুন: গাউসিয়ানদের মিশ্রণ, গাউসিয়ান প্রসেস, কে-এনএন, ডিসিশন ট্রিস, ফ্যাক্টর অ্যানালাইসিস, এসভিডি, পিএলএসআই, কৃত্রিম নিউরাল নেটওয়ার্ক ইত্যাদির মতো বেশ কয়েকটি দুর্দান্ত অ্যালগরিদমকে সমর্থন করার জন্য কাঠামোটি প্রসারিত করা যেতে পারে।
  2. ডকুমেন্টেশন উন্নত করুন, টেস্ট কভারেজ কোড উদাহরণ: একটি ভাল ডকুমেন্টেশন তৈরি করুন, JUnit পরীক্ষাগুলি উন্নত করুন, কোড মন্তব্যগুলি উন্নত করুন, কীভাবে অ্যালগরিদমগুলি ব্যবহার করতে হয় তার আরও ভাল উদাহরণ প্রদান করুন।
  3. আর্কিটেকচার উন্নত করুন কোড অপ্টিমাইজ করুন: ফ্রেমওয়ার্কের আর্কিটেকচারে আরও সরলীকরণ এবং উন্নতি, বিমূর্তকরণকে যুক্তিযুক্ত করা, নকশা উন্নত করা, গতি এবং মেমরি খরচ অপ্টিমাইজ করা ইত্যাদি।

আপনি দেখতে পাচ্ছেন যে এটি একটি দীর্ঘ রাস্তা এবং আমি কিছু সাহায্য ব্যবহার করতে পারি। আপনি যদি চ্যালেঞ্জের জন্য প্রস্তুত হন আমাকে একটি পংক্তি শুনাও অথবা গিথুবে আপনার পুল অনুরোধ পাঠান।

প্রাপ্তি স্বীকার

আমি ধন্যবাদ জানাতে চাই এলিফথেরিওস বাম্পালেটাকিস ফ্রেমওয়ার্কের আর্কিটেকচারের উন্নতিতে তার অমূল্য ইনপুটের জন্য। এছাড়াও আমি ধন্যবাদ দিতে চাই ej-টেকনোলজিস জিএমবিএইচ আমাকে তাদের জাভা প্রোফাইলারের লাইসেন্স দেওয়ার জন্য। তাছাড়া আমার কৃতজ্ঞতা জান কোটেক MapDB স্টোরেজ ইঞ্জিনে তার আশ্চর্যজনক কাজের জন্য। শেষ কিন্তু অন্তত নয়, আমার সাথে থাকার জন্য আমার বান্ধবী কিরিয়াকির প্রতি আমার ভালবাসা।

থেকে Datumbox v0.6.0 এর কোড ডাউনলোড করতে ভুলবেন না গিটহাব. লাইব্রেরি চালু আছে মাভেন সেন্ট্রাল রিপোজিটরি. আপনার জাভা প্রকল্পে লাইব্রেরি কীভাবে ব্যবহার করবেন সে সম্পর্কে আরও তথ্যের জন্য নিম্নলিখিতটি চেকআউট করুন কৌশল অথবা আমাদের Github রেপোর প্রধান পৃষ্ঠার নির্দেশাবলী পড়ুন।

আমি আপনার মন্তব্য এবং সুপারিশের জন্য উন্মুখ. টান অনুরোধ সবসময় স্বাগত জানাই! 🙂

সময় স্ট্যাম্প:

থেকে আরো ডেটাবক্স