ڈیٹام باکس مشین لرننگ فریم ورک 0.6.0 جاری کیا گیا پلیٹو بلاکچین ڈیٹا انٹیلی جنس۔ عمودی تلاش۔ عی

ڈیٹام باکس مشین لرننگ فریم ورک 0.6.0 جاری کیا گیا۔

ڈیٹام باکس مشین لرننگ فریم ورک کا نیا ورژن جاری کر دیا گیا ہے! اسے ابھی سے ڈاؤن لوڈ کریں۔ Github کے or ماون سینٹرل ریپوزٹری.

نیا کیا ہے؟

اہم توجہ ورژن 0.6.0 بڑے ڈیٹا کو ہینڈل کرنے کے لیے فریم ورک کو بڑھانا، کوڈ آرکیٹیکچر اور عوامی APIs کو بہتر بنانا، ڈیٹا پارس کرنا آسان بنانا، دستاویزات کو بڑھانا اور اجازت دینے والے لائسنس پر جانا ہے۔

آئیے اس ورژن کی تبدیلیوں کو تفصیل سے دیکھتے ہیں:

  1. بڑے ڈیٹا کو ہینڈل کریں۔: بہتر میموری مینجمنٹ اور نئے استقامت والے اسٹوریج انجنوں نے فریم ورک کو کئی جی بی سائز کے بڑے ڈیٹا سیٹس کو سنبھالنے کے قابل بنایا۔ کی حمایت شامل کرنا میپ ڈی بی ڈیٹا بیس انجن فریم ورک کو اس قابل بناتا ہے کہ وہ تمام ڈیٹا کو میموری میں محفوظ کرنے سے بچ سکے اور اس طرح وہ بڑے ڈیٹا کو سنبھال سکے۔ پہلے سے طے شدہ InMemory انجن کو زیادہ موثر ہونے کے لیے دوبارہ ڈیزائن کیا گیا ہے جبکہ MongoDB انجن کو کارکردگی کے مسائل کی وجہ سے ہٹا دیا گیا تھا۔
  2. بہتر اور آسان فریم ورک فن تعمیر: تجرید کی سطح کو نمایاں طور پر کم کیا گیا ہے اور کئی بنیادی اجزاء کو دوبارہ ڈیزائن کیا گیا ہے۔ خاص طور پر استقامت کے ذخیرہ کرنے کے طریقہ کار کو دوبارہ لکھا جاتا ہے اور کئی غیر ضروری خصوصیات اور ڈیٹا ڈھانچے کو ہٹا دیا جاتا ہے۔
  3. نئے "Scikit-Learn-like" عوامی APIs: الگورتھم کے تمام عوامی طریقوں کو Python's Scikit-Learn APIs (فٹ/پیش گوئی/ٹرانسفارم پیراڈائم) سے مشابہت کے لیے تبدیل کر دیا گیا ہے۔ نئے عوامی طریقے زیادہ لچکدار، آسان اور استعمال میں زیادہ دوستانہ ہیں۔
  4. ڈیٹا پارسنگ کو آسان بنائیں: نیا فریم ورک سہولت کے طریقوں کے ایک سیٹ کے ساتھ آتا ہے جو CSV یا ٹیکسٹ فائلوں کو تیزی سے پارس کرنے اور ڈیٹا سیٹ اشیاء میں ان کی تبدیلی کی اجازت دیتا ہے۔
  5. بہتر دستاویزات: تمام عوامی/محفوظ کلاسز اور فریم ورک کے طریقوں کو Javadoc تبصروں کا استعمال کرتے ہوئے دستاویز کیا گیا ہے۔ مزید برآں نیا ورژن JUnit کے بہتر ٹیسٹ فراہم کرتا ہے جو کہ فریم ورک کے ہر الگورتھم کو استعمال کرنے کے طریقے کی بہترین مثالیں ہیں۔
  6. نیا اپاچی لائسنس: فریم ورک کا سافٹ ویئر لائسنس "سے بدل گیاGNU جنرل پبلک لائسنس V3.0"کرنے کے لئے"اپاچی لائسنس ، ورژن 2.0" نیا لائسنس قابل اجازت ہے اور یہ تجارتی سافٹ ویئر کے اندر دوبارہ تقسیم کی اجازت دیتا ہے۔

چونکہ فریم ورک کا ایک بڑا حصہ اسے زیادہ موثر اور استعمال میں آسان بنانے کے لیے دوبارہ لکھا گیا تھا، ورژن 0.6.0 ہے۔ پیچھے کی طرف مطابقت نہیں رکھتا فریم ورک کے پہلے ورژن کے ساتھ۔ آخر کار فریم ورک الفا سے بیٹا ڈویلپمنٹ مرحلے میں چلا گیا اور اسے زیادہ مستحکم سمجھا جانا چاہیے۔

اسے کیسے استعمال کریں

ایک پچھلی بلاگ پوسٹ میں، ہم نے فراہم کیا ہے۔ تفصیلی تنصیب گائیڈ فریم ورک کو انسٹال کرنے کا طریقہ۔ یہ گائیڈ اب بھی نئے ورژن کے لیے درست ہے۔ اس کے علاوہ اس نئے ورژن میں آپ کو کئی مل سکتے ہیں۔ کوڈ کی مثالیں فریم ورک کے ماڈلز اور الگورتھم استعمال کرنے کے طریقے پر۔

اگلے اقدامات اور روڈ میپ

فریم ورک کی ترقی جاری رہے گی اور ورژن 1.0 کی ریلیز سے پہلے درج ذیل اضافہ کیا جانا چاہیے:

  1. Using کنسول سے فریم ورک: اگرچہ فریم ورک کا بنیادی ہدف مشین لرننگ ایپلی کیشنز کی ترقی میں مدد کرنا ہے، لیکن اسے غیر جاوا ڈویلپرز سے استعمال کرنا آسان بنایا جانا چاہیے۔ مہوت کی طرح کے نقطہ نظر کے بعد، فریم ورک کو کنسول کمانڈز کا استعمال کرتے ہوئے الگورتھم تک رسائی فراہم کرنی چاہیے۔ انٹرفیس سادہ، استعمال میں آسان ہونا چاہیے اور مختلف الگورتھم آسانی سے یکجا ہونا چاہیے۔
  2. ملٹی تھریڈنگ کی حمایت کریں: فریم ورک فی الحال صرف صاف کرنے کے عمل اور ڈسک میں غیر مطابقت پذیر تحریر کے لیے تھریڈز کا استعمال کرتا ہے۔ اس کے باوجود کچھ الگورتھم متوازی ہوسکتے ہیں اور اس سے عملدرآمد کے اوقات میں نمایاں کمی واقع ہوگی۔ ان صورتوں میں حل خوبصورت ہونا چاہیے اور مشین لرننگ الگورتھم کی اندرونی منطق/ریاضی میں ممکنہ حد تک کم ترمیم کرنی چاہیے۔
  3. 2d arrays اور matrices کا استعمال کم کریں: الگورتھم کی ایک چھوٹی سی تعداد اب بھی 2d صفوں اور میٹرکس کا استعمال کرتی ہے۔ اس کی وجہ سے تمام ڈیٹا میموری میں لوڈ ہو جاتا ہے جو استعمال کیے جانے والے ڈیٹا سیٹ کے سائز کو محدود کر دیتا ہے۔ کچھ الگورتھم (جیسے PCA) کو میٹرکس کے استعمال سے بچنے کے لیے دوبارہ لاگو کیا جانا چاہیے جبکہ دوسروں کے لیے (جیسے GaussianDPMM، MultinomialDPMM وغیرہ) ہمیں اسپارس میٹرکس کا استعمال کرنا چاہیے۔

دیگر اہم کام جو آنے والے ورژن میں کیے جانے چاہئیں:

  1. نئی مشین لرننگ الگورتھم شامل کریں: فریم ورک کو کئی عظیم الگورتھم کی مدد کے لیے بڑھایا جا سکتا ہے جیسے کہ مکسچر آف گاسیئنز، گاوسین پروسیسز، کے-این این، ڈیسیژن ٹریز، فیکٹر اینالیسس، ایس وی ڈی، پی ایل ایس آئی، آرٹیفیشل نیورل نیٹ ورکس وغیرہ۔
  2. دستاویزات کو بہتر بنائیں، ٹیسٹ کی کوریج اور کوڈ کی مثالیں: ایک بہتر دستاویزات بنائیں، JUnit ٹیسٹ کو بہتر بنائیں، کوڈ کے تبصروں کو بہتر بنائیں، الگورتھم استعمال کرنے کے طریقے کے بارے میں بہتر مثالیں فراہم کریں۔
  3. فن تعمیر کو بہتر بنائیں کوڈ کو بہتر بنائیں: فریم ورک کے فن تعمیر پر مزید آسانیاں اور بہتری، تجرید کو معقول بنانا، ڈیزائن کو بہتر بنانا، رفتار اور میموری کی کھپت کو بہتر بنانا وغیرہ۔

جیسا کہ آپ دیکھ سکتے ہیں کہ یہ ایک لمبی سڑک ہے اور میں کچھ مدد کر سکتا ہوں۔ اگر آپ چیلنج کے لیے تیار ہیں۔ مجھے ایک لکیر چھوڑ دو یا اپنی پل کی درخواست گیتھب پر بھیجیں۔

منظوریاں

میں شکریہ ادا کرنا چاہوں گا Eleftherios Bampaletakis فریم ورک کے فن تعمیر کو بہتر بنانے کے لیے ان کے انمول ان پٹ کے لیے۔ میں بھی شکریہ ادا کرنا چاہوں گا۔ ej-technologies GmbH مجھے ان کے جاوا پروفائلر کے لیے لائسنس فراہم کرنے کے لیے۔ اس کے علاوہ میری تعریف جان کوٹیک MapDB اسٹوریج انجن میں اس کے حیرت انگیز کام کے لیے۔ آخری لیکن کم از کم، میری گرل فرینڈ کیریاکی سے میرا پیار میرے ساتھ رکھنے پر۔

سے Datumbox v0.6.0 کا کوڈ ڈاؤن لوڈ کرنا نہ بھولیں۔ Github کے. لائبریری بھی دستیاب ہے۔ ماون سینٹرل ریپوزٹری. اپنے جاوا پروجیکٹ میں لائبریری کو استعمال کرنے کے طریقے کے بارے میں مزید معلومات کے لیے درج ذیل چیک آؤٹ کریں۔ رہنمائی یا ہمارے گیتھب ریپو کے مرکزی صفحہ پر دی گئی ہدایات کو پڑھیں۔

میں آپ کے تبصروں اور سفارشات کا منتظر ہوں۔ پل کی درخواستوں کا ہمیشہ خیرمقدم کیا جاتا ہے! 🙂

ٹائم اسٹیمپ:

سے زیادہ ڈیٹا باکس