ٹاپ AI ڈیٹا سیٹ اپنے ڈیٹا فیڈ میں کرپٹو کرنسی ویب سائٹس کی خصوصیات رکھتا ہے۔

ٹاپ AI ڈیٹا سیٹ اپنے ڈیٹا فیڈ میں کرپٹو کرنسی ویب سائٹس کی خصوصیات رکھتا ہے۔

Top AI Dataset Features Cryptocurrency Websites in its Datafeed PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  • Colossal Clean Crawled Corpus ڈیٹا کے لیے متعدد کرپٹو پلیٹ فارمز پر منحصر ہے۔
  • تجزیہ ظاہر کرتا ہے کہ C4 کے ٹیکسٹ اسنیپٹس کا کچھ حصہ کرپٹو پر مبنی ویب سائٹس سے نکالا گیا ہے۔
  • C4 کے ڈیٹاسیٹ میں کرپٹو سائٹس کی موجودگی اس کے تعصب کی سطح کو متاثر کر سکتی ہے۔

سب سے اوپر AI ٹول، Colossal Clean Crawled Corpus (C4)اس کے ڈیٹا کے ایک اہم حصے کے لیے متعدد کرپٹو پلیٹ فارمز پر منحصر ہے۔ ایک تجزیہ سے پتہ چلتا ہے کہ C4 کرپٹو پر مبنی ویب سائٹس یا ویب پلیٹ فارمز سے لاکھوں ٹیکسٹ اسنیپٹس نکالتا ہے cryptocurrency.

رپورٹس کے مطابق، یو ایس سیکیورٹیز اینڈ ایکسچینج کمیشن (SEC)، جو کہ اب کرپٹو سے متعلق معلومات کی ایک قابل ذکر مقدار پر مشتمل ہے، 36 ملین C4 ٹوکنز کا حامل ہے، جو پلیٹ فارم کے ڈیٹاسیٹ کے 0.02% کی نمائندگی کرتا ہے۔ SEC کی ویب سائٹ (sec.gov)، جس سے C4 ڈیٹا حاصل کرتا ہے، C39 کے ذریعے مصروف ویب سائٹس میں 4 ویں نمبر پر ہے۔

Satoshi Nakamoto کے Bitcointalk.org میں 6.1 ملین C4 ٹوکن ہیں، جو کل ٹوکنز کے 0.004% کے برابر ہیں۔ یہ پلیٹ فارم کے ذریعہ مصروف 780 ویں ویب سائٹ کے طور پر درجہ بندی کرتا ہے۔

ڈیٹا کے حصول کے لیے C4 کے ذریعے مصروف دیگر کرپٹو پلیٹ فارمز میں crypto نیوز ویب سائٹ، Cointelegraph، اور ٹوکنز ایگریگیشن پلیٹ فارم، CoinmarketCap شامل ہیں۔ یہ اور چھ مزید متعلقہ ویب سائٹس تمام C0.008 ٹوکنز کا 4% بنتی ہیں، جبکہ مخصوص کریپٹو کرنسیوں سے متعلق دیگر ویب سائٹس نے نمائندگی کا ایک نہ ہونے کے برابر حصہ بنایا۔

IPFS (ipfs.io) اور Steemit (steemit.com) C4 کے ڈیٹاسیٹ میں نمایاں طور پر نمایاں ہیں۔ آئی پی ایف ایس 16 ویں نمبر پر ہے، جبکہ سٹیمٹ 594 ویں پوزیشن پر ہے۔ یہ دونوں سائٹیں براہ راست کرپٹو میں شامل نہیں ہیں لیکن کرپٹو انڈسٹری کی طرف ان کا خاص جھکاؤ ہے۔

C4 میں کرپٹو سے متعلقہ پلیٹ فارمز کی شمولیت اے آئی کی تربیت یہ عمل مرکزی دھارے میں کریپٹو کرنسی کی تجاوزات کو بے نقاب کرتا ہے۔ C4 کے نتائج کو متاثر کرنے کے لیے کرپٹو ویب سائٹس کی نمائندگی کی حد کافی اہم ہے، حالانکہ گوگل اور فیس بک جیسی مرکزی دھارے کی ویب سائٹس ان سے نمایاں طور پر آگے ہیں۔

ڈیٹا سیٹ کے "صاف" ہونے کی اطلاعات کے باوجود C4 کو پائریٹڈ ڈیٹا اور نفرت انگیز تقریر پر تنقید کا سامنا کرنا پڑا ہے۔ مخصوص مواد کو سنسر کرنے کے لیے اس کی فہرست میں صرف 400 الفاظ کے ساتھ، یہ تجویز کرتا ہے کہ C4 کے اندر اب بھی متنازع مواد ہو سکتا ہے۔ اس کے ڈیٹاسیٹ میں کرپٹو سائٹس کی موجودگی اس کے تعصب کی سطح کو بھی متاثر کر سکتی ہے۔

پوسٹ مناظر: 125

ٹائم اسٹیمپ:

سے زیادہ سکے ایڈیشن