স্পারস নিউরাল নেটওয়ার্ক পদার্থবিদদেরকে দরকারী ডেটার দিকে নির্দেশ করে | কোয়ান্টা ম্যাগাজিন

স্পারস নিউরাল নেটওয়ার্ক পদার্থবিদদেরকে দরকারী ডেটার দিকে নির্দেশ করে | কোয়ান্টা ম্যাগাজিন

Sparse Neural Networks Point Physicists to Useful Data | Quanta Magazine PlatoBlockchain Data Intelligence. Vertical Search. Ai.

ভূমিকা

ধরুন আপনার হাজার পৃষ্ঠার বই আছে, কিন্তু প্রতিটি পৃষ্ঠায় মাত্র একটি লাইনের পাঠ্য রয়েছে। আপনি একটি স্ক্যানার ব্যবহার করে বইটিতে থাকা তথ্য বের করতে হবে, শুধুমাত্র এই নির্দিষ্ট স্ক্যানারটি নিয়মতান্ত্রিকভাবে প্রতিটি পৃষ্ঠার মধ্য দিয়ে যায়, একবারে এক বর্গ ইঞ্চি স্ক্যান করে। সেই স্ক্যানার দিয়ে পুরো বইটি দেখতে আপনার অনেক সময় লাগবে, এবং সেই সময়ের বেশির ভাগ সময়ই ফাঁকা জায়গা স্ক্যান করতে নষ্ট হবে। 

অনেক পরীক্ষামূলক পদার্থবিজ্ঞানীর জীবন এমনই। কণা পরীক্ষায়, ডিটেক্টরগুলি প্রচুর পরিমাণে ডেটা ক্যাপচার করে এবং বিশ্লেষণ করে, যদিও এটির একটি ক্ষুদ্র অংশে দরকারী তথ্য রয়েছে। "আকাশে উড়ন্ত একটি পাখির ফটোগ্রাফে, প্রতিটি পিক্সেল অর্থপূর্ণ হতে পারে," ব্যাখ্যা করা হয়েছে কাজুহিরো তেরাও, SLAC ন্যাশনাল অ্যাক্সিলারেটর ল্যাবরেটরির একজন পদার্থবিদ। কিন্তু একজন পদার্থবিজ্ঞানী যে ছবিগুলো দেখেন, প্রায়শই এর একটি ছোট অংশই আসলে গুরুত্বপূর্ণ। এর মতো পরিস্থিতিতে, প্রতিটি বিশদ বিবরণ অপ্রয়োজনীয়ভাবে সময় এবং গণনামূলক সংস্থান গ্রহণ করে।

কিন্তু যে পরিবর্তন শুরু হয়. একটি স্পার্স কনভোলিউশনাল নিউরাল নেটওয়ার্ক (SCNN) নামে পরিচিত একটি মেশিন লার্নিং টুলের সাহায্যে গবেষকরা তাদের ডেটার প্রাসঙ্গিক অংশগুলিতে ফোকাস করতে পারেন এবং বাকি অংশগুলি স্ক্রিন করতে পারেন। রিয়েল-টাইম ডেটা বিশ্লেষণ করার ক্ষমতাকে ব্যাপকভাবে ত্বরান্বিত করতে গবেষকরা এই নেটওয়ার্কগুলি ব্যবহার করেছেন। এবং তারা কমপক্ষে তিনটি মহাদেশে আসন্ন বা বিদ্যমান পরীক্ষায় SCNN নিয়োগ করার পরিকল্পনা করেছে। সুইচটি পদার্থবিদ্যা সম্প্রদায়ের জন্য একটি ঐতিহাসিক পরিবর্তন চিহ্নিত করে৷ 

"পদার্থবিজ্ঞানে, আমরা আমাদের নিজস্ব অ্যালগরিদম এবং গণনামূলক পদ্ধতির বিকাশে অভ্যস্ত," বলেছেন কার্লোস আর্গুয়েলেস-ডেলগাডো, হার্ভার্ড বিশ্ববিদ্যালয়ের একজন পদার্থবিদ। "আমরা সবসময় উন্নয়নের অগ্রভাগে ছিলাম, কিন্তু এখন, জিনিসের গণনাগত প্রান্তে, কম্পিউটার বিজ্ঞান প্রায়শই পথের নেতৃত্ব দিচ্ছে।" 

স্পার্স অক্ষর

যে কাজটি SCNN-এর দিকে পরিচালিত করবে তা 2012 সালে শুরু হয়েছিল, যখন বেঞ্জামিন গ্রাহাম, তারপর ওয়ারউইক বিশ্ববিদ্যালয়ে, একটি নিউরাল নেটওয়ার্ক তৈরি করতে চেয়েছিলেন যা চীনা হাতের লেখা চিনতে পারে। 

এই ধরনের ইমেজ-সম্পর্কিত কাজের জন্য সেই সময়ে প্রিমিয়ার টুল ছিল কনভোলিউশনাল নিউরাল নেটওয়ার্ক (সিএনএন)। চাইনিজ হস্তাক্ষর কাজের জন্য, একজন লেখক একটি ডিজিটাল ট্যাবলেটে একটি অক্ষর চিহ্নিত করবেন, যা 10,000 পিক্সেলের একটি চিত্র তৈরি করবে। CNN তারপরে একটি 3-বাই-3 গ্রিড সরানো হবে যাকে একটি কার্নেল বলা হয় সমগ্র চিত্র জুড়ে, প্রতিটি পিক্সেলের উপর পৃথকভাবে কার্নেলকে কেন্দ্র করে। কার্নেলের প্রতিটি স্থাপনের জন্য, নেটওয়ার্কটি একটি জটিল গাণিতিক গণনা সম্পাদন করবে যাকে কনভোলিউশন বলা হয় যা আলাদা বৈশিষ্ট্যের জন্য দেখায়।

সিএনএনগুলিকে তথ্য-ঘন চিত্র যেমন ফটোগ্রাফের সাথে ব্যবহার করার জন্য ডিজাইন করা হয়েছিল। কিন্তু একটি চীনা অক্ষর সম্বলিত একটি চিত্র বেশিরভাগই খালি; গবেষকরা এই সম্পত্তির সাথে ডেটা স্পারস হিসাবে উল্লেখ করেন। এটি প্রাকৃতিক বিশ্বের যে কোনও কিছুর একটি সাধারণ বৈশিষ্ট্য। "পৃথিবীটি কতটা বিরল হতে পারে তার একটি উদাহরণ দেওয়ার জন্য," গ্রাহাম বলেছিলেন, যদি আইফেল টাওয়ারটিকে সবচেয়ে ছোট সম্ভাব্য আয়তক্ষেত্রে আবদ্ধ করা হয় তবে সেই আয়তক্ষেত্রটি "99.98% বায়ু এবং মাত্র 0.02% লোহা" নিয়ে গঠিত হবে।

ভূমিকা

গ্রাহাম সিএনএন পদ্ধতিতে টুইক করার চেষ্টা করেছিলেন যাতে কার্নেলটি কেবলমাত্র ইমেজের 3-বাই-3 বিভাগে স্থাপন করা হয় যাতে কমপক্ষে একটি পিক্সেল থাকে যার মান শূন্য থাকে (এবং কেবল ফাঁকা নয়)। এইভাবে, তিনি এমন একটি সিস্টেম তৈরি করতে সফল হন যা দক্ষতার সাথে হাতে লেখা চীনা শনাক্ত করতে পারে। এটি শুধুমাত্র 2013% এর ত্রুটির হার সহ পৃথক অক্ষর সনাক্ত করে 2.61 সালের একটি প্রতিযোগিতা জিতেছে। (মানুষ গড়ে 4.81% স্কোর করেছে।) পরবর্তীতে তিনি আরও বড় সমস্যার দিকে মনোযোগ দেন: ত্রিমাত্রিক-বস্তু স্বীকৃতি।

2017 সালের মধ্যে, গ্রাহাম Facebook AI গবেষণায় চলে গিয়েছিলেন এবং তার কৌশলকে আরও পরিমার্জিত করেছিলেন এবং প্রকাশিত দ্য বিস্তারিত প্রথম SCNN-এর জন্য, যা কার্নেলটিকে শুধুমাত্র পিক্সেলের উপর কেন্দ্রীভূত করে যেগুলির একটি অশূন্য মান ছিল (কার্নেলটিকে 3-বাই-3 বিভাগে স্থাপন করার পরিবর্তে যেখানে কমপক্ষে একটি "অশূন্য" পিক্সেল রয়েছে)। এই সাধারণ ধারণাটিই তেরাও কণা পদার্থবিজ্ঞানের জগতে নিয়ে এসেছিলেন।

ভূগর্ভস্থ শট

তেরাও ফার্মি ন্যাশনাল অ্যাক্সিলারেটর ল্যাবরেটরিতে পরীক্ষা-নিরীক্ষার সাথে জড়িত যা সবচেয়ে অধরা পরিচিত প্রাথমিক কণাগুলির মধ্যে নিউট্রিনোর প্রকৃতি পরীক্ষা করে। এগুলিও মহাবিশ্বের সর্বাধিক প্রচুর পরিমাণে ভরযুক্ত কণা (যদিও বেশি না), তবে তারা খুব কমই একটি ডিটেক্টরের ভিতরে দেখা যায়। ফলস্বরূপ, নিউট্রিনো পরীক্ষা-নিরীক্ষার বেশির ভাগ ডেটা বিক্ষিপ্ত, এবং টেরাও ডেটা বিশ্লেষণের জন্য আরও ভাল পদ্ধতির সন্ধানে ছিলেন। তিনি SCNN-এ একটি খুঁজে পেয়েছেন।

2019 সালে, তিনি ডিপ আন্ডারগ্রাউন্ড নিউট্রিনো এক্সপেরিমেন্ট, বা DUNE থেকে প্রত্যাশিত ডেটার সিমুলেশনে SCNN প্রয়োগ করেছিলেন, যা 2026 সালে অনলাইনে আসার সময় বিশ্বের বৃহত্তম নিউট্রিনো পদার্থবিদ্যার পরীক্ষা হবে। প্রকল্পটি শিকাগোর ঠিক বাইরে, ফার্মিলাব থেকে নিউট্রিনো গুলি করবে, 800 মাইল পৃথিবীর মধ্য দিয়ে দক্ষিণ ডাকোটার একটি ভূগর্ভস্থ গবেষণাগারে। পথ ধরে, কণাগুলি তিনটি পরিচিত ধরণের নিউট্রিনোগুলির মধ্যে "দোদুল্যমান" হবে এবং এই দোলনগুলি বিস্তারিত নিউট্রিনো বৈশিষ্ট্য প্রকাশ করতে পারে।

SCNNগুলি সাধারণ পদ্ধতির চেয়ে দ্রুত সিমুলেটেড ডেটা বিশ্লেষণ করেছে, এবং এটি করার জন্য উল্লেখযোগ্যভাবে কম কম্পিউটেশনাল শক্তি প্রয়োজন। প্রতিশ্রুতিশীল ফলাফলের মানে হল যে SCNNs সম্ভবত প্রকৃত পরীক্ষামূলক চালানোর সময় ব্যবহার করা হবে।

2021 সালে, এদিকে, Terao মাইক্রোবুএন নামে পরিচিত ফার্মিলাবে আরেকটি নিউট্রিনো পরীক্ষায় SCNN যোগ করতে সাহায্য করেছিল। এখানে, বিজ্ঞানীরা নিউট্রিনো এবং আর্গন পরমাণুর নিউক্লিয়াসের মধ্যে সংঘর্ষের পরের দিকে তাকান। এই মিথস্ক্রিয়া দ্বারা তৈরি ট্র্যাকগুলি পরীক্ষা করে, গবেষকরা মূল নিউট্রিনো সম্পর্কে বিশদ অনুমান করতে পারেন। এটি করার জন্য, তাদের একটি অ্যালগরিদম প্রয়োজন যা ডিটেক্টরের ত্রি-মাত্রিক উপস্থাপনায় পিক্সেলগুলিকে (বা, প্রযুক্তিগতভাবে, তাদের ত্রি-মাত্রিক অংশগুলিকে ভক্সেল বলা হয়) দেখতে পারে এবং তারপরে কোন পিক্সেলগুলি কোন কণার গতিপথের সাথে যুক্ত তা নির্ধারণ করতে পারে।

কারণ ডেটা এতই বিক্ষিপ্ত — একটি বড় ডিটেক্টরের মধ্যে ছোট লাইনের বিচ্ছিন্নতা (প্রায় 170 টন তরল আর্গন) — SCNN এই কাজের জন্য প্রায় নিখুঁত। একটি স্ট্যান্ডার্ড CNN এর সাথে, ছবিটিকে 50 টুকরোতে বিভক্ত করতে হবে, কারণ সমস্ত গণনা করতে হবে, তেরাও বলেছিলেন। "একটি বিরল CNN এর সাথে, আমরা একবারে পুরো চিত্রটি বিশ্লেষণ করি - এবং এটি আরও দ্রুত করি।"

সময়মত ট্রিগার

মাইক্রোবুনে কাজ করা গবেষকদের মধ্যে একজন ছিলেন ফেলিক্স ইউ নামে একজন স্নাতক ইন্টার্ন। SCNN-এর ক্ষমতা এবং দক্ষতায় মুগ্ধ হয়ে, তিনি দক্ষিণ মেরুতে আইসকিউব নিউট্রিনো অবজারভেটরির সাথে আনুষ্ঠানিকভাবে অনুমোদিত হার্ভার্ড গবেষণা গবেষণাগারে স্নাতক ছাত্র হিসাবে তার পরবর্তী কর্মক্ষেত্রে সরঞ্জামগুলি নিয়ে আসেন।

মানমন্দিরের মূল লক্ষ্যগুলির মধ্যে একটি হল মহাবিশ্বের সবচেয়ে শক্তিশালী নিউট্রিনোগুলিকে আটকানো এবং তাদের উত্সগুলিতে ফিরে আসা, যার বেশিরভাগই আমাদের ছায়াপথের বাইরে অবস্থিত। ডিটেক্টরটি অ্যান্টার্কটিক বরফে সমাহিত 5,160টি অপটিক্যাল সেন্সর নিয়ে গঠিত, যার শুধুমাত্র একটি ক্ষুদ্র অংশ যে কোনো সময়ে আলোকিত হয়। বাকি অ্যারের অন্ধকার থাকে এবং বিশেষ করে তথ্যপূর্ণ নয়। আরও খারাপ, অনেক "ইভেন্ট" যা ডিটেক্টর রেকর্ড করে মিথ্যা ইতিবাচক এবং নিউট্রিনো শিকারের জন্য উপযোগী নয়। শুধুমাত্র তথাকথিত ট্রিগার-স্তরের ইভেন্টগুলি আরও বিশ্লেষণের জন্য কাটছাঁট করে, এবং কোনটি সেই পদের যোগ্য এবং কোনটি স্থায়ীভাবে উপেক্ষা করা হবে তা নিয়ে তাৎক্ষণিক সিদ্ধান্ত নেওয়া দরকার।

স্ট্যান্ডার্ড সিএনএন এই কাজের জন্য খুব ধীর, তাই IceCube বিজ্ঞানীরা দীর্ঘকাল ধরে LineFit নামক একটি অ্যালগরিদমের উপর নির্ভর করে তাদের সম্ভাব্য উপযোগী সনাক্তকরণ সম্পর্কে জানাতে। কিন্তু সেই অ্যালগরিদমটি অবিশ্বস্ত, ইউ বলেছেন, "যার মানে আমরা আকর্ষণীয় ঘটনাগুলি মিস করতে পারি।" আবার, এটি একটি স্পার্স ডেটা পরিবেশ আদর্শভাবে একটি SCNN-এর জন্য উপযুক্ত।

ইউ — আর্গুয়েলেস-ডেলগাডো, তার ডক্টরাল উপদেষ্টা এবং জেফ লাজার, উইসকনসিন, ম্যাডিসন বিশ্ববিদ্যালয়ের একজন স্নাতক ছাত্রের সাথে — এই সুবিধাটি পরিমাপ করেছেন, এতে দেখানো হয়েছে একটি সাম্প্রতিক কাগজ যে এই নেটওয়ার্কগুলি সাধারণ সিএনএনগুলির তুলনায় প্রায় 20 গুণ দ্রুত হবে৷ "এটি ডিটেক্টর থেকে আসা প্রতিটি ইভেন্টে চালানোর জন্য যথেষ্ট দ্রুত," প্রতি সেকেন্ডে প্রায় 3,000, লাজার বলেছিলেন। "এটি আমাদেরকে কী ফেলতে হবে এবং কী রাখতে হবে সে সম্পর্কে আরও ভাল সিদ্ধান্ত নিতে সক্ষম করে।"

ভূমিকা

লেখকরা অফিসিয়াল আইসকিউব ডেটা ব্যবহার করে একটি সিমুলেশনে একটি SCNN সফলভাবে নিযুক্ত করেছেন এবং পরবর্তী ধাপ হল দক্ষিণ মেরু কম্পিউটিং সিস্টেমের একটি প্রতিলিপিতে তাদের সিস্টেম পরীক্ষা করা। সবকিছু ঠিকঠাক থাকলে, আর্গুয়েলেস-ডেলগাডো বিশ্বাস করেন যে তাদের আগামী বছর অ্যান্টার্কটিক মানমন্দিরে তাদের সিস্টেম ইনস্টল করা উচিত। কিন্তু প্রযুক্তি আরও ব্যাপক ব্যবহার দেখতে পারে. "আমরা মনে করি যে [SCNNs উপকৃত হতে পারে] সমস্ত নিউট্রিনো টেলিস্কোপ, শুধু আইসকিউব নয়," আর্গুয়েলেস-ডেলগাডো বলেছেন৷

নিউট্রিনোর বাইরে

ফিলিপ হ্যারিস, ম্যাসাচুসেটস ইনস্টিটিউট অফ টেকনোলজির একজন পদার্থবিদ, আশা করছেন যে SCNNগুলি তাদের সকলের মধ্যে সবচেয়ে বড় কণা সংঘর্ষে সাহায্য করতে পারে: CERN-এর লার্জ হ্যাড্রন কোলাইডার (LHC)৷ হ্যারিস এই ধরণের নিউরাল নেটওয়ার্ক সম্পর্কে এমআইটি সহকর্মী, কম্পিউটার বিজ্ঞানী সং হ্যানের কাছ থেকে শুনেছিলেন। হ্যারিস বলেন, "গানটি অ্যালগরিদমকে দ্রুত এবং দক্ষ করে তোলার একজন বিশেষজ্ঞ," LHC-এর জন্য উপযুক্ত, যেখানে প্রতি সেকেন্ডে 40 মিলিয়ন সংঘর্ষ ঘটে।

তারা যখন কয়েক বছর আগে কথা বলেছিল, গান হ্যারিসকে একটি স্বায়ত্তশাসিত-যান প্রকল্প সম্পর্কে বলেছিল যে সে তার ল্যাবের সদস্যদের সাথে অনুসরণ করছে। গানের দল গাড়ির সামনের স্থানের 3D লেজার মানচিত্র বিশ্লেষণ করতে SCNN ব্যবহার করছিল, যার বেশিরভাগই খালি, সামনে কোন বাধা আছে কিনা তা দেখতে।

হ্যারিস এবং তার সহকর্মীরা এলএইচসি-তে একই ধরনের চ্যালেঞ্জের মুখোমুখি। যখন দুটি প্রোটন মেশিনের অভ্যন্তরে সংঘর্ষে লিপ্ত হয়, তখন বিপর্যয় কণা দিয়ে তৈরি একটি প্রসারিত গোলক তৈরি করে। যখন এই কণাগুলির একটি সংগ্রাহককে আঘাত করে, তখন একটি গৌণ কণা ঝরনা ঘটে। হ্যারিস বলেন, "যদি আপনি এই ঝরনাটির সম্পূর্ণ পরিমাণ ম্যাপ করতে পারেন," হ্যারিস বলেন, "আপনি এটির জন্মদানকারী কণার শক্তি নির্ধারণ করতে পারেন," যা বিশেষ আগ্রহের বিষয় হতে পারে - হিগস বোসনের মতো কিছু, যা পদার্থবিদরা 2012 সালে আবিষ্কৃত হয়, বা একটি অন্ধকার পদার্থ কণা, যা পদার্থবিদরা এখনও অনুসন্ধান করছেন।

"আমরা যে সমস্যাটি সমাধান করার চেষ্টা করছি তা বিন্দুগুলিকে সংযুক্ত করার জন্য নেমে আসে," হ্যারিস বলেছিলেন, ঠিক যেমন একটি স্ব-ড্রাইভিং গাড়ি একটি বাধা সনাক্ত করতে একটি লেজার মানচিত্রের বিন্দুগুলিকে সংযুক্ত করতে পারে।

SCNNগুলি LHC-তে ডেটা বিশ্লেষণের গতি বাড়িয়ে দেবে কমপক্ষে 50 এর ফ্যাক্টর, হ্যারিস বলেছেন। "আমাদের চূড়ান্ত লক্ষ্য হল [SCNNs] ডিটেক্টরে প্রবেশ করানো" — এমন একটি কাজ যাতে অন্তত এক বছরের কাগজপত্র এবং সম্প্রদায়ের কাছ থেকে অতিরিক্ত কেনাকাটা লাগে৷ তবে তিনি এবং তার সহকর্মীরা আশাবাদী।

সামগ্রিকভাবে, এটি ক্রমবর্ধমান সম্ভাবনা রয়েছে যে SCNNs - একটি ধারণা যা মূলত কম্পিউটার বিজ্ঞানের জগতে কল্পনা করা হয়েছিল - শীঘ্রই নিউট্রিনো পদার্থবিদ্যা (DUNE), নিউট্রিনো জ্যোতির্বিদ্যা (আইসকিউব) এবং উচ্চ-শক্তি পদার্থবিদ্যা (LHC) এ পরিচালিত সবচেয়ে বড় পরীক্ষায় ভূমিকা পালন করবে। .

গ্রাহাম বলেছিলেন যে তিনি আনন্দদায়কভাবে অবাক হয়েছিলেন যে এসসিএনএনগুলি কণা পদার্থবিজ্ঞানে তাদের পথ তৈরি করেছে, যদিও তিনি সম্পূর্ণ হতবাক হননি। "একটি বিমূর্ত অর্থে," তিনি বলেছিলেন, "মহাকাশে চলমান একটি কণা কিছুটা কাগজের টুকরোতে চলমান একটি কলমের ডগা'র মতো।"

সময় স্ট্যাম্প:

থেকে আরো কোয়ান্টাম্যাগাজিন