शोधकर्ता एआई को कैंसर से जुड़े म्यूटेशन को इंगित करना सिखाते हैं

शोधकर्ता एआई को कैंसर से जुड़े म्यूटेशन को इंगित करना सिखाते हैं

Researchers teach AI to pinpoint mutations linked to cancer PlatoBlockchain Data Intelligence. Vertical Search. Ai.

मशीन लर्निंग तकनीक, जैसे कि डीप लर्निंग, स्तन कैंसर जैसी बीमारियों की पहचान करने में आश्चर्यजनक रूप से प्रभावी साबित हुई है। हालांकि, जब आनुवंशिक स्तर पर म्यूटेशन की पहचान करने की बात आती है, तो ये मॉडल कैलिफोर्निया विश्वविद्यालय सैन डिएगो (यूसीएसडी) के शोधकर्ताओं के अनुसार कम आए हैं।

एक कागज में प्रकाशित इस सप्ताह नेचर बायोटेक्नोलॉजी पत्रिका में, विश्वविद्यालय के शोधकर्ताओं ने डीपमोसाइक नामक एक नई मशीन लर्निंग फ्रेमवर्क का प्रस्ताव दिया है, जो कैंसर सहित बीमारियों से जुड़े आनुवंशिक उत्परिवर्तन और आनुवंशिक लिंक के साथ विकारों की पहचान करने के लिए इमेज-आधारित विज़ुअलाइज़ेशन और डीप लर्निंग मॉडल के संयोजन का उपयोग करता है, जैसे कि ऑटिज्म स्पेक्ट्रम डिस्ऑर्डर।

बीमारी की पहचान करने के लिए एआई/एमएल का उपयोग हाल के वर्षों में एक गर्म विषय रहा है। उदाहरण के लिए, अगस्त में, हार्वर्ड के वैज्ञानिक विस्तृत एक बहुविध एआई प्रणाली जो 14 प्रकार के कैंसर की भविष्यवाणी करने में सक्षम है।

यूसीएसडी के प्रोफेसर जो ग्लीसन के अनुसार, समस्या यह है कि इनमें से अधिकतर मॉडल अनुवांशिक उत्परिवर्तनों की पहचान करने के लिए उपयुक्त नहीं हैं, जिन्हें मोज़ेक वेरिएंट या म्यूटेशन कहा जाता है, क्योंकि पिछले दो दशकों में विकसित अधिकांश सॉफ्टवेयर कैंसर के नमूनों पर प्रशिक्षित थे।

चूंकि कैंसर कोशिकाएं इतनी तेजी से विभाजित होती हैं, इसलिए कंप्यूटर प्रोग्राम के लिए उनका पता लगाना अपेक्षाकृत आसान होता है, उन्होंने के साथ एक साक्षात्कार में समझाया रजिस्टर. तुलनात्मक रूप से, मोज़ेक म्यूटेशन का पता लगाना मुश्किल है क्योंकि वे केवल कोशिकाओं के एक सबसेट में मौजूद होते हैं।

प्राथमिक विद्यालय में आपको जो पढ़ाया गया होगा, उसके विपरीत, जब कोशिकाएँ विभाजित होती हैं, तो वे एक दूसरे की पूर्ण प्रति नहीं होती हैं। मिनट परिवर्तन या उत्परिवर्तन हैं, ग्लीसन ने समझाया। ये उत्परिवर्तन आमतौर पर हानिरहित होते हैं लेकिन कभी-कभी ये कैंसर या अन्य बीमारियों का कारण बनते हैं। यह संभावित समस्याग्रस्त म्यूटेशनों की पहचान करने के तरीकों को इतना मूल्यवान बनाता है।

लेकिन हाल तक तक "डीएनए अनुक्रमण से उन उत्परिवर्तनों की पहचान करने का कोई अच्छा तरीका नहीं था," उन्होंने कहा। "हम इस पत्र में जो प्रस्तुत करते हैं वह ऐसा करने का एक नया तरीका है [जो] गहरी शिक्षा का लाभ उठाता है।"

डीप मोज़ेक में गोता लगाना

सैन डिएगो सुपरकंप्यूटिंग सेंटर के कॉमेट कंप्यूट क्लस्टर में रखे गए एनवीडिया केप्लर के180,000 जीपीयू नोड्स का उपयोग करते हुए डीपमोसाइक ढांचे को 80 मोज़ेक वेरिएंट पर प्रशिक्षित किया गया था।

परियोजना पर काम कर रहे एक पोस्ट-डॉक्टोरल शोधकर्ता, जिआओक्सू यांग ने बताया कि एक ओपन सोर्स पूर्व-प्रशिक्षित मॉडल के रूप में उपलब्ध है, यह फ्रेमवर्क जीनोम अनुक्रमों को छवियों में परिवर्तित करके काम करता है और फिर मोज़ेक म्यूटेशन की पहचान करने के लिए एक गहन शिक्षण दृढ़ तंत्रिका नेटवर्क लागू करता है। रजिस्टर.

और कुछ मशीन लर्निंग मॉडल के विपरीत, डीप मोज़ेक को तैनात करने वाले किसी भी व्यक्ति को अपने डेटा को कंडीशन करने की आवश्यकता नहीं होनी चाहिए जब तक कि वे मॉडल को फिर से प्रशिक्षित करने की योजना नहीं बनाते।

मौजूदा तरीकों की तुलना में, शोधकर्ताओं का दावा है कि मॉडल इन म्यूटेशनों को अधिक सटीकता के साथ पहचान सकता है। ग्लीसन ने कहा, और पारंपरिक तरीकों के लिए आवश्यक मैन्युअल सत्यापन प्रक्रिया की तुलना में, यह तीव्रता के आदेश भी हैं।

पर्याप्त जीपीयू अश्वशक्ति को देखते हुए, यांग का कहना है कि डीपमोसाइक एक घंटे के भीतर पूरे जीनोमिक प्रोफाइल के माध्यम से क्रंच करने में सक्षम होना चाहिए। और जबकि मॉडल को धूमकेतु पर प्रशिक्षित किया गया था, इसका मतलब यह नहीं है कि आपको मॉडल को चलाने या फिर से प्रशिक्षित करने के लिए सुपर कंप्यूटर की आवश्यकता है। उन्होंने दावा किया कि यह पूरी तरह से संभावना के दायरे में है कि कोई व्यक्ति व्यक्तिगत वर्कस्टेशन का उपयोग करके डीप मोज़ेक को प्रशिक्षित करे।

यांग ने कहा कि विशेष रूप से कैंसर को ध्यान में रखकर विकसित किए गए मॉडलों की तुलना में यह ढांचा अलग-अलग फायदे भी प्रदान करता है। इनमें से अधिकांश कार्यक्रमों के लिए गैर-कैंसर नियंत्रण नमूने की आवश्यकता होती है। यह उन्हें मोज़ेक वेरिएंट की पहचान करने के लिए अव्यावहारिक बनाता है क्योंकि म्यूटेशन कई ऊतकों में फैल सकता है।

डीपमोज़ैक "स्वतंत्र नियंत्रण है, जिसका अर्थ है कि हम उन प्रकारों को देखने में सक्षम हैं जो विभिन्न ऊतकों द्वारा साझा किए जाते हैं," उन्होंने कहा।

जबकि मोज़ेक वेरिएंट की पहचान करने के लिए बेहतर है, शोधकर्ताओं ने ध्यान दिया कि डीपमोज़ेक, कम से कम अपने वर्तमान रूप में, कैंसर के नमूनों के लिए व्यावहारिक नहीं है।

लेकिन जैसा कि ग्लीसन बताते हैं, इन उत्परिवर्तनों की सही पहचान करने में सक्षम होना चिकित्सा उपचार विकसित करने की दिशा में पहला कदम है।

एक गिट क्लोन दूर

DeepMosaic को घुमाने में रुचि रखने वाले शोधकर्ताओं को दूर नहीं जाना पड़ेगा। इसकी तैनाती और परीक्षण के लिए आवश्यक ढांचा, दस्तावेज और डेमो डाउनलोड के लिए उपलब्ध हैं GitHub.

पूर्व-प्रशिक्षित मॉडल के अलावा, शोधकर्ताओं ने अपने स्वयं के डेटासेट पर मॉडल को पुनः प्रशिक्षित करने के लिए आवश्यक सभी उपकरण भी शामिल किए हैं।

ग्लीसन के अनुसार, अभी भी सुधार की बहुत गुंजाइश है। उन्होंने समझाया, "वर्तमान में मानव आनुवंशिकी में बहुत सारे काम यूरोपीय वंश के साथ हैं," उन्होंने कहा कि इन उपकरणों को विभिन्न वंशों पर लागू करने का एक अवसर है।

बीमारी के संकेतों की पहचान करने के अलावा, डीप मोज़ेक के पास के क्षेत्रों में अनुप्रयोग हो सकते हैं। ग्लीसन ने कहा, "हमारा मॉडल एक व्यक्ति से जीनोमिक अनुक्रम फ़ाइलों में सूक्ष्म अंतरों को खोजने के लिए बहुत अच्छी तरह से तैयार है, लेकिन मुझे लगता है कि उपकरण में शायद अन्य क्षेत्रों में अनुप्रयोग हैं।" "उदाहरण के लिए, फोरेंसिक में, जहां हम सार्वजनिक डेटाबेस के साथ डीएनए के मिलान के बारे में बहुत कुछ सुन रहे हैं।"

यांग ने कहा कि मानव स्वास्थ्य और समझ में सुधार के लिए डीप मोज़ेक जैसे उपकरणों के अवसर केवल बढ़ते रहेंगे क्योंकि जीनोम अनुक्रमण की लागत में गिरावट जारी है। ®

समय टिकट:

से अधिक रजिस्टर