นักวิจัยสอนให้ AI ระบุการกลายพันธุ์ที่เชื่อมโยงกับมะเร็ง

นักวิจัยสอนให้ AI ระบุการกลายพันธุ์ที่เชื่อมโยงกับมะเร็ง

นักวิจัยสอน AI ให้ระบุการกลายพันธุ์ที่เชื่อมโยงกับมะเร็ง PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

เทคนิคการเรียนรู้ของเครื่อง เช่น การเรียนรู้เชิงลึก ได้พิสูจน์แล้วว่ามีประสิทธิภาพอย่างน่าประหลาดใจในการระบุโรค เช่น มะเร็งเต้านม อย่างไรก็ตาม เมื่อพูดถึงการระบุการกลายพันธุ์ในระดับพันธุกรรม แบบจำลองเหล่านี้ถือว่าสั้นเกินไป นักวิจัยจาก University of California San Diego (UCSD) กล่าว

ในกระดาษ การตีพิมพ์ ในวารสาร Nature Biotechnology ในสัปดาห์นี้ นักวิจัยของมหาวิทยาลัยได้เสนอกรอบการเรียนรู้ของเครื่องใหม่ที่เรียกว่า DeepMosaic ซึ่งใช้การผสมผสานระหว่างการสร้างภาพด้วยภาพและรูปแบบการเรียนรู้เชิงลึกเพื่อระบุการกลายพันธุ์ของยีนที่เกี่ยวข้องกับโรคต่างๆ รวมถึงมะเร็งและความผิดปกติที่มีการเชื่อมโยงทางพันธุกรรม เช่น โรคออทิสติกสเปกตรัม

การใช้ AI/ML เพื่อระบุโรคเป็นประเด็นร้อนในช่วงไม่กี่ปีที่ผ่านมา ตัวอย่างเช่น ในเดือนสิงหาคม นักวิทยาศาสตร์ฮาร์วาร์ด รายละเอียด ระบบ AI หลายรูปแบบสามารถทำนายมะเร็งได้ 14 ชนิด

ศาสตราจารย์โจ กลีสัน ศาสตราจารย์แห่ง UCSD กล่าวว่า ปัญหาคือ โมเดลเหล่านี้ส่วนใหญ่ไม่เหมาะกับการระบุการกลายพันธุ์ของยีน ที่เรียกว่า โมเสก แวเรียนต์ หรือการกลายพันธุ์ เนื่องจากซอฟต์แวร์ส่วนใหญ่ที่พัฒนาขึ้นในช่วงสองทศวรรษที่ผ่านมาได้รับการฝึกฝนเกี่ยวกับตัวอย่างมะเร็ง

เนื่องจากเซลล์มะเร็งมีการแบ่งตัวอย่างรวดเร็ว จึงค่อนข้างง่ายที่จะตรวจจับด้วยโปรแกรมคอมพิวเตอร์ เขาอธิบายในการให้สัมภาษณ์กับ ลงทะเบียน. เมื่อเปรียบเทียบแล้ว การกลายพันธุ์แบบโมเสกนั้นยากต่อการสังเกตเนื่องจากมีอยู่ในเซลล์ส่วนย่อยเท่านั้น

ตรงกันข้ามกับสิ่งที่คุณอาจได้รับการสอนในโรงเรียนประถม เมื่อเซลล์แบ่งตัว เซลล์เหล่านี้ไม่ใช่สำเนาที่สมบูรณ์ของกันและกัน มีการเปลี่ยนแปลงเล็กน้อยหรือการกลายพันธุ์ Gleeson อธิบาย การกลายพันธุ์เหล่านี้มักไม่เป็นอันตราย แต่บางครั้งก็นำไปสู่มะเร็งหรือโรคอื่นๆ สิ่งนี้ทำให้วิธีการระบุการกลายพันธุ์ที่อาจเป็นปัญหามีค่ามาก

แต่จนกระทั่งเมื่อไม่นานมานี้ "ไม่มีวิธีที่ดีในการระบุการกลายพันธุ์เหล่านั้นจากการจัดลำดับดีเอ็นเอ" เขากล่าว “สิ่งที่เรานำเสนอในบทความนี้เป็นวิธีใหม่ในการทำเช่นนั้น [ซึ่ง] ใช้ประโยชน์จากการเรียนรู้เชิงลึก”

ดำดิ่งสู่ DeepMosaic

เฟรมเวิร์ก DeepMosaic เองได้รับการฝึกอบรมบนโมเสก 180,000 รูปแบบโดยใช้โหนด GPU Nvidia Kepler K80 ซึ่งอยู่ในคลัสเตอร์คอมพิวติ้ง Comet ของ San Diego Supercomputing Center

เฟรมเวิร์กทำงานโดยการแปลงลำดับจีโนมให้เป็นรูปภาพ จากนั้นใช้เครือข่ายประสาทเทียมการเรียนรู้เชิงลึกเพื่อระบุการกลายพันธุ์ของโมเสก Xiaoxu Yang นักวิจัยหลังปริญญาเอกที่ทำงานในโครงการกล่าว ลงทะเบียน.

และไม่เหมือนกับโมเดลแมชชีนเลิร์นนิงบางโมเดล ใครก็ตามที่ใช้งาน DeepMosaic ไม่จำเป็นต้องกำหนดเงื่อนไขข้อมูลของตน เว้นแต่พวกเขาวางแผนที่จะฝึกโมเดลใหม่

เมื่อเปรียบเทียบกับวิธีการที่มีอยู่แล้ว นักวิจัยอ้างว่าแบบจำลองสามารถระบุการกลายพันธุ์เหล่านี้ด้วยความแม่นยำที่มากขึ้น และเมื่อเปรียบเทียบกับกระบวนการตรวจสอบด้วยตนเองที่ต้องใช้โดยวิธีทั่วไปแล้ว มันยังเร็วกว่าเป็นลำดับมากอีกด้วย Gleeson กล่าว

ด้วยแรงม้าของ GPU ที่เพียงพอ Yang กล่าวว่า DeepMosaic น่าจะสามารถบดขยี้โปรไฟล์จีโนมทั้งหมดได้ภายในหนึ่งชั่วโมง และในขณะที่โมเดลได้รับการฝึกฝนบน Comet นั่นไม่ได้หมายความว่าคุณต้องใช้ซูเปอร์คอมพิวเตอร์เพื่อเรียกใช้หรือแม้แต่ฝึกโมเดลใหม่ด้วยเช่นกัน เขาอ้างว่าอยู่ในขอบเขตของความเป็นไปได้โดยสิ้นเชิงสำหรับบางคนที่จะฝึก DeepMosaic โดยใช้เวิร์กสเตชันส่วนตัว

กรอบการทำงานยังมีข้อได้เปรียบที่แตกต่างกันเมื่อเทียบกับแบบจำลองที่พัฒนาขึ้นโดยคำนึงถึงโรคมะเร็งโดยเฉพาะ Yang กล่าว โปรแกรมเหล่านี้ส่วนใหญ่ต้องการตัวอย่างควบคุมที่ไม่ใช่มะเร็ง สิ่งนี้ทำให้การใช้พวกมันเพื่อระบุรูปแบบโมเสกไม่สามารถทำได้เนื่องจากการกลายพันธุ์อาจแพร่กระจายไปทั่วเนื้อเยื่อต่างๆ

DeepMosaic “เป็นอิสระจากการควบคุม หมายความว่าเราสามารถดูรูปแบบต่างๆ ที่ใช้ร่วมกันโดยเนื้อเยื่อต่างๆ ได้” เขากล่าว

นักวิจัยตั้งข้อสังเกตว่า DeepMosaic ซึ่งอย่างน้อยก็อยู่ในรูปแบบปัจจุบันนั้นใช้ไม่ได้ผลกับตัวอย่างมะเร็ง

แต่ตามที่กลีสันชี้ให้เห็น ความสามารถในการระบุการกลายพันธุ์เหล่านี้ได้อย่างถูกต้องเป็นขั้นตอนแรกในการพัฒนาวิธีการรักษาทางการแพทย์

โคลน Git ออกไป

นักวิจัยที่สนใจใช้งาน DeepMosaic ไม่ต้องไปไหนไกล เฟรมเวิร์ก เอกสารประกอบ และการสาธิตที่จำเป็นในการปรับใช้และทดสอบพร้อมให้ดาวน์โหลดแล้ว GitHub.

นอกเหนือจากโมเดลที่ได้รับการฝึกล่วงหน้าแล้ว นักวิจัยยังได้รวมเครื่องมือทั้งหมดที่จำเป็นในการฝึกโมเดลใหม่ในชุดข้อมูลของตนเอง

จากคำกล่าวของ Gleeson ยังมีช่องว่างอีกมากสำหรับการปรับปรุง “งานส่วนใหญ่ในปัจจุบันเกี่ยวกับพันธุศาสตร์ของมนุษย์นั้นมาจากบรรพบุรุษของชาวยุโรป” เขาอธิบาย พร้อมเสริมว่ามีโอกาสที่จะใช้เครื่องมือเหล่านี้กับบรรพบุรุษที่แตกต่างกัน

นอกเหนือจากการระบุลายเซ็นของโรคแล้ว DeepMosaic อาจมีแอปพลิเคชันในฟิลด์ที่อยู่ติดกัน “แบบจำลองของเราได้รับการปรับแต่งมาอย่างดีเพื่อระบุความแตกต่างเล็กน้อยในไฟล์ลำดับจีโนมจากบุคคลคนเดียว แต่ฉันคิดว่าเครื่องมือนี้น่าจะมีการใช้งานในด้านอื่นๆ” Gleeson กล่าว “ตัวอย่างเช่น ในทางนิติวิทยาศาสตร์ ที่เราได้ยินข่าวมากมายเกี่ยวกับการจับคู่ DNA กับฐานข้อมูลสาธารณะ”

โอกาสสำหรับเครื่องมือเช่น DeepMosaic เพื่อปรับปรุงสุขภาพและความเข้าใจของมนุษย์จะเพิ่มขึ้นอย่างต่อเนื่องเมื่อต้นทุนการจัดลำดับจีโนมยังคงลดลง Yang กล่าวเสริม ®

ประทับเวลา:

เพิ่มเติมจาก ลงทะเบียน