AI กำลังสร้างแบบจำลองสมองเพื่อช่วยให้เราเห็น ได้ยิน และสร้าง PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

AI กำลังสร้างแบบจำลองสมองเพื่อช่วยให้เราเห็น ได้ยิน และสร้างสรรค์

นี่เป็นเวอร์ชันแก้ไขของโพสต์ที่เดิมรัน โปรดคลิกที่นี่เพื่ออ่านรายละเอียดเพิ่มเติม.


ประสาทวิทยาศาสตร์และ AI มีประวัติอันยาวนานที่เกี่ยวพันกัน ผู้บุกเบิกด้านปัญญาประดิษฐ์มองว่าหลักการขององค์กรของสมองเป็นแรงบันดาลใจในการสร้างเครื่องจักรอัจฉริยะ ในการพลิกกลับอย่างน่าประหลาดใจ ขณะนี้ AI กำลังช่วยให้เราเข้าใจแหล่งที่มาของแรงบันดาลใจ นั่นคือ สมองของมนุษย์ แนวทางการใช้ AI เพื่อสร้างแบบจำลองของสมองนี้เรียกว่า neuroAI ตลอดทศวรรษหน้า เราจะพัฒนาให้ละเอียดยิ่งขึ้น ในซิลิโค แบบจำลองสมอง โดยเฉพาะอย่างยิ่งแบบจำลองของประสาทสัมผัสทั้งสองอย่าง การมองเห็นและการได้ยินที่โดดเด่นที่สุดของเรา ด้วยเหตุนี้ เราจะสามารถดาวน์โหลดและใช้แบบจำลองทางประสาทสัมผัสได้ตามต้องการ ด้วยความสะดวกเช่นเดียวกับการจดจำวัตถุหรือการประมวลผลภาษาที่เป็นธรรมชาติ

นักประสาทวิทยาและนักวิจัยด้านปัญญาประดิษฐ์หลายคนเข้าใจดี! – ตื่นเต้นมากเกี่ยวกับสิ่งนี้: สมองตามความต้องการ! ค้นหาความหมายของการเห็น รู้สึก การเป็นมนุษย์! ไม่ค่อยมีใครรู้จักคือมีการใช้งานจริงอย่างกว้างขวางในอุตสาหกรรม ฉันเป็นนักวิจัยในสาขานี้มานานแล้ว โดยได้ทำงานเกี่ยวกับวิธีที่สมองเปลี่ยนการมองเห็นให้กลายเป็นความหมายตั้งแต่ปริญญาเอกของฉัน ฉันได้เห็นความก้าวหน้าของวงการตั้งแต่เริ่มก่อตั้ง และฉันคิดว่าตอนนี้เป็นเวลาที่จะไล่ตามวิธีที่ neuroAI สามารถขับเคลื่อนความคิดสร้างสรรค์มากขึ้นและปรับปรุงสุขภาพของเราได้ 

ฉันคาดการณ์ว่า neuroAI จะพบการใช้งานอย่างแพร่หลายในงานศิลปะและการโฆษณา โดยเฉพาะอย่างยิ่งเมื่อเชื่อมต่อกับโมเดล AI กำเนิดใหม่ เช่น GPT-3 และ DALL-E ในขณะที่โมเดล AI กำเนิดในปัจจุบันสามารถผลิตงานศิลปะและสื่อเชิงสร้างสรรค์ได้ แต่พวกเขาไม่สามารถบอกคุณได้ว่าในที่สุดสื่อนั้นจะสื่อสารข้อความไปยังผู้ชมที่ตั้งใจไว้หรือไม่ แต่ neuroAI สามารถทำได้. ตัวอย่างเช่น เราอาจแทนที่การทดลองและข้อผิดพลาดของการสนทนากลุ่มและการทดสอบ A/B และสร้างสื่อที่สื่อสารสิ่งที่เราต้องการโดยตรง แรงกดดันมหาศาลของตลาดรอบ ๆ แอปพลิเคชันนี้จะสร้างวัฏจักรที่ดีซึ่งช่วยปรับปรุงโมเดล neuroAI 

แบบจำลองที่ได้รับการปรับปรุงนี้จะช่วยให้สามารถประยุกต์ใช้ด้านสุขภาพในการแพทย์ได้ ตั้งแต่การช่วยเหลือผู้ที่มีปัญหาทางระบบประสาทไปจนถึงการเสริมสร้างความสามารถของบ่อน้ำ ลองนึกภาพการสร้างภาพและเสียงที่เหมาะสมเพื่อช่วยให้บุคคลฟื้นการมองเห็นหรือการได้ยินได้เร็วขึ้นหลังการผ่าตัดเลสิคหรือหลังจากได้รับการฝังประสาทหูเทียมตามลำดับ 

นวัตกรรมเหล่านี้จะทำให้เกิดศักยภาพมากขึ้นด้วยเทคโนโลยีอื่นๆ ที่กำลังจะเกิดขึ้น: เทคโนโลยีความจริงเสริมและส่วนต่อประสานระหว่างสมองกับคอมพิวเตอร์ อย่างไรก็ตาม เพื่อให้เกิดประโยชน์สูงสุดจากระบบรับความรู้สึกที่ดาวน์โหลดได้ตามต้องการ เราจำเป็นต้องเติมช่องว่างในปัจจุบันในด้านเครื่องมือ ความสามารถพิเศษ และเงินทุน

ในงานชิ้นนี้ ฉันจะอธิบายว่า neuroAI คืออะไร มันอาจเริ่มวิวัฒนาการและเริ่มส่งผลกระทบต่อชีวิตของเราได้อย่างไร มันช่วยเสริมนวัตกรรมและเทคโนโลยีอื่นๆ อย่างไร และสิ่งที่จำเป็นในการผลักดันให้ก้าวไปข้างหน้า  

neuroAI คืออะไร?

NeuroAI เป็นวินัยที่เกิดขึ้นใหม่ที่พยายาม 1) ศึกษาสมองเพื่อเรียนรู้วิธีสร้างปัญญาประดิษฐ์ที่ดีขึ้น และ 2) ใช้ปัญญาประดิษฐ์เพื่อให้เข้าใจสมองดีขึ้น หนึ่งในเครื่องมือหลักของ neuroAI คือการใช้โครงข่ายประสาทเทียมเพื่อสร้างแบบจำลองคอมพิวเตอร์ของการทำงานของสมองที่เฉพาะเจาะจง แนวทางนี้เริ่มต้นในปี 2014 เมื่อนักวิจัยที่ เอ็มไอที และ โคลัมเบีย แสดงให้เห็นว่าโครงข่ายประสาทเทียมลึกสามารถอธิบายการตอบสนองในส่วนของสมองที่รับรู้วัตถุ: inferotemporal cortex (IT) พวกเขาแนะนำสูตรพื้นฐานเพื่อเปรียบเทียบโครงข่ายประสาทเทียมกับสมอง การใช้สูตรนี้และการทดสอบซ้ำๆ ในกระบวนการของสมอง เช่น การจดจำรูปร่าง การประมวลผลการเคลื่อนไหว การประมวลผลคำพูด การควบคุมแขน หน่วยความจำเชิงพื้นที่ นักวิทยาศาสตร์กำลังสร้างแบบจำลองคอมพิวเตอร์สำหรับสมอง 

สูตรเปรียบเทียบสมองกับเครื่องจักร

คุณจะสร้างแบบจำลอง NeuroAI ได้อย่างไร? ตั้งแต่เริ่มก่อตั้งในปี 2014 ภาคสนามได้ปฏิบัติตามสูตรพื้นฐานเดียวกัน:

1. ฝึกโครงข่ายประสาทเทียมในซิลิโกเพื่อแก้ปัญหา เช่น การจดจำวัตถุ เครือข่ายที่เป็นผลลัพธ์เรียกว่าการเพิ่มประสิทธิภาพงาน ที่สำคัญ การฝึกนี้มักจะเกี่ยวข้องกับภาพ ภาพยนตร์ และเสียงเท่านั้น ไม่ใช่ข้อมูลสมอง

2. เปรียบเทียบการกระตุ้นระดับกลางของโครงข่ายประสาทเทียมที่ผ่านการฝึกอบรมกับการบันทึกสมองจริง การเปรียบเทียบทำได้โดยใช้เทคนิคทางสถิติ เช่น การถดถอยเชิงเส้นหรือการวิเคราะห์ความคล้ายคลึงกัน

3. เลือกแบบจำลองที่มีประสิทธิภาพดีที่สุดเป็นแบบจำลองที่ดีที่สุดในปัจจุบันของพื้นที่เหล่านี้ของสมอง

สูตรนี้สามารถนำไปใช้กับข้อมูลที่เก็บรวบรวมภายในสมองจากเซลล์ประสาทเดี่ยวหรือจากเทคนิคที่ไม่รุกราน เช่น การตรวจด้วยคลื่นแม่เหล็กไฟฟ้า (MEG) หรือการถ่ายภาพด้วยคลื่นแม่เหล็กไฟฟ้าเชิงฟังก์ชัน (fMRI)

แบบจำลอง neuroAI ของส่วนหนึ่งของสมองมีลักษณะสำคัญสองประการ คำนวณได้: เราสามารถป้อนสิ่งเร้าให้กับโมเดลคอมพิวเตอร์เครื่องนี้ และมันจะบอกเราว่าพื้นที่สมองจะมีปฏิกิริยาอย่างไร นอกจากนี้ยังสร้างความแตกต่างได้: เป็นโครงข่ายประสาทลึกที่เราสามารถปรับให้เหมาะสมได้ในลักษณะเดียวกับที่เราเพิ่มประสิทธิภาพแบบจำลองที่แก้ปัญหาการจดจำภาพและการประมวลผลภาษาที่เป็นธรรมชาติ นั่นหมายความว่านักประสาทวิทยาสามารถเข้าถึงเครื่องมืออันทรงพลังทั้งหมดที่ขับเคลื่อนการปฏิวัติการเรียนรู้เชิงลึก ซึ่งรวมถึงระบบพีชคณิตเทนเซอร์ เช่น PyTorch และ TensorFlow 

สิ่งนี้หมายความว่า? เราเปลี่ยนจากการไม่เข้าใจส่วนสำคัญของสมอง มาเป็นการสามารถดาวน์โหลดแบบจำลองที่ดีของสมองได้ภายในเวลาไม่ถึงทศวรรษ ด้วยการลงทุนที่เหมาะสม เราจะมีแบบจำลองที่ยอดเยี่ยมของสมองชิ้นใหญ่ในเร็วๆ นี้ ระบบการมองเห็นเป็นระบบแรกที่สร้างแบบจำลอง ระบบการได้ยินอยู่ไม่ไกลหลัง; และพื้นที่อื่น ๆ จะล้มลงเหมือนโดมิโนอย่างแน่นอนเนื่องจากนักประสาทวิทยาผู้กล้าหาญรีบเร่งไขปริศนาของสมอง นอกเหนือจากการสนองความอยากรู้ทางปัญญาของเราแล้ว ซึ่งเป็นแรงจูงใจที่ยิ่งใหญ่สำหรับนักวิทยาศาสตร์!- นวัตกรรมนี้จะช่วยให้โปรแกรมเมอร์ทุกคนสามารถดาวน์โหลดแบบจำลองที่ดีของสมองและปลดล็อกแอปพลิเคชันมากมาย

พื้นที่การใช้งาน

ศิลปะและการโฆษณา

เริ่มจากสมมติฐานง่ายๆ นี้ก่อน: 99% ของสื่อที่เราสัมผัสคือผ่านสายตาและหูของเรา มีอุตสาหกรรมทั้งหมดที่สามารถกลั่นกรองเพื่อส่งพิกเซลและโทนสีที่เหมาะสมกับความรู้สึกเหล่านี้: ทัศนศิลป์ การออกแบบ ภาพยนตร์ เกม เพลง และโฆษณาเป็นเพียงส่วนน้อย นี่ไม่ใช่ตาและหูของเราที่ตีความประสบการณ์เหล่านี้ เนื่องจากมันเป็นเพียงตัวรับความรู้สึก แต่สมองของเราเท่านั้นที่เข้าใจข้อมูลนั้น สื่อสร้างมาเพื่อให้ความรู้ ความบันเทิง ก่อให้เกิดอารมณ์ที่ต้องการ แต่การพิจารณาว่าข้อความในภาพวาด ภาพถ่ายเฮดช็อตแบบมืออาชีพ หรือโฆษณาจะได้รับตามที่ตั้งใจไว้หรือไม่นั้นเป็นแบบฝึกหัดที่น่าผิดหวังในการลองผิดลองถูก: มนุษย์ต้องอยู่ในวงจรเพื่อตัดสินว่าข้อความนั้นได้รับผลกระทบหรือไม่ ซึ่งมีราคาแพงและเสียเวลา- บริโภค

บริการออนไลน์ขนาดใหญ่ได้ค้นพบวิธีแก้ไขปัญหานี้โดยทำให้การทดลองและข้อผิดพลาดเป็นแบบอัตโนมัติ: การทดสอบ A/B Google มีชื่อเสียง ทดสอบว่าจะใช้สีน้ำเงิน 50 เฉดใดสำหรับลิงก์ในหน้าผลลัพธ์ของเครื่องมือค้นหา จากข้อมูลของ The Guardian ตัวเลือกที่ดีที่สุดทำให้รายรับเพิ่มขึ้นจากระดับพื้นฐานที่ 200 ล้านดอลลาร์ในปี 2009 หรือโดยประมาณ 1% ของรายได้ของ Google ในขณะนั้น. Netflix ปรับแต่งภาพขนาดย่อ แก่ผู้ชมเพื่อเพิ่มประสิทธิภาพประสบการณ์ผู้ใช้ วิธีการเหล่านี้มีให้สำหรับยักษ์ใหญ่ออนไลน์ที่มีการเข้าชมจำนวนมาก ซึ่งสามารถเอาชนะเสียงรบกวนที่มีอยู่ในพฤติกรรมของผู้คนได้

จะเป็นอย่างไรถ้าเราสามารถคาดการณ์ได้ว่าผู้คนจะตอบสนองต่อสื่ออย่างไรก่อนที่จะได้รับข้อมูลใดๆ ซึ่งจะทำให้ธุรกิจขนาดเล็กสามารถเพิ่มประสิทธิภาพเนื้อหาที่เป็นลายลักษณ์อักษรและเว็บไซต์ได้แม้ว่าจะมีแรงฉุดที่มีอยู่เพียงเล็กน้อยก็ตาม NeuroAI เข้าใกล้มากขึ้นเรื่อยๆ เพื่อให้สามารถทำนายได้ว่าผู้คนจะตอบสนองต่อวัสดุที่เป็นภาพอย่างไร ตัวอย่างเช่น นักวิจัย ที่ Adobe กำลังทำงานเกี่ยวกับเครื่องมือ เพื่อทำนายและชี้นำความสนใจด้วยภาพในภาพประกอบ

นักวิจัยยังได้สาธิตการตัดต่อภาพเพื่อทำเป็นภาพ น่าจดจำหรือสวยงามมากขึ้น น่าพอใจ ตัวอย่างเช่น สามารถใช้เพื่อเลือกภาพเฮดช็อตแบบมืออาชีพโดยอัตโนมัติซึ่งสอดคล้องกับภาพที่ผู้คนต้องการฉายภาพตัวเองมากที่สุด ไม่ว่าจะเป็นแบบมืออาชีพ จริงจัง หรือสร้างสรรค์ โครงข่ายประสาทเทียมสามารถหาวิธีสื่อสารข้อความได้อย่างมีประสิทธิภาพมากกว่าภาพที่เหมือนจริง สามารถตรวจสอบ CLIP ของ OpenAI เพื่อค้นหาภาพที่สอดคล้องกับอารมณ์ ภาพที่สอดคล้องกับแนวคิดเรื่องความตกใจมากที่สุดจะไม่ผิดเพี้ยนไปจาก Munch's Scream

OpenAI CLIP เพิ่มภาพสูงสุดสำหรับแนวคิดเรื่องความตกใจ ผ่านกล้องจุลทรรศน์ OpenAI เผยแพร่ภายใต้ CC-BY 4.0

ในปีที่ผ่านมา OpenAI และ Google ได้แสดงให้เห็นถึงเครือข่ายศิลปะกำเนิดที่มีความสามารถที่น่าประทับใจในการสร้างภาพที่เหมือนจริงจากภาพถ่ายจากข้อความแจ้ง เรายังไม่ค่อยมีจังหวะนั้นสำหรับดนตรี แต่ด้วยความก้าวหน้าของแบบจำลองกำเนิด สิ่งนี้จะเกิดขึ้นอย่างแน่นอนในอีกไม่กี่ปีข้างหน้า ด้วยการสร้างเครื่องจักรที่ได้ยินเสียงเหมือนมนุษย์ เราอาจจะทำให้การผลิตเพลงเป็นประชาธิปไตย ทำให้ทุกคนสามารถทำในสิ่งที่ผู้ผลิตเพลงที่มีทักษะสูงสามารถทำได้: เพื่อสื่อสารอารมณ์ที่เหมาะสมระหว่างการขับร้อง ไม่ว่าจะเป็นความเศร้าโศกหรือความปิติยินดี เพื่อสร้างไส้เดือนของท่วงทำนอง; หรือทำให้ชิ้นนั้นเต้นแรงจนไม่อาจต้านทานได้

มีแรงกดดันอย่างมากจากตลาดในการเพิ่มประสิทธิภาพสื่อโสตทัศน์ เว็บไซต์ และโดยเฉพาะอย่างยิ่งโฆษณา และเราได้รวม neuroAI และอัลกอริธึมอาร์ตเข้ากับกระบวนการนี้แล้ว ความกดดันนี้จะนำไปสู่วัฏจักรที่ดีซึ่ง neuroAI จะดีขึ้นและมีประโยชน์มากขึ้นเนื่องจากมีการใช้ทรัพยากรมากขึ้นในการใช้งานจริง ผลข้างเคียงก็คือเราจะได้โมเดลที่ดีของสมอง ซึ่งจะมีประโยชน์นอกเหนือจากโฆษณา 

การเข้าถึงและการออกแบบอัลกอริทึม

หนึ่งในแอปพลิเคชั่นที่น่าตื่นเต้นที่สุดของ neuroAI คือการเข้าถึงได้ สื่อส่วนใหญ่ได้รับการออกแบบสำหรับบุคคล "ทั่วไป" แต่เราทุกคนประมวลผลข้อมูลภาพและการได้ยินต่างกัน ผู้ชาย 8% และผู้หญิง 0.5% ตาบอดสีแดง-เขียว และสื่อจำนวนมากไม่ได้ปรับให้เข้ากับความต้องการของพวกเขา มีผลิตภัณฑ์จำนวนมากที่จำลองภาวะตาบอดสีในปัจจุบัน แต่ต้องการให้ผู้ที่มีการมองเห็นสีปกติต้องตีความผลลัพธ์และทำการเปลี่ยนแปลงที่จำเป็น การรีแมปสีแบบคงที่ก็ใช้ไม่ได้กับความต้องการเหล่านี้เช่นกัน เนื่องจากวัสดุบางอย่างไม่ได้รักษาความหมายของการรีแมปสี (เช่น กราฟที่อ่านยาก) เราสามารถสร้างวัสดุและเว็บไซต์ที่ปลอดภัยสำหรับตาบอดสีได้โดยอัตโนมัติโดยใช้วิธี neuroAI ที่รักษาความหมายของกราฟิกที่มีอยู่

อีกตัวอย่างหนึ่งคือการช่วยเหลือผู้ที่มีความบกพร่องทางการเรียนรู้ เช่น ผู้ที่มีความบกพร่องทางการเรียนรู้ ซึ่งส่งผลกระทบถึง 10% ของผู้คนทั่วโลก ปัญหาพื้นฐานประการหนึ่งในดิสเล็กเซียคือ ความไวต่อฝูงชนซึ่งเป็นความยากลำบากในการจดจำรูปร่างที่มีคุณลักษณะพื้นฐานที่คล้ายกัน ซึ่งรวมถึงตัวอักษรสมมาตรเหมือนกระจก เช่น p และ q Anne Harrington และ Arturo Deza ที่ MIT กำลังทำงานเกี่ยวกับโมเดล neuroAI ที่จำลองเอฟเฟกต์นี้ และได้ผลลัพธ์ที่น่าพึงพอใจ ลองนึกภาพการนำแบบจำลองของระบบภาพ dyslexic มาออกแบบฟอนต์ที่มีทั้งความสวยงามและอ่านง่าย ด้วยข้อมูลที่ถูกต้องเกี่ยวกับระบบการมองเห็นของบุคคลใดบุคคลหนึ่ง เราจึงสามารถ ปรับแต่งฟอนต์ให้เหมาะกับแต่ละบุคคลซึ่งได้แสดงให้เห็นสัญญาในการปรับปรุงประสิทธิภาพการอ่าน สิ่งเหล่านี้อาจเป็นการพัฒนาคุณภาพชีวิตที่ดีขึ้นอย่างมาก

สุขภาพ

นักประสาทวิทยาหลายคนเข้าสู่วงการด้วยความหวังว่างานวิจัยของพวกเขาจะส่งผลดีต่อสุขภาพของมนุษย์ โดยเฉพาะอย่างยิ่งสำหรับผู้ที่มีปัญหาทางระบบประสาทหรือปัญหาสุขภาพจิต ฉันหวังเป็นอย่างยิ่งว่า neuroAI จะปลดล็อกการรักษาใหม่ๆ ด้วยแบบจำลองที่ดีของสมอง เราสามารถประดิษฐ์สิ่งเร้าที่เหมาะสมได้ เพื่อให้ข้อความที่ถูกต้องไปถึงมัน เหมือนกับกุญแจที่พอดีกับตัวล็อค ในแง่นั้น neuroAI สามารถนำไปใช้กับการออกแบบยาอัลกอริธึมได้ แต่แทนที่จะเป็นโมเลกุลขนาดเล็ก เราให้ภาพและเสียง 

ปัญหาที่เข้าถึงได้มากที่สุดคือตัวรับของตาและหูซึ่งมีลักษณะเฉพาะอยู่แล้ว ผู้คนหลายแสนคนได้รับการปลูกถ่ายประสาทหูเทียม ซึ่งเป็นประสาทเทียมที่กระตุ้นไฟฟ้าของหูในหู ทำให้คนหูหนวกหรือผู้ที่มีปัญหาในการได้ยินได้ยินอีกครั้ง รากฟันเทียมเหล่านี้ซึ่งมีอิเล็กโทรดสองสามโหลอาจใช้งานยากในสภาพแวดล้อมที่มีเสียงดังด้วยลำโพงหลายตัว หุ่นจำลองสมองสามารถ ปรับรูปแบบการกระตุ้นของรากฟันเทียมให้เหมาะสมที่สุด เพื่อขยายคำพูด สิ่งที่น่าทึ่งคือเทคโนโลยีนี้ ซึ่งพัฒนาขึ้นสำหรับผู้ที่มีรากฟันเทียม สามารถปรับเปลี่ยนเพื่อช่วยให้ผู้ที่ไม่มีอุปกรณ์ปลูกถ่ายเข้าใจคำพูดได้ดีขึ้นโดยการปรับเปลี่ยนเสียงแบบเรียลไทม์ ไม่ว่าพวกเขาจะมีความผิดปกติของการประมวลผลการได้ยินหรือบ่อยครั้งในสภาพแวดล้อมที่มีเสียงดัง

หลายคนประสบกับความเปลี่ยนแปลงของระบบประสาทสัมผัสตลอดชีวิต ไม่ว่าจะเป็นการฟื้นตัวจากการผ่าตัดต้อกระจกหรือสายตาสั้นตามอายุ เรารู้ว่าหลังจากการเปลี่ยนแปลงดังกล่าว ผู้คนสามารถเรียนรู้ที่จะตีความโลกใหม่ได้อย่างถูกต้องผ่านการทำซ้ำ ซึ่งเป็นปรากฏการณ์ที่เรียกว่าการเรียนรู้ด้วยการรับรู้ เราอาจสามารถเพิ่มการเรียนรู้ด้วยการรับรู้นี้ให้สูงสุดเพื่อให้ผู้คนสามารถฟื้นทักษะของตนได้เร็วและมีประสิทธิภาพมากขึ้น แนวคิดที่คล้ายกันนี้สามารถช่วยให้ผู้ที่สูญเสียความสามารถในการขยับแขนขาได้อย่างคล่องตัวหลังจากเกิดโรคหลอดเลือดสมอง หากเราสามารถค้นหาลำดับของการเคลื่อนไหวที่ถูกต้องเพื่อเสริมสร้างสมองได้อย่างเหมาะสม เราอาจช่วยให้ผู้รอดชีวิตจากโรคหลอดเลือดสมองกลับมาทำงานได้มากขึ้น เช่น การเดินอย่างลื่นไหลมากขึ้น หรือเพียงแค่ถือถ้วยกาแฟโดยไม่ทำหก นอกเหนือจากการช่วยเหลือผู้คนให้ฟื้นสภาพร่างกายที่สูญเสียไป แนวคิดเดียวกันนี้ยังสามารถช่วยให้คนที่มีสุขภาพแข็งแรงเข้าถึงสมรรถภาพทางประสาทสัมผัสสูงสุด ไม่ว่าจะเป็นผู้เล่นเบสบอล นักธนู หรือนักพยาธิวิทยา

สุดท้ายนี้ เราอาจเห็นว่าแนวคิดเหล่านี้ถูกนำมาใช้ในการรักษาความผิดปกติทางอารมณ์ ฉันไปงานทัศนศิลป์หลายครั้งเพื่อบรรเทาความเบื่อหน่ายในช่วงการระบาดใหญ่ และทำให้อารมณ์ของฉันดีขึ้นอย่างมาก ทัศนศิลป์และดนตรีสามารถยกระดับจิตวิญญาณของเราได้ และเป็นข้อพิสูจน์ว่าเราอาจจะเป็น สามารถให้การรักษาสำหรับความผิดปกติทางอารมณ์ผ่านทางประสาทสัมผัส เรารู้ว่าการควบคุมการทำงานของส่วนต่าง ๆ ของสมองด้วยการกระตุ้นด้วยไฟฟ้าสามารถบรรเทาภาวะซึมเศร้าที่ดื้อต่อการรักษาได้ บางทีการควบคุมการทำงานของสมองทางอ้อมผ่านประสาทสัมผัสก็อาจแสดงผลเช่นเดียวกัน การนำแบบจำลองง่ายๆ ไปใช้ เช่น ผลไม้ห้อยต่ำ ซึ่งส่งผลต่อส่วนต่างๆ ของสมองที่เข้าใจกันดี เราจะสร้างแบบจำลองที่ซับซ้อนมากขึ้นซึ่งสามารถช่วยสุขภาพของมนุษย์ได้ 

เปิดใช้งานแนวโน้มเทคโนโลยี

NeuroAI จะใช้เวลาหลายปีกว่าจะเชื่องและนำไปใช้ในแอปพลิเคชัน และมันจะสกัดกั้นแนวโน้มเทคโนโลยีที่เกิดขึ้นใหม่อื่นๆ ที่นี่ฉันเน้นสองแนวโน้มโดยเฉพาะอย่างยิ่งที่จะทำให้ neuroAI มีประสิทธิภาพมากขึ้น: เติมความเป็นจริง (AR) ซึ่งสามารถกระตุ้นได้อย่างแม่นยำ และส่วนต่อประสานระหว่างสมองกับคอมพิวเตอร์ (BCI) ซึ่งสามารถวัดการทำงานของสมองเพื่อตรวจสอบว่าสิ่งเร้ากระทำการตามที่คาดไว้  

เติมความเป็นจริง

แนวโน้มที่จะทำให้แอปพลิเคชั่น neuroAI มีประสิทธิภาพมากขึ้นคือการนำแว่นตาเสมือนจริงมาใช้ Augmented Reality (AR) มีศักยภาพที่จะกลายเป็นแพลตฟอร์มการคำนวณที่แพร่หลายเพราะ AR ผสานเข้ากับชีวิตประจำวัน

สมมติฐานของ Michael Abrash หัวหน้านักวิทยาศาสตร์ของ Meta Reality Labs คือถ้าคุณสร้างแว่นตา AR ที่มีความสามารถเพียงพอ ทุกคนจะต้องการมัน นั่นหมายถึงการสร้าง แว่นตาระดับโลกที่สามารถสร้างวัตถุเสมือนที่ล็อคโลกได้อย่างต่อเนื่อง; กรอบที่เบาและทันสมัยเหมือนคู่ของ Ray-Bans; และให้พลังวิเศษในชีวิตจริงแก่คุณอย่างความสามารถ โต้ตอบกับผู้คนอย่างเป็นธรรมชาติโดยไม่คำนึงถึงระยะทาง และ เสริมสร้างการได้ยินของคุณ. หากคุณสามารถสร้างสิ่งเหล่านี้ได้ ซึ่งเป็นความท้าทายทางเทคนิคครั้งใหญ่ แว่นตา AR สามารถทำตามวิถีที่เหมือน iPhone ได้ ดังนั้นทุกคนจะมีหนึ่ง (หรือสิ่งที่น่าพิศวง) 5 ปีหลังจากเปิดตัว

เพื่อให้สิ่งนี้เป็นจริง Meta ใช้เวลา ปีที่แล้ว 10 พันล้านดอลลาร์ในการวิจัยและพัฒนาสำหรับ metaverse. แม้ว่าเราจะไม่ทราบแน่ชัดว่า Apple กำลังทำอะไรอยู่ แต่ก็มี สัญญาณที่ชัดเจนว่าพวกเขากำลังทำงานกับแว่นตา AR. ดังนั้นจึงมีการผลักดันอย่างมากในด้านอุปทานเพื่อให้ AR เกิดขึ้น

ซึ่งจะทำให้มีอุปกรณ์แสดงผลที่มีประสิทธิภาพมากกว่าหน้าจอคงที่ในปัจจุบัน ถ้ามัน ตามวิถีของVRในที่สุดก็จะมีการติดตามการมองแบบบูรณาการ นี่จะหมายถึงวิธีการนำเสนอสิ่งเร้าที่มีอยู่อย่างแพร่หลายซึ่งควบคุมได้มากกว่าที่เป็นได้ในปัจจุบัน ซึ่งเป็นความฝันของนักประสาทวิทยา และอุปกรณ์เหล่านี้มีแนวโน้มที่จะมีการใช้งานด้านสุขภาพในวงกว้าง ตามที่ Michael Abrash บอกในปี 2017เช่น การเสริมสร้างการมองเห็นในที่แสงน้อย หรือการช่วยให้ผู้คนสามารถดำเนินชีวิตตามปกติได้แม้จะเสื่อมสภาพก็ตาม

ความสำคัญของ neuroAI นั้นชัดเจน: เราสามารถให้สิ่งเร้าที่ถูกต้องด้วยวิธีที่มีการควบคุมอย่างสูงอย่างต่อเนื่องในชีวิตประจำวัน สิ่งนี้เป็นจริงสำหรับการมองเห็น และอาจไม่ชัดเจนสำหรับการได้ยิน เนื่องจากเราสามารถส่งสัญญาณเสียงเชิงพื้นที่ได้ หมายความว่าเครื่องมือของเราที่จะนำมาซึ่งการบำบัดด้วยระบบประสาท AI สำหรับผู้ที่มีปัญหาทางระบบประสาทหรือสำหรับการปรับปรุงความสามารถในการเข้าถึงจะมีประสิทธิภาพมากขึ้น

BCI

ด้วยจอแสดงผลและลำโพงที่ยอดเยี่ยม เราสามารถควบคุมอินพุตหลักไปยังสมองได้อย่างแม่นยำ ขั้นต่อไปที่มีประสิทธิภาพมากขึ้นในการส่งสิ่งเร้าผ่านประสาทสัมผัสคือการตรวจสอบว่าสมองมีปฏิกิริยาตอบสนองตามที่คาดไว้ผ่านอินเทอร์เฟซสมองและคอมพิวเตอร์แบบอ่านอย่างเดียว (BCI) ดังนั้น เราสามารถวัดผลกระทบของสิ่งเร้าที่มีต่อสมอง และหากไม่เป็นไปตามที่คาดไว้ เราก็สามารถปรับได้ตามนั้นในสิ่งที่เรียกว่าการควบคุมแบบวงปิด 

เพื่อความชัดเจน ฉันไม่ได้พูดถึงวิธีการ BCI เช่น ชิปของ Neuralink หรือเครื่องกระตุ้นสมองส่วนลึกที่เข้าไปในกะโหลกศีรษะ เพียงพอสำหรับวัตถุประสงค์เหล่านี้ในการวัดการทำงานของสมองนอกกะโหลกศีรษะโดยไม่รุกราน ไม่จำเป็นต้องกระตุ้นสมองโดยตรง: แว่นตาและหูฟังคือทั้งหมดที่คุณต้องการเพื่อควบคุมอินพุตส่วนใหญ่ของสมอง

มี BCI แบบอ่านอย่างเดียวที่ไม่รุกรานจำนวนหนึ่งซึ่งทำการค้าในปัจจุบันหรือในไปป์ไลน์ที่สามารถใช้สำหรับการควบคุมแบบวงปิด ตัวอย่างบางส่วน ได้แก่ :

  • EEG Electroencephalography วัดกิจกรรมทางไฟฟ้าของสมองนอกกะโหลกศีรษะ เนื่องจากกะโหลกศีรษะทำหน้าที่เป็นตัวนำปริมาตร EEG จึงมีความละเอียดชั่วขณะสูง แต่มีความละเอียดเชิงพื้นที่ต่ำ ขณะนี้มีการใช้งานของผู้บริโภคที่ จำกัด สำหรับผลิตภัณฑ์การทำสมาธิ (Muse) และแอปพลิเคชัน neuromarketing เฉพาะ ฉันพอใจกับการใช้งานบางอย่างในบริบทของการควบคุมแบบวงปิด EEG สามารถมีพลังมากขึ้นได้มากเมื่อมีการควบคุมสิ่งเร้า เนื่องจากมีความเป็นไปได้ที่จะเชื่อมโยงสิ่งเร้าที่นำเสนอกับสัญญาณ EEG และถอดรหัสสิ่งที่บุคคลนั้นให้ความสนใจ (ทำให้เกิดวิธีการที่เป็นไปได้) อันที่จริง NextMind ซึ่งสร้าง "การคลิกใจ" ตาม EEG ตามศักยภาพที่ปรากฏ โดย Snapซึ่งขณะนี้กำลังผลิตผลิตภัณฑ์ AR OpenBCI คือ การวางแผน เพื่อปล่อยชุดหูฟังที่รวมเซ็นเซอร์ EEG เข้ากับชุดหูฟัง Aero ระดับไฮเอนด์ของ Varjo ฉันจะไม่นับ EEG ออก
  • เอฟเอ็มอาร์ไอ การถ่ายภาพด้วยคลื่นแม่เหล็กไฟฟ้าเชิงหน้าที่วัดการเปลี่ยนแปลงเล็กน้อยของออกซิเจนในเลือดที่เกี่ยวข้องกับการทำงานของระบบประสาท มันช้า พกพาไม่ได้ ต้องใช้ห้องของตัวเองและมีราคาแพงมาก อย่างไรก็ตาม fMRI ยังคงเป็นเทคโนโลยีเดียวที่สามารถอ่านกิจกรรมลึกลงไปในสมองโดยไม่รุกรานด้วยวิธีที่แม่นยำเชิงพื้นที่ มีสองกระบวนทัศน์ที่ค่อนข้างเป็นผู้ใหญ่และเกี่ยวข้องกับการควบคุมระบบประสาทแบบวงปิด ประการแรกคือ biofeedback ที่ใช้ fMRI ฟิลด์ย่อยของ fMRI แสดงให้เห็นว่าผู้คนสามารถปรับการทำงานของสมองได้ด้วยการนำเสนอทางสายตาบนหน้าจอหรือหูฟัง ประการที่สองคือการทำแผนที่เยื่อหุ้มสมองรวมถึงวิธีการเช่นเขตข้อมูลที่เปิดรับประชากรและ การประเมินการเลือก voxel ด้วยคลิปภาพยนตร์ หรือพอดแคสต์ ซึ่งช่วยให้ประเมินว่าส่วนต่างๆ ของสมองตอบสนองต่อสิ่งเร้าทางสายตาและการได้ยินที่แตกต่างกันอย่างไร วิธีการทั้งสองนี้บอกเป็นนัยว่าควรจะประเมินได้ว่าการแทรกแซงของ neuroAI ส่งผลต่อสมองอย่างไรและควบคุมให้มีประสิทธิภาพมากขึ้น
  • FNIRS. การทำงานใกล้อินฟราเรดสเปกโทรสโกปีจะใช้แสงแบบกระจายเพื่อประเมินปริมาตรของเลือดในสมองระหว่างเครื่องส่งและตัวรับ ขึ้นอยู่กับความจริงที่ว่าเลือดมีความทึบและการทำงานของระบบประสาทที่เพิ่มขึ้นทำให้เกิดการไหลเข้าของเลือดล่าช้าในปริมาณสมองที่กำหนด (หลักการเดียวกับ fMRI) NIRS ทั่วไปมีความละเอียดเชิงพื้นที่ต่ำ แต่ด้วย time gating (TD-NIRS) และการสุ่มตัวอย่างมากเกินไป (diffuse optical tomography) ความละเอียดเชิงพื้นที่จะดีกว่ามาก ทางด้านวิชาการนั้น กลุ่มของ Joe Culver ที่WUSTL ได้สาธิตการถอดรหัสภาพยนตร์จาก Visual Cortex ด้านการค้าเคอร์เนลอยู่ในขณะนี้ ผลิตและจัดส่งหูฟัง TD-NIRS ซึ่งเป็นผลงานทางวิศวกรรมที่น่าประทับใจ และเป็นพื้นที่ที่ผู้คนผลักดันและก้าวหน้าอย่างรวดเร็ว กลุ่มเก่าของฉันที่ Meta แสดงให้เห็นถึงการปรับปรุงอัตราส่วนสัญญาณต่อสัญญาณรบกวน 32 เท่า (ซึ่งสามารถปรับขนาดเป็น >300) ในเทคนิคที่เกี่ยวข้อง.
  • เมก. Magnetoencephalography วัดการเปลี่ยนแปลงเล็ก ๆ น้อย ๆ ในสนามแม่เหล็ก ดังนั้นจึงเป็นการจำกัดการทำงานของสมอง MEG คล้ายกับ EEG โดยจะวัดการเปลี่ยนแปลงในสนามแม่เหล็กไฟฟ้า แต่ไม่ได้รับผลกระทบจากการนำปริมาตร ดังนั้นจึงมีความละเอียดเชิงพื้นที่ที่ดีกว่า MEG แบบพกพาที่ไม่ต้องแช่เย็นจะเป็นตัวเปลี่ยนเกมสำหรับ BCI ที่ไม่รุกล้ำ ผู้คนกำลังก้าวหน้าด้วยเครื่องวัดค่าความเข้มข้นของสนามแม่เหล็กแบบออปติคัล และเป็นไปได้ที่จะซื้อเซ็นเซอร์ OPM แยกกันในตลาดเปิด จากผู้ผลิตเช่น QuSpin

นอกเหนือจากเทคนิคที่รู้จักกันดีเหล่านี้แล้ว เทคโนโลยีของม้ามืดบางอย่าง เช่น ดิจิตอลโฮโลแกรม เอกซ์เรย์ภาพและเสียง และอัลตราซาวนด์ที่ใช้งานได้อาจนำไปสู่การเปลี่ยนแปลงกระบวนทัศน์อย่างรวดเร็วในพื้นที่นี้

แม้ว่า BCI ที่ไม่รุกรานระดับผู้บริโภคยังอยู่ในช่วงเริ่มต้น แต่ก็มีแรงกดดันด้านตลาดจำนวนมากเกี่ยวกับกรณีการใช้งาน AR ที่จะทำให้พายมีขนาดใหญ่ขึ้น ปัญหาสำคัญสำหรับ AR คือการควบคุมอุปกรณ์: คุณไม่จำเป็นต้องเดินไปมาพร้อมกับตัวควบคุมหรือพึมพำกับแว่นตาของคุณหากหลีกเลี่ยงได้ บริษัทต่างๆ ค่อนข้างจริงจังในการแก้ปัญหานี้ โดยเห็นได้จากการซื้อ CTRL+Labs . ของ Facebook ใน 2019, Snap เข้าซื้อกิจการ NextMind และ Valve ร่วมมือกับ OpenBCI ดังนั้นเราจึงมีแนวโน้มที่จะเห็น BCI ที่มีมิติต่ำได้รับการพัฒนาอย่างรวดเร็ว BCI แบบมีมิติสูงอาจเป็นไปตามวิถีเดียวกันหากพบแอปนักฆ่าอย่าง AR เป็นไปได้ว่าแอปพลิเคชัน neuroAI ประเภทต่างๆ ที่ฉันสนับสนุนในที่นี้ เป็นกรณีการใช้งานที่ถูกต้องแม่นยำสำหรับเทคโนโลยีนี้

หากเราควบคุมข้อมูลเข้าทางตาและหูรวมทั้งวัดสภาวะของสมองได้อย่างแม่นยำ เราก็สามารถให้การรักษาโดยใช้ระบบประสาท AI ด้วยวิธีที่มีการตรวจสอบเพื่อประสิทธิภาพสูงสุด

สิ่งที่ขาดหายไปจากสนาม

วิทยาศาสตร์หลักที่อยู่เบื้องหลังแอปพลิเคชัน NeuroAI กำลังเติบโตอย่างรวดเร็ว และมีแนวโน้มเชิงบวกหลายประการที่จะเพิ่มการบังคับใช้ทั่วไป แล้วอะไรที่ขาดหายไปในการนำแอพพลิเคชั่น neuroAI ออกสู่ตลาด?

  1. เครื่องมือ ฟิลด์ย่อยอื่นๆ ภายใน AI ได้รับประโยชน์อย่างมากจากกล่องเครื่องมือที่ช่วยให้มีความคืบหน้าอย่างรวดเร็วและแบ่งปันผลลัพธ์ ซึ่งรวมถึงไลบรารีพีชคณิตเทนเซอร์ เช่น Tensorflow และ PyTorch สภาพแวดล้อมการฝึกอบรม เช่น OpenAI Gym และระบบนิเวศเพื่อแชร์ข้อมูลและโมเดล เช่น 🤗 HuggingFace พื้นที่เก็บข้อมูลแบบจำลองและวิธีการแบบรวมศูนย์ เช่นเดียวกับชุดประเมินผล ที่อาจใช้ประโยชน์จากข้อมูลการจำลองจำนวนมาก จะช่วยผลักดันให้ภาคสนามไปข้างหน้า มีชุมชนที่เข้มแข็งขององค์กรประสาทวิทยาศาสตร์แบบโอเพนซอร์สอยู่แล้ว และพวกเขาสามารถทำหน้าที่เป็นโฮสต์ตามธรรมชาติสำหรับความพยายามเหล่านี้
  2. ความสามารถพิเศษ มีสถานที่ไม่กี่แห่งที่การวิจัยและพัฒนาทำที่จุดตัดของประสาทวิทยาศาสตร์และ AI บริเวณอ่าวซึ่งมีห้องปฏิบัติการอยู่ที่สแตนฟอร์ดและเบิร์กลีย์ และพื้นที่รถไฟใต้ดินในบอสตันที่มีห้องทดลองจำนวนมากที่ MIT และฮาร์วาร์ด มีแนวโน้มว่าจะเห็นการลงทุนส่วนใหญ่จากระบบนิเวศของเงินร่วมลงทุนที่มีอยู่ก่อนแล้ว ศูนย์กลางที่สามที่เป็นไปได้คือเมืองมอนทรีออล ประเทศแคนาดา ซึ่งถูกยกขึ้นโดยแผนกประสาทวิทยาขนาดใหญ่ที่ McGill และ Universite de Montreal รวมกับการดึง Mila สถาบันปัญญาประดิษฐ์ที่ก่อตั้งโดย Yoshua Bengio ผู้บุกเบิก AI สาขาของเราจะได้รับประโยชน์จากหลักสูตรปริญญาเอกเฉพาะทางและศูนย์ความเป็นเลิศใน neuroAI เพื่อเริ่มต้นการค้า
  3. รูปแบบการระดมทุนและการค้าใหม่สำหรับการใช้งานทางการแพทย์ การใช้งานทางการแพทย์มีหนทางยาวไกลสู่การค้า และทรัพย์สินทางปัญญาที่ได้รับการคุ้มครองมักจะเป็นข้อกำหนดเบื้องต้นในการขอรับเงินทุนเพื่อลดความเสี่ยงในการลงทุนในเทคโนโลยี นวัตกรรมที่ใช้ AI นั้นยากต่อการจดสิทธิบัตร และซอฟต์แวร์ในฐานะอุปกรณ์การแพทย์ (SaMD) เพิ่งเริ่มออกสู่ตลาด ทำให้เส้นทางสู่การค้าไม่แน่นอน เราต้องการเงินทุนที่มุ่งเน้นการนำ AI และเทคโนโลยีทางการแพทย์มารวมกันเพื่อหล่อเลี้ยงพื้นที่ที่เพิ่งตั้งไข่นี้ 

มาสร้าง neuroAI . กันเถอะ

นักวิทยาศาสตร์และนักปรัชญาต่างงงว่าสมองทำงานอย่างไรมาแต่ไหนแต่ไรแล้ว กระดาษทิชชู่แผ่นบางๆ พื้นที่ XNUMX ตารางฟุต ช่วยให้เรามองเห็น ได้ยิน รู้สึก และคิดได้อย่างไร? NeuroAI ช่วยให้เราจัดการกับคำถามเชิงลึกเหล่านี้โดยการสร้างแบบจำลองของระบบประสาทในคอมพิวเตอร์ โดยการสนองความกระหายความรู้พื้นฐานนั้น - การเป็นมนุษย์หมายความว่าอย่างไร? นักประสาทวิทยากำลังสร้างเครื่องมือที่ช่วยให้ผู้คนหลายล้านมีชีวิตที่ร่ำรวยยิ่งขึ้น

เผยแพร่ 4 สิงหาคม 2022

เทคโนโลยี นวัตกรรม และอนาคต อย่างที่คนสร้างมันบอก

ขอบคุณสำหรับการลงทะเบียน

ตรวจสอบกล่องจดหมายของคุณสำหรับบันทึกต้อนรับ

ประทับเวลา:

เพิ่มเติมจาก Andreessen Horowitz