Некоторые нейронные сети изучают язык так же, как люди | Журнал Кванта

Некоторые нейронные сети изучают язык так же, как люди | Журнал Кванта

Некоторые нейронные сети изучают язык, как люди | Журнал Quanta PlatoРазведка данных на основе блокчейна. Вертикальный поиск. Ай.

Введение

Как мозги учатся? Это загадка, которая относится как к губчатым органам в наших черепах, так и к их цифровым аналогам в наших машинах. Несмотря на то, что искусственные нейронные сети (ИНС) построены из сложной паутины искусственных нейронов, якобы имитирующих то, как наш мозг обрабатывает информацию, мы не знаем, обрабатывают ли они входные данные аналогичным образом.   

«Давно ведутся споры о том, учатся ли нейронные сети так же, как люди», — сказал он. Всеволод Капацинский, лингвист из Орегонского университета.

Теперь исследование опубликованный в прошлом месяце предполагает, что естественные и искусственные сети учатся одинаково, по крайней мере, когда дело доходит до языка. Исследователи во главе с Гашпер Бегуш, вычислительный лингвист из Калифорнийского университета в Беркли, сравнил мозговые волны людей, слушающих простой звук, с сигналом, создаваемым нейронной сетью, анализирующей тот же звук. Результаты оказались поразительно похожими. «Насколько нам известно, — писали Бегуш и его коллеги, — наблюдаемые ответы на один и тот же стимул «являются наиболее похожими сигналами мозга и ИНС, о которых сообщалось до сих пор».

Что наиболее важно, исследователи протестировали сети, состоящие из нейронов общего назначения, которые подходят для различных задач. «Они показывают, что даже очень, очень общие сети, которые не имеют каких-либо эволюционных предубеждений в отношении речи или каких-либо других звуков, тем не менее демонстрируют соответствие человеческому нейронному кодированию», — сказал он. Гэри Лупьян, психолог из Висконсинского университета в Мэдисоне, который не участвовал в работе. Результаты не только помогают демистифицировать то, как ИНС обучаются, но также предполагают, что человеческий мозг, возможно, еще не оснащен аппаратным и программным обеспечением, специально разработанным для языка.

Чтобы установить базовый уровень для человеческой стороны сравнения, исследователи воспроизвели один слог — «ба» — несколько раз в двух восьмиминутных блоках для 14 говорящих по-английски и 15 по-испански. Во время воспроизведения исследователи зафиксировали колебания средней электрической активности нейронов в стволе мозга каждого слушателя — той части мозга, где сначала обрабатываются звуки.

Кроме того, исследователи скармливали одни и те же звуки «ба» двум разным наборам нейронных сетей — один обучался на английских звуках, другой — на испанских. Затем исследователи записали активность обработки нейронной сети, сосредоточив внимание на искусственных нейронах в слое сети, где сначала анализируются звуки (чтобы отразить показания ствола мозга). Именно эти сигналы очень точно соответствовали волнам человеческого мозга.

Исследователи выбрали тип архитектуры нейронной сети, известный как генеративно-состязательная сеть (GAN), первоначально изобретенный в 2014 году для генерации изображений. GAN состоит из двух нейронных сетей — дискриминатора и генератора, которые конкурируют друг с другом. Генератор создает образец, который может быть изображением или звуком. Дискриминатор определяет, насколько он близок к обучающей выборке, и предлагает обратную связь, что приводит к еще одной попытке генератора и так далее, пока GAN не сможет предоставить желаемый результат..

В этом исследовании дискриминатор изначально обучался на наборе английских или испанских звуков. Затем генератор, который никогда не слышал этих звуков, должен был найти способ их производить. Сначала он издавал случайные звуки, но после примерно 40,000 XNUMX циклов взаимодействия с дискриминатором генератор стал лучше и в конечном итоге стал производить правильные звуки. В результате такого обучения дискриминатор также стал лучше различать настоящие и сгенерированные.

Именно в этот момент, после того как дискриминатор был полностью обучен, исследователи воспроизвели на нем звуки «ба». Команда измерила колебания среднего уровня активности искусственных нейронов дискриминатора, которые генерировали сигнал, столь похожий на волны человеческого мозга.

Это сходство между уровнями активности человека и машины позволяет предположить, что обе системы выполняют схожие действия. «Точно так же, как исследования показали, что обратная связь от лиц, осуществляющих уход, формирует производство звуков младенцами, обратная связь от сети дискриминаторов формирует производство звуков генераторной сетью», — сказал Капацински, который не принимал участия в исследовании.

Эксперимент также выявил еще одну интересную параллель между людьми и машинами. Мозговые волны показали, что англо- и испаноязычные участники слышали звук «бах» по-разному (испаноязычные слышали больше «тьфу»), а сигналы GAN также показали, что обученная английскому языку сеть обрабатывала звуки несколько иначе, чем обученный испанцем.

«И эти различия работают в одном направлении», — пояснил Бегуш. Ствол мозга носителей английского языка реагирует на звук «ба» немного раньше, чем ствол мозга носителей испанского языка, а GAN, обученный английскому языку, реагировал на тот же звук немного раньше, чем модель, обученная испанскому языку. И у людей, и у машин разница во времени была почти одинаковой, примерно тысячная доля секунды. По словам Бегуша, это предоставило дополнительные доказательства того, что люди и искусственные сети «вероятно, обрабатывают вещи аналогичным образом».

Введение

Хотя до сих пор неясно, как именно мозг обрабатывает и изучает язык, лингвист Ноам Хомский предположил в 1950-х годах, что люди рождаются с врожденной и уникальной способностью понимать язык. Эта способность, утверждал Хомский, буквально встроена в человеческий мозг.

Новая работа, в которой используются нейроны общего назначения, не предназначенные для языка, предполагает обратное. «Документ определенно предоставляет доказательства против представления о том, что речь требует специальных встроенных механизмов и других отличительных особенностей», — сказал Капацинский.

Бегуш признает, что этот спор еще не урегулирован. Тем временем он продолжает исследовать параллели между человеческим мозгом и нейронными сетями, проверяя, например, соответствуют ли мозговые волны, исходящие из коры головного мозга (которая осуществляет слуховую обработку после того, как ствол мозга выполнил свою часть работы), сигналам, производимым более глубокими слоев ГАН.

В конечном счете, Бегуш и его команда надеются разработать надежную модель овладения языком, которая описывает, как машины и люди изучают языки, что позволит проводить эксперименты, которые были бы невозможны с людьми. «Мы могли бы, например, создать неблагоприятную среду [подобную той, что наблюдается с заброшенными младенцами] и посмотреть, не приведет ли это к чему-то, напоминающему языковые расстройства», — сказал он. Кристина Чжао, нейробиолог из Вашингтонского университета, написавший новую статью в соавторстве с Бегушем и Алан Чжоу, докторант Университета Джонса Хопкинса.

«Сейчас мы пытаемся понять, как далеко мы можем зайти, насколько близко к человеческому языку мы сможем приблизиться с помощью нейронов общего назначения», — сказал Бегуш. «Можем ли мы достичь человеческого уровня производительности с имеющимися у нас вычислительными архитектурами — просто сделав наши системы больше и мощнее — или это никогда не будет возможно?» Хотя необходима дополнительная работа, прежде чем мы сможем узнать наверняка, сказал он, «даже на этом относительно раннем этапе мы удивлены тем, насколько похожей является внутренняя работа этих систем — человека и ИНС».

Отметка времени:

Больше от Квантовый журнал