Когерентные демонстрационные оптические коммутаторы для еще более крупных кластеров искусственного интеллекта

Когерентные демонстрационные оптические коммутаторы для еще более крупных кластеров искусственного интеллекта

Сетевой бизнес Coherent представил оптический коммутатор, предназначенный для поддержки кластеров искусственного интеллекта высокой плотности, на конференции по оптоволоконной связи в понедельник.

Переключатель не похож на те, которые обычно можно встретить в кластерах искусственного интеллекта, поскольку фактическое переключение осуществляется полностью оптически, а не с использованием приемопередатчиков для преобразования фотонов в электроны и обратно. Лазерный свет просто входит в один порт и выходит из другого – конечно, с небольшим ослаблением.

Ассоциация прибор, который планируется начать массово в следующем году, имеет 300 входных и 300 выходных портов и основан на технологии Coherent Datacenter Light Wave Cross Connect. Насколько мы понимаем, он работает, манипулируя жидкокристаллическими ячейками, чтобы контролировать, какая длина волны света куда направляется.

Новейший оптический переключатель Coherent, представленный на выставке OFC, может похвастаться 300 входными и 300 выходными портами.

Новейший оптический переключатель Coherent, представленный на выставке OFC, может похвастаться 300 входными и 300 выходными портами – щелкните, чтобы увеличить

Об этом рассказал аналитик Dell'Oro Group Самех Бужелбене. Регистр что оптические переключатели схем дают несколько преимуществ. Помимо высокой пропускной способности и низкой задержки в сети, коммутаторы этого типа, как правило, менее дороги в эксплуатации, поскольку для них требуется значительно меньше электрических переключателей и оптических приемопередатчиков.

Кроме того, Coherent отмечает, что этот вид оптического переключения, как правило, более надежен – что принесет дивиденды в очень больших кластерах, в которых среднее время наработки на отказ, как правило, довольно низкое.

Это одна из причин, по которой Google разработала собственные оптические переключатели для своих модулей TPUv4. Выступая на конференции Hot Chips в прошлом году, Энди Свинг, технический руководитель группы TPU Google, сказал: объяснены [Видео] о том, что с помощью OCS Google удалось объединить очень большое количество ускорителей.

Эти модули состоят из 64 стоек, каждая из которых содержит 64 тензорных процессора (TPU). Каждая из этих стоек была оптически подключена к одному из коммутаторов OCS, разработанных Google, для создания комплексной сетки.

Свинг объяснил, что этот подход имеет несколько преимуществ, включая возможность динамической перенастройки размера кластера. Во-вторых, все ускорители связаны друг с другом, что повышает надежность — желательное качество, поскольку рабочие нагрузки по обучению могут длиться месяцами в зависимости от количества параметров модели и размера набора данных.

В случае модулей TPUv4 от Google, если один из узлов выйдет из строя, коммутатор можно будет перенастроить, чтобы обойти эту проблему.

Свинг также отметил, что этот подход позволяет использовать различные топологии сети в зависимости от модели. Например, в ходе тестирования Google наблюдал значительное увеличение пропускной способности сети за счет использования топологии витого тора, в которой ускорители объединены в нечто, напоминающее скрученную петлю.

Но хотя новые устройства OCS от Coherent могут позволить другим создавать кластеры с оптической коммутацией, подобные кластерам Google, Бужелбене из Dell Oro отметил, что OCS все еще остается относительно новой технологией в центрах обработки данных.

«Пока только Google, после многих лет разработки, смог внедрить его. в массе в своих сетях центров обработки данных», — сказала она. «Кроме того, коммутаторы OCS могут потребовать изменения установленной базы оптоволокна в зависимости от поставщика облачных услуг». ®

Отметка времени:

Больше от Регистр