Послідовні демонстраційні оптичні перемикачі для ще більших кластерів ШІ

Послідовні демонстраційні оптичні перемикачі для ще більших кластерів ШІ

Мережевий бізнес Coherent представив перемикач оптичних схем, призначений для підтримки кластерів штучного інтелекту високої щільності на конференції з оптичних комунікацій у понеділок.

Перемикач не схожий на ті, які ви зазвичай можете знайти в кластерах штучного інтелекту, оскільки фактичне перемикання обробляється повністю оптично, а не за допомогою приймачів для перетворення фотонів в електрони і назад. Лазерне світло просто входить в один порт і виходить з іншого – звичайно, з невеликим ослабленням.

Команда прилад, який планується випустити наступного року, має 300 вхідних і 300 вихідних портів і базується на технології перехресного з’єднання Light Wave від Coherent. Як ми розуміємо, він працює шляхом маніпулювання рідкокристалічними комірками, щоб контролювати, яка довжина хвилі світла куди йде.

Останній комутатор оптичної схеми Coherent, представлений на OFC, може похвалитися 300 вхідними та 300 вихідними портами.

Останній перемикач оптичної схеми Coherent, представлений на OFC, має 300 вхідних і 300 вихідних портів – Натисніть, щоб збільшити

Про це заявив аналітик Dell'Oro Group Саме Буджелбене Реєстр що перемикачі оптичних схем пропонують декілька переваг. На додаток до високої пропускної здатності та низької затримки мережі, комутатори цього типу, як правило, менш дорогі в експлуатації, оскільки вони потребують значно менше електричних комутаторів і оптичних трансиверів.

Крім того, Coherent зазначає, що цей вид оптичного перемикання, як правило, більш надійний – те, що принесе дивіденди в дуже великих кластерах, у яких середній час до відмови, як правило, досить низький.

Це одна з причин, чому Google розробив власні перемикачі оптичних схем для своїх модулів TPUv4. Виступаючи на Hot Chips минулого року, Енді Свінг, технічний керівник групи TPU Google, пояснені [Відео], що за допомогою OCS Google зміг поєднати дуже велику кількість прискорювачів.

Ці модулі складаються з 64 стійок, кожна з яких містить 64 модулі обробки тензорів (TPU). Кожна з цих стійок була під’єднана оптичним шляхом до одного з перемикачів OCS, розроблених компанією Google, для сітки «все-до-всіх».

Swing пояснив, що цей підхід має декілька переваг, зокрема можливість динамічно змінювати розмір кластера. Інший полягає в тому, що всі прискорювачі підключені один до одного, що підвищує надійність – бажана якість, оскільки навчальні навантаження можуть тривати місяцями залежно від кількості параметрів моделі та розміру набору даних.

У випадку модулів Google TPUv4, якщо один із вузлів вийде з ладу, комутатор можна буде переналаштувати, щоб вирішити цю проблему.

Свінг також зазначив, що цей підхід дозволяє використовувати різні топології мережі залежно від моделі. Наприклад, під час тестування Google побачив значне збільшення пропускної здатності мережі за допомогою топології скручений тор, у якій прискорювачі об’єднані разом у щось, що нагадує кручену петлю.

Але хоча нові пристрої Coherent OCS можуть дозволити іншим створювати кластери з оптичною комутацією, подібні до кластерів Google, Boujelbene з Dell Oro зазначив, що OCS все ще є відносно новою технологією в центрі обробки даних.

«Поки що тільки Google, після багатьох років розробки, зміг розгорнути його в масі у своїх мережах центрів обробки даних», – сказала вона. «Крім того, для комутаторів OCS може знадобитися зміна встановленої бази оптоволокна залежно від постачальника хмарних послуг». ®

Часова мітка:

Більше від Реєстр