Роль ЦП в устойчивом искусственном интеллекте и машинном обучении

Роль ЦП в устойчивом искусственном интеллекте и машинном обучении

Роль ЦП в устойчивом анализе данных PlatoBlockchain с использованием искусственного интеллекта и машинного обучения. Вертикальный поиск. Ай.

объявление о По мере того как ИИ расширяет свое влияние на бизнес-вычислительные среды, его влияние вызывает некоторые непредвиденные побочные эффекты. последние новости IDC FutureScape В отчете, например, прогнозируется, что по мере того, как компании стремятся представить продукты/услуги, улучшенные искусственным интеллектом, и помочь своим клиентам во внедрении искусственного интеллекта, эта технология станет ключевым фактором мотивации для инноваций.

Еще одно изменение, вызванное искусственным интеллектом, связано с тем, в какой степени центрам обработки данных, возможно, придется сбалансировать процессоры с дискретными ускорителями искусственного интеллекта, такими как графические процессоры или специализированные архитектуры, чтобы обеспечить высокопроизводительные вычислительные возможности, которые нужны разработчикам искусственного интеллекта.

Это дискуссия, которая поднимает важные вопросы для владельцев центров обработки данных, как с точки зрения дополнительных капитальных вложений, так и с вероятностью того, что (хотя методы измерения неточны) типичные операции ИИ на основе графического процессора потребляют больше энергии, чем обычные ИТ-рабочие нагрузки.

Борьба с более высокими затратами на электроэнергию и выбросы углекислого газа в результате искусственного интеллекта является дополнительной проблемой для операций центров обработки данных, которые также должны гарантировать, что обновленные вычислительные архитектуры, оптимизированные для искусственного интеллекта, могут справляться с возросшими потребностями в мощности без риска перегрузки существующих технологий или объектов.

Поскольку расширенное регулирование в области управления устойчивым развитием и управления выбросами углерода подталкивает операции по снижению энергопотребления во всем спектре ИТ-оборудования и программного обеспечения, ИИ представляет собой как возможность, так и препятствие.

Снижение энергопотребления ИИ

В совокупности повышенное энергопотребление и необходимые архитектурные реконфигурации, необходимые для размещения рабочих нагрузок искусственного интеллекта и машинного обучения, представляют собой непреодолимую проблему для центров обработки данных, объясняет Стефан Гиллих, директор по искусственному интеллекту GTM в Центре передового опыта Intel в области искусственного интеллекта.

«Совершенно очевидно, что в вертикальных секторах и отраслях, где бы ни разрабатывались, обучались и запускались приложения и услуги искусственного интеллекта/машинного обучения, возможности локальных и облачных ИТ-сред должны будут подвергнуться модернизации, чтобы справиться с растущими объемами данных. — интенсивные рабочие нагрузки», — говорит Гиллих. «Также очевидно, что эти обновления должны повлечь за собой нечто большее, чем просто увеличение вычислительных возможностей».

По мнению Гиллиха, многое можно сделать для повышения устойчивости центров обработки данных, ориентированных на искусственный интеллект, начиная с переоценки некоторых предположений, касающихся ландшафта искусственного интеллекта и машинного обучения. Процессоры — хорошее начало, особенно при принятии решения о том, какие процессоры или графические процессоры лучше подходят для этой задачи.

Потому что, хотя рабочие нагрузки, связанные с интенсивными вычислениями в области ИИ, похоже, растут (никто точно не знает, какими темпами), основная часть работы центров обработки данных (рабочие нагрузки, не связанные с ИИ) должна продолжать работать изо дня в день, обеспечивая стабильную работу приложений. и потоки доходов от услуг не должны быть нарушены.

Большинство из них в настоящее время обрабатываются центральными процессорами, и переоснащение стандартного центра обработки данных более дорогими графическими процессорами для очень многих объектов будет излишним. В общих чертах, графический процессор потребляет больше мощности, чем центральный процессор, для выполнения аналогичной задачи. В зависимости от источника питания для конкретной конфигурации стойки интеграция графических процессоров в инфраструктуру центра обработки данных требует, например, модернизации систем распределения питания, что неизбежно повлечет за собой дополнительные первоначальные затраты, а также более высокие счета за электроэнергию после их запуска.

Более того, разработка процессоров Intel продолжает быть инновационной. В различных сценариях использования можно доказать, что ЦП обеспечивает такую ​​же хорошую, а иногда и лучшую общую производительность, чем графический процессор, утверждает Гиллих. Их производительность можно повысить с помощью революционных технологий, таких как Intel® AMX (Advanced Matrix Extensions) — ускоритель, встроенный в процессоры Intel Xeon 4-го поколения.

«Процессоры Intel Xeon могут позволить центрам обработки данных масштабировать внедрение искусственного интеллекта за счет встроенного ускорения искусственного интеллекта, которое повышает производительность процессора для машинного обучения, обучения и вывода», — отмечает Гиллих. «Таким образом, они могут использовать дискретные ускорители, чтобы минимизировать капитальные затраты и максимизировать производительность, одновременно используя существующие вычислительные среды Intel Xeon».

Необходимо смешивать рабочие нагрузки с искусственным и неискусственным интеллектом.

Intel AMX — это выделенный аппаратный блок на ядре масштабируемого процессора Intel Xeon, который позволяет рабочим нагрузкам искусственного интеллекта выполняться на ЦП, а не перегружать их на дискретный ускоритель, обеспечивая значительный прирост производительности. Он подходит для рабочих нагрузок искусственного интеллекта, таких как рекомендательные системы машинного обучения, распознавание изображений и обработка естественного языка, которые основаны на матричной математике.

Еще одним аргументом в пользу расширенных ЦП является то, что они предоставляют операторам центров обработки данных экономически эффективный способ более эффективно использовать существующие ресурсы ЦП, обеспечить будущую безопасность своих активов, чтобы они могли выполнять смешанные рабочие нагрузки, и дать им возможность лучше контролировать общее энергопотребление.

Это, в свою очередь, может помочь поставщикам услуг центров обработки данных (и их клиентам) достичь целей устойчивого развития и обеспечить преимущество для разработчиков программного обеспечения (корпоративных или сторонних), которые ищут оптимизированную платформу для демонстрации энергоэффективности своего кода. выходы.

«Реальность такова, что вместо того, чтобы спешить с возможностями, которые могут сулить рабочие нагрузки ИИ, операторы центров обработки данных понимают, что им следует учитывать ряд императивов, которые обусловлены как коммерческими интересами, так и технологическими решениями», — говорит Гиллих.

Эти императивы могут включать: интеграцию рабочих нагрузок ИИ с рабочими нагрузками, не связанными с ИИ; интеграция различных аппаратных и программных стеков; и поскольку они хотят гарантировать, что у них есть архитектура, подходящая для множества различных рабочих нагрузок, интеграция различных типов рабочих потоков.

«Эти вопросы указывают на сложные проблемы, поскольку их правильное решение влияет на оптимальную технологическую и энергоэффективность – поскольку энергоэффективность теперь является основным эталоном производительности, который будет все больше влиять на коммерческую жизнеспособность центров обработки данных», — говорит Гиллих. «Итак, еще раз, это имеет первостепенное значение».

С точки зрения Гиллиха, ключом к адаптации к этой возникающей реальности является поэтапный процесс, который можно назвать «ассимиляцией ИИ». Первый момент заключается в том, что рабочие нагрузки ИИ не отделены от других типов рабочих нагрузок — они будут интегрированы в обычные рабочие нагрузки, а не запускаться отдельно.

Гиллих приводит видеоконференции в качестве примера такой поэтапной интеграции: «Уже при потоковой передаче стандартного аудио/видео трафика через стандартные приложения искусственный интеллект интегрируется для выполнения сопутствующих задач, таких как обобщение, перевод, транскрипция. Такие функции очень хорошо поддерживаются ИИ.

Комплексная экономия энергии

Достижение энергоэффективности должно быть поистине комплексной стратегической задачей, утверждает Гиллих. «Он охватывает как программную часть, так и аппаратную архитектуру – полный механизм, обеспечивающий выполнение определенного рабочего процесса. Где хранятся данные, чтобы сделать доступ наиболее эффективным – с точки зрения вычислений и, следовательно, с точки зрения энергопотребления – является ли это лучшим местом для энергоэффективности?»

Другой фактор, который следует учитывать при этой оценке, — это определить, где выполняется рабочая нагрузка. Например, работает ли он на клиентах (например, на компьютерах с искусственным интеллектом, оснащенных процессорами Intel Core Ultra, а не на серверах в центре обработки данных? Могут ли некоторые из этих рабочих нагрузок искусственного интеллекта действительно выполняться на клиентах (наряду с серверами)?

Каждый вариант достоин рассмотрения, если он поможет лучше сбалансировать баланс ИИ-вычислений и энергопотребления, утверждает Гиллих: «Это почти как возврат к идее старой школы распределенных вычислений».

Гиллих добавляет: «Иногда наши клиенты спрашивают: «Где будет играть ИИ?» – ответ в том, что ИИ будет играть везде. Поэтому в Intel наши амбиции сосредоточены на том, что можно было бы назвать универсальным внедрением ИИ, поскольку мы считаем, что он найдет применение во всех областях применения».

В Intel это включает в себя промежуточное программное обеспечение, такое как API, которое, как и любая другая часть стека программного обеспечения, должно быть максимально эффективным. «Разрастание API» может привести к ненужной обработке, минимизации нагрузки на инфраструктуру и отсутствию мониторинга и контроля.

Intel OneAPI, предприятия могут реализовать всю ценность своего оборудования, разработать высокопроизводительный межархитектурный код и подготовить свои приложения к будущим потребностям», — объясняет Гиллих.

«Intel oneAPI — это открытая, межотраслевая, основанная на стандартах, унифицированная, мультиархитектурная и мультивендорная модель программирования, которая обеспечивает единый интерфейс разработки для всех архитектур ускорителей — для повышения производительности приложений и производительности. Инициатива oneAPI поощряет сотрудничество по спецификации oneAPI и совместимым реализациям oneAPI во всей экосистеме».

Гиллих добавляет: «oneAPI предоставляет стек промежуточного программного обеспечения, который берет стандартные вещи, такие как AI Frameworks — например, Pytorch или TensorFlow [программная платформа с открытым исходным кодом для искусственного интеллекта и машинного обучения] — и транслирует их на машинном уровне, а oneAPI обеспечивает эффективный способ сделай это. Пользователи могут использовать общий API на уровне платформы Ai, и у нас есть API (oneAPI), который подходит для различных вариантов оборудования». Таким образом, общий API означает, что пользователи могут создавать открытое программное обеспечение, которое может поддерживаться открытым программным стеком.

Производительность на уровне графического процессора по ценам на уровне процессора

Прогресс в сфере ИТ во многом обусловлен ожиданием непрерывного технологического прогресса в сочетании с улучшениями в стратегиях развертывания, основанными на знаниях. Эта модель основана на поиске наилучшего достижимого баланса между бюджетными расходами и рентабельностью инвестиций в бизнес, а также на ожидании того, что всегда есть к чему стремиться. ИИ представляет собой апогей этого идеала – он достаточно умен, чтобы заново изобрести собственное ценностное предложение посредством постоянного самосовершенствования.

Встраивая ускоритель AMX в свои процессоры Intel Xeon 4-го поколения, Intel показывает, как можно достичь производительности на уровне графического процессора при ценах на уровне процессора. Это позволяет центрам обработки данных масштабироваться, максимизируя отдачу от существующих вычислительных мощностей на базе Intel Xeon, а также обеспечивает модель ценообразования, которая снижает стоимость входа для клиентов с рабочими нагрузками ИИ, но с ограниченным бюджетом.

А более низкое энергопотребление процессоров означает, что энергоэффективность может быть достигнута комплексно во всех операциях центра обработки данных, таких как охлаждение и вентиляция, и это еще один выигрышный момент для архитекторов программного обеспечения и разработчиков решений AL, заботящихся об устойчивом развитии.

Предоставлено Intel.

Отметка времени:

Больше от Регистр