APU AMD Instinct MI300A с графическим процессором CDNA 3, процессором Zen 4 и унифицированной памятью обеспечивает ускорение до 4 раз по сравнению с дискретными графическими процессорами в HPC

Май 4, 2024 | Железо и Программы | Нет комментариев

0
(0)
Время чтения 3 минуты

Гибридные процессоры AMD Instinct MI300A обеспечивают существенное улучшение производительности при рабочих нагрузках HPC по сравнению с традиционными дискретными графическими процессорами.

Отойдя от дискретных графических процессоров, APU Instinct MI300A от AMD увеличат производительность высокопроизводительных вычислений до 4 раз.

AMD Instinct MI300A — это реализация платформы Exascale APU, заложенной много лет назад. Идея заключалась в том, чтобы объединить высокопроизводительный графический процессор вместе с высокопроизводительным процессором в одном корпусе, который использует единый пул памяти. Для высокопроизводительных вычислений такие конструкции ускорителей/сопроцессоров обеспечивают более высокую производительность на ватт, но требуют большого количества портирования, настройки и поддержки приложений с миллионами строк кода, что может быть немного сложным. Тем не менее, похоже, что исследователи использовали две популярные модели программирования, OpenMP и OpenACC, чтобы в полной мере использовать мощь гибридного процессора AMD следующего поколения.

В этой исследовательской работе под названием « Портирование приложений HPC на AMD Instinct MI300A с использованием унифицированной памяти и OpenMP » используется платформа OpenFOAM, которая представляет собой библиотеку C++ с открытым исходным кодом:

  • Мы предоставляем схему модели программирования APU и демонстрируем простоту и гибкость переноса кодов на MI300A с помощью OpenMP.
  • Мы разрабатываем наш метод постепенного ускорения производства и широко применяемый в отрасли код — OpenFOAM.

Поскольку ускоритель AMD Instinct MI300A использует унифицированный интерфейс HBM, он устраняет необходимость репликации данных и не требует разделения программирования между пространствами памяти хоста и устройства. Кроме того, пакет программного обеспечения ROCm от AMD обеспечивает дополнительные оптимизации, которые помогают объединить все сегменты APU в один согласованный и гетерогенный пакет. Небольшой обзор APU AMD Instinct MI300A:

  • Первый интегрированный пакет CPU+GPU
  • Нацеленность на рынок экзафлопсных суперкомпьютеров
  • AMD MI300A (интегрированный процессор + графический процессор)
  • 153 миллиарда транзисторов
  • До 24 ядер Zen 4
  • Архитектура графического процессора CDNA 3
  • До 192 ГБ памяти HBM3
  • До 8 чиплетов + 8 стеков памяти (5-нм + 6-нм техпроцесс)
Источник изображения: Архив

В результате производительность получает огромную выгоду. В ходе оценки с использованием теста OpenFOAM HPC для мотоциклов APU AMD Instinct MI300A сравнивался с графическими процессорами AMD Instinct MI210, NVIDIA A100 80 ГБ и NVIDIA H100 (80 ГБ). Графические процессоры AMD работали на стеке ROCm 6.0, а графические процессоры NVIDIA — на стеке CUDA 12.2.2. Тест был настроен на выполнение 20 временных шагов, при этом среднее время выполнения каждого временного шага (в секундах) принималось за показатель качества (FOM). Во всех трех конфигурациях, за исключением Instinct MI300A, использовался дискретный ЦП, поэтому ЦП, подключенный к разъему, был настроен с гетерогенным управлением памятью, чтобы графические процессоры могли обращаться к системной памяти и запускать тест.

Что касается тестов, результаты были нормализованы к системе NVIDIA H100, которая предлагала лучшую производительность дискретного графического процессора среди трех дискретных чипов, но APU Instinct MI300A в итоге показал 4-кратный прирост по сравнению с NVIDIA H100 и 5-кратный прирост по сравнению с ускорителем Instinct MI210. .

  • На графических процессорах более 65 % времени тратится на миграцию страниц: обновление таблиц графических процессоров и копирование данных между хостом и устройством.
  • В APU унифицированная физическая память, совместно используемая ядрами ЦП и вычислительными блоками графического процессора, полностью устраняет накладные расходы на миграцию страниц, что приводит к значительному повышению производительности.
Источник изображения: Архив

Также было обнаружено, что AMD Instinct MI300A с единственным процессором Zen 4 был в два раза быстрее, чем однопроцессорный процессор Zen 4, работающий с дискретным графическим процессором. Перегрузка APU MI300A несколькими процессами дополнительно повысила производительность в 2 раза (тест с 3–6 ядрами ЦП на APU), что намного лучше, чем отсутствие масштабируемости в конфигурации dGPU+dCPU.

В результате похоже, что вычислительные возможности APU AMD Instinct MI300A не имеют себе равных в сегменте высокопроизводительных вычислений. NVIDIA отошла от традиционной производительности HPC в своей линейке Blackwell следующего поколения, поскольку искусственный интеллект, похоже, является основным увлечением в наши дни, и хотя AMD собирается решить эту проблему с помощью своих ускорителей MI300X и своих будущих обновлений , это похоже на сегмент HPC. выведет AMD на первый план.

Насколько публикация полезна?

Нажмите на звезду, чтобы оценить!

Средняя оценка 0 / 5. Количество оценок: 0

Оценок пока нет. Поставьте оценку первым.

Подпишитесь на нашу рассылку

AliExpress WW

0 Комментариев

Оставить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

 

Не копируйте текст!