NVIDIA представила свое новейшее решение Blackwell GB200 NVL4 с четырьмя графическими процессорами и двумя графическими процессорами, объединенными в одно мощное решение для высокопроизводительных вычислений и искусственного интеллекта.
NVIDIA ускоряет развитие искусственного интеллекта с помощью мощных аппаратных решений: Blackwell GB200 NVL4 и Hopper H200 NVL
В рамках своих анонсов SC24 NVIDIA представляет две совершенно новые аппаратные платформы, одна из которых основана на ее существующем стеке Hopper, а другая — на ее новейшем стеке Blackwell. Эти два решения предназначены для корпоративных серверов, обеспечивая ускоренные рабочие нагрузки HPC и AI.
Начиная с NVIDIA H200 NVL , компания теперь подтверждает общую доступность этих карт Hopper на базе PCIe, которые могут подключать до 4 графических процессоров через домен NVLINK, предлагая в семь раз более высокую пропускную способность, чем стандартное решение PCIe. Компания заявляет, что решения H200 NVL могут вписаться в любой центр обработки данных и предлагают ряд гибких конфигураций серверов, оптимизированных для гибридных рабочих нагрузок HPC и ИИ.
Что касается спецификаций, решение Hopper H200 NVL предлагает в 1,5 раза больше памяти HBM, в 1,7 раза больше производительности вывода LLM и в 1,3 раза больше производительности HPC. Вы получаете 114 SM с общим количеством ядер CUDA 14 592, 456 тензорных ядер и производительностью до 3 TFLOPs FP8 (FP16 накопленной). Графический процессор оснащен 80 Гб памяти HBM2e, настроенной через 5120-битный интерфейс, и имеет TDP 350 Вт.
Переходя к Blackwell, мы впервые демонстрируем NVIDIA GB200 NVL4, который является совершенно новым модулем, являющимся своего рода большим расширением оригинального решения GB200 Grace Blackwell Superchip AI. Модуль GB200 NVL4 удваивает возможности CPU и GPU, а также добавляет увеличенную память.
Вы получаете два графических процессора Blackwell GB200, сконфигурированных на более крупной плате с двумя процессорами Grace. Модуль разработан как односерверное решение с доменом NVLINK из 4 графических процессоров и 1,3 ТБ когерентной памяти. С точки зрения производительности модуль обеспечит улучшение моделирования в 2,2 раза и повышение производительности обучения и вывода в 1,8 раза. Растущий список партнеров NVIDIA предложит решение NVL4 в ближайшие месяцы.
Что касается TDP, то поскольку модуль Superchip составляет около 2700 Вт, можно ожидать, что более крупное решение GB200 NVL4 будет потреблять около 6 кВт мощности. Легко увидеть усилия, предпринимаемые NVIDIA для ускорения сегмента вычислений ИИ.
Недавно компания опубликовала мировые рекорды в MLPerf v4.1, как в обучении , так и в выводе , и дело не только в том, что Blackwell потрясающий, но и в том, что Hopper становится еще лучше с постоянной оптимизацией. Компания также ускоряет свою дорожную карту ИИ до годового цикла с несколькими новыми инфраструктурами, запланированными на ближайшие годы, такими как Blackwell Ultra и Rubin .