Site icon compsnews.ru

Графический процессор NVIDIA GeForce RTX 5090 будет оснащен массивным монолитным кристаллом GB202 «Blackwell»

Время чтения 2 минуты

Флагманский графический процессор NVIDIA GeForce RTX 5090 будет оснащен массивным и монолитным кристаллом GB202 «Blackwell», сообщает Kopite7kimi .

Флагман NVIDIA GeForce RTX 5090 будет оснащен монолитным кристаллом GB202 «Blackwell», но здесь может быть некая особенность

Судя по тому, что нам известно на данный момент, графический процессор NVIDIA GB202 «Blackwell» будет работать на флагманской видеокарте GeForce RTX 5090. Предварительные спецификации выявили до 192 модулей SM, которые будут иметь до 24 567 ядер CUDA, если чип сохранит 128 ядер на дизайн SM от чипов AD102 «Ada». Теперь, основываясь на новом твите инсайдера Kopite7kimi, выяснилось, что графический процессор будет использовать монолитную конструкцию.

Хотя NVIDIA перешла на чиплетную конструкцию для своих чипов HPC/AI, таких как B100 и B200, похоже, что компания по-прежнему хочет сохранить монолитные корпуса для своих ориентированных на потребителя кристаллов графических процессоров. Говорят, что графический процессор GB202 «Blackwell» будет физически монолитным по конструкции, и из более ранних отчетов мы знаем, что ожидается, что он будет иметь вдвое больше SM и ядер, чем GB203, что является более урезанным кристаллом для подобных устройств. GeForce RTX 5080. Это создаст огромную разницу в производительности между двумя картами, но RTX 5090 выглядит настоящим зверем.

Подробнее о NVIDIA GeForce RTX 5090 мы поговорим чуть позже, но перед этим давайте поговорим подробнее о самом графическом процессоре GB202 «Blackwell». Таким образом, похоже, что мы рассматриваем монолитную конструкцию, но мы также не можем исключить возможность наличия под капотом конструкции в стиле чиплета.

По сути, NVIDIA может упаковать два кристалла GB203 в монолитный корпус, не делая его похожим на дизайн чиплета. Это позволит улучшить связь между кристаллами, а не узкие места связи между кристаллами, связанные с правильной реализацией чиплетов. Хотя у NVIDIA есть решения для преодоления узких мест, такие как NVLINK и другие межсоединения, они могут оказаться немного дороже, поскольку усложняют графический процессор.

У NVIDIA уже есть решение, которое уже представлено на рынке в виде GA100 и GH100, которые, по сути, представляют собой две половинки меньшего кристалла, соединенные межкомпонентным соединением и обменивающиеся данными через разделенный кэш L2. Брайан Катандзаро из NVIDIA объяснил, что эта реализация улучшает масштабируемость, и первоначальный переход к этому дизайну прошел гладко. Ожидается, что чип будет основан на технологическом узле TSMC 4NP (5 нм), который повышает плотность на 30% (транзистор), так что, помимо архитектурного обновления, это также должно принести хорошие улучшения.

Теперь NVIDIA, вероятно, собирается сделать то же самое в игровой части, а это означает, что если все это окупится, то в будущем мы сможем увидеть предложение чиплетов в стиле B100/B200.

Теперь вернемся к NVIDIA GeForce RTX 5090: уже есть множество сообщений о том, что мы можем получить 512-битный интерфейс на флагмане следующего поколения, и уже есть информация о совершенно новом решении для охлаждения и печатной платы для этого монстра карта.

Учитывая, что слухи предполагают, что AMD выйдет из сегмента сверхвысокой производительности графики со своей линейкой RDNA 4 , похоже, что NVIDIA может еще больше укрепить свое лидерство в игровом сегменте с графическими процессорами Blackwell, когда они выйдут на рынок. Ожидается , что NVIDIA GeForce RTX 5090 будет выпущена через несколько недель после RTX 5080, который, по слухам, станет первым игровым графическим процессором Blackwell на полках магазинов.

Спецификации графического процессора NVIDIA Blackwell GB202 «Предварительные»:

ИМЯ ГРАФИЧЕСКОГО ПРОЦЕССОРАГБ202AD102
ГПХ12 (на каждый графический процессор)?12 (на каждый графический процессор)
ТПК8 (по ГПХ)?6 (на ГПХ)
СМ2 (на TPC)?2 (на каждый TPC)
Всего СМС192?144
Подядроподлежит уточнению4 (за каждый SM)
ФП32128 (за СМ)?128 (за см)
ФП32+INT32подлежит уточнению128 (за см)
Ядра CUDA24 567?18 432
Искаженияподлежит уточнению64 (за каждый SM)
Потокиподлежит уточнению2048 (за СМ)
Кэш L1подлежит уточнению192 КБ (на SM)
Кэш L2подлежит уточнению96 МБ (на каждый графический процессор)
РОПподлежит уточнению32 (по ГПХ)
Стандарт памятиГДДР7GDDR6X
Макс. шина памяти512-битный384-битный
Максимальный объем памяти48 ГБ?24 ГБ
Exit mobile version