Флагманский графический процессор NVIDIA GeForce RTX 5090 будет оснащен массивным и монолитным кристаллом GB202 «Blackwell», сообщает Kopite7kimi .
Флагман NVIDIA GeForce RTX 5090 будет оснащен монолитным кристаллом GB202 «Blackwell», но здесь может быть некая особенность
Судя по тому, что нам известно на данный момент, графический процессор NVIDIA GB202 «Blackwell» будет работать на флагманской видеокарте GeForce RTX 5090. Предварительные спецификации выявили до 192 модулей SM, которые будут иметь до 24 567 ядер CUDA, если чип сохранит 128 ядер на дизайн SM от чипов AD102 «Ada». Теперь, основываясь на новом твите инсайдера Kopite7kimi, выяснилось, что графический процессор будет использовать монолитную конструкцию.
Хотя NVIDIA перешла на чиплетную конструкцию для своих чипов HPC/AI, таких как B100 и B200, похоже, что компания по-прежнему хочет сохранить монолитные корпуса для своих ориентированных на потребителя кристаллов графических процессоров. Говорят, что графический процессор GB202 «Blackwell» будет физически монолитным по конструкции, и из более ранних отчетов мы знаем, что ожидается, что он будет иметь вдвое больше SM и ядер, чем GB203, что является более урезанным кристаллом для подобных устройств. GeForce RTX 5080. Это создаст огромную разницу в производительности между двумя картами, но RTX 5090 выглядит настоящим зверем.
Подробнее о NVIDIA GeForce RTX 5090 мы поговорим чуть позже, но перед этим давайте поговорим подробнее о самом графическом процессоре GB202 «Blackwell». Таким образом, похоже, что мы рассматриваем монолитную конструкцию, но мы также не можем исключить возможность наличия под капотом конструкции в стиле чиплета.
По сути, NVIDIA может упаковать два кристалла GB203 в монолитный корпус, не делая его похожим на дизайн чиплета. Это позволит улучшить связь между кристаллами, а не узкие места связи между кристаллами, связанные с правильной реализацией чиплетов. Хотя у NVIDIA есть решения для преодоления узких мест, такие как NVLINK и другие межсоединения, они могут оказаться немного дороже, поскольку усложняют графический процессор.
У NVIDIA уже есть решение, которое уже представлено на рынке в виде GA100 и GH100, которые, по сути, представляют собой две половинки меньшего кристалла, соединенные межкомпонентным соединением и обменивающиеся данными через разделенный кэш L2. Брайан Катандзаро из NVIDIA объяснил, что эта реализация улучшает масштабируемость, и первоначальный переход к этому дизайну прошел гладко. Ожидается, что чип будет основан на технологическом узле TSMC 4NP (5 нм), который повышает плотность на 30% (транзистор), так что, помимо архитектурного обновления, это также должно принести хорошие улучшения.
Теперь NVIDIA, вероятно, собирается сделать то же самое в игровой части, а это означает, что если все это окупится, то в будущем мы сможем увидеть предложение чиплетов в стиле B100/B200.
Теперь вернемся к NVIDIA GeForce RTX 5090: уже есть множество сообщений о том, что мы можем получить 512-битный интерфейс на флагмане следующего поколения, и уже есть информация о совершенно новом решении для охлаждения и печатной платы для этого монстра карта.
Учитывая, что слухи предполагают, что AMD выйдет из сегмента сверхвысокой производительности графики со своей линейкой RDNA 4 , похоже, что NVIDIA может еще больше укрепить свое лидерство в игровом сегменте с графическими процессорами Blackwell, когда они выйдут на рынок. Ожидается , что NVIDIA GeForce RTX 5090 будет выпущена через несколько недель после RTX 5080, который, по слухам, станет первым игровым графическим процессором Blackwell на полках магазинов.
Спецификации графического процессора NVIDIA Blackwell GB202 «Предварительные»:
ИМЯ ГРАФИЧЕСКОГО ПРОЦЕССОРА | ГБ202 | AD102 |
---|---|---|
ГПХ | 12 (на каждый графический процессор)? | 12 (на каждый графический процессор) |
ТПК | 8 (по ГПХ)? | 6 (на ГПХ) |
СМ | 2 (на TPC)? | 2 (на каждый TPC) |
Всего СМС | 192? | 144 |
Подядро | подлежит уточнению | 4 (за каждый SM) |
ФП32 | 128 (за СМ)? | 128 (за см) |
ФП32+INT32 | подлежит уточнению | 128 (за см) |
Ядра CUDA | 24 567? | 18 432 |
Искажения | подлежит уточнению | 64 (за каждый SM) |
Потоки | подлежит уточнению | 2048 (за СМ) |
Кэш L1 | подлежит уточнению | 192 КБ (на SM) |
Кэш L2 | подлежит уточнению | 96 МБ (на каждый графический процессор) |
РОП | подлежит уточнению | 32 (по ГПХ) |
Стандарт памяти | ГДДР7 | GDDR6X |
Макс. шина памяти | 512-битный | 384-битный |
Максимальный объем памяти | 48 ГБ? | 24 ГБ |
0 Комментариев