Графические процессоры Nvidia Blackwell и GeForce RTX 50-й серии: слухи, характеристики, даты выпуска, цены и все, что мы знаем

Апр 20, 2024 | Железо и Программы | Нет комментариев

0
(0)
Время чтения 11 минуты

Вот что мы знаем и ожидаем от архитектуры графического процессора Blackwell следующего поколения от Nvidia.

Архитектура графических процессоров Nvidia Blackwell следующего поколения и графические процессоры RTX 50-й серии появятся точно по графику. Хотя Nvidia официально не указала сроки анонса потребительских компонентов, ходило множество слухов и предполагаемых утечек данных. Мы также поговорили с некоторыми людьми и ожидаем, что увидим как минимум RTX 5090 и RTX 5080 к началу курортного сезона в октябре или ноябре. Тогда графические процессоры Blackwell пополнят ряды лучших видеокарт .

Nvidia также предоставила многие основные сведения о графическом процессоре Blackwell B200 для своего центра обработки данных . Хотя варианты искусственного интеллекта и центров обработки данных неизбежно будут различаться, между предыдущими графическими процессорами Nvidia для потребителей и центров обработки данных есть некоторые общие аспекты, и мы ожидаем, что так будет и дальше. Это означает, что у нас, по крайней мере, есть некоторые хорошие сведения об определенных аспектах будущих графических процессоров RTX 50-й серии.

По-прежнему много неизвестного, а утечки больше похожи на то, как люди бросают дротики в стену, чем на фактическую инсайдерскую информацию. Мы расскажем об основных слухах, а также о других деталях, включая дату выпуска, потенциальные характеристики и другие технологии. В ближайшие месяцы мы можем ожидать появления дополнительных подробностей и будем обновлять эту статью по мере поступления информации. Вот все, что мы знаем о Nvidia Blackwell и графических процессорах RTX 50-й серии.

ДАТЫ ВЫПУСКА BLACKWELL И RTX 50-Й СЕРИИ

Из всех неизвестных дату выпуска — по крайней мере, первых графических процессоров Blackwell — определить проще всего. Основываясь на том, что мы слышали лично, мы ожидаем, что серия RTX 50 выйдет к концу года. Nvidia, как правило, хорошо ориентируется в сроках выпуска новых графических процессоров, и выпуск топовых RTX 5090 и 5080 до периода праздничных покупок в ноябре и декабре имеет наибольший смысл.

Здесь также имеется множество исторических прецедентов. Графические процессоры Ada Lovelace RTX 40-й серии впервые появились в октябре 2022 года. Графические процессоры Ampere RTX 30-й серии впервые появились в сентябре 2020 года. До этого серия RTX 20 была выпущена двумя годами ранее, в сентябре 2018 года, а серия GTX 10 была выпущена в мае/июне 2016 года, а серия GTX 900 появится в сентябре 2014 года. Это целое десятилетие, когда новые архитектуры графических процессоров Nvidia появляются примерно каждые два года, и мы не видим причин для Nvidia менять тактику сейчас.

Речь идет не только о двухлетнем графике потребительских графических процессоров. Nvidia впервые раскрыла основные детали архитектуры Hopper H100 в марте 2022 года на своей ежегодной конференции по технологиям графических процессоров (GTC), а Ада Лавлейс прибыла в октябре 2024 года. А в мае 2020 года она впервые представила архитектуру Ampere A100 , а затем потребительские варианты. несколько месяцев спустя. То же самое произошло и в 2018 году с Volta V100 и Turing, а в 2016 году — с Tesla P100 и Pascal. Итак, за последние четыре поколения мы впервые узнали о центрах обработки данных и графических процессорах искусственного интеллекта, а потребительские графические процессоры были представлены и выпущены позже в том же году. Теперь Nvidia только что представила архитектуру Blackwell B200 , снова на GTC, и можно с уверенностью сказать, что мы услышим о потребительских вариантах этой осенью.

Мы не знаем точных названий и моделей, которые планирует Nvidia использовать для комплектующих Blackwell следующего поколения. Мы уверены, что у нас будут карты RTX 5090, RTX 5080, RTX 5070 и RTX 5060 и, возможно, какая-то комбинация вариантов Ti и/или Super. Некоторые из этих вариантов, несомненно, выйдут во время обновления в середине цикла в конце 2025 или начале 2026 года. Нам также интересно, будет ли у Nvidia графический процессор RTX 5050 — он пропустил этот уровень на настольных компьютерах с 40-й серией и 20-й серии, хотя последняя имела графические процессоры классов GTX 1660 и 1650.

Учитывая прошлые тенденции, мы ожидаем, что в этом году появятся, по крайней мере, RTX 5090 и 5080 высшего уровня, возможно, с RTX 5070 Ti, чтобы составить им компанию. Или, может быть, в этом году Nvidia выпустит RTX 5090, RTX 5080 Ti и RTX 5080. Затем, скорее всего, где-то в 2025 году, появятся графические процессоры среднего уровня (судя по номерам моделей) 5070 и 5060 с типичным поэтапным графиком выпуска.

TSMC 4NP, УСОВЕРШЕНСТВОВАННЫЙ 4-НМ ТЕХПРОЦЕСС NVIDIA

Основной доклад Nvidia Blackwell GTC 2024
Чипы Nvidia B200 будут использовать TSMC 4NP(Изображение предоставлено: Nvidia)

Одним из неожиданных анонсов на GTC 2024 стало то, что Blackwell B200 будет использовать узел TSMC 4NP — «4-нм Nvidia Performance». Хотя названия многих процессов действительно стали в значительной степени оторваны от физических характеристик, многие ожидали, что Nvidia перейдет к усовершенствованному варианту передовой технологии процесса N3 от TSMC. Вместо этого компания выбрала усовершенствование существующего узла 4N, который уже использовался с графическими процессорами Hopper и Ada Lovelace в течение последних двух лет.

Выбор этого пути, безусловно, дает некоторую экономию средств, хотя TSMC не раскрывает соглашения о ценах по контрактам со своими различными партнерами. Blackwell B200 также использует двухчиповое решение, в котором два идентичных чипа связаны через соединение NV-HBI (Nvidia High Bandwidth Interface) со скоростью 10 ТБ/с. Возможно, Nvidia просто не считала необходимым переходить на 3-нм узел для этого поколения.

И тем не менее, это открывает возможность для AMD и даже Intel потенциально перейти к более новому и более совершенному технологическому узлу, втиснув больше транзисторов в меньший по размеру чип. Nvidia применила аналогичный подход с серией RTX 30, используя менее дорогой процесс Samsung 8N вместо более нового и лучшего TSMC N7. Будет интересно посмотреть, окажет ли это какое-либо существенное влияние на то, как будут складываться различные графические процессоры следующего поколения.

Конечно, также возможно, что варианты Blackwell B200 будут использовать TSMC 4NP, тогда как потребительские чипы будут использовать другой узел. Во многом это зависит от того, какая часть базовой архитектуры будет использоваться центрами обработки данных и потребительскими вариантами, а также от того, считает ли Nvidia целесообразность диверсификации. Здесь существует прецедент использования разных узлов и даже производителей: Ampere A100 использовал TSMC N7, а чипы серии RTX 30 использовали Samsung 8N. Pascal GP107 и GP108 серии GTX 10 также производились на 14LPP от Samsung, а GP102, GP104 и GP106 — на TSMC 16FF.

ПАМЯТЬ GDDR7 СЛЕДУЮЩЕГО ПОКОЛЕНИЯ.

GDDR7 на GTC 2024
Чипы GDDR7 были показаны на GTC 2024

Давно ожидалось, что потребительские и профессиональные (т.е. не строго центры обработки данных) графические процессоры Blackwell перейдут на память GDDR7 . Все признаки GTC 2024 свидетельствуют о том, что GDDR7 будет готова для следующего поколения графических процессоров до конца года. Фактически, Samsung и SK hynix продемонстрировали на GTC чипы GDDR7, а Micron подтвердила, что GDDR7 также находится в производстве.

Графические процессоры RTX 40-й серии текущего поколения используют память GDDR6X и GDDR6 с тактовой частотой от 17 до 23 Гбит/с. GDDR7 имеет целевую скорость до 36 Гбит/с, что на 50 % выше, чем у GDDR6X, и на 80 % выше, чем у стандартной GDDR6. SK hynix заявляет, что у нее даже будут чипы со скоростью 40 Гбит/с, хотя точные сроки их появления не уточняются. В любом случае, это обеспечит столь необходимое повышение пропускной способности памяти на всех уровнях.

Конечно, мы не знаем, будет ли Nvidia на самом деле выпускать карты с тактовой частотой памяти 36 Гбит/с. Раньше использовались чипы GDDR6X со скоростью 24 Гбит/с, но их тактовая частота составляла 22,4 Гбит/с или 23 Гбит/с, а некоторые чипы Micron со скоростью 24 Гбит/с, очевидно, были понижены до 21 Гбит/с в различных видеокартах RTX 4090, которые мы тестировали. Таким образом, Nvidia может использовать память со скоростью 36 Гбит/с, но запускать ее только со скоростью 32 Гбит/с. Это все еще значительный удар по пропускной способности.

При скорости 36 Гбит/с 384-битный интерфейс памяти GDDR7 может обеспечить пропускную способность 1728 ГБ/с. Это на 71% выше, чем у RTX 4090 в настоящее время. 256-битный интерфейс обеспечит скорость 1152 ГБ/с по сравнению с 736 ГБ/с у 4080 Super — увеличение на 57%. 192-битные карты будут иметь пропускную способность 864 ГБ/с, а даже 128-битные карты получат пропускную способность до 576 ГБ/с. Nvidia может даже пойти дальше и создать 96-битный интерфейс с пропускной способностью 432 ГБ/с.

Мы также ожидаем, что Nvidia продолжит использовать большой кэш L2 с Blackwell. Это обеспечит еще более эффективную пропускную способность памяти — каждое попадание в кэш означает необязательный доступ к памяти. Если, например, использовать коэффициент попадания в кэш 50 %, это удвоит эффективную пропускную способность памяти, однако учтите, что коэффициент попадания зависит от игры и настроек, причем более высокие разрешения, в частности, снижают показатель попадания.

GDDR7 также потенциально решает проблему соотношения объема памяти и ширины интерфейса. В GTC нам сказали, что чипы на 16 ГБ (2 ГБ) находятся в производстве, но также появятся чипы на 24 ГБ (3 ГБ). Более крупные чипы с производительностью, не соответствующей степени двойки, вероятно, не будут готовы до 2025 года, но они будут более важны для компонентов более низкого уровня. Нет острой необходимости в потребительских видеокартах с объемом памяти более 24 ГБ, хотя мы могли видеть RTX 5090 с 32 ГБ (с 512-битным интерфейсом). Даже 16 ГБ обычно достаточно для игр при 256-битном интерфейсе.

Однако наличие чипов емкостью 24 ГБ означает, что Nvidia (наряду с AMD и Intel) может разместить 18 ГБ видеопамяти на 192-битном интерфейсе, 12 ГБ на 128-битном интерфейсе и 9 ГБ на 96-битном интерфейсе. Мы могли даже увидеть карты емкостью 24 ГБ с 256-битным интерфейсом и 36 ГБ с 384-битным интерфейсом, что вдвое превышает емкость профессиональных карт. А как насчет 512-битного интерфейса профессиональной карты с памятью «раскладушка» (микросхемы с обеих сторон печатной платы), содержащей колоссальные 96 ГБ видеопамяти? Это было бы отлично для определенных задач ИИ и профессиональных задач, и это скорее вопрос «когда», а не «если» мы увидим такую ​​карту.

АРХИТЕКТУРНЫЕ ОБНОВЛЕНИЯ БЛЭКВЕЛЛА

Архитектура Blackwell почти наверняка будет содержать различные обновления и улучшения по сравнению с архитектурой Ады Лавлейс предыдущего поколения, но сейчас краткое изложение того, что мы знаем наверняка, можно резюмировать двумя словами: немного. Но каждое поколение графических процессоров Nvidia содержало как минимум несколько архитектурных обновлений, и мы можем ожидать, что то же самое произойдет и в этом раунде.

Nvidia увеличила потенциальную производительность трассировки лучей в каждом поколении RTX, и Blackwell, похоже, продолжит эту тенденцию. Поскольку все больше игр, таких как Alan Wake 2 и Cyberpunk 2077, продвигают полную трассировку пути (не говоря уже о возможности моддеров использовать RTX Remix для улучшения старых игр эпохи DX10 с полной трассировкой пути), потребность в более высокой пропускной способности трассировки лучей становится еще большей. Вероятно, будут и другие обновления, ориентированные на RT, точно так же, как Ada предложила SER (переупорядочение выполнения шейдеров), OMM (микрокарты непрозрачности) и DMM (смещенные микросетки). Но какими могут быть эти изменения, пока неизвестно.

Что мы точно знаем, так это то, что графический процессор Blackwell B200 для центра обработки данных еще раз переработал тензорные ядра, предложив встроенную поддержку числовых форматов FP4 и FP6. Они будут в первую очередь полезны для вывода ИИ, а учитывая, что потребительские графические процессоры будут выполнять двойную функцию с профессиональными картами, можно с уверенностью сказать, что все чипы Blackwell также будут поддерживать FP4 и FP6. (В качестве примера Ada добавила поддержку FP8 в свои тензорные ядра.)

Какие еще архитектурные изменения может внести Blackwell? Если мы правы в том, что Nvidia придерживается TSMC 4NP для потребительских компонентов, мы не ожидаем масштабных изменений. По-прежнему будет использоваться большой кэш L2, а также будет присутствовать улучшенный OFA (ускоритель оптического потока), используемый для генерации кадров DLSS 3. Возможно, в него даже будут внесены некоторые изменения, чтобы улучшить его, хотя нам придется подождать и посмотреть.

Одним из потенциальных намеков на то, что может случиться с самыми быстрыми решениями, является Blackwell B200. Nvidia создала NV-HBI, чтобы объединить два одинаковых чипа в один массивный графический процессор. Это не SLI, а скорее подход в стиле чиплетов с огромной пропускной способностью между чипами, так что два чипа функционально ведут себя как один графический процессор. Может ли NV-HBI появиться и на потребительских графических процессорах? Мы считаем, что это разумная возможность — вероятно, не для чипов с более низкими характеристиками, но, конечно, для самых больших чипов.

Необработанные вычисления, как для графики, так и для более общих рабочих нагрузок, почти наверняка увеличатся на приличную величину, хотя, вероятно, больше в сторону увеличения на 30%, а не на 50%. RTX 4080 предлагает 40 терафлопс вычислений FP32 по сравнению, например, с 30 терафлопс у 3080 — увеличение на 33%, тогда как 4090 предлагает 83 терафлопс по сравнению с 40 терафлопс у 3090 — гораздо большее увеличение на 107%. Возможно, Nvidia также «добрится успеха» на RTX 5090, внеся при этом небольшие улучшения в другие места.но нам придется подождать и посмотреть.

ЦЕНЫ НА RTX 50-Й СЕРИИ

Nvidia Ада Лавлейс и GeForce RTX 40-й серии
(Изображение предоставлено: Shutterstock)

Сколько будут стоить графические процессоры RTX 50-й серии? Честно говоря, учитывая текущие рыночные условия, нет особых оснований ожидать, что Nvidia снизит цены по сравнению с текущими графическими процессорами RTX 40-й серии. Nvidia установит цену на карты настолько высокую, насколько, по ее мнению, ее примет рынок. Учитывая потенциально более высокую производительность искусственного интеллекта и возросший спрос со стороны неигрового сектора, нам может повезти, если следующее поколение будет иметь ту же структуру цен, что и нынешнее поколение.

В то же время мы надеемся, что цены на поколение не вырастут. 1000 долларов за «пониженную» RTX 4080 Super означает, что конкретный уровень графического процессора теперь стоит на 43% дороже, чем во времена RTX 2080 Super. Конечно, у нас также были промежуточные RTX 3080 10 ГБ за 699 ​​долларов и RTX 3080 Ti за 1199 долларов, когда цены были совершенно перепутаны из-за распространенности криптомайнинга на графических процессорах в сочетании с последствиями Covid-19. К счастью, хотя в настоящее время майнинг определенных криптовалют с помощью графического процессора технически выгоден, WhatToMine оценивает предполагаемый доход менее чем в 1 доллар в день для RTX 4090, а это означает, что для выхода на уровень безубыточности при текущих курсах и ценах потребуется около пяти лет.

Сектор бюджетных графических процессоров также практически вымер. Интегрированная графика достигла точки, когда она «достаточно быстра» для большинства распространенных рабочих нагрузок, включая даже скромные игры — это особенно верно для мобильных процессоров, а варианты для настольных компьютеров обычно гораздо менее эффективны. Последними новыми графическими процессорами, действительно ориентированными на бюджетный сектор, были довольно невпечатляющие RX 6500 XT и RX 6400 от AMD — Nvidia не выпускала новых графических процессоров стоимостью менее 200 долларов с момента запуска GTX 1650 Super в 2019 году (если только вы не хотите посчитать пародию, которая была GTX 1630 ).

Это означает, что для специализированных видеокарт для настольных ПК мы сейчас живем в мире, где «бюджет» означает около 300 долларов, «массовый» означает 400–600 долларов, «высококлассный» — для графических процессоров стоимостью около 1000 долларов и сегмент «энтузиастов». цель — 1500 долларов или больше. По крайней мере, такова точка зрения Nvidia на ситуацию. Графические процессоры AMD, как правило, немного более доступны, особенно если смотреть на розничные цены, но Nvidia поддерживает более высокую структуру цен, по крайней мере, последние четыре года.

СПЕКУЛЯТИВНЫЕ ХАРАКТЕРИСТИКИ БЛЭКВЕЛЛА

Учитывая все, что мы сказали до сих пор, мы надеемся, что должно быть ясно, что в настоящее время доступно очень мало официальной информации о Блэквелле. Взлом Nvidia в 2022 году дал нам имя Blackwell и некоторые потенциальные кодовые имена, но это было более двух лет назад, и за это время многое может измениться. Плюс, подробности о Блэквелле изначально были довольно скудными.

Однако, как и в случае с каждым крупным обновлением архитектуры графического процессора, ходит множество слухов и предполагаемых утечек. Некоторые предполагают, что у них есть внутренние знания, другие, похоже, являются догадками. Приведу лишь несколько недавних примеров: одна из «утечек» гласит, что мы должны ожидать, что Blackwell GB202 будет иметь 384-битный интерфейс памяти в ноябре 2023 года, тогда как более поздняя утечка в марте 2024 года говорит о том, что Blackwell GB202 будет иметь 512-битный интерфейс .

Еще стоит поразмыслить над двухчиповым решением NV-HBI для Blackwell B200, о котором мы упоминали ранее. Возможно, Blackwell GB202 высшего уровня будет использовать тот же подход и будет иметь два чипа GB203, связанных через NV-HBI. Это позволило бы Nvidia контролировать фактический размер кристалла самых быстрых чипов, одновременно обеспечивая гораздо более высокий уровень производительности.

На данный момент мы включим оба потенциальных варианта GB202 в нашу таблицу предполагаемых характеристик, а также предполагаемые названия и характеристики в других местах. Большое количество вопросительных знаков должно дать понять, что в настоящее время у нас нет достоверной информации.

Насколько публикация полезна?

Нажмите на звезду, чтобы оценить!

Средняя оценка 0 / 5. Количество оценок: 0

Оценок пока нет. Поставьте оценку первым.

SiteAnalyzer, технический и SEO-анализ сайтов

Подпишитесь на нашу рассылку

0 Комментариев

Оставить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

 

Не копируйте текст!