Intel вышла на рынок дискретных видеокарт два года назад со своей архитектурой Alchemist. Запуск был ожидаемым, поскольку компания вышла на рынок, на котором десятилетиями доминировали NVIDIA и AMD. Но не все пошло по плану.
Видеокарты Intel Arc A-series «Alchemist» были выпущены после большой задержки, и даже отложенный запуск не смог помочь команде синих, поскольку она страдала от серьезных проблем с драйверами, проблемами с программным обеспечением и общими проблемами с играми. Это оставило неприятный осадок в умах людей, которые ждали, что предложит Intel. После запуска ходило несколько слухов о том, что Intel в конечном итоге отменит свою линейку дискретных видеокарт, но одним хорошим результатом подразделения GPU стала команда разработчиков программного обеспечения, которая работала день и ночь над оптимизацией приложений и игр. История Fine Wine для Intel была засвидетельствована нашими собственными глазами, и Arc также увидела значительное падение цен в ближайшие месяцы, приближаясь к сегменту менее 300 долларов США с 16 ГБ видеопамяти.
Но, несмотря на все это, конкуренты продолжили выпускать свои продукты следующего поколения. На этот раз Intel является первой в очереди, которая предлагает продукт следующего поколения до основных запусков, которые запланированы на первую половину следующего года. Встречайте семейство Arc 2-го поколения под кодовым названием Battlemage или B-Series.
Линейка Intel Arc Battlemage решает самые существенные проблемы архитектуры Arc первого поколения, при этом уделяя особое внимание расширенной поддержке современных API и ряду новых функций. Сегодня Intel запускает Arc B580, свою первую видеокарту Battlemage второго поколения, и ее цена начинается с 249 долларов США.
Подробное описание архитектуры Intel Arc Battlemage
На выставке ITT 2024 компания Intel развеяла все слухи об отмене или задержке линейки GPU и Arc. Том Петерсен выступил с одной из самых заряженных презентаций во время мероприятия, которая была посвящена архитектуре следующего поколения Xe2. Начиная с деталей, Intel упрощает ситуацию, и вместо использования схем наименования LP, LPG, HP и HPG компания просто называет свою линейку следующего поколения Xe2. Внутри компании эти чипы по-прежнему будут иметь эти кодовые названия, но они больше не будут использоваться для клиентской стороны.
Некоторые из целей Xe2 для Intel заключались в достижении более высокой утилизации, улучшенного распределения работы и меньших накладных расходов на программное обеспечение. Это проект с нуля, в котором исправлено несколько основных проблем, которые были замечены в графических процессорах Xe «Alchemist». С самого начала Intel поразила аудиторию диаграммой эффективности производительности IP, которая показывает прирост до 12,5x, что весьма существенно, и у нас есть это глубокое погружение, чтобы продемонстрировать, что такое Xe2 и как Intel достигает этого прироста.
Intel утверждает, что архитектура Xe2, как и Xe, обладает высокой масштабируемостью, что позволит интегрировать ее в маломощные мобильные SOC, такие как Lunar Lake, и вплоть до более мощных видеокарт Arc с дискретными опциями, которые появятся позже.
Глубокий обзор архитектуры Intel Xe2
Итак, начнем наше подробное исследование: ядро Xe второго поколения или Xe2 оснащено несколькими вычислительными ресурсами, которые перераспределены по собственным ядрам SIMD16 для повышения эффективности.
Характеристики ядра Xe2:
- 8 512-битных векторных движков
- 8 2048-битных XMX-движков
- поддержка 64b атомарных операций
- 192КБ Общий L1$/SLM
Векторный движок также был обновлен и включает в себя:
- Собственные АЛУ SIMD16 — поддержка операций SIMD16 и SIMD32
- Расширения матрицы Xe (поддержка INT2, INT4, INT8, FP16, BF16)
- Расширенная математика и FP64 — трансцендентные числа: SIN, COS, LOG, EXP
- 3-сторонний совместный выпуск — FP + INT/EM + XMX
Блоки Xe Matrix Engine или XMX также присутствовали в графических процессорах Alchemist «Xe», но теперь они поддерживают больше типов данных и работают намного быстрее: FP16 имеет производительность 2048 OPS/такт, а INT8 — 4096 OPS/такт.
Разобравшись с этими двумя, давайте посмотрим, как эти новые движки складываются в слайс рендеринга Xe2, который является фундаментальными блоками графического процессора Xe2. Эти слайсы рендеринга могут быть сложены и масштабированы по мере необходимости и оптимизированы для уменьшения задержки, устранения остановок и улучшения рукопожатия HW/SW. Эти слайсы рендеринга подключены к интерфейсу команд, который изначально поддерживает Execute Indirect.
Срез рендеринга также включает новый движок Geometry с 3-кратной пропускной способностью выборки вершин и 3-кратной производительностью затенения сетки (с повторным использованием вершин), новый кэш L1$/SLM для выборки вне порядка (со сжатыми текстурами), 2-кратная пропускная способность для выборки без фильтрации и программируемых смещений, новый блок HiZ, который имеет на 50% больше кэша и поддерживает раннюю выборку HiZ небольших примитивов. Наконец, есть два новых пиксельных бэкэнда, которые предлагают вдвое большую пропускную способность смешивания, 33-процентное увеличение кэша цвета пикселей и рендерит целевую предварительную выборку в L2$.
Новейший блок трассировки лучей Xe2 превосходит Xe1
Основным блоком ядра Xe2 является его RTU (Ray Tracing Unit), который включает в себя 3 конвейера обхода, 18 пересечений прямоугольников (6 на пересечение прямоугольника и 3 прямоугольника на RTU) и 2 пересечения треугольников.
Итак, вот краткое описание архитектуры графического процессора Intel Xe2, которая предлагает:
- Ядра Xe2 2-го поколения
- Улучшенные векторные двигатели
- Более глубокие тайники
- Новые двигатели XMX
- Производительность и эффективность — оптимизированный интерфейс
- Собственная аппаратная поддержка для выполнения косвенных команд
- Более крупные блоки трассировки лучей
В целом, архитектура графического процессора Intel Xe2 разработана для большей совместимости с играми и достижения более высокого уровня использования. Новый блок Execute Indirect используется играми для ускорения вызовов отрисовки, а получение 12,5-кратного скачка сулит геймерам хорошие перспективы, поскольку он широко используется в таких движках, как Unreal Engine.
Intel Lunar Lake получает первый графический процессор Xe2 IP, полное погружение в интегрированный Xe2
Первым продуктом, в котором используются графические процессоры Xe2, является Lunar Lake, и он поставляется в интегрированной конфигурации. Несколько блоков в Lunar Lake привязаны к графическому процессору, например, Media Engine и Display Engine.
Прежде чем мы перейдем к ним, давайте поговорим о конфигурации Xe2 для Lunar Lake:
- 8 ядер Xe2
- 64 Векторных Двигателя
- 2 Геометрические трубопроводы
- 8 сэмплеров
- 4 бэкэнда Pixel
- 8 блоков трассировки лучей
- 8 МБ L2$
Графический процессор Lunar Lake Xe2 имеет 8 ядер Xe2, а каждое ядро Xe2 имеет 8 блоков XMX и 8 векторных блоков, блок загрузки/хранения, блок сортировки потоков и выделенный кэш L1/L$. Каждое из этих четырех ядер Xe2 создает один срез рендеринга.
Так как же все это масштабируется с точки зрения производительности по сравнению с графическим процессором Xe от Meteor Lake? Intel заявляет, что графические процессоры Xe2 достигли на 50% более высокой производительности при ISO и значительно более низкого энергопотребления при той же производительности.
Блок XMX также является значительной частью, которая видит приток 67 пиковых INT8 TOPS, что добавляет к общей мощи ИИ, предлагаемой процессорами Lunar Lake. Чип в общей сложности предлагает 120 платформенных TOPS, включая 48 TOPS от NPU4 и 5 TOPS от самого процессора.
Xe Display Engine для Lunar Lake
Теперь мы переходим от GPU к другим блокам самого ЦП Lunar Lake, начиная с Display Engine. Display Engine поставляется с 3 Display Pipes с поддержкой до 8K60 HDR, до 3x 4K60 HDR и до 1080p360 или 1440p360. Display Engine поддерживает HDMI 2.1, DisplayPort 2.1 и новые возможности eDP 1.5.
Фронт-энд Display Engine включает Decode/Decrypt и Streaming Buffer Zone. Для конвейера обработки пикселей вы получаете 6 плоскостей на конвейер с аппаратной поддержкой преобразования цветов и композиции, при этом будучи гибкими и энергоэффективными.
Также имеется дополнительный оптимизированный конвейер с низким энергопотреблением с Panel Replay (отключение питания во время бездействующих кадров) и новый датчик яркости с LACE (локальное адаптивное улучшение контрастности). Что касается сжатия и кодирования, вы получаете механизм сжатия потока отображения с 31 визуально без потерь сжатия и транспортное кодирование (потоковое кодирование для протоколов HDMI и DisplayPort). Маршрутизатор и порты включают сборку потока и маршрутизацию портов с поддержкой до 4 портов для дополнительной гибкости.
Возвращаясь к eDP (eDisplayPort) 1.5 с Panel Replay, его называют эволюцией самообновления панели с выборочными обновлениями с ранней транспортировкой и поддержкой адаптивной синхронизации. Новая возможность отображения обеспечивает уменьшение дрожания и улучшенное воспроизведение, предлагая при этом более высокую энергоэффективность.
Xe Media Engine для Lunar Lake — поддержка VVC, сторонний кэш и лучшее кодирование
Последний блок SOC Lunar Lake, подключенный к графическому процессору Xe2, — это Media Engine, который теперь имеет собственный выделенный кэш объемом 8 МБ общего кэша. Этот новый кэш может использоваться остальной частью чипа, но в нем нет необходимости, поскольку остальные ядра сами имеют выделенный кэш.
Этот сторонний кэш позволяет Lunar Lake значительно экономить пропускную способность, поскольку сокращается трафик к системной памяти при рабочих нагрузках мультимедиа. Это также позволяет значительно снизить энергопотребление при рабочих нагрузках кодирования.
Погружаясь в Media Engine, он поддерживает декодирование HDR до 8k60 10-бит, кодирование HDR до 8k60 10-бит, AVC, VP9, H.265 HEVC, AV1 и совершенно новый движок VVC. Движок VVC значительно снижает битрейт, обеспечивая то же качество, что и AV1 (уменьшение размера файла до 10%). Он также поддерживает адаптивное разрешение потоковой передачи и кодирование содержимого экрана.
И, наконец, у нас есть программный стек Windows GPU, который готов для графических процессоров Xe2. Intel заявила, что потратила много времени на настройку производительности API-уровня своих графических процессоров Alchemist «Xe», особенно DX9, но вся эта программная работа переносится на Xe2 с поддержкой всех последних API и фреймворков вместе с их средами выполнения.
На этом мы завершаем работу над Xe2 — совершенно новой графической архитектурой, которая обеспечивает огромные улучшения производительности, новейшие наборы функций и многое другое как для интегрированных решений, таких как Lunar Lake, так и для дискретных вариантов с предстоящей линейкой Arc Battlemage.
Intel Arc Battlemage
Начиная с деталей BMG-G21 SoC на базе Xe2, чип имеет максимум пять срезов рендеринга, которые включают четыре ядра Xe2 каждое, что в общей сложности составляет 20 ядер Xe2. Каждое ядро Xe2 имеет 8 512-битных векторных движков, 8 2048-битных движков XMX, поддержку 64b атомарных операций и модернизированный кэш L1$/SLM объемом 256 КБ. Ядра Xe2 также включают выделенный блок RT (трассировка лучей), а каждый срез рендеринга несет четыре блока Sampler, Geometry, Rasterizer, HiZ и два блока Pixel Backend.
BMG-G21 SoC имеет площадь 272 мм2 и в общей сложности 19,6 млн транзисторов, что делает его на 33% меньше, чем кристалл Alchemist ACM-G10, который имел 21,7 млн транзисторов. Сам чип был изготовлен на узле процесса TSMC 5 нм (N5).
По данным Intel, дискретный графический процессор Battlemage BMG-G21 обеспечивает невероятное улучшение производительности на 70% на ядро Xe и повышение производительности на ватт на 50% по сравнению с предыдущим поколением. Обновленный IP Xe2 обеспечивает более низкое время выполнения по сравнению с архитектурой Alchemist, что позволяет лучше использовать кремний и повысить производительность по сравнению с предшественниками. Итак, разобравшись с архитектурой, давайте начнем с оборудования.
Сегодня Intel анонсирует два варианта своей линейки Battlemage B-Series, Arc B580 и Arc B570. Оба этих чипа основаны на одной и той же SoC BMG-G21 с немного разными характеристиками и ценами.
Характеристики графического процессора Intel Arc B580 — 20 ядер Xe2 и 12 ГБ видеопамяти
Видеокарта Intel Arc B580 является топовым предложением на данный момент, с 20 ядрами Xe2, упакованными в 5 рендеринговых слайсов с 20 блоками RT, 160 XMX AI Engines и тактовой частотой до 2670 МГц. Карта включает 12 ГБ памяти GDDR6, работающей через 192-битный интерфейс, и обеспечивает пропускную способность до 456 ГБ/с.
Карта имеет пиковый TBP 190 Вт и питается от одного 8-контактного разъема и использует интерфейс PCIe 4.0 x8. Графический процессор поддерживает все новейшие движки HW-ускорения, такие как AV1, HEVC, AVC, VP9 и XAVC-H, и поставляется с тремя выходами DP2.1 (UHBR13.5) и одним выходом HDMI 2.1.
Характеристики графического процессора Intel Arc B570 — 18 ядер Xe2 и 10 ГБ видеопамяти
Вторая карта — Intel Arc B570, которая имеет 18 ядер Xe2 с 5 рендер-слайсами, 18 RT-блоков, 144 XMX AI Engines, тактовую частоту до 2500 МГц, 10 ГБ памяти GDDR6, работающей через 160-битный интерфейс, и пиковую пропускную способность 380 ГБ/с. Карта поставляется с 150 Вт TBP и имеет те же характеристики подключения, что и B580.
Производительность графических процессоров Intel Arc B580 и B570 «Battlemag»
С точки зрения производительности Intel Arc B580, как утверждается, на 24% быстрее, чем Arc A750 в среднем, что является приличным повышением, учитывая, что Arc A750 стоил столько же $249. Между тем, по сравнению с конкурентами, Intel Arc B580, как утверждается, на 10% быстрее, чем NVIDIA GeForce RTX 4060, которая продается примерно на $50 дороже и имеет 8 ГБ VRAM.
Другие сравнительные моменты, представленные Intel, включают взгляд на производительность растра и трассировки лучей по сравнению с конкурентами NVIDIA (RTX 4060) и AMD (RX 7600). Arc B580 предлагает до 32% более высокую производительность растеризации по более низкой цене, обеспечивая при этом более высокую производительность RT, чем конкуренты.
Дополнительная VRAM помогает Intel продвигать ее как карту 1440p. С 10+ ГБ VRAM видеокарты Arc B580 и B570 могут обеспечить более высокую производительность при работе с более высоким качеством текстур или качеством RT. Intel предлагает геймерам более высокую VRAM по основным ценам — это надежный шаг для привлечения геймерских масс, которые ждали обновления до более высоких вариантов VRAM в сегменте менее 250 долларов США.
Arc B580 за 249 долларов и Arc B570 за 219 долларов
Что касается доступности, то Intel Arc B580 поступит в продажу 13 декабря по цене 249 долларов США с возможностью выбора из различных вариантов, включая версию Limited Edition, в то время как Intel Arc B570 поступит в продажу с 16 января 2025 года по цене 219 долларов США в различных индивидуальных моделях.
Видеокарта Intel Arc B580 «Battlemage» Limited Edition отличается совершенно новой конструкцией охлаждения и кожуха с двухслотовым форм-фактором и двумя вентиляторами, обеспечивая надежную производительность без дополнительных настроек, улучшенный воздушный поток и бесшумную работу, а также возможности разгона свыше 3 ГГц.
Линейка графических процессоров Intel Arc Battlemage
GPU Name | Arc B580 | Arc B570 |
---|---|---|
Family | Battlemage B-Series | Battlemage B-Series |
Process | TSMC 5nm | TSMC 5nm |
Die | 272mm2 | 272mm2 |
Transistors | 19.6 Million | 19.6 Million |
Cores | 20 Xe2 | 18 Xe2 |
RT Units | 20 RTU | 18 RTU |
XMX Engines | 160 | 144 |
Clock Speed | 2670 MHz | 2500 MHz |
VRAM | 12 GB GDDR6 | 10 GB GDDR6 |
Memory Bus | 192-bit | 160-bit |
Bandwidth | 456 GB/s | 380 GB/s |
TBP | 190W | 150W |
Connector | 1x 8-Pin | 1x 8-Pin |
Interface | PCIe 4.0 x8 | PCIe 4.0 x8 |
Price | $249 | $219 |
Launch | 13th December 2024 | 16th January 2025 |
Распаковка и крупный план Intel Arc Battlemage B580 Limited Edition
Видеокарта Intel Arc B580 Limited Edition поставляется в специальной коробке, снаружи окрашенной в синий и фиолетовый цвета.
Переднюю крышку упаковки можно снять, чтобы увидеть картонную коробку с большим логотипом «Intel Arc» внутри.
Внутри упаковки вы найдете видеокарту и аксессуары в отдельных отсеках.
В комплект аксессуаров входит маленькая игрушка Arc, которую можно использовать в качестве дисплея, а также несколько наклеек и инструкций.
Intel Arc B580 Limited Edition — очень аккуратная и простая видеокарта, которая выглядит великолепно.
После того, как упаковка будет готова, я наконец-то смогу начать говорить о самой карте. Arc B580 использует полностью черную цветовую схему, которая выглядит фантастически. Только логотипы на черном окрашены в белый цвет.
Видеокарта представляет собой компактный вариант по размеру и весит 779 граммов. Карта имеет размеры 272 x 115 мм и занимает 2 слота для установки.
Охлаждающий кожух выступает за пределы печатной платы, а конструкция карты, соответствующая стандарту SFF, упрощает установку практически в любые корпуса и даже в корпуса форм-фактора ITX.
Обратная сторона карты имеет сплошную заднюю панель черного цвета.
Видеокарты Arc Limited Edition оснащены вентиляторами собственной эксклюзивной конструкции с 11 лопастями.
Intel также использует технологию 0db fan на вентиляторах. Эта функция не будет вращать вентиляторы на карте, пока они не достигнут определенного порога.
Я снова говорю о полнозакрывающей задней пластине, которую использует карта. Вся пластина сделана из пластика, но она действительно приятна на ощупь. Матово-черная отделка задней пластины придает ей уникальный эстетический вид. Видеокарта также имеет компактную конструкцию печатной платы, что означает, что кожух, радиатор и задняя пластина выходят за пределы печатной платы. Второй вентилятор продувает воздух через радиатор и выдувает его из вырезов, которые расположены в самом конце задней пластины.
Закончив с внешней частью карты, я теперь начну рассматривать то, что находится под капотом видеокарт. Первое, что бросается в глаза, — это большой стек ребер, который является частью радиатора, используемого этой картой.
Большой набор ребер идет от передней части печатной платы к задней и настолько толстый, что сквозь него едва можно что-либо увидеть.
Говоря о радиаторе, следует отметить, что он состоит из двух блоков алюминиевых ребер, соединенных между собой четырьмя тепловыми трубками, проходящими через медную опорную пластину и выходящими к двойным блокам радиатора.
В комплект поставки входят несколько тепловых прокладок для VRM и чипов памяти. Они полноразмерные, обеспечивают полный контакт с компонентами, обеспечивая стабильную и эффективную теплопередачу. Карта питается от одного 8-контактного разъема.
Ввод/вывод на видеокарте соответствует референсной схеме, которая включает три Display Port 2.1 (UHBR 13.5/10) и один порт HDMI 2.1. Карта также использует интерфейс PCIe 4.0 x8.
Заключение
Intel наконец-то выпустила дискретную видеокарту Arc второго поколения, Battlemage Arc B580. Видеокарта прочно позиционируется в основном сегменте, который, честно говоря, был очень слабым с предложениями AMD и NVIDIA в их текущей линейке поколений. Intel воспользовалась этой возможностью и теперь предлагает B580 по цене 249 долларов США, что делает ее очень сильным продуктом для геймеров.
Если судить по показателям производительности, Intel Arc B580 Limited Edition хорошо конкурирует с продуктами, для которых она предназначена, такими как NVIDIA GeForce RTX 4060, и даже превосходит видеокарту Arc A770 16 ГБ в некоторых играх. Это связано с архитектурными оптимизациями и исправлениями, включенными в архитектуру Battlemage Xe2. Видеокарта разработана как игровое решение 1080p, но также хорошо работает в 1440p благодаря 12 ГБ VRAM.
С точки зрения дизайна Intel Arc B580 Limited Edition — это фантастическая видеокарта, сочетающая в себе двухслотовый и двухвентиляторный дизайн в гладком черном корпусе с превосходным охлаждением, и даже традиционный 8-контактный разъем, так что никаких проблем с 16-контактным разъемом с этой картой. Видеокарта поставляется с интерфейсом PCI Express 4.0 x8, чего достаточно для продукта такого уровня. Может быть, в будущем мы увидим Gen5 или x16, используемые в более дорогой версии?
С точки зрения цены, Intel Arc B580 за 249 долларов США достаточно конкурентоспособна, чтобы стать королем следующего бюджета. Ни одна другая карта в этой ценовой категории не предлагает такой же уровень производительности в сочетании с 12 ГБ видеопамяти. Она опережает RTX 4060 с достаточным отрывом и по более низкой цене, что делает ее очень выгодной, и хотя NVIDIA находится на грани запуска своей линейки RTX 50 «Blackwell», нам не следует ожидать замены RTX 4060 в ближайшее время. Это дает Intel Arc B580 достаточно времени, чтобы завоевать позиции и некоторую долю рынка, которую Intel так отчаянно жаждала.
С выпуском Intel Arc B580 компания Intel вернулась в сегмент дискретных графических процессоров с еще более мощным предложением, которое станет отличным приобретением для бюджетной и массовой аудитории.
0 Комментариев