Суперкомпьютер Aurora, созданный совместно Intel, Аргоннской национальной лабораторией и HPE, занял второе место с производительностью 585,34 петафлопс при частичной работе системы. Значительный прогресс был достигнут в ранней научной программе Аргонны, ориентированной на применение высокопроизводительных вычислений и искусственного интеллекта в научных исследованиях. На этой фотографии члены монтажной группы проходят мимо многочисленных стеллажей в Аргоннской национальной лаборатории. (Фото: Аргоннская национальная лаборатория)
Суперкомпьютер Aurora наконец-то преодолел экзафлопсный барьер и достиг самой высокой производительности искусственного интеллекта благодаря аппаратному обеспечению Intel Ponte Vecchio.
Суперкомпьютер Aurora на базе процессора Intel достигает производительности 1,01 экзафлопс при вычислениях и 10,6 экзафлопс при использовании искусственного интеллекта по мере выхода системы на полную рабочую мощность
Ожидалось, что суперкомпьютер Aurora, развернутый в Аргоннской национальной лаборатории и созданный в сотрудничестве с HPE (Hewlett Packard Enterprise), станет одним из лучших в сегменте высокопроизводительных вычислений и искусственного интеллекта. Платформа, оснащенная процессорами Intel Xeon CPU Max и Data Center GPU Max, конкурировала с AMD, которой удалось первой преодолеть экзафлопсный барьер . Между тем, несмотря на анонс еще в 2019 году, суперкомпьютеру Aurora едва удалось достичь поставленных целей, но сегодня система достигла 87% операционной мощности или в общей сложности 9234 узлов.
На выставке ISC High Performance 2024 компания Intel в сотрудничестве с Аргоннской национальной лабораторией и Hewlett Packard Enterprise (HPE) объявила, что суперкомпьютер Aurora преодолел экзафлопсный барьер на скорости 1,012 эксафлопс и является самой быстрой системой ИИ в мире, предназначенной для ИИ для открытой науки. достижение 10,6 экзафлопс AI. Intel также подробно расскажет о решающей роли открытых экосистем в развитии высокопроизводительных вычислений (HPC) с ускорением искусственного интеллекта.
через Intel
Что касается технических характеристик, суперкомпьютер Aurora построен с использованием 166 стоек, которые оснащены 10 624 блейд-серверами, 21 248 чипами Intel Xeon CPU Max (4-го поколения Sapphire Rapids) и 63 744 блоками серии Intel Data Center GPU Max (Ponte Vecchio). Он основан на матрице HPE Slingshot для межсетевых соединений и использует 84 992 конечных точки.
Что касается показателей производительности, суперкомпьютеру Aurora удалось занять второе место в тесте HPL LINPACK, но ему удалось преодолеть экзафлопсный барьер в 1,012 эксафлопс, используя всего 87% от общей мощности узла (9234 узла против 10 624). Система также заняла третье место в тесте HPCG с производительностью 5612 терафлопс в секунду, используя всего 39% мощности системы.
Используя архитектуру ядра Xe и несколько аппаратных блоков искусственного интеллекта, суперкомпьютер Aurora теперь занимает первое место в рейтингах производительности искусственного интеллекта с общей номинальной производительностью 10,6 экзафлопс искусственного интеллекта. Производительность измерялась с использованием теста смешанной точности LINPACK (HPL-MxP).
Что дальше: Новые суперкомпьютеры с технологиями Intel Xeon CPU Max Series и Intel Data Center GPU Max Series подчеркивают цель Intel по развитию высокопроизводительных вычислений и искусственного интеллекта. Системы включают в себя Cassandra Европейско-Средиземноморского центра по изменению климата (CMCC) для ускорения моделирования изменения климата; CRESCO 8 Итальянского национального агентства по новым технологиям, энергетике и устойчивому экономическому развитию (ENEA) для обеспечения прорывов в термоядерной энергетике; Техасский центр перспективных вычислений (TACC), который находится в полной готовности для анализа биологических данных, сверхзвуковых турбулентных потоков и атомистического моделирования широкого спектра материалов; а также Управление по атомной энергии Соединенного Королевства (UKAEA) для решения проблем, связанных с памятью, которые лежат в основе проектирования будущих термоядерных электростанций.
Результаты теста искусственного интеллекта смешанной точности станут основой для графического процессора Intel следующего поколения для искусственного интеллекта и высокопроизводительных вычислений под кодовым названием Falcon Shores . Falcon Shores будет использовать архитектуру Intel Xe следующего поколения с лучшими достижениями Intel Gaudi. Эта интеграция обеспечивает единый интерфейс программирования.
Первые результаты производительности на процессоре Intel Xeon 6 с P-ядрами и памятью комбинированного ранга мультиплексора (MCR) со скоростью 8800 МТ/с обеспечивают повышение производительности до 2,3 раз для реальных приложений HPC, таких как Nucleus для европейского моделирования океана (NEMO), по сравнению с предыдущим поколением, создавая прочную основу в качестве предпочтительного хост-ЦП для решений HPC.
0 Комментариев