El Capitan на базе чипов AMD стал самым быстрым суперкомпьютером в мире (видео)
El Capitan имеет производительность 1,7 экзафлопс, благодаря чему самая быстрая машина Intel опустилась на третье место в списке Top500.
Машина El Capitan заняла первое место в полугодовом списке Top500 как самый быстрый суперкомпьютер на планете с производительностью 1,742 экзафлопс. Об этом пишет Tom’s Hardware.
AMD и Национальная лаборатория имени Лоуренса в Ливерморе (LLNL) сегодня объявили, что работающий на базе AMD El Capitan стал первым в мире по мощности.
El Capitan дебютирует в списке на первом месте, опередив предыдущего лидера, Frontier с производительностью 1,3 экзафлопс. Система Aurora на базе Intel опустилась на третье место в списке — система не представила новый прогон бенчмарка, что означает, что частично работоспособная система все еще испытывает проблемы со сбоями на многочисленных фронтах.
Масштаб El Capitan ошеломляет — система имеет 11 136 узлов, упакованных 44 544 AMD MI300A APU, 5,4 петабайта основной памяти и исключительно производительную подсистему хранения данных "Rabbit" (подробнее об этом ниже). El Capitan достигла 1,742 квинтиллиона операций в секунду (эксафлопс) производительности в тесте, что эквивалентно выполнению одного вычисления каждую секунду в течение 54 миллиардов лет, — но El Capitan выполняет этот объем работы каждую секунду.
Это на 45% быстрее, чем вторая по скорости система в списке. Национальное управление ядерной безопасности (NNSA) будет использовать систему для модернизации ядерного арсенала США путем имитации взрывов, чтобы исключить необходимость подземных детонаций и имитировать эффекты старения, безопасность и надежность ядерного арсенала. Система также будет использоваться для разработки двух новых конструкций МБР. Система будет использоваться для рабочих нагрузок HPC и AI или их слияния.
El Capitan может похвастаться теоретическим пиком (Rpeak) производительности в 2,746 экзафлопс. Однако это число рассчитано с учетом полной производительности всех компонентов системы, работающих на пиковых скоростях с идеальным линейным масштабированием производительности, что просто неосуществимо в реальном мире.
Rmax El Capitan, реальное измерение производительности в бенчмарке High-Performance Linpack (HPL), который служит мерилом для лучших суперкомпьютеров, достигло 1,742 экзафлопс в реальном использовании. Rmax может увеличиться в будущем при дальнейшей настройке системы, и агентство заявляет, что проведет еще один полномасштабный бенчмарк HPL, прежде чем El Capitan будет перемещен в секретную сеть.
Также важно отметить, что производительность суперкомпьютерной системы в HPL измеряется с полной двойной точностью FP64. Напротив, суперкомпьютеры, ориентированные на ИИ, измеряются с меньшими типами данных, которые позволяют достичь гораздо более высоких оценок "AI exaflop", но они не сопоставимы напрямую с показателями в списке Top500.
El Capitan потребляет более 35 мегаватт электроэнергии при полной загрузке и обеспечивает производительность 58,89 гигафлопс/ватт, занимая 18-е место в рейтинге самых эффективных суперкомпьютеров Green500.
El Capitan имеет поразительное количество вычислительных ядер (CPU+GPU), распределенных по 44 544 процессорам AMD MI300A. Эти APU объединяют ядра CPU и GPU в одном физическом пакете. Каждый чип MI300A имеет 13 чиплетов, многие из которых объединены в 3D-стеке, чтобы создать единый пакет чипа с двадцатью четырьмя ядрами Zen 4 CPU, объединенными с графическим движком CDNA 3 и восемью стеками памяти HBM3 общим объемом 128 ГБ.
В целом чип MI300A содержит 146 миллиардов транзисторов, что делает его самым большим чипом, который AMD запустила в производство. Девять вычислительных кристаллов, смесь 5-нм ЦП и ГП, 3D-стекированы поверх четырех 6-нм базовых кристаллов, которые являются активными интерпозерами, обрабатывающими память и трафик ввода-вывода, среди прочих функций.
Вы можете увидеть глубокое погружение в топологию El Capitan здесь. Архитектура использует кэш-когерентную память для сокращения перемещения данных между ЦП и ГП, что часто потребляет больше энергии, чем само вычисление, тем самым уменьшая задержку и повышая производительность и энергоэффективность. Это также значительно упрощает как портирование старого кода, так и создание нового кода.
HPE создает систему El Capitan с архитектурой Shasta, которая состоит из высокоплотных жидкостно-охлаждаемых шкафов EX4000 и ускорительных лезвий EX225a, связанных между собой сетевым соединением Slingshot-11.
Эта платформа обеспечивает работу двух других суперкомпьютеров exascale Министерства энергетики: Frontier, предыдущего самого быстрого суперкомпьютера в мире, и часто откладываемого Aurora, работающего на базе кремния Intel. Это дает HPE первое, второе и третье места в списке Top500, и все три являются первыми и единственными системами exascale-класса в списке.
Для сравнения, El Capitan на 45% быстрее Frontier, второго по скорости суперкомпьютера в списке Top500. Frontier на базе AMD теперь занимает второе место в списке Top500, что дает компании еще одно перо в шляпе — кремний AMD обеспечивает работу двух самых быстрых суперкомпьютеров в мире.
Интересно, что у суперкомпьютера Frontier также есть новый результат бенчмарка для списка с бенчмарком 1,353 экзафлопс, что выше предыдущего представления в 1,194. Rpeak также был увеличен с 1,714 экзафлопс до 2,055 экзафлопс. Хотя El Capitan сейчас является самым быстрым известным суперкомпьютером в мире, мы были бы не правы, если бы не упомянули, что у Китая есть несколько собственных машин класса exascale.
Они окутаны тайной и не включены в список Top500 из-за страха ответных мер в виде санкций США. DOE не представило новый бенчмарк для Aurora от Intel, что весьма удивительно. Шесть месяцев назад подача Aurora закрепила за системой второе место в Top500, но система не была полностью работоспособна. Вместо этого бенчмарк-прогон включал только 87% активной системы.
В то время Intel заявила, что Aurora страдала от многочисленных аппаратных проблем, включая сбои оборудования и системы охлаждения, эксплуатационные ошибки и нестабильность сети. Отсутствие новой заявки означает, что эти ошибки еще не были полностью исправлены. Aurora по-прежнему лидирует в ориентированном на ИИ бенчмарке смешанной точности HPL-MxP, что делает его самым быстрым из известных суперкомпьютеров ИИ в мире с производительностью 10,6 эксафлопс ИИ.
Фактически, AMD обеспечивает работу пяти из десяти самых быстрых суперкомпьютеров, в то время как у Intel их три, у Nvidia один, а японский Arm Fugaku, изготовленный по индивидуальному заказу, все еще удерживает свое место. LLNL также прокомментировал, что эта система является самой экономически эффективной системой, развернутой "даже близко" к аналогичному масштабу, указывая на то, что El Capitan не только самый быстрый в мире, но и самый экономичный на переднем крае технологий.
Ранее писали, что новый материал повысит производительность солнечных панелей. Устройство из селенида индия показало высокую эффективность преобразования солнечного света в электричество.