Экзафлопсный суперкомпьютер Frontier получит 28-МВт питание, 500 тыс. л теплоносителя для СЖО и 110-тонный фальшпол

 

В начале года мы опубликовали заметку, посвящённую выводу из строя суперкомпьютера Titan, расположенного в Национальной лаборатории Ок-Ридж (ORNL) и успешно выполнившего 2,8 млн задач для науки. Titan отправился на заслуженный покой, а его место займёт суперкомпьютер Frontier мощностью 1,5 Эфлопс: в настоящее время уже начаты работы по его монтажу.

Если проект суперкомпьютера Aurora для Аргонноской национальной лабораторией столкнулся с задержками из-за проблем Intel с освоением 7-нм техпроцесса, то в случае с Frontier всё идёт по плану — первый американский суперкомпьютер экзакласса будет использовать именно решения AMD. Об этом проекте стало известно в мае 2019 года, когда AMD и Cray объявили о сотрудничестве.

Разместится Frontier в Национальной лаборатории Ок-Ридж (ORNL), в помещениях своего предшественника, Titan. Сама ORNL сообщила об успешном начале работ по переоборудованию инфраструктуры под новый суперкомпьютер. А работ потребуется немало, поскольку Frontier потребует существенно больших мощностей как по питанию, так и по охлаждению. Его масса также больше, что потребует укрепить силовые структуры помещения. Помещение, известное как комната E102, расположено в здании за номером 5600, имеет площадь свыше 1800 м2, и оно требует удаления всей старой инфраструктуры, включая полную замену фальшпола.

Если Titan потреблял около 10 МВт, то Frontier потребует почти 30 МВт, а система охлаждения должна будет отводить порядка 40 МВт тепловой энергии. В настоящее время новый, способный выдержать большие массы, фальшпол уже установлен, его масса составляет порядка 110 тонн. Ведутся работы по прокладке новых 24-дюймовых магистралей СЖО, способных прокачать около 19 тысяч литров жидкости в минуту. Общий же объём теплоносителя составит почти 500 тысяч литров (130 тысяч американских галлонов). За работу СЖО будут отвечать четыре насосных станции каждая мощностью 350 л.с. каждая.

Ранее пространство вокруг «комнаты 102» занимали офисы группы OLCF, но теперь там устанавливаются трансформаторы подсистем питания мощностью 28 мВт. Также пришлось изыскать место для градирен СЖО — для них был возведен новый фундамент в соседнем здании за номером 5800. В нём не прекращались научные исследования и, хотя в распоряжении проекта имелись данные о проложенных силовых линиях, было принято решение не рисковать и использовать георадары и сенсоры ЭМИ.

Архитектура вычислительного узла Frontier

Архитектура вычислительного узла Frontier

Несмотря на все трудности, проект Frontier пока развивается успешно. Как правило, такие HPC-системы требуют порядка двух лет на подготовку и монтаж. К тому же пандемия внесла свои коррективы — ранее ORNL уже была вынуждена объявить об обязательном тестировании всех работников на коронавирус. Несмотря на это, завершение работ намечено на весну 2021 года. Полномасштабный запуск Frontier в эксплуатацию произойдет не позднее 2022 года.

Коммутаторы Slingshot требуют довольно серьёзного охлаждения

Коммутаторы Cray Slingshot требуют довольно серьёзного охлаждения

Новый суперкомпьютер сможет поддерживать минимальную производительность на уровне 1,5 экзафлопс. В его состав войдёт более 100 стоек Cray Shasta, заполненных узлами на базе AMD EPYC Milan и ускорителей Radeon Instinct в соотношении 1 к 4. Для устранения потенциальных «бутылочных горлышек» каждый ГП в каждом узле получит свой сетевой порт Cray Slingshot, который обеспечит прямую связь между этими чипами. А программный комплекс, обеспечивающий работу Frontier, будет сочетать в себе технологии Cray Programming Environment и открытую платформу AMD ROCm. Подробнее о новом суперкомпьютере можно узнать на сайте ORNL.

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER. | Можете написать лучше? Мы всегда рады новым авторам.

Источник:

Постоянный URL: https://servernews.ru/1028415

Комментарии

Система Orphus