С 31 января 2014 г. в Северном (Арктическом) федеральном университете имени М. В. Ломоносова (САФУ) в Архангельске заработал суперкомпьютер, чье аппаратное решение выполнено на основе оборудования Fujitsu. Специалистами этой компании был создан кластер, включающий двадцать вычислительных узлов (серверы PRIMERGY), два сервера управления, сеть передачи данных и системы хранения данных ETERNUS DX. Архитектура вычислителя базируется на процессорах Intel Xeon Phi. Помимо аппаратной части внедрены графический интерфейс управления кластером и параллельная файловая система хранения данных FEFS (Fujitsu Exabyte File System). В стандартных тестах Linpack вычислителем была достигнута производительность 17 Тфлопс.

О подробностях проекта и о перспективах использования суперкомпьютера в образовательном процессе вуза рассказывают и. о. заведующего кафедрой программирования и высокопроизводительных вычислений Института математики, информационных и космических технологий САФУ, научный сотрудник Технического университета Лулео (Швеция) Владимир Березовский и директор Центра инновационного обучения, заведующая лабораторией технологий распределенных и высокопроизводительных вычислительных систем Ольга Юфрякова.

Как можно понять из новостных сообщений, это ваш первый суперкомпьютер. Почему его установка произошла именно сейчас?

В последние годы появилась необходимость перестройки инженерного образования в связи с тем, что сама по себе инженерная деятельность приобретает сейчас исследовательский характер, опирающийся на фундаментальные знания. Суперкомпьютерные технологии (СКТ) позволяют максимально реализовать возможности математического моделирования, ставить и решать во всей полноте междисциплинарные задачи, наиболее близко подходя к описанию физического мира. Проектно-конструкторская, расчетно-технологическая работа в инженерной деятельности все больше полагается на расчетно-технологические вычислительные среды (CAD/CAE/CAM-технологии). Подготовка современных специалистов требует внедрения СКТ в инженерное образование. В САФУ давно создана инфраструктура для подготовки кадров и проведения научных исследований в области суперкомпьютинга и высокопроизводительных вычислений. Созданы научно-образовательный центр «Математическое моделирование, высокопроизводительные вычисления и информатизация образования», лаборатории вычислительной физики, технологий распределенных и высокопроизводительных вычислительных систем, кафедра программирования и высокопроизводительных вычислений, а также Центр инновационного обучения. Выстроена система подготовки высококвалифицированных кадров в области СКТ, ведутся программы повышения квалификации и переподготовки кадров, открыты магистратуры. Модули СКТ включаются в программы подготовки инженерных специальностей университета. Так что оставалось только установить вычислитель.

В вашем проекте подкупает то, что вы явно приобретали кластер не из соображений престижа (вхождения в топы рейтингов), а подходили к вопросу взвешенно и расчетливо. Почему выбраны именно такие мощностные параметры?

Параметры выбирались исходя из основной задачи, которую должен решать суперкомпьютер, — внедрения СКТ в образовательный процесс. Он должен быть достаточно мощным для решения учебных и исследовательских задач. При этом необходимо, чтобы кластер нормально интегрировался в существующую инженерную ИТ-инфраструктуру университета, накладывающую ограничения в части потребления электроэнергии и занимаемых системой площадей, а также имел приемлемую стоимость. То есть основным определяющим фактором было соотношение «цена/качество».

Какие задачи вы ставили перед поставщиком аппаратной части? Почему исполнителем проекта стала именно компания Fujitsu?

Кластер должен был быть разнородным и состоять из вычислительных узлов с 64-разрядной архитектурой x86 и узлов с гибридной 64-разрядной архитектурой x86 + GPU (графические ускорители). Вычислительная сеть должна строиться на основе Infiniband FDR; совокупная пиковая производительность суперкомпьютера — составлять не менее 15 Тфлопс, а производительность в тесте Linpack — не менее 85% от пиковой. Компания Fujitsu в данном случае победила в конкурсном отборе (а участвовали также IBM, HP и «T-Платформы»), предоставив решение с лучшим соотношением упомянутых цены и качества.

Какое прикладное ПО вам пришлось приобрести для полноценной работы?

Для решения поставленных нами задач необходима среда разработки, содержащая оптимальные компиляторы, библиотеки коммуникации и оптимизированные математические библиотеки. Выбор был сделан в пользу Intel Claster Studio. В дальнейшем прикладное ПО может быть развернуто из пакетов открытого и академического программного обеспечения. Сейчас это Quantum Espresso, OpenFOAM. Планируем развернуть Salome, LAMMPS, DL_POLY, NWChem, Siesta. Кроме того, приобретены ANSYS, Accelrys Material Studio и Pipeline Pilot. Хотим купить Gaussian, LS-DYNA, FlowVision.

Каким именно образом предполагается использовать кластер в учебном процессе?

Это многочисленные курсы по методам и алгоритмам высокопроизводительных вычислений, параллельному программированию, архитектуре вычислительных систем, математическому моделированию, а также курсы инженерного моделирования. Предполагается, что студенты будут использовать расчеты на кластере при выполнении курсовых и дипломных работ и во время практики. Помимо этого мы планируем создать курсы математического моделирования для аспирантов.

Планируете ли вы взаимодействие с другими вузами, институтами или суперкомпьютерными центрами?

Университет более пяти лет является членом суперкомпьютерного консорциума университетов России, уже устоялись связи с Московским государственным университетом имени М. В. Ломоносова, Санкт-Петербургским национальным исследовательским университетом информационных технологий, механики и оптики (НИУ ИТМО), Санкт-Петербургским государственным политехническим университетом (СПбГПУ), Нижегородским государственным университетом имени Н. И. Лобачевского (ННГУ), а также с норвежским университетом Тромсе и шведским техническим университетом Лулео.

Предполагается ли решать на вычислителе задачи сторонних заказчиков на коммерческой основе?

Если будут оставаться ресурсы после решения основной задачи, то, как говорится, добро пожаловать.

Когда, по вашим расчетам, удастся полностью загрузить суперкомпьютер теми или иными задачами?

Сейчас идет настройка среды, запуск пробных задач и внедрение системы в учебных процесс. После прохождения очередного шага отладки кластер уже неделями работает почти с полной загрузкой.

На создание кластера было затрачено 26 млн. руб. Существует ли в данном проекте понятие окупаемости? Или вы расставляете иные акценты?

Думаем, кластер окупится после выпуска примерно сотни специалистов, использующих в своей деятельности суперкомпьютерные технологии.

По вашим расчетам, на какой период времени вам хватит текущих вычислительных мощностей? Предполагается ли их последующее наращивание — расширение суперкомпьютера?

Вычислительные технологии развиваются очень быстрыми темпами. Сейчас кластер представляет воплощение последних компьютерных достижений. В ближайшие два-три года он будет находиться на уровне актуальных вычислительных технологий, а основные образовательные задачи сможет решать еще лет десять. Поэтому у нас в планах — полноценное развитие нашей суперкомпьютерной площадки. По мере востребованности СКТ в регионе потребуется создать центр коллективного пользования с мощностями на один-два порядка большими, но это уже будут суперкомпьютеры для прикладной сферы, и в образование они будут отдавать незначительную часть своих ресурсов.

СПЕЦПРОЕКТ КОМПАНИИ FUJITSU