В нашей стране наконец стали заметны подвижки в сфере развития суперкомпьютерных ресурсов. Напомним, что в феврале в Межрегиональном вычислительном центре Томского университета был запущен комплекс “СКИФ Cyberia” с характеристикой 9 Тфлопс в тесте Linpack (пиковая производительность — 12 Тфлопс), который, в частности, на днях задействован в проекте повышения безопасности работы в шахтах. А сегодня к внедрению суперкомпьютера производительностью 8 Тфлопс готовится НПО “Сатурн”. Правда, данный комплекс по своей мощи не войдёт даже в первую сотню списка лучших решений мира Top500, но тем не менее в российской промышленности он станет одним из сильнейших. Работы будут выполнять компании КРОК и IBM. Система поможет в создании новых авиадвигателей гражданского и военного назначения, газотурбинных двигателей для морской техники, наземных энергетических и газоперекачивающих установок. С 2005 г. “Сатурн” эксплуатирует кластер на базе серверов IBM xSeries, выполняющий газодинамические, прочностные и другие инженерные расчеты. Пока он считается самым производительным в промышленности России и СНГ и загружен на 100%. Новый суперкомпьютер должен быть сдан в эксплуатацию в конце текущего или начале следующего года.

В эти же сроки в Южно-Уральском государственном университете будет развёрнут, как прогнозируется, самый мощный в СНГ кластер из 284 четырехпроцессорных узлов на базе Intel Xeon, предназначенный для обучения и проектирования сложной техники (автомобилей, самолётов и др.). Предварительная оценка его пиковой производительности — 16 Тфлопс. Бюджет проекта составляет 75 млн. руб. Помимо аппаратной части будет поставлено также несколько САПР и САЕ-систем, включая отечественную разработку FlowVision. Комплекс войдёт в состав сети СКИФГРИД, ресурсы которой планируется предоставлять потребителям на рыночной основе. Эксперты полагают, что стоимость вычислительного часа отечественной grid-сети в пересчете на единицу производительности будет в два раза ниже, нежели в Западной Европе; обещаны также льготы для научных и учебных структур.

СКИФГРИД реализуется как программа Союзного государства России и Белоруссии, которая была утверждена в апреле 2007 г. и состоит из нескольких подпрограмм. В частности, “СКИФ Университеты”, организованная Институтом программных систем РАН, Научно-исследовательским центром МГУ им. М. В. Ломоносова и компаниями Intel и “Т-Платформы”, предлагает вузам двух стран льготные условия по оснащению суперкомпьютерами “СКИФ”. До 20 декабря в рамках акции “СКИФ: учим по-новому!” можно получить существенные скидки.

В ближайшие месяцы темп наращивания отечественных суперкомпьютерных ресурсов сохранится. Так, Межведомственный суперкомпьютерный центр РАН обещает увеличить свои вычислительные возможности на порядок и довести их до 80 Тфлопс. Россия, Белоруссия и Украина подключились и к международной инициативе European Grid Initiative, объединившей 36 национальных проектов по развитию grid-сетей. В перспективе планируется единая общеевропейская grid-инфраструктура, а пока стартуют различные совместные исследовательские проекты, вырабатываются стандарты, готовится ПО промежуточного слоя. Вычислительные ресурсы планируется поставлять конечным потребителям непосредственно на ПК.

За рубежом

Развитием grid- и других форм высокопроизводительных вычислений регулярно занимаются и США со своими партнёрами. Так, на базе вычислительного центра техасского университета в Аустине сформирован глобальный академический суперкомпьютерный консорциум, объединивший специалистов из Англии, Венесуэлы, Германии, Испании, Мексики, Польши и Японии. Он займётся компьютерным решением важных научных и инженерных проблем. А Национальный научный фонд США поддержал концепцию Global Environment for Network Innovations (Geni) — создание “нового” безопасного Интернета, на которую выделено 350 млн. долл. Эксплуатация Geni начнётся через 10—15 лет. Потребность в безопасной и быстрой глобальной киберсреде действительно высока. Похожий проект Future and Internet Research с бюджетом 50 млн. долл. задумала и Европа, рассчитывая получить сеть с хорошей пропускной способностью, свободную от спама, киберпреступности и порнографии и упрощающую доступ к grid-ресурсам. Аналогичную идею прорабатывают и японцы, обещая сдать свою версию улучшенной Сети в коммерческую эксплуатацию к 2020 г.

Новые архитектуры, новые тенденции

На днях были поставлены два оригинальных рекорда вычислительной производительности. Проект Folding@home по анализу процесса формирования белков, объединивший тысячи игровых приставок Sony PlayStation 3, на которые был загружен научный софт, достиг результата 1 Пфлопс. Готовит передовую вычислительную систему в оригинальной архитектуре и Фэн Сун Сю, главный проектировщик шахматной машины Deep Blue, обыгравшей в 1997 г. чемпиона мира Каспарова. Теперь Фэн взялся за игру го — хотя специалисты уже много лет твердят о невозможности создать сильного компьютерного игрока в го, выполняющего полный перебор вариантов на заданную глубину, архитектор настроен оптимистично и верит в быстрый рост грубой машинной силы. Тем временем управляемая хакерами сеть зомби-компьютеров, заражённых червем Sworm (он использует очередную уязвимость Windows), взяла под скрытый контроль 2 млн. машин и по общей производительности обошла лучший суперкомпьютер из списка Top500 (IBM BlueGene/L, 360 Тфлопс). Какими же другими нестандартными путями развиваются суперкомпьютерные технологии?

Фирма Tilera, основанная профессором Массачусетского технологического института Анантом Агарвалом, обещает решить все фундаментальные проблемы, связанные с масштабируемостью приложений для многопроцессорных машин. Для начала она выпустила чип Tile64 ценой 455 долл., выполненный по 90-нм технологии и ориентированный на встраиваемые системы. Формально он поддерживает набор RISC-команд, а фактически реализует сверхбольшие инструкции VLIW (RISC-набор реализован на микрокоде VLIW). В ближайшее время обещан 120-узловой процессор по технологии 65 нм. В чипе Tile64 смоделирована компьютерная сеть — в каждом ядре объединены процессор с собственным кэшем и “роутер”, который рассылает данные четырем смежным ядрам. Такая архитектура в ряде задач, например, при обработке видео, оказалась на порядок эффективнее процессоров Intel Xeon. Создателям ПО для Tile64 доступна версия Linux, оптимизированная для многопроцессорных архитектур, и среда разработки параллельных приложений на базе среды Eclipse. Каждая копия Linux выполняется на отдельном ядре, возможна поддержка и других ОС на базе Tile64. Для переделки прикладных программ под новую архитектуру достаточно заменить в исходном коде стандартные системные вызовы на их “многоядерные” аналоги.

Однако пока ресурсы чипа Tile64 ограничены, и поэтому такие серьёзные научные структуры, как PNNL, тихоокеанская лаборатория министерства энергетики США, ориентируются на решения от более известных на рынке производителей. Осенью PNNL приобрела суперкомпьютер Cray XMT, в котором впервые реализована оригинальная массовая многопоточная архитектура с глобальной памятью. Она ориентирована на бизнес-приложения, где процессор простаивает подчас 80—90% времени, которое тратится в основном на обмен данными с памятью. Cray XMT способна поддерживать сотни тысяч параллельных потоков, которые одновременно обращаются к общей памяти и позволяют эффективно реализовывать и прикладное проектирование электросетей, и научные задачи — из области математического, физического и бизнес-анализа, подразумевающие обработку терабайтов данных.

Сотрудники PNNL совместно с коллегами из Cray уже много лет ведут инновационные исследования по созданию параллельных аппаратных решений и ПО для них. Но в последнее время в мире заметно активизировались проекты в смежной с суперкомпьютерной области. Оплата электроэнергии съедает сегодня весьма заметную долю бюджета в ИТ-инфраструктуре, поэтому быстро растет актуальность технологий экономии электропитания. Оригинальный способ такой экономии предложила компания SiCortex. Она презентовала в Лос-Анджелесе кластер SC648 производительностью 0,5 Тфлопс, который подключается к обычной розетке 110 Вт, а в ходе презентации питался энергией, вырабатывавшейся командой из восьми велосипедистов. Они разместились на велотренажерах, дополненных электрогенераторами мощностью по 260 Вт. В итоге SC648, управлявшийся Linux, успешно выполнил прикладной анализ данных для министерства сельского хозяйства США, определив неизвестные взаимосвязи между геномами насекомых-вредителей. Даже Джон Макки, CEO SiCortex, не до конца верил в успех эксперимента. Пораженный результатами, он заявил, что ещё десять лет назад подобные расчеты были не под силу лучшим машинам, а сегодня их быстро выполняет далеко не самый мощный кластер на человеческой тяге.

Оптимизирует структуру шести своих ЦОДов Голубой гигант. Он переводит ресурсы 3900 серверов на 30 мэйнфреймов серии Sustem z под управлением Linux. В результате, по расчетам, лишь ежегодная экономия на электроэнергии будет приносить IBM 50 млн. долл. Ещё одно выгодное суперкомпьютерное направление — борьба с болезнями. По оценкам Всемирного Банка, пандемия гриппа может вызвать падение мирового ВВП на 2% (800 млрд. долл.). В частности, масштабные пандемии существенно ухудшают эффективность работы цепочек поставщиков, поэтому корпорация IBM предложила новый сервис Pandemic Business Impact Modeler, который позволяет оценить возможное влияние вспышки пандемии на эффективность бизнеса, помогает подготовиться к напасти с помощью имитационных экспериментов и вовремя составить планы управления кризисными ситуациями.

Софт для параллельного ПО

Компания AMD выпустила спецификацию Light-Weight Profiling (LWP, developer.amd.com/LWP) в рамках инициативы Hardware Extensions for Software Parallelism, подразумевающей оптимизированное выполнение параллельных задач в реальном времени. LWP нацелена прежде всего на виртуальные Java-машины и платформу .NET. В сентябре AMD также опубликовала открытую спецификацию, полезную разработчикам софта для графических процессоров ATI GPU. Так, обещан выпуск драйверов R500/600 в исходных текстах. А текущий набор инструкций x86 инженеры AMD расширяют семейством команд Streaming SIMD Extensions SSE5. Программистам предоставляются мощные упрощенные команды и средства создания хорошо масштабируемых приложений. В частности, доступны инструкции с тремя операндами и команды, за один такт выполняющие набор операций умножения и сложения.

О поддержке в своих продуктах четырёхъядерного процессора AMD Opteron/ Barcelona объявила компания Portland Group. Её компиляторы для Си/С++ и Фортрана будут генерировать оптимизированный код в оригинальном формате Unified Binary, который обеспечивает эффективное выполнение программы на всех 64-разрядных платформах AMD и Intel и их инновационных расширениях. Поддержку данного процессора в своих программных решениях также обещают Microsoft, Novell, Red Hat, Sun Microsystems и VMware.