ОБЗОРЫ

В октябре 2004 г. в г. Санта Фе (шт. Нью-Мехико, США) прошла конференция "The Path to Extreme Supercomputing" (www.zettaflops.org), организованная Сандийской национальной лабораторией США и посвященная вопросам создания суперкомпьютеров с зеттафлопсной производительностью*1.

_____

*1 1 зеттафлопс = 1024 экзафлопсов, 1021 оп/с. 1 экзафлопс = 1024 петафлопсов. 1 петафлопс = 1024 терафлопсов. 1 терафлопс - примерно 1 трлн. операций с плавающей запятой/с, производительность тысячи гигагерцовых процессоров.

Потребность в подобных вычислительных мощностях высказывают физики, химики и биологи, моделирующие молекулярные процессы, проектировщики автомобилей и космических аппаратов, разработчики систем машинного зрения, метеорологи, заинтересованные в исследовании глобального климата и оперативном предсказании землетрясений*1, военные, занимающиеся криптографией и моделированием ядерных реакций, и представители множества других областей деятельности.

_____

*1 Для получения своевременного и точного прогноза землетрясения сегодня нужны ресурсы порядка нескольких экзафлопсов, иначе анализ данных будет закончен уже после происшествия.

На зеттафлопсных машинах удастся реализовать оригинальные алгоритмы искусственного интеллекта и обработки объемной мультимедийной информации. Ожидается, что через 30-50 лет программы научатся писать ПО и разрабатывать оборудование, появятся интерфейсы, связывающие мозг со вспомогательными периферийными устройствами и преобразовывающие соответствующие виды сигналов в реальном времени и т. д. Но даже ресурс в один экзафлопс уже позволит создать ПО, выполняющее интеллектуальную работу по проектированию оборудования на уровне хорошего инженера. Однако наибольшего эффекта удастся добиться, если использовать группы таких искусственных работников, для чего потребуется производительность на несколько порядков выше.

Из истории

Тематика зеттафлопсных компьютеров стала более-менее пристально обсуждаться лишь в XXI веке, когда окончательно прояснились ограничения классических технологий создания процессоров, а математические наработки позволили оценить перспективность других альтернатив. Основное ограничение общепринятых методов создания кремниевых вычислителей связано с так называемым принципом Ландауэра.

Рольф Ландауэр

Рольф Ландауэр, исследователь из IBM, еще в 1961 г. показал, что энергия в процессе вычислений расходуется не на что иное, как на уничтожение битов информации. На практике при стирании бита происходит выделение некоторого (очень малого) количества тепла. Но в классической фон-неймановской архитектуре значения битов в регистрах процессора переписываются огромное множество раз и объем выделяемой при этом энергии уже становится заметным. Общеизвестен факт нагревания процессоров, и чем больший объем вычислений со стиранием информации они производят, тем сильнее греются. Процессор с быстродействием 100 петафлопс уже будет выделять около мегаватта тепла, а один зеттафлопсный процессор - приблизительно 10 гигаватт, объем, сравнимый с энергопотреблением некоторых западных стран*1.

_____

*1 Если же пытаться добиться более высоких показателей производительности, то проявится ограничение в виде теоретического предела возможности отвода тепла от устройства.

Теоретическое решение проблемы сформулировал в 1973 г. Чарльз Беннет, которого на работу в IBM пригласил сам Ландауэр. Беннет в соответствии с идеями своего коллеги предложил достаточно простой выход: чтобы выделения энергии не происходило, достаточно просто прекратить в ходе вычислений стирание битов информации! Надо не расходовать энергию на перезапись ненужных битов (увеличение энтропии), а за счет входного сигнала каким-то образом их накапливать, сохранять в системе для последующего использования, тогда, очевидно, общая энтропия системы не будет увеличиваться и рассеивания тепла не произойдет.

Чарльз Беннет

В результате появилась концепция так называемых обратимых вычислений, когда стирания информации на выходе некоторого логического модуля не происходит, а для этого необходимо, чтобы по выходной информации можно было восстановить информацию на входе (для чего, как правило, требуется усложнить конструкцию такого модуля). Например, операция логического отрицания NOT обратима - по ее результату можно узнать исходное значение. А вот классические операции AND или OR необратимы.

Другими словами, если необратимые логические операции полностью расходуют энергию сигнала, то обратимые могут повторно и многократно задействовать ее части для продолжения расчетов и восстановления своего исходного состояния, поэтому теоретически КПД подобного вычислителя может быть сколь угодно близок к 100%*1.

_____

*1 Можно привести аналогию с электровозами, которые, первоначально получая энергию на разгон из проводов, в дальнейшем при так называемом рекуперативном торможении возвращают до 90% этой энергии обратно в сеть.

Впоследствии физики пришли к выводу, что не существует ни одной необратимой технологии, на базе которой можно построить процессор с зеттафлопсной производительностью, характеризующийся разумным выделением тепла. Ресурсы же этих технологий, в соответствии с законом Мура и темпами развития процессорного рынка, будут исчерпаны где-то через 20 лет. Петафлопсные устройства ожидаются примерно в 2010 г., а к 2020-му будет достигнут порог в 1 экзафлопс, после чего следует ждать технологического кризиса.

В то же время каких-либо масштабных целенаправленных исследований по обратимым логическим процессам, где любые вычисления происходят с сохранением всех битов, буквально до 2004 г. не проводилось. Даже единичные серьезные научные работы по этой теме как физиков, так и математиков содержат ошибки.

Проблемы обратимости

Ключевая и парадоксальная на первый взгляд проблема заключается в том, что создать обратимое логическое устройство не представляет никакого труда. Достаточно немного усложнить логический блок, добавив еще один выход, просто дублирующий вход, и тем самым сделать его обратимым, получив возможность определять входные значения по выходным*1.

_____

*1 Это, впрочем, относится далеко не ко всем бинарным логическим операциям. Для некоторых, например AND, на выход надо подавать больше информации.

Однако подобный модуль не будет обратимым в том смысле, какой вкладывали в эту концепцию Ландауэр и Беннет. Так может быть получена лишь модель, имитация обратимого процесса - тут и ошибалось немало исследователей, путая предлагаемые ими модели обратимых процессов с реальной термодинамической обратимостью. Для построения обратимых вычислительных устройств нужны обратимые физические процессы, которые теоретически описаны хорошо, однако до практического их использования еще далеко*1. Например, не подходят для этого транзисторные элементы - энергия в них рассеивается и при выполнении логически обратимых операций.

_____

*1 Интересно, что чем быстрее выполняются обратимые физические процессы, тем сложнее воплотить их на практике. Это еще одно препятствие на пути создания эффективных обратимых устройств.

Пока никем не доказано, что возможность создания зеттафлопсных компьютеров реализуема (или не реализуема) на практике. Теоретически - да, логические вычислители на базе обратимых процессов не противоречат современной физике (по крайней мере, на сегодняшнем уровне понимания), хотя физические модели соответствующих процессов далеки от завершения.

Трудной задачей остается проектирование полноценных обратимых логических схем, сопоставимых по сложности с современными процессорами. Оказалось, что логически обратимые блоки можно выстраивать строго определенным образом, при этом необходимо минимизировать число дополнительных регистров, поддерживающих обратимость, а также уметь выявлять неактивные части процессора для реализации многозадачности, повторно используя энергию сигнала - для всего этого пока не существует хороших проектных технологий.

Нелегко даже просто перевести производительность будущего обратимого устройства на общепринятые значения. Ведь в типовых тестах быстродействие определяется не по логическим операциям, а на вычислениях с плавающей запятой (флопсах). Одна же такая операция занимает от 20 до 100 тыс. простейших логических действий, многие из которых (например, сдвиг) необратимы.

Хороших идей много - дело за реализацией

С другой стороны, на руку разработчикам обратимых устройств играет тот факт, что стремиться к миниатюризации им совсем не обязательно (а вот для создателей классических процессоров это очень важно). В достаточно крупных устройствах гораздо проще контролировать паразитные эффекты и рассеивание энергии. Хотя на принципе контроля за рассеиванием тепла базируется одно из возможных микрофизических решений: если удастся соблюсти примерно одинаковый уровень мощности входного и выходного сигналов логического преобразователя, то энергию рассеивания, просто подающуюся на дополнительный выход, можно задействовать для других вычислений. Устройство (молекулярных размеров), все элементы которого действуют на одном энергетическом уровне, может основываться, например, на идее туннельного перехода (сквозного преодоления потенциального барьера). Впрочем, теоретическая физика допускает множество "волшебных", на первый взгляд, явлений, только их практическая реализация затруднена. Так, значительно упростится создание обратимых устройств, если удастся задействовать идеи физики низких температур. Однако возможность прикладного использования температур, близких к абсолютному нулю, станет доступной не ранее чем через 20-30 лет.

Перспективными в плане обратимости эксперты считают стремительно развивающиеся микро/нано-электромеханические технологии, системы клеточных автоматов (достаточно подобрать правила перехода между состояниями так, чтобы всегда можно было определить предыдущее состояние по последующему, а для обратимости просто запускать тактовый генератор в обратном направлении). Вполне вероятно, такие автоматы удастся построить из молекул. Подходящими могут оказаться любые подходы - квантовые, молекулярно-механические и т. п., не замыкающиеся на классическом необратимом принципе переключения состояний с использованием полевого эффекта. Поэтому, в частности, ученые давно хотят задействовать достижения квантовой механики, не исключая одновременное использование и необратимых функций - в конце концов, не страшно, если процессор будет выделять разумный объем энергии.

В середине 1990-х гг. в Массачусетском технологическом институте были созданы первые чипы-процессоры, сопроцессоры и запоминающие устройства с обратимой логикой, а для них написаны реализации языка Си. И хотя они, конечно, представляют собой лишь модели (реального сохранения энергии не происходит, так как применяются необратимые физические процессы), тем не менее возможность проектирования логических обратимых схем достаточно высокой сложности уже продемонстрирована.

Действительно ли нужен зеттафлопсный процессор?

Не исключено, впрочем, что для достижения нужной производительности будет вполне достаточно действующих компьютерных архитектур. Просто особое внимание придется уделить технологиям эффективного распараллеливания программ и созданию памяти с быстрым доступом. Так, известный проект SETI@home по поиску сигналов внеземных цивилизаций в космическом шуме, объединяющий ресурсы миллионов ПК энтузиастов, преодолел барьер в 1 зеттафлопс (суммарно, за три года) еще 26 сентября 2001 г., а сегодня его общая производительность за все время работы достигла 5,5 зеттафлопсов! Многие вычислительные задачи анализа физических явлений вообще неудобно решать на машине с одним процессором - гораздо проще создать параллельную модель, которая состоит из множества простых ячеек с наборами состояний, и затем эксплуатировать ее в многопроцессорных сетях.

Поэтому в разработку эффективных кластерных архитектур, допускающих линейное увеличение производительности при наращивании числа машин в сети, сегодня вкладываются значительные инвестиции. Например, открытая архитектура Clustermatic (www.clustermatic.org), развиваемая при поддержке Лос-Аламосской национальной лаборатории США, охватывает все элементы кластерных систем, от BIOS до параллельного периферийного оборудования, и поддерживает спецификации Linux, LinuxBIOS, BProc, BJS и LA-MPI.

Заслуживают внимания и технологии "мультипроцессор в памяти"/"компьютер в чипе", когда в едином адресном пространстве несколько процессоров одновременно выполняют отдельные задачи (принцип "именованной логики"). При этом не возникает проблем с узостью пропускной полосы между процессорами и ОЗУ, так как они объединены в чипе. Однако потенциал такого решения недотягивает до зеттафлопсных режимов.

В рамках программы High Productivity Computing Systems военного научного агентства передовых исследований США (DARPA) к 2010 г. должны быть созданы машины, быстродействие которых выше существующих в десятки раз, а архитектура учитывает требования безопасности и устойчивости к разным видам угроз, а также отличается относительно невысокой стоимостью разработки ПО и возможностью переноса программных решений. Серьезный коммерческий интерес к петафлопсным компьютерам силовые структуры проявляют уже сегодня. Они готовы платить за автоматизацию аналитической деятельности, криптографические работы, проектирование оружия, моделирование бортовых комплексов и биотехнологические исследования.

Промышленный интерес к поиску технологий интенсивных вычислений, в которых не будет верхнего предела производительности, только-только начинает зарождаться. Очень уж радужные перспективы они открывают: например, вычислительная способность мозга человека составляет примерно 100 терафлопсов*1. И если закон Мура с помощью обратимых решений удастся соблюсти, то уже после 2030 г. быстродействие типичного ПК превысит потенциальные возможности человеческого мозга, а в 50-60-е годы сравняется с интеллектуальной мощью всего человечества*2.

_____

*1 Оценка специалистов IBM, оценки других экспертов колеблются в диапазоне от 100 гигафлопсов до 100 зеттафлопсов. Впрочем, производительность конкретного мозга сильно зависит от мотивации его владельца к собственному развитию :).

*2 Не совсем корректное сравнение, т. к. методов расчета производительности автопоэзной сети, которую представляет собой человечество как система, пока не создано. - Прим. гл. ред.

Так или иначе, но с 4 по 6 мая 2005 г. в г. Искья (Италия) пройдет первая международная конференция по обратимым вычислениям. Передовые исследования рубежных возможностей вычислительных устройств дадут отдачу в любом случае - пусть и не сразу - в виде зеттафлопсных машин.