Статья только в электронной версии журнала

Статья только в электронной версии журнала

Стихийное бедствие, злой рок или простая оплошность - что бы ни стало причиной беды, надо заранее быть к ней готовыми

В начале этого года Лоу Вильсон испытал на себе действие закона Мерфи, который, как известно, гласит: "Если может произойти что-то плохое, оно непременно случится".

Вильсон, системный консультант из корпорации Florida Power (Сент-Питерсберг, шт. Флорида), как раз установил автоматизированную систему резервного копирования, которая должна была облегчить компании дистрибуцию ПО 2000 года, и только он сделал это, как одним прекрасным утром у него вышли из строя жесткие диски сразу двух файл-серверов. Это грозило потерей 9 Гб критически важных данных. Однако благодаря системе резервного копирования NetBackup корпорации Veritas Software (Маунтин-Вью, шт. Калифорния) ему удалось восстановить данные, а к концу дня - запустить запасную систему.

Вильсону крупно повезло, но далеко не все ИТ-менеджеры могут рассчитывать на везение там, где речь идет о защите от аварийных отказов систем: ведь сегодня ставки - а значит, и риски - как никогда высоки. Пришло время всерьез заняться планом обеспечения непрерывности бизнеса.

Сегодня самые разные компании используют в своей работе электронную коммерцию и Интернет и уже автоматизировали многие внутренние процессы, начиная с электронной почты и заканчивая системами учета продаж и приема заказов. Таким образом, информационные технологии в их бизнесе приобретают все большее значение. По данным опроса, проведенного фирмой Comdisco (Роузмонт, шт. Иллинойс), Интернет и интрасети - неотъемлемая часть инфраструктуры 64% американских компаний. Из них 37% используют свои информационные системы для выполнения критически важных бизнес-приложений. Независимое исследование Техасского университета показало, что 43% компаний США, пострадавших от катастрофической потери данных, были вынуждены прекратить свою деятельность, 51% смогли продолжать работу максимум еще два года и лишь 6% сумели полностью выправить положение.

В то же время Интернет и набирающая силу электронная коммерция способствуют увеличению числа аварий и усугубляют их последствия. В последние годы с непредвиденными ситуациями столкнулись многие компании, в частности издательство The New York Times и фирма MasterCard International. 13 сентября 1998 г. - это было воскресенье, день, когда Web-сайт The New York Times посещают до 150 000 человек, - его вывела из строя группа хакеров. А 13 апреля того же года отказала сеть InterSpan корпорации AT&T. На целые сутки оказались в затруднительном положении ее корпоративные пользователи, а их ни много ни мало 6600! Один из них, компания MasterCard, через эту сеть ежегодно осуществляет транзакции по кредитным карточкам на сумму около 600 млрд. долл. в год, что в пересчете на одни сутки составляет 1,64 млрд. долл. Причиной аварии, по-видимому, стал программный сбой в двух из 145 поддерживающих систему коммутаторов.

Другой источник неприятностей - новая и крайне опасная порода компьютерных вирусов. В последнее время они распространяются даже по электронной почте. Например, вирус, известный под именем Wobbler, маскируется под сообщение от знакомых или обновление ПО от сервис-провайдера Интернета. Созданное на основе новейших хакерских технологий, нераспознаваемое антивирусными программами современное поколение вирусов уничтожает данные жестких дисков и выводит из строя операционные системы. Ни один пользователь электронной почты не застрахован от подобной атаки. Потенциальные опасности Интернета вынудили ФБР добиваться санкций на контроль правительственных и коммерческих сетей.

Кроме вирусов, наводнений и пожаров нормальной работе компаний могут угрожать и менее заметные опасности. Бедой чревата любая непредвиденная проблема, вызывающая замедление или нарушение работы системы, начиная с аварии жесткого диска и кончая природным воздействием, разрушающим здание, где она размещена. При этом достаточно нарушить доступ к ней. Такое бывает в случае наводнения или эвакуации персонала при общественных беспорядках.

Но не все повреждения сетей носят характер аварии; большинство все-таки вызвано ошибками людей, достаточно серьезными, чтобы повлечь за собой потерю клиентов, утрату доверия инвесторов, падение курса акций и снижение прибылей.    

 

Постучите по дереву

Несмотря на обилие факторов риска, многие компании, по данным экспертов, предпочитают отгонять дурные мысли вместо того, чтобы застраховать свои системы от воздействия непредвиденных обстоятельств. Согласно статистике, собранной Web-сайтом www.dlttape.com/proveit, принимающим заказы на интерактивную оценку готовности фирмы к нештатным ситуациям, 72% компаний работают в "опасной зоне" (в том смысле, что они практически не подготовлены к ликвидации последствий аварий), 82% не имеют выверенного плана восстановления работоспособности систем, а 75% не осознают серьезности финансовых последствий, вызванных перебоями в работе компьютеров.

Как показал опрос, проведенный IBM среди 226 корпоративных менеджеров по наладке и восстановлению бизнес-систем, лишь 8% компаний, зарабатывающих на Интернете, имеют готовый план восстановительных работ. В целом, по данным списка 1997 Comdisco Vulnerability Index фирмы Comdisco, только 12% всех компаний реально могут противостоять авариям сетей и информационных систем.

В то же время до 60% компаний из тех, что формально имеют планы восстановительных мероприятий, на практике никогда их не проверяли и не уверены в том, что предусмотренные в них меры помогут сохранить в нештатной ситуации работоспособность систем и критически важную информацию. Об этом свидетельствуют результаты исследования, опубликованного в прошлом году компанией Hewlett-Packard.

"Проведенные исследования показывают, что небольшие и средние компании (с годовым доходом меньше 500 млн. долл.), как правило, меньше подготовлены к ликвидации аварий, чем более крупные: у них практически нет готовых планов, проверенных методов и технологических платформ", - говорит Сэм Грин, менеджер по обеспечению непрерывности бизнеса из корпорации Quantum (Милпитас, шт. Калифорния), производящей запоминающие системы.

Но раз так важно иметь планы на случай непредвиденных обстоятельств, то почему они есть далеко не у всех? По мнению экспертов, во многом это связано с тем, что высшее руководство компаний еще не понимает, насколько это необходимо для гарантии непрерывной работы бизнес-систем. Часть управленцев все, что связано с сетями, рассматривает как предмет чисто технологической, никак не связывая это с бизнесом.

Другая сторона проблемы, утверждают эксперты, заключается в том, что верхний эшелон менеджеров не сознает всего многообразия обстоятельств, которые могут привести к остановке систем. Многие управленцы думают, что небольшие аварии, воздействующие на компьютерные системы, но физически не угрожающие жизни людей, всегда можно предупредить.

По этой причине руководство компаний часто не хочет тратить средства на детальную разработку и проверку планов обеспечения непрерывности бизнеса. Ведь эти расходы не компенсируются впоследствии ростом доходов или повышением производительности труда. Все это кажется не таким важным, как, например, проблема 2000 года или развертывание коммерции через Интернет.

Планирование поддержки непрерывности бизнеса нередко тормозят и сами ИТ-отделы. Хороший план, отмечает Грин из корпорации Quantum, предусматривает дополнительную нагрузку на персонал: надо постоянно архивировать данные и хранить их в определенном месте, а сам план требует периодического тестирования и обновления. Не удивительно, что перегруженные массой других забот руководители и служащие ИТ-отделов не хотят за это браться.

Укажите на потери

Есть несколько хороших способов убедить руководство компаний в необходимости подготовки серьезных планов на случай возможных аварий.

Во-первых, следует указать, к каким убыткам может привести крупная авария. Это зависит от сферы бизнеса, но, по оценке экспертов (см. диаграмму), потери могут достигать 6,4 млн. долл. в час. По данным обзора фирмы SunGard Recovery Services (Уэйн, шт. Пенсильвания) за 1997 г., чтобы избежать негативных последствий аварии, 83% компаний должны возобновить свою деятельность не позже, чем через сутки после случившегося.

Во вторых, можно попросить ведущих менеджеров ответить на ряд вопросов, касающихся подготовленности к чрезвычайным ситуациям. Как отразится на конкурентоспособности компании приостановка компьютерных операций на один день? А если они остановятся на неделю? А на месяц? Есть ли у компании база клиентов, операции с которыми осуществляются в рамках электронной коммерции?

В-третьих, стоит обратить внимание руководства компании на случаи успешного преодоления последствий аварий. Один из примеров дает Fiduciary Trust Co. International, частная банковская и финансовая компания, имеющая 600 служащих и располагающаяся на верхних этажах одного из небоскребов World Trade Center в Нью-Йорке. 26 февраля 1993 г. террористы взорвали там бомбу, после чего многие компании приостановили операции, а Fiduciary Trust воспользовалась своим тщательно выверенным резервным планом. "Мы смогли продолжать деятельность после взрыва, потому что у нас был работоспособный и проверенный план восстановления, надежный поставщик системы дублирования, и мы всегда трижды в сутки добросовестно архивировали данные", - пояснил Тони Маджио, возглавлявший в то время информационные службы компании.

Какие задачи ставятся при подготовке плана поддержки непрерывности бизнеса? Эксперты считают, что такой план должен предусматривать меры по сведению к минимуму потерь и возможных юридических претензий, организованному восстановлению систем, сокращению страховых взносов, сохранению имущества организации, снижению нагрузки на узкий круг ответственных лиц и обеспечению безопасности персонала и клиентов.

Чтобы план был эффективным, он должен содержать три основных раздела: подготовка документации, резервирование систем, обучение персонала.

В документацию следует включить полный список телефонов всех ответственных лиц компании, информацию, которая позволит в экстренных ситуациях быстро связаться с пожарной охраной, коммунальными службами, поставщиками, клиентами, сервис-провайдерами, страховыми агентами, внешними пунктами хранения данных, полицией и владельцем арендуемого здания.

Необходимы четкие инструкции о том, как действовать в различных экстренных ситуациях, затрагивающих целый город, занимаемое здание, всю компанию, только ее сеть или просто доступ в помещения. Если у каждого сотрудника будет брошюра с такой информацией, ему не придется тратить время на телефонные звонки после происшествия.

Кроме того, целесообразно создать автоматическую телефонную справочную, которая в ответ на звонки будет воспроизводить сообщение с инструкциями и системной информацией (желательно это сообщение регулярно обновлять), например, когда сотрудники должны выйти на работу, когда предположительно будет восстановлена нормальная деятельность компании, какими альтернативными телефонными и модемными линиями следует пользоваться до ликвидации аварии.

Нужно составить перечни компьютерных руководств и гарантийных документов, коммуникационной аппаратуры, страховых свидетельств, компьютерного оборудования и ПО, файлов данных, размещенных в вынесенных за пределы офиса центрах хранения информации, вместе с графиком их резервного копирования, а также список дверных и сейфовых ключей с указанием их местонахождения.

Составляя надежный план на случай экстренных ситуаций, следует решить, нужна ли компании собственная система резервирования или лучше арендовать ее у стороннего провайдера. Надо определить, какое из используемого оборудования имеет первостепенную важность и можно ли на короткое время заменить его домашними компьютерами; может ли компания в течение недели обойтись своим резервным сервером и переносными ПК.

Если вы решили положиться на сервис-провайдера, выясните, какие он предлагает услуги и обеспечивают ли они необходимый уровень защиты. Некоторые службы, например Recall Total Information Management (Атланта), специализируются на услугах по резервному копированию с периодичностью от нескольких раз в день до одного раза в неделю. Другие, такие как Comdisco и HP, могут создавать из своих модулей законченные системы, зеркально отражающие систему вашей компании.

Какой бы вариант построения резервной информационной системы ни был выбран ИТ-менеджером, уже сегодня следует побеспокоиться о составлении и тестировании планов восстановления деятельности компании. Сейчас больше чем когда-либо непозволительно рассчитывать на везение.

С автором, профессором факультета компьютерных приложений и офисного менеджмента в колледже г. Санта-Барбары (Калифорния) и специалистом в области систем и новых технологий хранения данных, можно связаться по адресу: parker@sbcc.net.

Prove It советует: как выстоять в час испытаний

Дж. П.

Не исключено, что вы уже приступили к разработке плана восстановления работоспособности компании после аварий, но можно ли быть уверенным, что в нем будут предусмотрены все ситуации?

Чтобы оценить меру своей готовности к чрезвычайным ситуациям, ответьте на 10 вопросов анкеты, предлагаемой Web-сайтом Prove It (www.dlttape.com/proveit). Этот сайт финансируют 20 компаний, выпускающих устройства копирования данных на магнитных лентах и другие продукты для восстановления информации. Данная анкета, предназначенная для руководителей предприятий, помогает уяснить, в какой мере можно рассчитывать, что вашей компании удастся успешно выбраться из крупной аварии. После того как вы ответите на все вопросы, программа оценит вашу готовность в баллах, и вы сможете сравнить свой показатель с оценками других организаций, прошедших тот же тест. Кроме того, по результатам тестирования вы получите конкретные рекомендации.

Прочитайте вопросы и ответьте "да", "нет" или "не уверен".

1. Есть ли у вас письменный план восстановления нормальной работы в случае аварии?

2. Проводили ли вы его тестирование?

3. Дал ли ваш тест положительный результат?

4. Пытались ли вы оценить и классифицировать финансовые риски, связанные с отказами различных жизненно важных функций?

5. Есть ли у вас планы распределения персональных функций и обязанностей в случае чрезвычайной ситуации?

6. Корректируете ли вы восстановительные планы в соответствии с изменениями в вашем бизнесе?

7. Регулярно ли вы производите резервное копирование данных, причем с каждого сервера или жесткого диска?

8. Регулярно ли вы пересылаете резервные копии в безопасное хранилище вне вашего здания?

9. Есть ли у вас внутрикорпоративные стандарты на использование сред, жестких дисков, ПО и технологий автоматизированного архивирования?

10. Проявляет ли внимание к вопросам готовности к чрезвычайным ситуациям высшее руководство вашей организации?    

Аварии сжигают доллары

Разработка и развертывание плана поддержки непрерывности бизнеса стоят денег, но игнорирование проблемы чрезвычайных ситуаций может обойтись намного дороже. Ниже приведены усредненные данные, отражающие потери из-за отказа компьютерных систем в различных отраслях индустрии

Версия для печати