2004 г
Назад Оглавление Вперёд
Наличие "горячего" резервного центра обработки данных (ЦОД) с установленным оборудованием, протестированной операционной средой и критически важными приложениями минимизирует отрицательные последствия для организации при возникновении бедствия.
"Холодный" резервный ЦОД - пустое помещение, оборудованное, как минимум, фальшполом, кондиционерами, гарантированным электроснабжением, противопожарными средствами и освещением, которое готово к установке вычислительного оборудования.
При возникновении чрезвычайной ситуации поставщики технических средств будут максимально помогать вам, но, тем не менее, поставка оборудования займет от 6 до 10 дней. Поставленное оборудование должно быть установлено и протестировано. Эти задержки необходимо учитывать при оценке последствий чрезвычайных ситуаций для бизнеса.
Наличие полностью оборудованного основного ЦОД и "холодного" резервного помещения, вкупе с разработанными в "Плане восстановления после бедствия (DRP)" процедурами его перевода в "горячий" режим, как правило, экономически наиболее целесообразное решение. Основным недостатком при этом является неизбежная задержка, связанная с переводом "холодного" резервного помещения в "горячий" режим.
На западном рынке существует широкий выбор полностью оборудованных резервных ЦОД. Помещения могут отличаться по предлагаемой площади, типу и размерам установленного оборудования, средствам обеспечения физической защиты помещения или географическому положению, но во всех случаях предлагается основное - работающие компьютеры, готовые к использованию клиентами.
Контракт на услуги должен содержать следующие сведения: условия и дату вступления в силу, определение терминологии контракта, условия использования помещения, суммы и график платежа, условия, касающиеся нескольких одновременных бедствий, ответственность, изменения аппаратных средств, конфиденциальность и условия расторжение контракта.
Компания, с которой заключен контракт, должна предоставить план помещений, включая компьютерный зал, приемную, зал заседаний и т.п.
Для уверенности в действенности Плана в случае бедствия он должен регулярно испытываться. Основной и резервный ЦОДы как правило непрерывно обновляются. Добавляется новое программное обеспечение, модернизируется оборудование и возможно появление проблем с прикладными системами, которые ранее успешно прошли испытания. Испытания - единственный способ обеспечить гарантированный и относительно безболезненный перенос деятельности в резервный ЦОД.
Испытания должны регулярно документироваться. Нельзя полагаться на знания ключевого специалиста, который отвечает за восстановление операционной системы, необходимых библиотек и файлов. В момент бедствия ключевой специалист наверняка будет отсутствовать.
Первоначальное испытание должно касаться восстановления операционной системы, тестирования языка управления заданиями (JCL), восстановления файлов на специфических дисковых системах, проверки системы связи и проверки простого пакетного задания, запускающего приобретенное программное обеспечение. Потребуются испытания критических прикладных систем. Первоначальные испытания порой оказываются неудачными. Ключ к успеху - регистрация успехов и неудач с последующей корректировкой Плана, учитывающей результаты предыдущих испытаний.
Удачное восстановление части библиотек и файлов на диске при первой попытке испытаний - уже успех. При последующих испытаниях проверяется восстановление файлов по резервным копиям, заархивированным в удаленном хранилище. Если дисковые массивы в резервном помещении отличаются от основных, заранее запланируйте, как на них переписывать файлы, сколько места отвести под рабочие области и т.д.
Все критически важные прикладные системы должны тестироваться. Это единственный способ убедиться, что они будут работать в резервном помещении. Подготовьте график проведения испытаний всех критически важных прикладных систем и зафиксируйте все успехи и неудачи.
При испытании некоторых прикладных систем может потребоваться система связи. Испытание системы связи должно быть проведено как можно скорее, чтобы заранее определить потребности в каналах связи.
Несмотря на наличие плана испытаний в резервном помещении, руководство должно спланировать проведение неожиданных внеплановых испытаний с использованием имитации бедствий. При имитации бедствия, когда персонал заранее не знает, когда и какой вид испытаний должен быть проведен, можно лучше оценить эффективность своего Плана.
Обеспечение возможности работы программистов в резервном помещении - существенная часть Плана восстановления после бедствия. Программисты должны иметь доступ к исходным текстам программ, перетранслировать их, редактировать связи. Они также нуждаются в доступе к средствам программирования и отладки. Необходимо проверить возможность трансляции для всех используемых языков.
Назад Оглавление Вперёд