2001 г

О проблемах хранения корпоративной информации

Смирнов Николай, itex_spb@cards.lanck.net, тел (812) 393-46-53
Директор филиала ООО "АЙТЕКС-М" в Санкт-Петербурге

Современную организацию невозможно представить без электронных данных. И чем крупнее фирма, тем сильнее ее функционирование зависит от компьютерной техники. Документы и бухгалтерия, счета клиентов и организаций, рекламная информация, почта, программы, файлы с графическими и аудио/видео данными, корпоративные базы данных и т.д., - все находится на дисках серверов локальных сетей или дисках мэйнфреймов.

Можно даже сравнить, что информация - это кровь, которая течет по жилам корпорации и поддерживает ее жизнедеятельность.

Тенденции роста объемов и концентрации информации

В настоящее время, практически все организации сталкиваются с проблемой критического нарастания объемов информации. Рост данных ставит перед техническим персоналом любой компании задачу построения современной системы хранения данных. По данным исследования, проведенного компанией Meta Group (Стэмфорд, шт. Коннектикут), объем информации, аккумулируемой компаниями, удваивается каждые 18 месяцев. Конечно, такие показатели пока более актуальны для зарубежных компаний, но и в российских фирмах идет процесс увеличения объемов полезной информации. Тем более, что сейчас в России быстрыми темпами развиваются такие сферы деятельности, как электронная коммерция, планирование ресурсов предприятия (ERP) и управление взаимоотношениями с потребителями (customer relationship management - CRM).

Исторически сложилось так, что на каждом предприятии собрался целый комплекс различных автоматизированных систем, каждая из которых так или иначе решает те задачи, для которых она предназначена. Ни для кого не секрет, что обмениваться данными все эти системы могут с большим трудом, а то и вообще требуется новый ввод данных для каждой конкретной системы. Поэтому, возникает заинтересованность пользователей в концентрации информации, чтобы применять ее на различных системных платформах. При этом, совместное использование информации предполагает консолидацию корпоративного аппаратного обеспечения. Преобладающие в корпоративных информационных системах приложения баз данных только усиливают потребность в связях между различными платформами. Концепцию "большого мешка" успешно применяют многие компании. Проведенный Business Research Group опрос 300 специалистов показал, что две трети респондентов рассматривают возможность объединения устройств хранения данных в единую подсистему, допускающую совместное использование данных.

Как это ни удивительно, большинство компаний пока относятся к вопросу создания структуры хранения данных не слишком серьезно. "Пока что большинство компаний действуют импульсивно. Осознавая рост объема информации, они просто увеличивают число серверов и расширяют объем дискового пространства. Лишь немногие подходят к проблеме стратегически", - говорит Джефф Хайн, руководитель подразделения профессионального обслуживания компании Berkshire Computer Products (Хопкинтон, шт. Массачусетс). Причем такой поход наблюдается как в зарубежных, так и в российских компаниях.

Цена потери доступа к корпоративной информации

Можно долго обсуждать успехи технического прогресса, однако в словосочетании "информационные технологии" второе понятие всегда подчинено первому, а информация стоила, и будет стоить дороже средств ее обработки, передачи и хранения. Плата за поддержку неизбежно увеличивающихся объемов данных составляет сегодня, по данным IDC, 50% всех расходов на ИТ-решения. И все это для того, чтобы избежать еще более высоких расходов, связанных с потерями доступа к хранилищам информации и измеряемых от 20 тыс. до 6 млн. долл. в час в зависимости от приложения. Эта сумма складывается из стоимости снижения продуктивности служащих из-за сбоя в системе, стоимости работы, которая не может быть выполнена, пока система не восстановлена, стоимости ремонта вышедших из строя элементов системы. Поэтому при реализации критически важных для предприятия приложений стоит учесть, что цена простоев из-за сбоев системы вполне оправдывает вложение немалых средств в установку отказоустойчивых архитектур. Десять лет назад, когда сервер локальной сети на базе процессора Intel выходил из строя, неприятности компании ограничивались возмущением пользователей по поводу отсутствия доступа к электронной почте. Теперь же при выходе из строя приложений, от которых напрямую зависит прибыль, и при потере доступа к ценной информации компания терпит убытки.

В Соединенных Штатах, где зависимость от компьютеров выше, чем в России, поскольку техника и программы используются более широко, убытки от сбоев систем составляют до 4 млрд. долларов в год (по данным FIND/SVP). Как правило, остановка американской фирмы на срок до 8 дней ведет к снижению до 3-4% годового оборота компании, а из простоя в 10 дней способны выкарабкаться немногие компании. Полная же потеря корпоративной информации грозит компании крахом.

Общие требования к дисковым подсистемам хранения данных

Одной из основных проблем построения дисковой подсистемы хранения данных, во все времена остается задача обеспечения их продолжительного функционирования. Решение этой задачи имеет три составляющих: надежность, доступность (готовность) и удобство обслуживания. Все эти три составляющих предполагают, в первую очередь, борьбу с неисправностями системы, порождаемыми отказами и сбоями в ее работе.

Дисковая подсистема хранения данных имеет в своем составе накопители на жестких магнитных дисках. Как любой технически сложный продукт, накопители на жестких дисках подвержены выходу из строя по внешним и внутренним причинам. К внешним относятся - механические, электрические, плохие условия эксплуатации. Внутренние причины делятся на два типа. Первые, "фатальные" - выгорание микросхем управления, выход из строя контактов, внутренние разрушения компонентов. Вторые проявляются в виде постепенного ухудшения функциональных показателей диска, выхода характеристик за пределы рабочего диапазона.

Повышение надежности системы основано на принципе предотвращения неисправностей, путем снижения интенсивности отказов и сбоев, за счет применения электронных схем и компонентов с высокой и сверхвысокой степенью интеграции, снижения уровня помех, облегченных режимов работы схем, обеспечения тепловых режимов их работы, а также за счет совершенствования методов сборки аппаратуры. Единицей измерения надежности является среднее время наработки на отказ (MTBF - Mean Time Between Failure).

В 1987 году трое специалистов из университета Беркли опубликовали статью с описанием методов повышения надежности путем использования массивов небольших (3.5- и 5.25-дюймовых) дисководов, которые могут достичь показателей производительности, характерных для одного большого дорогого диска (Single Large Expensive Disk - SLED) в мэйнфреймах. Эта технология получила название RAID - Redundant Array of Inexpensive Disks (избыточный массив недорогих дисков). Но позже, расшифровка аббревиатуры RAID претерпела изменение - теперь она означает Redundant Array of Independent Disks (избыточный массив независимых дисков). Дисковый массив RAID - это консолидированная серверная система для хранения данных большого объема. В массивах RAID значительное число дисков относительно малой емкости используется для хранения крупных объемов данных, а также для обеспечения более высокой надежности и избыточности. Подобный массив воспринимается компьютером как единое логическое устройство.

Повышение готовности предполагает предотвращение влияния отказов и сбоев на работу системы хранения данных с помощью средств контроля и коррекции ошибок, а также средств автоматического восстановления рабочего процесса после проявления неисправности. Ключевым моментом здесь является обеспечение защитной избыточности на базе как аппаратного, так и программного обеспечения. Это позволяет сохранить текущее состояние данных или продолжить выполнение процесса до замены вышедших из строя компонентов на исправные.

Отказоустойчивая система хранения данных должна обеспечивать переключение на альтернативное устройство в случае сбоя, а также информировать администратора о любых изменениях конфигурации, так чтобы он мог восстановить вышедшие из строя компоненты прежде, чем перестанут работать их дубликаты. Для этого система должна посылать сообщения на консоль администратора, регистрировать на диске все ошибки для периодического просмотра, а также иметь возможность отправить внешнее сообщение, в случае если сбой произошел в отсутствие администратора на своем рабочем месте.

Повышение готовности - есть способ борьбы за снижение времени простоя системы. Единицей измерения здесь является коэффициент готовности, который определяет вероятность пребывания системы в работоспособном состоянии в любой произвольный момент времени. Статистически коэффициент готовности определяется как MTBF/(MTBF+MTTR), где MTTR (Mean Time To Repair) - среднее время восстановления (ремонта), т.е. среднее время между моментом обнаружения неисправности и моментом возврата системы к полноценному функционированию.

Необходимо сказать несколько слов о пользе применения резервного копирования. Конечно, обеспечение резервного копирования данных увеличивает стоимость системы хранения данных, но нужно помнить, что резервные копии - это своего рода "спасательный круг", способный пригодиться в самых разных ситуациях (например пожар, наводнение, террористический акт, и т.п.). Поэтому, возможен разумный компромисс между суммарной стоимостью систем резервного копирования и убытками, которые может понести фирма в случае потери данных.

Понятно, что чисто техническими решениями невозможно полностью предотвратить возможные потери данных. Необходимы также организационные меры, предупреждающие потерю информации. Во-первых, необходимо обеспечить безопасность доступа к информации, во-вторых, разработать технологию резервного копирования и восстановления, и, наконец, определить место хранения резервных носителей.

При соблюдении всех этих мероприятий, потери информации сводятся к минимуму, и, если даже, по каким-то причинам происходят потери - обеспечивается быстрое восстановление данных с максимально возможной достоверностью.

Вопрос выбора дисковых систем хранения данных

Думается, что о необходимости применения дисковых подсистем хранения данных было сказано уже достаточно. Поэтому, более полезным представляется сформулировать список общих вопросов, которые следует учитывать, при выборе определенной системы хранения данных:

Исполнение системы?
Каковы возможности системы к масштабируемости?
Насколько надежными являются используемые дисководы?
Обеспечение доступности данных: Как реализованы функции резервирования элементов? Как происходит замена дисков? Сколько времени это занимает и можно ли это сделать не прерывая работы?
Имеется ли возможность работы с различными системными платформами?
Каким образом осуществляется диагностирование системы и анализ результатов проверки?
Поддерживается ли технология обеспечения резервного копирования?

В настоящее время на рынке представлено достаточно большое количество дисковых подсистем хранения данных различных производителей, отличающихся по своим возможностям и характеристикам. В качестве примера можно рассмотреть систему TETRAGON фирмы COMPAREX (Германия), производителем которой является фирма HITACHI (Япония). Дисковые системы TETRAGON являются лидером на мировом рынке по техническим характеристикам и надежности, на самом деле гарантируют 100%-ную доступность данных (по данным Gartner Group). Организация Raid Advisory Board по своей классификации дисковых массивов, с точки зрения пользователей по защищенности данных, присвоила семейству COMPAREX TETRAGON максимальный класс DTDS+ (Disaster Tolerant Disk System, или удаленное "зеркало") - обеспечивающий сохранность данных даже при полном отказе или физическом разрушении одной из систем, а также доступ к данным при отказе любой единичной компоненты и сохранность данных при сбоях питания и других воздействиях окружающей среды.

Дисковые подсистемы хранения данных COMPAREX TETRAGON T2000/T2100 имеют следующие технические характеристики:

Подсистема TETRAGON выполнена как отдельное устройство, состоящее из двух блоков - контроллера (1 шт.) и дискового массива (до 4 шт.). Контроллер специально разработан для RAID массивов, к которому может подключаться до 4 пар дисковых процессоров, каждая из пар допускает до 8 одновременных операций обмена данных с дисками. Все элементы контроллера соединены двумя внутренними шинами с пропускной способностью 200 MB/s.
Кроме этого имеется еще одна шина, используемая только для целей управления с пропускной способностью 100 MB/s. Для модели T2100 пропускная способность каждой из двух внутренних шин 240 MB/s, а шин управления по 135 MB/s (их также 2 шт.).
Для обмена данных между серверами и системой TETRAGON, в ней имеются канальные процессоры, которые представляют из себя мощные RISС - процессоры. В модели TETRAGON 2000 таких процессоров может быть до 4, а в модели T2100 - до 8 шт. Каждый из канальных процессоров имеет по 4 физических пути для перепосылки данных.
Объем энергонезависимой кэш-памяти может составлять до 8GB (модель Т2000) и до 16GB (T2100).
Построение системы предоставляет полную независимость от марок вычислительного оборудования, с которым предполагается совместная работа. Не требуется установки дополнительного программного обеспечения - достаточно только средств операционной системы.
Уникальная архитектура TETRAGON позволяет легко расширять емкость подсистемы, в зависимости от потребностей пользователя. Минимальная емкость обеспечивает 22.68 GB памяти прямого доступа и может быть увеличена до 1 600 GB (для модели Т2000) и до 11 000 GВ (модель Т2100).
Специально разработанные высоконадежные 3.5" дисковые накопители (MTBF - 2 000 000 часов), емкостью до (9 GB. ( (модель Т2000) и до 47 GB. (модель Т2100) или уникальные 2.5" диски емкостью 6 GB и 15GB, со скоростью вращения 12000 об./сек (только в модели Т2100), отличающиеся непревзойденным быстродействием. Диски различных объемов могут комбинироваться в одной системе для того, чтобы максимально удовлетворить конкретным потребностям пользователя. Дисководы подсоединены по двум параллельным интерфейсам SCSI-2 Wide&Fast.
Система обеспечивает постоянную доступность данных (24 часа 7 дней в неделю). Данные, занесенные в систему, никогда не потребуют поддержки в режиме off-line - вне зависимости от того, какие ошибки могут произойти и какие модификации или изменения конфигурации могут потребоваться. Такая непрерывность операции достигается благодаря:
- Возможности выполнять все модификации оборудования, не прерывая работы пользователя.
- Использованием технологии RAID-5
- Наличию динамических запасных дисков, которые используются автоматически в случае отказов основных дисков. В маловероятном случае сбоя диска, его содержание автоматически восстанавливается на запасном дисководе, а после установки исправного переписывается обратно. Даже при интенсивной работе пользователей вся эта операция займет не более 2 часов. Пользователь может иметь до 8 запасных дисков
- Отсутствию в системе не продублированных элементов и модулей.
Кроме интерфейса с серверами архитектуры S/390 по параллельным каналам (обеспечивающим скорость передачи данных до 9 МB/s) или ESCON-каналам ввода/вывода (до 17 МB/s), системы TETRAGON могут оснащаться интерфейсом SCSI (до 40 МB/s) для одновременного подключения к процессорам других платформ (UNIX, WindowsNT, Novell) и интерфейсом Fibre Channel (только в модели T2100) (скорость до 100 МB/s). Поставляются программные средства, обеспечивающие с помощью системы TETRAGON эффективный обмен данными между различными платформами, а также высокоскоростное сохранение/восстановление информации открытых систем средствами мэйнфреймов.
Дисковая подсистема TETRAGON предоставляет большие возможности по диагностированию. Например, в режиме простоя, система автоматически запускает программы проверки дискового массива, что позволяет во-первых заблаговременно выявить возможные ошибки, а во-вторых рационально использовать время невостребованности системы пользователями. Имеются возможности передавать информацию об ошибках сразу на рабочее место администратора дисковой подсистемы или прямо в сервис центр.
Система имеет поддержку режима Remote Copy (функция ведения удаленной зеркальной копии) в синхронном и асинхронном режиме. Резервная подсистема может быть установлена в помещении, удаленном до 43км от основного вычислительного центра, при этом используется соединение между дисковыми подсистемами по ESCON каналам.

В данной статье рассмотрены вопросы необходимости построения систем хранения информации в крупных организациях. А также описаны наиболее предпочтительные, с нашей точки зрения, технологии и продукты, которые обеспечивают с технической стороны максимально возможную надежность и доступность данных.

А с экономической стороны позволяют сохранить вложенные инвестиции, за счет больших возможностей масштабируемости.