Не так давно в ИТ-лексиконе, посвященном хранению данных, появилась аббревиатура SAM. Что это такое? И почему о системах управления хранением сегодня говорят все больше?
Можно найти различные объяснения термина SAM (Storage Area Management — «управление средой хранения»): управление устройствами хранения, массивами данных и соединениями; управление хранимыми данными и их потоками (ввод/вывод, копирование, восстановление, зеркалирование); упреждающий мониторинг производительности систем хранения; учет стоимости средств хранения и контроль эксплуатационных характеристик и др. В зависимости от контекста SAM аналитики стараются давать более широкие определения.
- SAM - набор задач, направленных на мониторинг и поддержание системы хранения, а также потоков данных с целью повышения эффективности.
- SAM - стратегия создания инфраструктуры хранения данных, позволяющая получать измеримую пользу для бизнеса.
Пирамида управления
Функции управления можно разделить на несколько уровней, которые обычно представляют в виде Пирамиды управления (рис. 1), показывающей возможные направления развития систем SAM.
Рис. 1. Пирамида управления
Нижний уровень, непосредственно взаимодействующий с элементами сети хранения данных, представлен наиболее широким диапазоном решений, как правило, разработанных компаниями, специализирующимися на конкретных типах оборудования сетей хранения (Brocade, Gadzoox и др.).
Следующий уровень, SAN Network Management, оперирует агрегированными данными, поступающими снизу. При этом большая часть решений представлена ведущими разработчиками систем корпоративного управления — Veritas, BMC, HP и Tivoli. Уровень SAN Virtualization образован решениями в модной сегодня области. О виртуализации много говорится, но зачастую термин «виртуализация» трактуется очень расплывчато. Это может привести к тому, что данный уровень в дальнейшем не займет действительно значимого положения в Пирамиде управления. В то же время уровень Data Management выглядит совсем уже старожилом, собравшим все решения в области управления хранением данных. Среди них можно выделить наиболее известные, такие как Veritas со своим семейством продуктов NetBackup, Legato Networker и CA ARCserve.
В последнее время появились два терминологически устоявшихся уровня: Storage Resource Management и Application Integration. Первый позволяет оперировать понятиями файловых систем, томов, групп томов, емкости и производительности вне зависимости от типа соединений, что дает возможность получить логическое представление всех ресурсов хранения. Второй — идентифицировать и соотнести, какие ресурсы хранения поддерживают специфичные бизнес-приложения.
На практике достаточно сложно реализовать все функции управления средой хранения в рамках одного приложения. Закономерен вопрос об архитектуре проектируемого решения. Обычно разработчики реализуют трехзвенные структуры хранения: консоль оператора — сервер управления — агенты (рис. 2).
Рис. 2. Архитектура управления
Различают два вида SAM: внутриконтурное управление (in-band) и управление по дополнительному (вспомогательному) каналу (out-of-band). При построении внутриконтурной архитектуры функции управления выполняются с использованием существующих каналов системы хранения (обычно Fibre Channel). В случае управления по дополнительному каналу обмен данными между элементами сети хранения и консолью управления осуществляется с использованием протокола SNMP по сети Ethernet. Архитектуры out-of-band и in-band обеспечивают различный уровень надежности, быстродействия, нагрузки на каналы системы хранения и т.д. Для реализации различных специфических функций SAM зачастую одновременно используются оба подхода.
Фундаментальные разработки в области управления хранением ведутся сегодня по следующим направлениям:
- протокол SNMP, который, скорее всего, будет основополагающим для IP-сетей хранения;
- модель CIM (Common Information Model), разрабатываемая в ассоциации Storage Networking Industry Association;
- службы Fabric Services в Fibre Channel;
- XML-агенты для Web-просмотра состояния и отчетов.
Стоимость Storage Management
Экономическая целесообразность — зачастую основной вопрос, волнующий сегодня ИТ-департаменты; поэтому очень актуальной видится экономическая сторона SAM. Ответ на этот вопрос еще более усложняется, если в организации не существует методик определения и статистики затрат на управление ресурсами информационной системы. Вследствие сложности определения стоимости управления и администрирования в области управления средой хранения эти затраты зачастую связывают со стоимостью используемого оборудования. По оценкам разработчиков систем SAM, стоимость управления должна в 7-10 раз превышать стоимость приобретенного оборудования. Оценки Gartner гораздо скромнее: сравнив ИТ-бюджеты западных компаний, удалось определить, что в среднем компании тратят втрое больше на управление, чем на оборудование сетей хранения. Эту же закономерность подтверждает и еще одно исследование ИТ-бюджетов 600 компаний, в соответствии с которым затраты на закупку оборудования для систем хранения составляют всего 2%, в то время как стоимость управления SAM и администрирования составляет 6,6% от общего ИТ-бюджета. Отсюда можно предположить, что в западных компаниях реальные затраты на управление выше расходов на оборудование примерно в 3-3,5 раза.
В отечественных условиях оценить затраты на построение SAM гораздо сложнее: многие среды хранения вообще не управляются. В большинстве случаев в бюджете не планируются расходы на эти цели, либо отводятся мизерные суммы. Использование в российских компаниях соотношения управление/оборудование, полученного из западного опыта, может не привести к желаемому результату, поскольку руководители ИТ-отделов зачастую не могут определить издержки, связанные с поддержкой работоспособности системы хранения. Поэтому и эффект от использования SAM не поддается расчету, а проблему экономии средств приходится решать совершенно другими способами, например, урезанием ИТ-бюджета и отказом от части проектов.
Жизненный цикл управления
Осознанное использование SAM позволяет получить представление о полном «жизненном цикле» управления, состоящем из 4 фаз (рис. 3):
- Идентификации ресурсов и проблем.
- Оценки и анализа данных (существенные, несущественные; проблемные области, способы их устранения и др.).
- Реализации непосредственно управления (на основе автоматизированных политик с учетом существующих ограничений).
- Прогнозировании (выявление тенденций по использованию ресурсов, определение динамики роста, выработка политики).
Рис. 3. Управление жизненным циклом
Последовательное прохождение этих фаз позволяет планировать развитие среды хранения данных. Выявленные тенденции должны быть проанализированы и сопоставлены с планом развития системы для выявления отклонений. Таким образом, осуществляется переход к непрерывному процессу SAM.
Различные подходы к управлению хранением
Условно можно выделить две большие категории решений: специализированные (направленные на решения определенной задачи) и интегрированные (обладающие набором разнообразных функций SAM). Для корпоративных заказчиков наибольший интерес представляет вторая категория, так как данные решения могут рассматриваться как часть единой корпоративной системы управления. Разработчики интегрированных решений стараются максимально охватить функциональность, представленную в Пирамиде управления. Тем не менее, важно понимать, какие из функций управления пользователь получает в свое распоряжение вместе с предлагаемыми продуктами.
IBM/Tivoli Policy-based Management
Рис. 4. Tivoli SAN Manager
В концепции IBM/Tivoli выделено три составные части управления, реализованные каждая в конкретном продукте: менеджер сети хранения (Network Manager), менеджер дисковых ресурсов (Disk Manager) и менеджер политик (Policy Manager).
Семейство Tivoli SAN Manager (рис. 4) предоставляет графический интерфейс управления сетью хранения, позволяющий наглядно отображать топологию сети, а также снабжать администратора дополнительной информацией (например, о конфигурируемых параметрах и о состоянии оборудования).
Манипулирование дисковыми ресурсами выполняется на более высоком уровне с помощью Tivoli Storage Manager. Функции управления производительностью всей среды реализованы с помощью Tivoli Storage Resource Manager. Этот модуль позволяет показывать различные параметры загрузки, а также проводить идентификацию несохраненных файлов, мониторинг заданных пороговых значений. Кроме того, Storage Resource Manager выполняет анализ дискового пространства, что позволяет этому модулю планировать емкость хранения и делать некоторые экономические оценки эксплуатации среды хранения.
Veritas Storage Resource Management Vision
Компания Veritas предлагает своим клиентам концепцию, реализация которой предполагает две стадии. Первую реализует продукт SANPoint Control, в котором особое внимание уделено интеграции многих функций в общую систему корпоративного управления. В продукте реализованы основные функции управления, такие как управление инфраструктурой, производительностью, правилами (политиками). SANPoint Control обеспечивает администратору возможность не только наблюдать реальную топологию сети хранения, но и ряд функций более высоких уровней Пирамиды управления.
На второй стадии предполагается использовать новый продукт Global Operations Manager. К его особенностям следует отнести возможность проведения стоимостного анализа, что позволит не только контролировать технические параметры среды хранения, но и обеспечить возможности управления с экономической точки зрения.
HP ENSAextended
Рис. 5. HP ENSAextended
Компания Hewlett-Packard представляет свою концепцию, получившую наименование ENSA (Enterprise Network Storage Architecture), в которую помимо уже известного продукта OV Storage Area Manager добавлен Storage Provisioner (рис. 5).
Разработчиками OV Storage Area Manager охвачены пять основных областей управления, поддержанных соответствующими наборами продуктов.
- Управление устройствами (Storage Node Manager).
- Управление емкостью (Storage Builder).
- Управление производительностью (Storage Optimizer).
- Учет использования и биллинга (Storage Accountant).
- Контроль доступа и распределения пространства (Storage Allocater).
Управление устройствами обеспечивает автоматическое построение топологии сети, мониторинг событий и последующее определение работоспособности устройств сети хранения.
Storage Builder ведет учет емкости, позволяя устанавливать необходимые пороговые значения, а также собирать статистику и составлять отчеты. На основе полученной информации продукт Storage Optimizer обеспечивает мониторинг производительности системы хранения и сбор статистики. Продукт Storage Accountant позволяет проводить учет использования среды хранения, а также расчет важных финансовых характеристик. Данные функции непосредственно связаны с качеством работы системы, поэтому Storage Accountant обеспечивает функцию управления качеством услуг (SLM — service level management). Storage Allocater, позволяет вести контроль доступа и логическое распределение дискового пространства без перезагрузки системы. OV Storage Provisioner, обеспечивает контроль над организацией хранения данных. Другими словами, процесс Storage Provisioning обеспечивает автоматизацию процессов внесения изменений, которые должны быть сделаны в среде с сохранением правил доступа между существующими системами и устройствами хранения данных, для достижения определенного качества предоставляемых услуг.
BMC Software Application-Centric Storage Management
Представленная компанией BMC Software концепция многоуровневого управления Software Application-Centric Storage Management (рис. 6) обеспечивает выполнение многих функций: от управления сетью к управлению ресурсами и приложениями и, наконец, далее к автоматизации (Provisioning).
Рис. 6. BMC Software Application-Centric Storage Management
На нижнем уровне система управления взаимодействует с элементами сети через модули знаний: например, SAN KM или NAS KM. На их основе система управления получает необходимые данные для выполнения функций мониторинга, сбора событийной информации и т.д.
Наиболее интересными модулями, реализованными в продуктах BMC Software, являются Capacity Planning и Cost Accounting. Так, например, модуль BMC Capacity Planning позволяет получать статистику использования ресурсов сети, а также устанавливать пороговые значения для контроля над объемом дисковых массивов. Для экономической оценки системы хранения используется модуль BMC Cost Accounting. В его функции входит учет элементов сети, а также вычисление стоимости хранения данных.
Подход BMC позволяет организовать «сквозной» процесс управления системой хранения: собирая информацию непосредственно от физических устройств и трансформируя ее на выходе в услуги хранения. Следует отметить, что особое внимание уделено реализации функции корреляции событий, собираемых в сети. Другими словами, анализ всей информации о сбоях в сети позволяет с одной стороны, оценить влияние ошибок на качество услуг, а с другой, помогает выявить реальные причины возникновения сбоев. На основе собираемой статистики о работе сети, данная система управления также позволяет прогнозировать параметры работы и качество предоставляемых услуг.
Наличие уровня Storage Automation (Provisioning) преследует цели, аналогичные тем, которые нашли отражение в концепции ENSA.
Представленные решения сконцентрированы на предоставлении наиболее полной картины от нижнего уровня управления до управления на уровне ресурсов, приложений и даже некоторых аспектов бизнес-процессов (хотя говорить о последних, наверное, пока еще преждевременно). Несмотря на разницу концептуальных решений, предлагаемых этими компаниями, можно увидеть наличие ряда одинаковых терминологических понятий. Значит, выработка общих подходов в области SAM — далеко не утопия.
Экономическая оценка
Разработчики SAM включают в свои решения некоторые инструменты экономического анализа систем хранения, помогающие учитывать и планировать расходы на хранение корпоративных данных. Пока с помощью этих инструментов нельзя автоматически оценить экономический эффект от внедрения системы управления хранилищем данных.
Компания Giga Information Group представила TEI (Total Economic Impact) — методику оценки «общего экономического воздействия» от внедрения SAM. Данная методика была использована для анализа реальной системы, в состав которой входили: два центра данных (серверы под управлением Sun Solaris, Windows, AIX, Linux), два подключенных к сети хранилища, система EMC Symmetrix, серверы Compaq EMA8000 и 12000, инструментарий резервирования Veritas NetBackup, ленточная библиотека STK. Общий объем хранимой информации составлял 60 Tбайт (50 Tбайт из них находились в сети хранения); данные использовались приложениями Oracle, Peoplesoft, Exchange, SQL Server. Суть методологии состоит не только в том, чтобы измерить затраты и снизить издержки, но и оценить воздействие технологии на увеличение эффективности бизнес-процессов. Оценка по этой методике основана на использовании четырех базовых элементов: затраты на внедрение; реализованные преимущества; полученная гибкость; риск.
Затраты на внедрение подразумевают стоимость лицензий на ПО, профессиональных услуг и обучения, поддержки. Реализованными преимуществами в виде экономии средств в проекте были:
- снижение общего времени простоя;
- уменьшение капитальных затрат (приобретение нового оборудования);
- экономия на эксплуатационных расходах, связанных с числом и стоимостью специалистов в области SAM;
- экономия за счет появления более четких организационных аспектов, оказывающих влияние на процессы резервного копирования и восстановления данных;
- экономия затрат на управление средой (эти затраты оценивают стоимость управления на единицу хранимой информации, которая изначально возрастает, но затем по мере роста объемов хранения будет уменьшаться);
- снижение затрат на создание процессов обеспечения жизнедеятельности систем (используемые площади, питание, кондиционирование воздуха и т.п.).
Каждое из преимуществ в методике связано с выработанными заранее критическими факторами успеха (CSF, critical success factor), которые в свою очередь напрямую связаны с бизнес-стратегией компании.
Помимо явных преимуществ, в проекте учитывался такой показатель, как полученная гибкость, которая заключается в нахождении «неявных», но значимых по величине сумм, преимуществ реализации проекта внедрения SAM. Так, внедрение дает возможность оценить в некоторых случаях достаточность используемой емкости хранения для поддержания нового приложения или модернизации системы. Этот факт позволяет сократить время ввода в эксплуатацию нового приложения, что дает возможность получения новой прибыли. Без системы управления при возникновении задачи внедрения нового приложения, большинство компаний действуют простым способом, приобретая всякий раз новый сервер и устройства хранения для очередного приложения, задерживая начало внедрения для составления спецификаций, выбора поставщика, установку оборудования и т.д.
Риски проекта учитывают следующие аспекты:
- отношения с производителем (потребуется заменить его в ходе проекта);
- функциональность (продукт не обеспечивает заявленные функции);
- архитектуру продукта (архитектура продукта не позволит учесть будущие изменения в инфраструктуре);
- культуру организации (что организация не будет способна адаптировать технологию к своим условиям);
- задержку проекта (риск воздействия на бизнес компании в случае задержки проекта или его остановки);
- величина проекта (риск проекта в зависимости от масштабов задач и требуемого бюджета).
TEI учитывает риски, рассчитывая показатели с учетом действующих рисков на основе нижней оценки, наиболее вероятного значения и максимальной оценки. Так например, если рассчитанное без учета риска значение экономии на капитальных затратах составляет 2287 тыс. долл., минимальная экономия на капитальных затратах составляет 1829 тыс. (в случае, если будет достигнута 80-процентная реализация данного преимущества), а максимальное значение — 2515 тыс. долл. (показывающее небольшое увеличение, до 110%, полученного преимущества от рассчитанного, то величина экономии с учетом риска составит 2210 тыс.).
Затраты на внедрение SAM, рассчитанные для этого проекта за 3-летний период, составили 1956126 долл., 67% из которых были затрачены на закупку ПО, 23% — на поддержку ПО, а 10% — на профессиональное обучение и обслуживание.
Для проведения расчетов гибкости была использована формула, предложенная еще в 1973 году Фишером Блэком и Мироном Шольцем, которая позволяет рассчитать значения гибкости на базе величины реализуемых преимуществ, величины инвестиций в проект, длительности получения гибкости, а также величины безрисковой процентной ставки (принимается из расчета определенного числа процентов в год) и риска проекта (измеряется в виде среднеквадратического отклонения стоимости в ходе проекта, обычно принимается не менее 35%).
Суммарная величина экономии за счет реализованных преимуществ и полученной гибкости, которая также рассчитывалась за 3-летний период, составила для этого проекта 3329359 долл. В результате вычислений было получено, что фактическая величина возврата инвестиций с учетом рисков составила 70%. Таким образом, период окупаемости данного проекта с учетом рисков равен 17 месяцам.
Основная экономия (в размере 66%) была достигнута за счет снижения капитальных затрат на приобретение нового оборудования. Существенную часть экономии получили за счет полученной гибкости (8,4%). Кроме того, внедрение проекта позволило уменьшить время простоя систем на 25% в год.
Выводы
Несомненно, рынок систем хранения переживает в данный момент активный рост, и как следствие, широкое применение получат различные технологии хранения (рис. 7). По этим причинам актуальность решений SAM будет неуклонно возрастать. Разработчики систем управления средой хранения будут стараться предложить на рынок решения, которые смогут максимально полно охватить уровни Пирамиды управления.
Рис. 7. Динамика технологий хранения
По аналогии с телекоммуникационными системами управления, на рынке систем SAM крупные игроки с целью расширения функциональности своих решений могут выбрать стратегию поглощения компаний с узкоспециализированными решениями. Развитие решений SAM повлечет за собой необходимость разработки общепринятых стандартов и технологий, что позитивно скажется на дальнейшем использовании и внедрении корпоративными заказчиками систем хранения.
ИТ-департаменты уже задумываются над емкой английской фразой: «Think SAM, not SAN». И причиной тому выступает неприязнь к «слепому» приобретению все новых и новых серверов и систем хранения, которая сменяется обоснованным выбором интеллектуальных решений в области управления. Такие решения должны стать ключом к оптимизации и сокращению затрат на приобретение нового оборудования, а также позволят контролировать процессы, проистекающие в среде хранения данных.
Вадим Саякин (svy@nvconsulting.net) — генеральный директор компании NV Consulting (Москва).
На международной конференции НР Software Universe программные средства управления хранением хотя и не стали центральной темой, тем не менее, выступили важнейшей составной частью предложений Hewlett-Packard в области программного обеспечения и одним из механизмов реализации новой стратегии компании по созданию платформы адаптивного управления информационной инфраструктурой. Во время конференции Генеральный менеджер подразделения НР Network Storage Solutions EMEA по программному бизнесу Отмар Шнайдер ответил на вопросы редактора журнала «Открытые системы» Натальи Дубовой.
В чем суть предложений НР по управлению хранением?
Программное обеспечение управления хранением образует стек, включающий три основных уровня. Нижний уровень — инфраструктурное программное обеспечение для работы с дисковыми массивами: репликация данных, клонирование данных, создание мгновенных виртуальных образов логических томов (snapshot), выбор безопасного пути доступа и т.д. Средний уровень — уровень виртуализации. Верхний — собственно программные средства управления хранением, которые надо рассматривать в двух аспектах. Во-первых, это управление ресурсами хранения (storage resource management, SRM), а во-вторых, управление данными. Заказчики хотят, чтобы им гарантировали определенное время доступа к данным, определенную работоспособность приложений, хотят быть уверенными, что их ИТ-инфраструктура хранения работает и обеспечивает заданное качество сервиса. И в то же время, мы должны обеспечить выполнение политики защиты хранения, гарантированное время восстановления, что предполагает некоторую избыточность данных и т.д. Программное обеспечение этого уровня мы продолжаем продвигать на рынок под маркой OpenView, поскольку это часть общего управления информационной средой компании. Одновременно, мы развиваем сотрудничество с другими компаниями, чтобы иметь возможность управлять устройствами хранения от ЕМС, IBM, Hitachi и т.д., так как программные функции этого уровня зависят от аппаратной платформы хранения.
Что касается виртуализации, то я рассматриваю ее не как потребительское решение, а как технологию, которая открывает новые возможности в использовании ресурсов хранения. Виртуализация, на самом деле, тоже возможна на разных уровнях. Уже существуют вполне зрелые реализации этой технологии на уровне массивов. Но стратегическим направлением развития в этой области является виртуализация на уровне сети. Для этого нужны специализированные приставки. Мы уже имеем такое устройство — SV3000, теперь оно будет поставляться под новым названием CASA (continuous access storage appliance - «устройство непрерывного доступа к хранению»). Задача, которая интересует заказчиков — это репликация данных в гетерогенной среде. Предположим, у вас есть дисковые подсистемы от ЕМС, массив НР ХР и т.д., и надо выполнить репликацию с одной системы на другую. CASA позволяет сделать это для разнородных систем. У наших заказчиков часто возникает необходимость хранить множественные копии данных. Для таких задач, как тестирование приложений, создание хранилища или витрины данных разумно использовать более дешевую инфраструктуру хранения. CASA позволяет представить множество разнородных физических устройств как один виртуальный пул и использовать этот пул в приложении. В частности, перенести копию данных из EMC Symmetrix или НР ХР на более дешевые системы НР VA, например.
Но рынок еще не вполне готов принять решения такого типа. Многие наши заказчики интересуются виртуализацией и способны оценить ее преимущества, однако пока они решают такие задачи, как репликация данных, создание резервного сайта для восстановления при катастрофах без использования средств виртуализации. Наша цель — подготовить рынок.
Концепцию SRM мы реализуем в семействе продуктов ОV SAM (Storage Area Manager). В ноябре выпущена третья версия этого семейства. Начиная с версии 2.2, которая появилась в 2002 году, в этой системе предусмотрена поддержка устройств от ЕМС, IBM и Hitachi Data Systems.
Управление разнородными устройствами хранения в одной информационной инфраструктуре — серьезная проблема. В будущем мы будем придерживаться стандартов, которые разрабатываются под эгидой SNIA. В 2003 году должны появиться спецификации, известные под названием Bluefin. Теперь для них официально используется аббревиатура SMIS — storage management interface specifications. НР будет делать продукты, соответствующие этим стандартам, но нашим заказчикам нужны решения по управлению уже сейчас, поэтому мы идем на то, чтобы обмениваться с другими компаниями интерфейсами для доступа к устройствам хранения. Это позволяет управлять такими системами, как IBM Shark и EMC Symmetrix, планируя в будущем осуществить переход к поддержке стандартов, полностью независимых от конкретных производителей.
В некоторых аналитических материалах предложения НР в области программных средств управления системами хранения сравнивают с инициативами ЕМС по созданию промежуточного программного обеспечения управления хранением...
Действительно, эти предложения выглядят похоже, что не удивительно — все понимают, что сегодня нужно заказчикам. Я думаю, наше преимущество состоит, в частности, в наличии OV SAМ, которая работает в реальных гетерогенных инфраструктурах. То же самое касается продукта OV Data Protector, который реализует функциональность управления данными. И я вижу большое преимущество в возможности комбинировать и интегрировать функции SRM и управления данными в единую систему управления хранением.
Заказчикам крайне интересна идея управления службами, поэтому в портфеле Open View система Data Protector и новая версия OV SAМ заранее интегрированы с другими системами, причем не только с базовым продуктом с OV Operations, но и с модулями OV Service Desk Navigator, OV Reporter. И это позволяет реализовать концепцию ITSM. Иными словами, пользователи семейства OV из одного источника получают управление хранением как часть сквозного управления с поддержкой концепций ITSM.
Несколько лет назад много говорилось о формировании платформы управления информационной средой из лучших элементов от разных поставщиков. Но при этом возникла проблема объединения их в одно целое и извлечения из этого возможных преимуществ. Теперь я вижу, что для заказчиков интеграция имеет гораздо большую ценность, чем исключительные возможности отдельных компонентов — ключевой элемент стратегии НР заключается в поставке именно интегрированных решений. Но при всей ценности интеграции мы обеспечиваем модульный подход к внедрению OV — заказчик может начать с решения отдельных задач, которые в данный момент для него наиболее критичны. Например, реализацию платформы управления можно начать с простого мониторинга сети хранения. Затем добавить анализ производительности, резервирование, еще какие-нибудь функции, затем интегрировать все это в OV Operations. И так, шаг за шагом на базе предыдущего реализовывать более сложное решение, обеспечивая тем самым более быстрый финансовый эффект.
Как происходит объединение программных технологий управления хранением НР и Compaq?
У Compaq было решение класса SRM, но не собственной разработки, а приобретенное у небольшой компании Highground, которая затем была куплена Sun Microsystems. У этих модулей имелось значительное перекрытие по функциям с OV SAM. Поэтому мы решили, что именно OV SAM будет стратегической базой для дальнейшего развития, а те функции, которых у нас не было, будут разрабатываться как компоненты семейства SAM. В 2003 году планируется постепенно отказаться от поставок этого класса продуктов Compaq и реализовать программу перехода заказчиков на OV SAM.
В 2003 году планируется сделать OV SAM составной частью устройства управления, но мы будем продолжать продвигать это семейство и как автономный программный продукт.
Что касается программного обеспечения для дисковых массивов, то здесь имеет место значительная избыточность. Например, поддержка множественных путей доступа или средства репликации данных реализованы и для массива ЕVA, и для ХР. Это технически сложные функции. Со временем у НР будет единое средство поддержки множественных путей доступа с возможностями использования на разных массивах. Такая же работа будет проделана и для других общих функций, но не стоит рассчитывать, что это произойдет очень быстро.
Триединое решение по управлению хранением
С чем обычно ассоциируются системы хранения? Прежде всего, наверное, дисковые массивы, библиотеки магнитных лент, возможно аббревиатуры SAN, NAS и все, однако осталась неупомянутой еще одна важная составляющая — программное обеспечение, которому ведущие производители отводят сегодня первостепенное значение. В условиях, когда хранение данных выходит за рамки отдельно взятой дисковой подсистемы и становится сетевым, подчас объединяя решения от разных поставщиков, задача обеспечения нормальной работы сложных архитектур хранения ложится на программную систему управления высокого уровня.
Основной проблемой управления комплексной системой хранения является необходимость обеспечить централизованный контроль за разнородными устройствами. Очевидный путь ее решения — стандартизация программного доступа к разным системам, которая сейчас проводится ассоциацией SNIA, разрабатывающей спецификации интерфейсов управления хранением (Storage Management Interface Specifications), о поддержке которых в своих продуктах заявляют основные игроки рынка.
IBM предлагает решения по централизованному управлению системами хранения в рамках семейства Tivoli, в которое входят модули Tivoli Storage Resource Management, Tivoli SAN Manager и Tivoli Storage Manager. Однако помимо развития этого направления компания ведет разработку двух новых программных систем — речь идет о программном механизме виртуализации Virtualization Engine и сетевой файловой системе Storage Tank. Оба продукта относятся к более низкому, по сравнению с Tivoli, уровню программного обеспечения для инфраструктуры хранения. Эти системы будут поддерживать стандарты SMIS и потому сами смогут быть управляемы как Tivoli, так и модулями от других производителей. Они автоматизируют и унифицируют доступ к данным на разнородных устройствах в сетях хранения на уровне блоков (Virtualization Engine) или файлов (Storage Tank) таким образом, чтобы все ресурсы хранения в сети выглядели для приложений как единый, однородный ресурс.
Virtualization Engine — программный модуль, реализующий идеологию симметричной виртуализации на уровне сети хранения. Большинство производителей сегодня сходятся на том, что виртуализация — представление данных системы или систем хранения в виде единого пула ресурсов — наиболее актуальна именно для унификации доступа приложений к данным на разных дисковых массивах в сети хранения. Основной путь для достижения этого — разместить между серверами и системами хранения специальное устройство, пропускающее через себя весь трафик запросов к данным и выступающее в роли единой точки управления емкостями дискового хранения на уровне блоков данных. Приложения могут обращаться к данным, не зная их физического расположения — всю работу по преобразованию логической структуры в физическую берет на себя устройство виртуализации. Понятно, что ключевая работа при этом выполняется на программном уровне. В качестве аппаратной платформы для Virtualization Engine выбран Linux-кластер из eServer xSeries, в первых версиях системы предполагается использование максимальной конфигурации из 8 узлов. Каждый узел имеет кэш емкостью 4 Гбайт, что позволяет реализовать на базе системы различную функциональность.
Помимо базовых возможностей виртуализации, Virtualization Engine обеспечит создание «моментальных» копий, удаленное копирование и миграцию данных в рамках сети хранения. Эти функции создают хорошую базу для реализации на основе SAN систем восстановления при катастрофах и управления иерархическим хранением — миграции данных с быстрых на медленные носители в зависимости от их роли в приложениях. Объединяя ресурсы хранения в единый пул, Virtualization Engine обеспечит оптимизацию использования емкости различных дисковых массивов. Важнейшее преимущество Virtualization Engine — повышение продуктивности работы администратора инфраструктуры хранения, который получает возможность полностью изолировать приложения от физической структуры хранения данных и автоматизировать и унифицировать управление доступом к этой структуре. Надо оговориться, правда, что в первых версиях системы IBM обещает только ограниченную поддержку разнородных устройств хранения.
В дополнение к возможностям централизации всех функций доступа и управления данными на уровне блоков, которые будут реализованы с помощью Virtualization Engine, в IBM разрабатывают систему Storage Tank для унификации доступа к файлам в рамках сети хранения. Storage Tank — это сетевая файловая система, которая обеспечивает централизованное управление и совместное использование файлов в сети хранения приложениями, которые работают под управлением разных операционных систем: IBM AIX, Sun Solaris, HP-UX, Linux, Windows. Каждая из них имеет свою файловую систему — отсутствие единого пространства имен и разнородная структура файлов приводит к тому, что в сети хранения каждый сервер приложений на хост-компьютере может видеть только свою часть подсистемы хранения. В результате не удается обеспечить централизованное управление файловым доступом в сеть хранения, и необходимо для каждой файловой системы определять свою политику резервирования/восстановления, миграции данных и других задач. Storage Tank решает эту проблему, организуя единую файловую систему для всех разнородных серверов приложений с помощью сервера метаданных, который реализован, как и Virtualization Engine, на базе кластера серверов xSeries под управлением Linux. Но, в отличие от Virtualization Engine, сервер метаданных Storage Tank находится в стороне от сети хранения. Клиентские компоненты системы устанавливаются для каждого сервера приложений, использующего данные в сети хранения, и взаимодействуют с сервером метаданных по IP-cети. Сервер организует единое пространство имен для всех файлов в сети хранения и обеспечивает унифицированный доступ и возможность разделения файлов приложениями под управлением разных операционных систем. При этом сам по себе обмен данными между приложениями и устройствами хранения идет по высокопроизводительным протоколам сети хранения. По сути, Storage Tank обеспечивает функциональность NAS-сервера, но с производительностью SAN, т. е. предлагает конвергенцию этих двух технологий.
IBM планирует предоставлять бесплатные лицензии на исходный код клиентских модулей Storage Tank, предполагая стимулировать разработчиков на создание приложений, которые смогут работать с Storage Tank. Кроме того, будет обнародован протокол для взаимодействия с сервером метаданных Storage Tank.
Вместе с Tivoli, Storage Tank и Virtualization Engine образуют сегодня базу программного обеспечения IBM для управления системами хранения. Взаимодополняя друг друга, они решают единую задачу — представление всех систем хранения как единого ресурса и централизованное управление ими на базе открытых стандартов.
Наталья Дубова