Intersoft Lab по материалам зарубежных сайтов
2007-03-06
Устройства для ХД (Data Warehouse Appliance DWA) часто подаются техническими и финансовыми аналитиками как потенциальная возможность изменения рынка (см. статью «Что такое устройства для Хранилищ данных»).
Первооткрывателем в этой области стала компания Teradata, которая хотя и не любит упоминать термин «устройство», однако в той или иной мере подстегнула развитие рынка. Затем, четыре года назад, новая компания Netezza предложила свое решение, которое попало в разряд ценных и популярных продуктов. Далее, всего лишь год назад, еще один новичок фирма DATAllegro анонсировала собственное устройство для ХД, а за ней последовали и другие производители.
Поставщики утверждают, что эти пакеты аппаратных и программных средств помогут компаниям сэкономить средства и сэкономить время внедрения. Но действительно ли они привнесут существенные перемены на рынок?
Некоторые считают, что да. Ряд экспертов утверждает, что ХД устройства это своего рода «катализатор рынка», который ломает старые правила и дает новые возможности инвестиций.
Почему же устройства вызывают такой интерес? Очевидно, это новый шаг в информационных технологиях, так как данная технология позволяет экономить деньги и усилия, объединяя программные и аппаратные средства. Важно то, что устройство ориентировано на конкретные нужды, предназначено для решение одной сложной задачи.
Создание хранилища задача непростая, а обеспечение доступа к нему BI-инструментов затрудняется сложностью его дизайна. Казалось бы устройство устраняет ряд слабых мест.
Однако можно ли действительно утверждать, что такой продукт упрощает внедрение ХД и бизнес-приложений? Имеют ли устройства «бизнес-смысл»? Чтобы решить эти вопросы, необходимо разделить сегодняшних поставщиков на две категории: специализирующиеся исключительно на устройствах и крупные производители компьютерного оборудования.
К первой категории относятся DATAllegro и Netezza. Очевидно, что у них должны быть особые преимущества, чтобы сохранить конкурентоспособность рядом с магнатами.
Netezza и DATAllegro смогли обеспечить продукт с хорошим соотношением цены и производительности, упрощающий и совершенствующий процесс внедрения ХД. И отзывы клиентов подтверждают это.
Что же делают специализированные производители? Их устройства включают в себя оборудование, широко представленное на рынке, Хранилище, операционные системы и базы данных с открытым кодом, и, как правило, некоторое собственное ПО, которое компания-поставщик разрабатывает для повышения производительности. Обычно устройства конфигурируются для различных пороговых объемов данных и уровней использования. Кроме того, эти компании вступают в партнерство с другими поставщиками ХД, ETL и BI, предлагая их ПО в своих пакетах.
Конечно, эти продукты могут быть очень хорошими с точки зрения цены-эффективности , так как в них используются популярные компоненты, базы данных и операционные системы с открытым кодом (такие как Linux), а также за счет предварительного конфигурирования.
Но несмотря на преимущества, нужно помнить о двух фактах:
Множество неудачных внедрений обусловлены сложностью дизайна Хранилища, но основные трудности все-таки возникают в результате проблемы интеграции данных из множества источников, а также в необходимости добиваться их качества и согласованности. Как правило установка и конфигурирование ПО это лишь небольшая часть ХД-проекта. Все подобные инициативы имеют успех или терпят крах в результате интеграции данных, а не на почве конфигурирования и настройки оборудования и ПО.
Активность IBM, HP и Sun в области ХД-устройств можно рассматривать и как оценку этого рынка, и как «вызов» обосновавшимся там специализированным разработчикам, таким как Netezza и DATAllegro.
Компания IBM начала свою деятельность в этой сфере с предложения преконфигурированного средства на базе AIX[1] и Linux. Но это было только началом. С тех пор IBM воплотила множество идей в данной области. Например был предложен продукт Data Warehousing Balanced Configuration Unit 2.1 для Linux, а также an IBM eServer 326m System. И IBM это далеко не единственная из крупных фирм, предлагающих полный набор устройств для ХД.
В июле 2006 года Hewlett-Packard Co. (HP) и Sun MicroSystems Inc., каждая в отдельности и при сотрудничестве с совершенно разными программными партнерами, преложили пакеты устройств для ХД.
Сначала HP заявила о партнерстве с лидером в области СУБД Oracle, обеспечив целый набор серверного оборудования, средств хранения и, конечно, программного обеспечения, позволяющие клиентам быстро внедрять и использовать технологию Хранилищ.
Конфигурации этих устройств предполагают «скользящее» изменение масштабов, обеспечивающее клиентам выбор между Хранилищами, оптимизированным с целью высокой производительности, либо с целью достижения оптимального сочетания цены/эффективности. В основе таких устройств лежат серверы HP Integrity и ProLiant, а также дисковые массивы HP StorageWorks и СУБД Oracle 10g. Предполагается масштабирование ХД от 250 Гбайт до 10 Тбайт.
Новый проект Sun проводится в тандеме с компанией Greenplum, специалистом в области управления данными с открытым кодом. Sun/Greenplum Data Warehouse Appliance это готовое устройство, основанное на базе данных с открытым кодом PostgresSQL и операционной системе Solaris 10 фирмы Sun. Он опережает по масштабам инициативу HP и Oracle, обеспечивая конфигурации в 10, 40 и 100 Тбайт.
Компании Sun и Greenplum, как и соперники HP/Oracle и IBM обещают высокую производительность и масштабируемость. Оба партнера обещают, что их продукт сможет сканировать 1 Тбайт данных за 60 секунд, а также масштабироваться до сотен терабайт.
Интерес крупных производителей компьютерного оборудования это своего рода сигнал о том, что недорогие, доступные, модульные и масштабируемые устройства станут доминирующими компонентами в решении широкого диапазона корпоративных требований. Например 15 000 долларов за Хранилище объемом 1 Тбайт, или 25 000 долларов за 10 Тбайт это более конкурентоспособная цена, чем у многих известных поставщиков. В результате активность магнатов может привести к ценовой войне, так как на рынке устройств для ХД уже сейчас наблюдается очень жесткая конкуренция.
Netezza, DATAllegro и IBM должны долбиться того же соотношения цены/производительности, что и главный конкурент Sun/Greenplum, при этом базовая конфигурация по стоимости не должна превышать 20 000 долларов за Хранилище объемом 1 Тбайт.
Можно ли сказать, что крупные поставщики обеспечивают ХД-устройства того же качества, что и специализированные компании? Основное отличие в том, что они не предлагают ничего «специального» для повышения эффективности, например запатентованной технологии для параллельной обработки и оптимизации ввода/вывода.
Эта ситуация напоминает события пятнадцатилетней давности, когда известные производители оборудования предлагали преконфигурированное аппаратное обеспечение (серверы и носители), а также ПО (СУБД и приложения), также как сегодня устройства. Фактически они разработали тогда ряд систем поддержки принятия решений, ставшие предшественниками сегодняшних BI-инструментов. Вроде бы задача для них не нова. Их пакеты удобны, однако в них нет ничего новаторского.
Итак, теперь мы можем ответить на три вопроса:
[1] Advanced Interactive eXecutive операционная система семейства Unix компании IBM.