Описание:
Данный документ описывает несколько общих бизнес задач и показывает, как SQL Server 2005 Analysis Services решает данные задачи простыми и наименее затратными способами. Под типами бизнес задач понимается обеспечение простого и интегрированного представления данных, консолидация витрин данных и разрозненных приложений, аналитического представления данных, решение проблем связанных с локализацией и получение аналитических данных в реальном времени, что обычно является либо сложным, либо вообще невыполнимым при использовании других продуктов работающих с хранилищами данных. Microsoft предоставляет предприятиям новые возможности в виде единого, мощного и функционального пакета программ.
Авторские права Информация, содержащаяся в этом документе, представляет текущую точку зрения корпорации Microsoft на обсуждаемые вопросы на момент публикации. Поскольку Microsoft должна реагировать на изменяющиеся условия на рынке, документ не следует рассматривать как обязательство со стороны Microsoft; корпорация Microsoft не может гарантировать, что вся представленная информация сохранит точность после даты публикации.
Настоящий документ предназначен только для информационных целей. MICROSOFT НЕ ДАЕТ В ЭТОМ ДОКУМЕНТЕ НИКАКИХ ЯВНЫХ ИЛИ ПОДРАЗУМЕВАЕМЫХ ГАРАНТИЙ.
Если не оговорено противное, используемые в этом документе названия компаний и продуктов, имена людей, действующие лица и/или данные являются вымышленными, и их ни в коей мере не следует связывать с какими-либо реальными людьми, компаниями, продуктами или событиями.
© 2005 Microsoft Corporation. Все права защищены.
Microsoft, SharePoint, Visual Basic и Visual Studio являются товарными знаками или охраняемыми товарными знаками корпорации Майкрософт в США и/или в других странах.
Другие упоминаемые здесь названия продуктов или компаний могут представлять собой торговые марки соответствующих владельцев.
Этот документ является предварительным и может быть существенным образом переработан до финального коммерческого релиза программного продукта
В проблемах, испытываемых многими организациями нет ничего нового. К примеру, множество компаний стремится купить программные продукты, такие как SAP для управления основной частью бизнеса. К сожалению, часто данные продукты имеют сложную структуру, мешающую проведению эффективного анализа данных. Компания может иметь совершенно независимые программные системы управления взаимоотношениями с заказчиками (CRM) и системы контроля движения товаров на предприятии (SCM). Ко всему прочему, как правило, обе эти системы содержат информацию, критичную для принятия ключевых решений в бизнесе. Организации также сознают, что для того, чтобы соответствовать множеству отчётным и аналитическим требований они создали массу приложений и хранилищ данных, на основе быстро меняющихся указаний аналитиков, сотрудников по работе с информацией, служащих и пользователей.
Для того, чтобы решить подобные проблемы, Microsoft в течение длительного времени развивала технологии связанные с интеллектуальным анализом данных (BI) и упрощением бизнес коммуникаций. C выходом Microsoft® SQL Server™ 2005 Analysis Services Компания Microsoft существенно упростил проблему. Сейчас у организаций есть одно согласованное решение для создания отчётности как для OLTP (системы транзакционной обработки данных) так и для OLAP (системы формирования отчётов) хранилищ данных. SQL Server 2005 Analysis Services существенно уменьшает количество усилий, затрачиваемых для предоставления в согласованном виде информации из любого массива разнородных данных.
SQL Server 2005 Analysis Services предоставляет набор высокоинтегрированных инструментов помощи бизнесу, позволяющий оценить весь спектр возможностей интеллектуального анализа данных, будь то интегрирование данных из множества приложений в единый формат, анализ данных из всевозможных источников, создание отчётов на основе данных с использованием множества форматов и технологий, добычи данных для создания взаимосвязей или предсказания будущих результатов с помощью предсказывающей аналитики.
В данном документе рассматриваются несколько типичных проблем бизнеса, а также то, как SQL Server 2005 Analysis Services решает эти проблемы с присущей ему простотой и максимальной эффективностью. Бизнес проблемы, охватываемые в данном документе:
Таблица 1 показывает характерные проблемы и варианты их решения с использованием возможностей SQL Server 2005 Analysis Services.
| Проблема Бизнеса | Возможности SQL Server 2005 Analysis Services, используемые для решения данной проблемы |
|---|---|
| Простое, единое представление данных | UDM представление источников данных |
| Объединение витрин данных и разобщённых приложений. | UDM перспективы |
| Интеллектуальное представление бизнес данных. | "Многие-ко-многим" UDM's измерения, ролевые измерения, ссылочные измерения и измерения фактов. |
| Локализация аналитики Localizing the Analytics Experience | Мастера UDM's перевода и конвертации валют |
| Бизнес Приложения, выполняемые в режиме реального времени | Упреждающее кэширование UDM's |
SQL Server 2005 Analysis Services способен создавать кубы без промежуточного хранилища данных в виде "звезды". UDM предоставляет возможность генерации отчётности непосредственно на производственной системе, без создания промежуточного хранилища, как требовалось ранее. Это достигается благодаря тому, что UDM может обращаться к любому источнику данных, находящемуся в 3-й нормальной форме и не требует организации данных в виде схем "звезда" или "снежинка". Более того, SQL Server 2005 Analysis Services способен создавать сложные схемы на основе существующей структуры данных, включая вычисляемые поля, SQL выражения, возвращающих набор данных и т.п. Данные схемы могут служить основой для создания кубов. Производительность исходных систем не затрагивается, т.к. кубы являются самостоятельным хранилищем данных. Это означает то, что производственные OLTP системы будут продолжать работать с прежней производительностью, при этом, предоставляя возможность бизнесу иметь доступ к сложной аналитике, а так же при желании к аналитике, работающей в режиме, близком к режиму приложений реального времени.
SQL Server 2005 Analysis Services предоставляет мощную возможность поддержки совместимости, благодаря технологии, называемой "Представления Источников Данных" (Data Source Views - DSV). Технология DSV позволяет создавать сложные аналитические модели на основании существующих OLTP схем, либо на основании схем "звезда". Это позволяет работать со сложными схемами, включающими дружественные имена и виртуальные связи. Одно из главных преимуществ DSV это то, что они могут быть созданы аналитиками, не имеющими права создания объектов в БД. Единожды созданные многомерные объекты анализа могут основываться на DSV, позволяя строить кубы, принимая за основу меняющуюся схему БД, что даёт возможность проводить анализ на производственной системе, без влияния на быстродействие критических приложений.
Множество хранилищ создаёт ряд проблем. Вероятней всего это могут быть достаточно дорогостоящие операции, необходимые для обслуживания БД, распределённых по предприятию и требующие множества обновлений из одних и тех источников данных. Так же представляется сложным консолидировать разрозненные витрины данных в меньшее количество витрин, либо в единое производственное хранилище.
Ликвидация некоторых промежуточных хранилищ данных имеет ряд положительных моментов, характеризующихся общей стоимостью владения (TCO). Во-первых, количество работы уменьшается с уменьшением количества витрин и снижением операций репликации, конвертирования и трансформирования данных. Снижаются требования к свободному пространству, необходимому для хранения данных, т.к. устраняется избыточность. Так же снижаются затраты на синхронизацию данных. Уменьшаются риски потери целостности данных, т.к. отпадает необходимость поддерживать множество витрин данных и согласовывать их друг с другом.
Наличие разобщённых приложений, использующих разные источники данных характеризуется рядом моментов: Затрудняется контроль согласованности данных, т.к. не существует единой актуальной версии данных. OLAP и OLTP системы представляют свои версии данных, так как в OLAP систему данные загружаются с помощью ETL. Раздельное хранение данных требует большего места и отличается тенденцией к избыточности и не согласованности. Альтернатива данному способу хранение информации - хранилище данных. Ко всему прочему приложения отчётности и аналитики очень часто выглядят как совершенно не связанные обращающиеся к БД различным образом и требующие различных настроек. В связи с этим многие аналититические программы, созданные сторонними фирмами никоим образом не поддерживают ни одной разновидности реляционной отчётности и могут лишь предоставлять некоторые варианты статичных копий результатов обработки данных.
Другое улучшение, связанное с UDM, а соответственно и со всеми аналитическими и отчётными приложениями это возможность создавать Ключевые Показатели Выполнения (KPI) используя систему KPI. Это предоставляет возможность организациям определять ключевые метрики бизнеса. Описание метрик хранится и создаётся в едином месте, т.о. все приложения могут получать доступ к единой версии данных. KPI могут показываться в виде простых, но достаточно информативных иконок, таких как измерители и светофоры, что даёт возможность быстрого доступа к статусам ключевых показателей бизнеса и помогает людям, принимающим решения в бизнесе.
Хотя детализация и является мощным средством, она не способна предоставить ответы на все вопросы. Некоторые приложения предоставляют возможность альтернативного анализа, но, к сожалению, обладают ограничивающими возможностями совместимости на уровне ядра хранилища данных. Данные ограничения затрудняют ряд форм анализа данных.
Вместо того чтобы просто детализировать данные, пользователям необходима возможность детализации одного измерения в разрезе другого. Например, при рассмотрении измерения "продукты" аналитик, возможно, захочет взглянуть на клиентов, заказавших эти продукты или на поставщиков, от которых данные продукты были получены. Аналитикам, возможно, потребуется сравнить значения, например даты заказов и даты отправления товаров, вместо того, чтобы фокусироваться на анализе одного параметра. Бизнес может потребовать моделирование более сложных взаимосвязей, нежели простые иерархии, к примеру, когда один автор пишет более чем одну книгу и книга написана более чем одним автором. Ядро хранилища БД обычно испытывает затруднения с моделированием подобных сложных сценариев, делая почти невозможным анализ и построение отчётности на основе таких структур.
SQL Server 2005 Analysis Services также предоставляет концепцию измерений "многие-ко-многим". Традиционные хранилища данных допускают взаимосвязь факта только с одним измерением, что означает ассоциирование связанной записи факта c одним и только одним продуктом в измерении продуктов. В реальном мире всё не так очевидно. Компания может владеть информацией о клиентах и банковских счетах. Счета представляются клиенту в виде нескольких счетов (текущий, сберегательный, расходный и т.д.) , в добавок каждый счёт может использоваться несколькими людьми (сберегательный счёт для Джона До и Джейн До). SQL Server 2005 поддерживает эту сложную взаимосвязь, в которой одна запись фактов может отображаться на множество записей измерений, предоставляя возможность ещё более сложного и мощного анализа с помощью упрощённого моделирования данных.
Многие движки хранилищ данных требуют создание кубов, в которых одно измерение соответствует одному возможному типу анализа. Например, фирма может захотеть проанализировать заказы по датам заказа или датам отгрузки. Вместо того чтобы создавать 2 измерения SQL Server 2005 Analysis Services предоставляет возможность проектировщику хранилища построить одно временное измерение и затем использовать это измерение как базовое для даты заказа и даты отправки. Возможность использования измерения в двух различных ролях известна как ролевое измерение. Данные измерения помогают уменьшить занимаемое дисковое пространство и время выполнения, сохраняя данные только единожды, позволяя просматривать измерение как несколько различных измерений для аналитиков и пользователей. Иногда в таблице фактов хранятся данные, не связанные ни с одной записью таблицы измерений. SQL Server 2005 Analysis Services позволяет определить подобные данные и создать связь "один-к-одному" с таблицей фактов, ссылающееся на вырожденное измерение.
Обычно вырожденное измерение носит название фактического в SQL Server 2005 Analysis Services. Это означает, что становится простым иметь измерение, используемое только для отдельных записей таблиц фактов, либо идентифицирующее данные, составляющие агрегированное значение.
Выгода перевода в единый формат очевидна. Сравнение данных, поступивших из различных стран невозможно до тех пор, пока вы не приведёте данные в согласованный локальный формат. Локализация данных позволяет анализировать информацию предприятия вне зависимости от исходной страны. Недостаток состоит, например, в том, что хранилище консолидирует все данные в американских долларах, что вероятней всего создаст трудности аналитику в Токийском отделении компании. Бизнес вынужден выбирать между созданием нескольких копий хранилищ для каждого офиса и единым хранилищем с единым языком и валютой.
Существует два основных преимущества такого подхода. Первое - отпадает необходимость создания нескольких локализованных хранилищ, уменьшается место хранения. Второе - это даёт возможность организациям расширить аналитику на всё предприятие, так как каждая страна теперь может получить свою локализованную версию данных. Возможность использования локализованных видов отдельных кубов предоставляется с помощью возможности, называемой Translations. Translations разрешает перевод данных и метаданных в локальный формат "на лету", предоставляя пользователям локализованную версию с минимальными усилиями, по сравнению с созданием отдельных кубов для каждой страны.
Некоторое время существовали BI решения, работающие в режиме реального времени, или близко к реальному времени. Множество приложений интеллектуальной обработки данных, работающих в режиме, близком к режиму реального времени имели проблемы быстродействия, так как не могли сохранять данные в оптимальном формате. К тому же большинство таких приложений оказывали негативное влияние на исходные БД OLTP, постоянно запрашивая необходимые данные и таким образом существенно замедляя работу систем.
Одно из больших преимуществ такого подхода это то, что компании получают возможность анализа в режиме близком к реальному времени или в режиме реального времени, при этом полностью сохраняя производительность кубов хранилищ данных. Администраторы могут настроить контроль и частоту обновления информации. Упреждающее кэширование позволяет обращаться к кубу в любой момент - не только после его создания, но и в момент его заполнения или обновления. В случае поступления запроса перед тем, как куб полностью обновится, Microsoft Analysis Services 2005 переключится с MOLAP на ROLAP режим для того, чтобы обработать запрос.
Благодаря достаточно важным нововведениям Компании Microsoft BI приложения способны предоставить невероятную мощь и серьезный аналитический инструментарий организациям любого размера.
BI решения большей частью являются историческими слепками данных, устаревающих на момент проведения аналитики. Некоторые BI приложения поддерживают возможность анализа близкую к режиму реального времени, но часто страдают плохим быстродействием и существенным накладным расходам.
Многие BI решения так же нуждаются в способности объединять нескольких витрин данных в единое хранилище. Другие BI реализации страдают недостатком гибкости при анализе иерархических структур или моделировании сложных взаимосвязей между несколькими измерениями. В конечном итоге продукты, предназначенные для работы с хранилищами данных попросту не способны оперировать локализованными данными и числовыми форматами, разделяя при этом отчётность и аналитику данных. Очень часто это означает то, что данные содержатся в нескольких хранилищах, предназначенных для различных целей.
SQL Server 2005 Analysis Services легко решает подобные проблемы. Хранилища могут быть созданы непосредственно на основании реляционных структур, CRM и SCM систем, а так же любых других данных, без необходимости создания схемы "звезда" и с минимальным влиянием, либо вообще без нагрузок на производительность ключевых приложений, используемых в бизнесе. Analysis Services представляют технологию обновления OLAP кубов он-лайн с минимальным воздействием на исходную БД, при этом ускоряя подготовку реляционной отчётности на основании этих же данных. Analysis Services так же делает возможным представление в виде множества витрин одного хранилища данных для одновременной работы нескольких отделов организации и различных пользователей. Это позволяет каждому отделу заниматься анализом данных без создания и поддержи множества хранилищ. Так же одно хранилище может быть представлено в виде нескольких локализованных версий без необходимости построения отдельных хранилищ.
В конечном итоге Универсальный Язык Моделирования Компании Microsoft (UDM) сочетает удобства OLTP и OLAP хранилищ в единой модели. Можно строить OLAP кубы "на лету" и обновлять их в почти реальном режиме времени. В схеме "звезда" нет необходимости. Приложения, создающие отчётность выигрывают от кэширования данных OLAP кубов, что позволяет оперативно получать отчёты на основании OLTP БД.
Благодаря достаточно серьезным нововведениям Компании Microsoft, BI приложения способны предоставить невероятную мощь и серьёзный аналитический инструментарий организациям любого размера. Используя эти возможности компании, могут создавать более мощные, гибкие и эффективные по затратам BI приложения, которые могут использоваться гораздо более широким кругом пользователей и спектром инструментов, чем когда-либо.
Крейг Атли является вице-президентом KiZAN Technologies LLC и возглавляет группу, занимающуюся решениями, связанными с интеллектуальной обработкой данных, разработкой и дизайну приложений масштаба больших корпораций. Он работает с продуктами компании Microsoft для интеллектуальной обработки данных с момента создания их концепций. Крейг Атли так же участвовал в создании BI приложений и хранилищ данных по всей территории Соединенных Штатов Америки. Он автор, докладчик, и обладатель статуса Microsoft MVP
Данный документ подготовлен в сотрудничестве с A23 Consulting.