Описание:
Данный документ описывает несколько общих бизнес задач и показывает, как SQL Server 2005 Analysis Services решает данные задачи простыми и наименее затратными способами. Под типами бизнес задач понимается обеспечение простого и интегрированного представления данных, консолидация витрин данных и разрозненных приложений, аналитического представления данных, решение проблем связанных с локализацией и получение аналитических данных в реальном времени, что обычно является либо сложным, либо вообще невыполнимым при использовании других продуктов работающих с хранилищами данных. Microsoft предоставляет предприятиям новые возможности в виде единого, мощного и функционального пакета программ.
Авторские права
Этот документ является предварительным и может быть существенным образом переработан до финального коммерческого релиза программного продукта
Информация, содержащаяся в этом документе, представляет текущую точку зрения корпорации Microsoft на обсуждаемые вопросы на момент публикации. Поскольку Microsoft должна реагировать на изменяющиеся условия на рынке, документ не следует рассматривать как обязательство со стороны Microsoft; корпорация Microsoft не может гарантировать, что вся представленная информация сохранит точность после даты публикации.
Настоящий документ предназначен только для информационных целей. MICROSOFT НЕ ДАЕТ В ЭТОМ ДОКУМЕНТЕ НИКАКИХ ЯВНЫХ ИЛИ ПОДРАЗУМЕВАЕМЫХ ГАРАНТИЙ.
Если не оговорено противное, используемые в этом документе названия компаний и продуктов, имена людей, действующие лица и/или данные являются вымышленными, и их ни в коей мере не следует связывать с какими-либо реальными людьми, компаниями, продуктами или событиями.
© 2005 Microsoft Corporation. Все права защищены.
Microsoft, SharePoint, Visual Basic и Visual Studio являются товарными знаками или охраняемыми товарными знаками корпорации Майкрософт в США и/или в других странах.
Другие упоминаемые здесь названия продуктов или компаний могут представлять собой торговые марки соответствующих владельцев.
Содержание
Введение
Слишком часто бизнес обнаруживает, что его инвестиции в высококлассные приложения превращаются в кучу бесполезной информации, которую невозможно интегрировать и анализировать. Это означает, что обещание принять более информированное решение в ситуации временной ограниченности часто остаётся невыполненным. Для того чтобы проанализировать плохо интегрируемые системы организации пользуются несколькими подходами: используют несколько систем отчётности, извлекают и трансформируют данные, создают хранилища данных, либо покупают новые промышленные системы, так как новые системы, обещающие улучшенную работу с отчётностью. Каждое из данных решений имеет свои недостатки - от использования неадекватных инструментов до новых и дорогих проектов консолидирования данных.
В проблемах, испытываемых многими организациями нет ничего нового. К примеру, множество компаний стремится купить программные продукты, такие как SAP для управления основной частью бизнеса. К сожалению, часто данные продукты имеют сложную структуру, мешающую проведению эффективного анализа данных. Компания может иметь совершенно независимые программные системы управления взаимоотношениями с заказчиками (CRM) и системы контроля движения товаров на предприятии (SCM). Ко всему прочему, как правило, обе эти системы содержат информацию, критичную для принятия ключевых решений в бизнесе. Организации также сознают, что для того, чтобы соответствовать множеству отчётным и аналитическим требований они создали массу приложений и хранилищ данных, на основе быстро меняющихся указаний аналитиков, сотрудников по работе с информацией, служащих и пользователей.
Для того, чтобы решить подобные проблемы, Microsoft в течение длительного времени развивала технологии связанные с интеллектуальным анализом данных (BI) и упрощением бизнес коммуникаций. C выходом Microsoft® SQL Server™ 2005 Analysis Services Компания Microsoft существенно упростил проблему. Сейчас у организаций есть одно согласованное решение для создания отчётности как для OLTP (системы транзакционной обработки данных) так и для OLAP (системы формирования отчётов) хранилищ данных. SQL Server 2005 Analysis Services существенно уменьшает количество усилий, затрачиваемых для предоставления в согласованном виде информации из любого массива разнородных данных.
SQL Server 2005 Analysis Services предоставляет набор высокоинтегрированных инструментов помощи бизнесу, позволяющий оценить весь спектр возможностей интеллектуального анализа данных, будь то интегрирование данных из множества приложений в единый формат, анализ данных из всевозможных источников, создание отчётов на основе данных с использованием множества форматов и технологий, добычи данных для создания взаимосвязей или предсказания будущих результатов с помощью предсказывающей аналитики.
В данном документе рассматриваются несколько типичных проблем бизнеса, а также то, как SQL Server 2005 Analysis Services решает эти проблемы с присущей ему простотой и максимальной эффективностью. Бизнес проблемы, охватываемые в данном документе:
- Простое, Интегрированное представление данных. Большинство организаций обслуживает несколько независимых приложений для обеспечения таких функций, как ERP (промышленное планирование ресурсов), CRM, SCM, обеспечение работы отдела кадров и т.п. Microsoft SQL Server 2005 Analysis Services решает эти проблемы использованием Видов Источников Данных (Data Source Views), технологию, позволяющую создать аналитические модели на основе существующих структур данных.
- Консолидированные Витрины Данных. Организации могут создавать специализированные информационные хранилища данных для каждого направления деятельности и затем обнаружить, что консолидирование этих данных в единое хранилище затруднительно, либо невозможно. Microsoft SQL Server 2005 Analysis Services предоставляет Унифицированную Модель Измерений и Проекций (Unified Dimensional Model and Perspectives) для создания единой адекватной версии данных, которую в случае необходимости можно представить как виртуальные хранилища данных отделов предприятия.
- Интеллектуальное Представление Данных (Intelligent View of Data). Большинство инструментов хранилищ данных сегодня создают иерархические структуры для предоставления возможности аналитикам и компетентным сотрудникам агрегировать и детализировать данные. Однако агрегирование и детализация не является единственным возможным способом анализа данных. Microsoft SQL Server 2005 Analysis Services предоставляет бизнесу возможность создания решений, поддерживающих гибкую иерархию, связи "многие ко многим" и другие типы измерений, позволяющих осуществлять более развитую аналитику в сравнении с предоставляемыми альтернативными приложениями.
- Локализация Аналитики (Localizing the Analytics Experience). В некоторых случаях ведение бизнеса сопряжено с обобщением данных, собираемых на нескольких языках. Для того чтобы правильно консолидировать аналитические данные приходится переводить информацию на один язык и использовать единую валюту. Использование подобных решений весьма затруднительно. Но благодаря возможности, называемой Translations, Microsoft SQL Server 2005 Analysis Services предоставляет компаниям строить единые решения, способные локализовывать данные "на лету" в зависимости от того, где находится пользователь.
- Интеллектуальный Анализ Данных в Реальном Режиме Времени. Большинство решений используемых интеллектуальный анализ данных и хранилища данных представляют собой статические снимки данных, обновляемых каждой ночью или еженедельно. Системы интеллектуального анализа данных в реальном режиме времени существуют, но работа их более медленна, нежели работа со статическими снимками данных. Microsoft SQL Server 2005 Analysis Services предоставляет бизнесу возможность интеллектуального анализа данных в реальном режиме времени или со временем, сравнимым с обработкой данных в режиме он-лайн и минимальной нагрузкой для производственной системы.
Изучение задач бизнеса
Для того, чтобы проанализировать типы проблем, решаемых SQL Server 2005 Analysis Services лучше всего рассмотреть реальные ситуации, встречающиеся в ряде организаций сегодня. Это отнюдь не означает, что весь список проблем можно адресовать к инструментам SQL Server BI. Данный документ предоставляет обзор наиболее общих задач, которые можно решить с помощью SQL Server BI tools эффективно и с минимальными затратами. Компания Microsoft фокусируется на предоставлении возможности организациям ускорить процессы интегрирования, анализа и построения отчётности по информационным данным вне зависимости от того, где они расположены, значительно уменьшая общую стоимость владения (TCO). При этом минимизируется время, необходимое для принятия взвешенных решений и используются данные из широкого спектра приложений.
Таблица 1 показывает характерные проблемы и варианты их решения с использованием возможностей SQL Server 2005 Analysis Services.
Проблема Бизнеса | Возможности SQL Server 2005 Analysis Services, используемые для решения данной проблемы |
Простое, единое представление данных | UDM представление источников данных |
Объединение витрин данных и разобщённых приложений. | UDM перспективы |
Интеллектуальное представление бизнес данных. | "Многие-ко-многим" UDM's измерения, ролевые измерения, ссылочные измерения и измерения фактов. |
Локализация аналитики
Localizing the Analytics Experience | Мастера UDM's перевода и конвертации валют |
Бизнес Приложения, выполняемые в режиме реального времени | Упреждающее кэширование UDM's |
Проблема 1: Простое, Единое Представление Данных
Большинство организаций хранит и обрабатывает свои данные в нескольких системах, таких как ERP, CRM и SCM. Системы, как правило, созданы различными производителями, используют различную терминологию, схемы данных, а иногда и разные базовые механизмы хранения данных. Однако люди, принимающие решения в бизнесе хотят просматривать данные из всех источников, для того, чтобы принимать взвешенные и информированные решения. Наличие гетерогенных данных, сохраняемых в различных форматах, означает то, что анализ данных требует обобщения результатов процедур извлечения, трансформирования и загрузки (ETL). Даже, если при анализе данных в организации используется один источник данных, такой как CRM приложение информация должна быть преобразована в удобное хранилище, либо в витрину данных (обычно в форме "звезды") для создания кубов и использования профессиональных программ анализа данных.
Решение: Отсоединённые виды данных (Disconnected Semantic View)
Новшества SQL Server 2005 Analysis Services делают возможным выполнение профессионального анализа данных существующих систем с гораздо меньшими проблемами, чем раньше. С помощью UDM или Унифицированного Языка моделирования Данных организации могут создать единое представление разрозненных данных, включающее реляционные БД, OLTP БД, плоские файлы и даже Web сервисы. UDM предоставляет бизнесу возможность моделирования сложных структур данных из различных источников с последующим созданием реляционной отчётности и применением многомерного анализа унифицированного языка моделирования данных.
SQL Server 2005 Analysis Services способен создавать кубы без промежуточного хранилища данных в виде "звезды". UDM предоставляет возможность генерации отчётности непосредственно на производственной системе, без создания промежуточного хранилища, как требовалось ранее. Это достигается благодаря тому, что UDM может обращаться к любому источнику данных, находящемуся в 3-й нормальной форме и не требует организации данных в виде схем "звезда" или "снежинка". Более того, SQL Server 2005 Analysis Services способен создавать сложные схемы на основе существующей структуры данных, включая вычисляемые поля, SQL выражения, возвращающих набор данных и т.п. Данные схемы могут служить основой для создания кубов. Производительность исходных систем не затрагивается, т.к. кубы являются самостоятельным хранилищем данных. Это означает то, что производственные OLTP системы будут продолжать работать с прежней производительностью, при этом, предоставляя возможность бизнесу иметь доступ к сложной аналитике, а так же при желании к аналитике, работающей в режиме, близком к режиму приложений реального времени.
SQL Server 2005 Analysis Services предоставляет мощную возможность поддержки совместимости, благодаря технологии, называемой "Представления Источников Данных" (Data Source Views - DSV). Технология DSV позволяет создавать сложные аналитические модели на основании существующих OLTP схем, либо на основании схем "звезда". Это позволяет работать со сложными схемами, включающими дружественные имена и виртуальные связи. Одно из главных преимуществ DSV это то, что они могут быть созданы аналитиками, не имеющими права создания объектов в БД. Единожды созданные многомерные объекты анализа могут основываться на DSV, позволяя строить кубы, принимая за основу меняющуюся схему БД, что даёт возможность проводить анализ на производственной системе, без влияния на быстродействие критических приложений.
Проблема 2: Витрины данных и консолидирование разрозненных приложений
Объединение Витрин Данных
Одна из главных стратегий фирмы, создающей хранилища данных это создание витрин и малых хранилищ, предназначенных для независимых отделов компании, либо для решения специфических проблем, таких как анализ финансовых документов или анализ набора потребительских товаров и услуг, приобретаемых на рынке.
Множество хранилищ создаёт ряд проблем. Вероятней всего это могут быть достаточно дорогостоящие операции, необходимые для обслуживания БД, распределённых по предприятию и требующие множества обновлений из одних и тех источников данных. Так же представляется сложным консолидировать разрозненные витрины данных в меньшее количество витрин, либо в единое производственное хранилище.
Ликвидация некоторых промежуточных хранилищ данных имеет ряд положительных моментов, характеризующихся общей стоимостью владения (TCO). Во-первых, количество работы уменьшается с уменьшением количества витрин и снижением операций репликации, конвертирования и трансформирования данных. Снижаются требования к свободному пространству, необходимому для хранения данных, т.к. устраняется избыточность. Так же снижаются затраты на синхронизацию данных. Уменьшаются риски потери целостности данных, т.к. отпадает необходимость поддерживать множество витрин данных и согласовывать их друг с другом.
Решение: Единая верная версия данных
Компания Microsoft решает эту проблему с помощью Универсальной Модели Измерений (UDM). UDM позволяет объединить бизнес-логику приложения, измерения, ключевые показатели производительности (KPIs) а также информацию, необходимую для создания единой верной версии данных. При этом SQL Server 2005 Analysis Services использует возможность, называемую проекции данных. Проекции данных предоставляют возможность сегментации универсального языка моделирования (UDM), при этом основываясь на требованиях различных отделов компании. Проекция предоставляет требуемые данные каждому отделу и избавляет от необходимости иметь собственные хранилища данных, процедуры обработки и синхронизации данных (ETL), устраняя синхронизационные издержки. Так же соблюдается связанность и согласованность данных, т.к. используется всего одна физическая копия куба.
Операции с разобщёнными приложениями
Для того чтобы соответствовать различным требованиям отчётности и аналитики многие организации создают различные, не связанные между собой приложения. Компании могут создавать решения для реляционной отчётности, анализа данных, систем обработки официальных документов и т.д. Подобные приложения часто базируются на различных источниках данных. Реляционные системы отчётности обычно используют нормализованные OLTP структуры, в то время как аналитические приложения используют OLAP кубы, построенные на основе схем "звезда".
Наличие разобщённых приложений, использующих разные источники данных характеризуется рядом моментов: Затрудняется контроль согласованности данных, т.к. не существует единой актуальной версии данных. OLAP и OLTP системы представляют свои версии данных, так как в OLAP систему данные загружаются с помощью ETL. Раздельное хранение данных требует большего места и отличается тенденцией к избыточности и не согласованности. Альтернатива данному способу хранение информации - хранилище данных. Ко всему прочему приложения отчётности и аналитики очень часто выглядят как совершенно не связанные обращающиеся к БД различным образом и требующие различных настроек. В связи с этим многие аналититические программы, созданные сторонними фирмами никоим образом не поддерживают ни одной разновидности реляционной отчётности и могут лишь предоставлять некоторые варианты статичных копий результатов обработки данных.
Решение: Единая модель UDM's
Для решения проблем распределенных приложений Компания Microsoft предоставляет механизм интеллектуального анализа данных, который существенно уменьшает не только сами проблемы, но и решает сопутствующие вопросы. В прошлом различие между OLAP и OLTP системами было очевидно: компании извлекали данные из одного, либо нескольких OLTP источников данных, трансформировали эти данные в общий согласованный вид, загружали данные в схему "звезда" БД, а затем строили кубы на основании этой схемы. Это означало, то, что аналитики могли изучать и рассматривать данные в виде кубов или отчётов OLTP, но структуры данных были различны, различались так же инструменты анализа и даже языки, используемые для построения запросов. Сейчас благодаря UDM эти проблемы решены. UDM соединяет требования к реляционным отчётам, создаваемым на основе OLTP источников с требованиями аналитики, проводимой на основе OLAP структур в единую отчётную модель. Используя UDM, аналитические и отчётные приложения обращаются к одному хранилищу данных. OLAP кубы создаются и обслуживаются он-лайн, предоставляя мощные аналитические возможности в комбинации с обновлениями кубов, проходящими почти в реальном режиме времени. Приложения, формирующие отчётность получают выигрыш в скорости, благодаря упреждающему OLAP кэшированию, выполняемому с помощью UDM. Отсутствие необходимости в отдельных моделях данных для OLTP и OLAP предоставляет ряд преимуществ. Задача соблюдения целостности данных решается в одном месте, а не во множестве хранилищ данных. Данные больше не разобщены и хранятся в одной базе, используемой для реляционных и OLAP отчётов. Необходимость в создании приложений и разобщённых хранилищ данных уменьшена возможностью инструментов обращаться к общему хранилищу данных и просматривать данные в реляционном виде или в виде кубов.
Другое улучшение, связанное с UDM, а соответственно и со всеми аналитическими и отчётными приложениями это возможность создавать Ключевые Показатели Выполнения (KPI) используя систему KPI. Это предоставляет возможность организациям определять ключевые метрики бизнеса. Описание метрик хранится и создаётся в едином месте, т.о. все приложения могут получать доступ к единой версии данных. KPI могут показываться в виде простых, но достаточно информативных иконок, таких как измерители и светофоры, что даёт возможность быстрого доступа к статусам ключевых показателей бизнеса и помогает людям, принимающим решения в бизнесе.
Рисунок 1. Смешанные отчёты
Проблема 3: Интеллектуальное бизнес представление данных
Детализация данных это одна из наиболее мощных возможностей аналитических приложений. Детализация данных предоставляет пользователям возможность выполнения интерактивных процессов анализа данных, позволяет выдвигать гипотезы и затем изучать поведение данных. Возможность детализации данных позволяет пользователям получить ответ на вопрос о том, каким образом образуются числа, которые они видят. Пользователи могут анализировать данные без помощи работников отдела информационных технологий, периодически запрашивая новые и новые отчёты с более низким уровнем детализации.
Хотя детализация и является мощным средством, она не способна предоставить ответы на все вопросы. Некоторые приложения предоставляют возможность альтернативного анализа, но, к сожалению, обладают ограничивающими возможностями совместимости на уровне ядра хранилища данных. Данные ограничения затрудняют ряд форм анализа данных.
Вместо того чтобы просто детализировать данные, пользователям необходима возможность детализации одного измерения в разрезе другого. Например, при рассмотрении измерения "продукты" аналитик, возможно, захочет взглянуть на клиентов, заказавших эти продукты или на поставщиков, от которых данные продукты были получены. Аналитикам, возможно, потребуется сравнить значения, например даты заказов и даты отправления товаров, вместо того, чтобы фокусироваться на анализе одного параметра. Бизнес может потребовать моделирование более сложных взаимосвязей, нежели простые иерархии, к примеру, когда один автор пишет более чем одну книгу и книга написана более чем одним автором. Ядро хранилища БД обычно испытывает затруднения с моделированием подобных сложных сценариев, делая почти невозможным анализ и построение отчётности на основе таких структур.
Решение: Расширенное моделирование измерений
SQL Server Analysis Services 2005 способны решать описанные выше проблемы с помощью ряда нововведений, предоставляющих мощные аналитические возможности. Одна из таких возможностей это измерения, базирующиеся на атрибутах. Сегодняшние OLAP продукты стараются обрабатывать очень сложные жёсткие иерархии измерений. Это означает то, что бизнес аналитики работают с детализацией от группы продуктов до семейства продуктов, от семейства до единиц хранения. Однако очень часто имеется ряд дополнительных атрибутов измерения, таких как размер, цвет, вес и т.д. Эти дополнительные атрибуты часто принадлежат отдельным единицам хранения. При исследовании данных становится трудным детализировать информацию по цвету, как атрибуту измерения. Измерения, основанные на атрибутах, решают данную проблему, используя атрибуты, взамен жёсткой иерархии измерений. Все атрибуты могут быть использованы для декомпозиции и фильтрации, предоставляя возможность построения любой комбинации взаимосвязи измерений на лету.
SQL Server 2005 Analysis Services также предоставляет концепцию измерений "многие-ко-многим". Традиционные хранилища данных допускают взаимосвязь факта только с одним измерением, что означает ассоциирование связанной записи факта c одним и только одним продуктом в измерении продуктов. В реальном мире всё не так очевидно. Компания может владеть информацией о клиентах и банковских счетах. Счета представляются клиенту в виде нескольких счетов (текущий, сберегательный, расходный и т.д.) , в добавок каждый счёт может использоваться несколькими людьми (сберегательный счёт для Джона До и Джейн До). SQL Server 2005 поддерживает эту сложную взаимосвязь, в которой одна запись фактов может отображаться на множество записей измерений, предоставляя возможность ещё более сложного и мощного анализа с помощью упрощённого моделирования данных.
Многие движки хранилищ данных требуют создание кубов, в которых одно измерение соответствует одному возможному типу анализа. Например, фирма может захотеть проанализировать заказы по датам заказа или датам отгрузки. Вместо того чтобы создавать 2 измерения SQL Server 2005 Analysis Services предоставляет возможность проектировщику хранилища построить одно временное измерение и затем использовать это измерение как базовое для даты заказа и даты отправки. Возможность использования измерения в двух различных ролях известна как ролевое измерение. Данные измерения помогают уменьшить занимаемое дисковое пространство и время выполнения, сохраняя данные только единожды, позволяя просматривать измерение как несколько различных измерений для аналитиков и пользователей. Иногда в таблице фактов хранятся данные, не связанные ни с одной записью таблицы измерений. SQL Server 2005 Analysis Services позволяет определить подобные данные и создать связь "один-к-одному" с таблицей фактов, ссылающееся на вырожденное измерение.
Обычно вырожденное измерение носит название фактического в SQL Server 2005 Analysis Services. Это означает, что становится простым иметь измерение, используемое только для отдельных записей таблиц фактов, либо идентифицирующее данные, составляющие агрегированное значение.
Проблема 4: Локализация Аналитического Опыта
Одно из преимуществ хранилищ информации это консолидация данных в согласованном виде. Например, продажи во множестве стран фиксируются в местной валюте. Однако использование британских фунтов и японской йены вместе лишено смысла; взамен этого мастер BI может описать правила конвертации валют непосредственно в формате UDM. Строки с одними и теми же данными могут быть переведены из одного языка в другой, единицы измерения могут быть трансформированы из английской в метрическую и наоборот.
Выгода перевода в единый формат очевидна. Сравнение данных, поступивших из различных стран невозможно до тех пор, пока вы не приведёте данные в согласованный локальный формат. Локализация данных позволяет анализировать информацию предприятия вне зависимости от исходной страны. Недостаток состоит, например, в том, что хранилище консолидирует все данные в американских долларах, что вероятней всего создаст трудности аналитику в Токийском отделении компании. Бизнес вынужден выбирать между созданием нескольких копий хранилищ для каждого офиса и единым хранилищем с единым языком и валютой.
Решение: Встроенный перевод метаданных и данных, а так же конвертация валют
Благодаря SQL Server 2005 Analysis Services у бизнеса есть возможность создать хранилище на едином языке, при этом, предоставив пользователям видеть локализованные версии данных. Это означает, что единое локализованное хранилище данных, имеющее формат, адаптированный для американского рынка может просматриваться аналитиками и информационными работниками других стран в их локальной валюте, числовых и текстовых форматах.
Существует два основных преимущества такого подхода. Первое - отпадает необходимость создания нескольких локализованных хранилищ, уменьшается место хранения. Второе - это даёт возможность организациям расширить аналитику на всё предприятие, так как каждая страна теперь может получить свою локализованную версию данных. Возможность использования локализованных видов отдельных кубов предоставляется с помощью возможности, называемой Translations. Translations разрешает перевод данных и метаданных в локальный формат "на лету", предоставляя пользователям локализованную версию с минимальными усилиями, по сравнению с созданием отдельных кубов для каждой страны.
Рисунок 2. Мульти Перевод
Проблема 5: Интеллектуальная обработка данных в реальном времени
Типичное решение интеллектуальной обработки данных (BI) включает в себя ряд общих черт. Данные консолидированы, согласованы, доступны для чтения и представляют собой историческую информацию. Историчность информации обычно не подразумевает лишь то, что данные накоплены за предыдущий период времени, это так же означает их не полное обновление. Даже, если обновление информации осуществляется каждой ночью представители бизнеса, принимающие ключевые решения используют вчерашнюю информацию. В динамично меняющейся ситуации вчерашней информации может оказаться недостаточно.
Некоторое время существовали BI решения, работающие в режиме реального времени, или близко к реальному времени. Множество приложений интеллектуальной обработки данных, работающих в режиме, близком к режиму реального времени имели проблемы быстродействия, так как не могли сохранять данные в оптимальном формате. К тому же большинство таких приложений оказывали негативное влияние на исходные БД OLTP, постоянно запрашивая необходимые данные и таким образом существенно замедляя работу систем.
Решение: Правильная Информация, Правильный Формат, Правильное Время
Microsoft SQL Server 2005 Analysis Services предоставляет возможность предприятиям выполнять аналитические исследования в режиме близком к реальному времени, без необходимости ночных или еженедельных обновлений данных. Более того, решение позволяет выполнять анализ данных, не ухудшая быстродействие BI приложения. В конечном итоге замедление быстродействия будет либо отсутствовать вообще, либо будет пренебрежимо мало в сравнении с BI приложением, работающим в режиме реального времени. Данная функциональность SQL Server 2005 Analysis Services стала возможной благодаря упреждающему кэшированию. Упреждающее кэширование позволяет при создании куба указывать, когда и как куб будет обновлён. Как пример, анализ в режиме реального времени может быть достигнут такой настройкой кэша, при которой каждая новая транзакция в реляционной базе данных будет посылать уведомление UDM. Это приведёт в действие обновление куба в фоновом режиме, и будет поддерживать синхронизацию между кубом и реляционной БД. Как альтернатива возможно обновление кэша по временному расписанию, например каждые пол часа.
Одно из больших преимуществ такого подхода это то, что компании получают возможность анализа в режиме близком к реальному времени или в режиме реального времени, при этом полностью сохраняя производительность кубов хранилищ данных. Администраторы могут настроить контроль и частоту обновления информации. Упреждающее кэширование позволяет обращаться к кубу в любой момент - не только после его создания, но и в момент его заполнения или обновления. В случае поступления запроса перед тем, как куб полностью обновится, Microsoft Analysis Services 2005 переключится с MOLAP на ROLAP режим для того, чтобы обработать запрос.
Благодаря достаточно важным нововведениям Компании Microsoft BI приложения способны предоставить невероятную мощь и серьезный аналитический инструментарий организациям любого размера.
Заключение
В последнее время появилось множество вариантов систем интеллектуальной обработки данных (BI). Например, множество информации в компаниях хранится в CRM, SCM, ERP, либо других приложениях, имеющих собственный формат и схему хранения данных. UDM предоставляет возможность бизнесу выполнять сложную аналитику и строить отчёты по огромным массивам данных, даже в случае, если они представляют собой гетерогенные источники данных.
BI решения большей частью являются историческими слепками данных, устаревающих на момент проведения аналитики. Некоторые BI приложения поддерживают возможность анализа близкую к режиму реального времени, но часто страдают плохим быстродействием и существенным накладным расходам.
Многие BI решения так же нуждаются в способности объединять нескольких витрин данных в единое хранилище. Другие BI реализации страдают недостатком гибкости при анализе иерархических структур или моделировании сложных взаимосвязей между несколькими измерениями. В конечном итоге продукты, предназначенные для работы с хранилищами данных попросту не способны оперировать локализованными данными и числовыми форматами, разделяя при этом отчётность и аналитику данных. Очень часто это означает то, что данные содержатся в нескольких хранилищах, предназначенных для различных целей.
SQL Server 2005 Analysis Services легко решает подобные проблемы. Хранилища могут быть созданы непосредственно на основании реляционных структур, CRM и SCM систем, а так же любых других данных, без необходимости создания схемы "звезда" и с минимальным влиянием, либо вообще без нагрузок на производительность ключевых приложений, используемых в бизнесе. Analysis Services представляют технологию обновления OLAP кубов он-лайн с минимальным воздействием на исходную БД, при этом ускоряя подготовку реляционной отчётности на основании этих же данных. Analysis Services так же делает возможным представление в виде множества витрин одного хранилища данных для одновременной работы нескольких отделов организации и различных пользователей. Это позволяет каждому отделу заниматься анализом данных без создания и поддержи множества хранилищ. Так же одно хранилище может быть представлено в виде нескольких локализованных версий без необходимости построения отдельных хранилищ.
В конечном итоге Универсальный Язык Моделирования Компании Microsoft (UDM) сочетает удобства OLTP и OLAP хранилищ в единой модели. Можно строить OLAP кубы "на лету" и обновлять их в почти реальном режиме времени. В схеме "звезда" нет необходимости. Приложения, создающие отчётность выигрывают от кэширования данных OLAP кубов, что позволяет оперативно получать отчёты на основании OLTP БД.
Благодаря достаточно серьезным нововведениям Компании Microsoft, BI приложения способны предоставить невероятную мощь и серьёзный аналитический инструментарий организациям любого размера. Используя эти возможности компании, могут создавать более мощные, гибкие и эффективные по затратам BI приложения, которые могут использоваться гораздо более широким кругом пользователей и спектром инструментов, чем когда-либо.
Крейг Атли является вице-президентом KiZAN Technologies LLC и возглавляет группу, занимающуюся решениями, связанными с интеллектуальной обработкой данных, разработкой и дизайну приложений масштаба больших корпораций. Он работает с продуктами компании Microsoft для интеллектуальной обработки данных с момента создания их концепций. Крейг Атли так же участвовал в создании BI приложений и хранилищ данных по всей территории Соединенных Штатов Америки. Он автор, докладчик, и обладатель статуса Microsoft MVP
Данный документ подготовлен в сотрудничестве с A23 Consulting.