Logo Море(!) аналитической информации!
IT-консалтинг Software Engineering Программирование СУБД Безопасность Internet Сети Операционные системы Hardware
Бесплатный конструктор сайтов и Landing Page

Хостинг с DDoS защитой от 2.5$ + Бесплатный SSL и Домен

SSD VPS в Нидерландах под различные задачи от 2.6$

✅ Дешевый VPS-хостинг на AMD EPYC: 1vCore, 3GB DDR4, 15GB NVMe всего за €3,50!

🔥 Anti-DDoS защита 12 Тбит/с!

VPS в 21 локации

От 104 рублей в месяц

Безлимитный трафик. Защита от ДДоС.

🔥 VPS до 5.7 ГГц под любые задачи с AntiDDoS в 7 локациях

💸 Гифткод CITFORUM (250р на баланс) и попробуйте уже сейчас!

🛒 Скидка 15% на первый платеж (в течение 24ч)

Погружение данных в хранилище

Реляционные системы учета, на основе данных которых нам предстоит формировать хранилище, чисто исторически могут быть представлены самыми различными СУБД и форматами хранения. Продуктовая система может быть построена на Oracle, внутренняя бухгалтерия - на FoxPro, а управление кадрами - на Access. Тем не менее, для целей анализа данные нужны могут понадобиться все и сразу. Следовательно, мы должны уметь осуществлять доступ к источникам данных различной природы. Перед тем, как положить данные в хранилище, данные должны быть очищены, проверены на непротиворечивость и приведены к единому виду. Например, одно приложение хранит месяц апрель как "Апрель", другое - как "апр", третье - как "April", четвертое - как "IV", пятое - как "04" и т.д. Даже если мы с помощью OLE DB, ODBC или как-то иначе мы организовали доступ ко всем нашим разнородным источникам данных, или если нам повезло и все это хранится в одной СУБД, мы получим несколько разных членов одного временнОго измерения, которым на самом деле соответствует всего лишь один член уровня "месяц". А, кроме того, он может вообще храниться не отдельно, а в составе даты, и тогда его нужно выделить оттуда при наполнении хранилища. Еще одно требование - возможность частичной предагрегации. Допустим, наша продуктовая система хранит данные о продажах за каждый день. Но в процессе анализа будущего куба мы не собираемся погружаться до дней, так как по логике приложения нас вполне устроит месячный дискрет. Следовательно, нечего тащить все детали в куб и раздувать объем хранилища, стоит агрегировать месячные продажи еще на стадии наполнения хранилища. Согласно теории построения хранилищ, последние должны пополняться в строго определенные моменты времени, скажем, раз в день, неделю, месяц. Это разумно, поскольку а) он-лайновое обновление данных свело бы на нет все преимущества, связанные с read-only природой хранилища (правда, существуют такие вещи, как поддержка ответов на запросы типа "что-если", предполагающая внесение изменений в локальный многомерный кэш, и обратная запись, вносящая изменение непосредственно в хранилище на сервере, но об этом чуть позже); б) предвычисление агрегатов в случае внесения изменений в детальные данные, на основе которых построено хранилище, есть процесс далеко не мгновенный, что невозможно, если допустить он-лайновые изменения в хранилище. Следовательно, загрузка данных в хранилище должна происходить на основе расписания в фиксированные моменты времени.

Итак, доступ к разнородным данным, их очистка, проверка на непротиворечивость, унификация, предагрегация и выполнение на основе определенного графика во времени - все эти задачи при погружении данных в хранилище решают службы преобразования данных .

Назад | Содержание | Вперед

 

Скидка до 20% на услуги дата-центра. Аренда серверной стойки. Colocation от 1U!

Миграция в облако #SotelCloud. Виртуальный сервер в облаке. Выбрать конфигурацию на сайте!

Виртуальная АТС для вашего бизнеса. Приветственные бонусы для новых клиентов!

Виртуальные VPS серверы в РФ и ЕС

Dedicated серверы в РФ и ЕС

По промокоду CITFORUM скидка 30% на заказ VPS\VDS

VPS/VDS серверы. 30 локаций на выбор

Серверы VPS/VDS с большим диском

Хорошие условия для реселлеров

4VPS.SU - VPS в 17-ти странах

2Gbit/s безлимит

Современное железо!

Новости мира IT:

Архив новостей

IT-консалтинг Software Engineering Программирование СУБД Безопасность Internet Сети Операционные системы Hardware

Информация для рекламодателей PR-акции, размещение рекламы — adv@citforum.ru,
тел. +7 495 7861149
Пресс-релизы — pr@citforum.ru
Обратная связь
Информация для авторов
Rambler's Top100 TopList liveinternet.ru: показано число просмотров за 24 часа, посетителей за 24 часа и за сегодня This Web server launched on February 24, 1997
Copyright © 1997-2000 CIT, © 2001-2019 CIT Forum
Внимание! Любой из материалов, опубликованных на этом сервере, не может быть воспроизведен в какой бы то ни было форме и какими бы то ни было средствами без письменного разрешения владельцев авторских прав. Подробнее...