Logo Море(!) аналитической информации!
IT-консалтинг Software Engineering Программирование СУБД Безопасность Internet Сети Операционные системы Hardware

VPS в России, Европе и США

Бесплатная поддержка и администрирование

Оплата российскими и международными картами

🔥 VPS до 5.7 ГГц под любые задачи с AntiDDoS в 7 локациях

💸 Гифткод CITFORUM (250р на баланс) и попробуйте уже сейчас!

🛒 Скидка 15% на первый платеж (в течение 24ч)

Скидка до 20% на услуги дата-центра. Аренда серверной стойки. Colocation от 1U!

Миграция в облако #SotelCloud. Виртуальный сервер в облаке. Выбрать конфигурацию на сайте!

Виртуальная АТС для вашего бизнеса. Приветственные бонусы для новых клиентов!

Виртуальные VPS серверы в РФ и ЕС

Dedicated серверы в РФ и ЕС

По промокоду CITFORUM скидка 30% на заказ VPS\VDS

Технологии IBM для работы с неструктурированными данными

Марк Ривкин, IBM

Большинство организаций уже давно имеет множество информационно-управляющих систем, работающих со структурированными данными (числами и строчками символов). Сегодня все системы такого типа строятся на основе той или иной коммерческой СУБД. Эти СУБД реализуют основные функции, присущие информационно-управляющим системам, такие как надежность, масштабируемость, защита данных, гибкость, простая модель данных и т д.

Однако коммерческие СУБД слабо приспособлены для работы с неструктурированными данными. А объем неструктурированных данных в мире растет лавинообразно. Что же такое неструктурированные данные (их еще часто называют контентом)? Это документы (текстовые и отсканированные), книги, презентации, картинки, рентгеновские снимки, отпечатки пальцев, музыкальные клипы, диктофонные записи, фотографии, электронные таблицы, фильмы, результаты наблюдений , новости, почта, протоколы чатов, счета и накладные, компьютерные распечатки и т д и т п.

Большинству организаций нужны системы обработки неструктурированных данных, начиная с систем документооборота и контроля исполнения документов и кончая системами типа видео по требованию или системами для постоянного мониторинга и анализа прессы. Особенно возрос интерес к работе с неструктурированными данными после появления Интернета. Все веб-сайты и порталы работают с контентом и требуют сбора, хранения, маршрутизации, обновления и своевременного уничтожения этого контента.

К сожалению, в области работы с неструктурированными данными мы повторяем тот же путь, что в прошлом при работе с структурированными данными. Еще 15 – 20 лет назад каждый программист писал “с нуля” свою информационно-управляющую систему. Данные он размещал в файлах и сам пытался реализовать элементы надежности, масштабируемости, защиты и т д. Лишь тогда, когда люди поняли, что есть функционал, общий для всех систем, работающих со структурированными данными, были созданы коммерческие СУБД, которые реализуют этот функционал хорошо. Вряд ли сегодня кто-нибудь начнет создавать информационную систему “с нуля”.

А вот в области работы с неструктурированными данными картина пока еще выглядит по-другому. Множество организаций пытается реализовать системы документооборота, архивы и т д на основе коммерческих СУБД. Это аналогично тому, что мы делали 20 лет назад для информационно-управляющих систем. Так как весь функционал для работы с неструктурированными данными приходится каждый раз писать заново.

Чтобы решить эту проблему, надо было создать аналог СУБД для систем управления неструктурированными данными. Этот аналог назвали “системой управления контентом”. В информационных технологиях появился новый класс систем – Enterprise Content Management (ECM), т е коммерческие системы управления контентом, построенные на основе стандартов. Слово Enterprise (корпоративная) здесь используется не случайно. Дело в том, что такая система должна стать ядром управления контентом всего предприятия. На ее основе реализуется множество разнообразных систем обработки неструктурированных данных, таких как порталы, архивы, документооборот, библиотеки, видео по требованию и т д

Понятно, что система уровня предприятия должна быть масштабируемой, надежной, транзакционной, защищенной, гибкой, поддерживать работу с большого числа пользователей и эффективно работать с огромными объемами контента. Например, библиотеки видеофильмов для телевидения сегодня достигают нескольких петабайт. Возможно, систему документооборота для небольшой рабочей группы можно купить или разработать без использования систем класса ECM, но если Вам надо реализовать несколько систем для работы с неструктурированными данными на предприятии, то ECM системы незаменимы. Они сэкономят Вам много времени и обеспечат высокое качество создаваемых систем.

В данном докладе мы поговорим об одной из систем класса ECM – системе DB2 Content Manager компании IBM. По данным Gartner Group она лидирует на рынке ECM и на ее основе сегодня созданы сотни систем для работы с неструктурированными данными.

Мы поговорим об архитектуре системы, рассмотрим ее функции, обсудим отдельные компоненты системы и их назначение. А также попытаемся показать, какие типичные проблемы предприятия она позволяет решить и чем отличается от простой коммерческой СУБД.

VPS/VDS серверы. 30 локаций на выбор

Серверы VPS/VDS с большим диском

Хорошие условия для реселлеров

4VPS.SU - VPS в 17-ти странах

2Gbit/s безлимит

Современное железо!

Бесплатный конструктор сайтов и Landing Page

Хостинг с DDoS защитой от 2.5$ + Бесплатный SSL и Домен

SSD VPS в Нидерландах под различные задачи от 2.6$

✅ Дешевый VPS-хостинг на AMD EPYC: 1vCore, 3GB DDR4, 15GB NVMe всего за €3,50!

🔥 Anti-DDoS защита 12 Тбит/с!

Новости мира IT:

Архив новостей

IT-консалтинг Software Engineering Программирование СУБД Безопасность Internet Сети Операционные системы Hardware

Информация для рекламодателей PR-акции, размещение рекламы — adv@citforum.ru,
тел. +7 495 7861149
Пресс-релизы — pr@citforum.ru
Обратная связь
Информация для авторов
Rambler's Top100 TopList This Web server launched on February 24, 1997
Copyright © 1997-2000 CIT, © 2001-2019 CIT Forum
Внимание! Любой из материалов, опубликованных на этом сервере, не может быть воспроизведен в какой бы то ни было форме и какими бы то ни было средствами без письменного разрешения владельцев авторских прав. Подробнее...