Перспективы развития DOCS Open и компонент
для него
А. Афанасьев, АО Весть
В работе современных предприятий важную роль играют его информационные ресурсы. Любое
более или менее крупное предприятие вынуждено хранить десятки и сотни тысяч документов.
Типичными примерами неструктурированных документов являются договора, письма,
распоряжения, служебные записки и тому подобные документы. При большом объеме хранения
найти что-либо в архиве неструктурированных документов без применения необходимых мер
организации информации очень сложно. Типичными для хорошей информационно-поисковой
системы являются возможность поиска документов по атрибутам, ключевым словам документа и
содержанию документа. В настоящее время все большее распространение получают
специализированные системы управления документами (СУД).
К основным их функциям относятся:
- выдача и возврат документов библиотечного типа.
- Нумерация версий документов.
- Поиск документов (как по тексту, так и по атрибутам, задаваемым
пользователем).
- Многоуровневая система защиты информации.
- Администрирование учета и архивирования.
- Работа с разнообразными форматами документов (просмотр документа без
процессора обработки документа).
Рассмотрим систему DOCS Open, предназначенную для ведения архивов средних и крупных
организаций.
Система DOCS Open построена по современной архитектуре "клиент-сервер", причем. должно
быть минимум 2 сервера: сервер библиотеки, который хранит карточки документов, и сервер
документов, хранящий сами документы. Это вовсе не означает того, что для этого необходимо 2
машины - оба сервера могут с успехом функционировать на одной машине. В то же время для
больших архивов один сервер библиотеки может управлять несколькими серверами документов.
Дополнительно в системе может быть сервер полнотекстового индекса, обеспечивающий быстрое
построение полнотекстовых индексов на документы, хранимые в архивах DOCS Open. Данная
возможность позволяет искать документы по их содержанию, не зная атрибутов необходимых
документов.
В качестве сервера библиотек может использоваться практически любая промышленная
реляционная база данных. Для ряда СУБД поддерживается специальные методы доступа
(напрямую через интерфейсные библиотеки). В качестве сервера документов могут выступать
произвольная сетевая операционная система. PC DOCS Inc. сделала основную ставку на
Windows NT. В последнее время именно для этой платформы выпускаются новые продукты,
обеспечивающие повышенную секретность доступа к информации. Сервер полнотекстового
индекса работает на IBM PC под любыми вариантами Windows или на MAC.
Клиентское место DOCS Open функционирует на IBM PC (в DOS и Windows) или на MAC.
Причем экранные формы, используемые в средах Windows, DOS и Mac - одни и те же, хотя
администратор архива при желании может разработать специальные экранные формы для
каждой из среды и для каждой группы пользователей. Так называемый мобильный клиент
DOCS Open может работать и в отрыве от основного архива, причем синхронизация локального
архива и архива предприятия происходит автоматически. Синхронизация локального архива
пользователя и архива предприятия может происходить по локальной сети, по коммутируемым и
некоммутируемым каналам связи.
DOCS Open хранит документы в файлах, которые размещаются в файловой системе сервера
документов (сетевой операционной системы). Каждый документ содержится в исходном виде (в
виде одного или нескольких файлов). Для одного документа может храниться несколько версий
(до 99 версий и 26 подверсий документа). Можно ввести ограничение на объем хранимой
информации на каждом сервере документов.
DOCS Open имеет средства миграции документов по различным типам носителей данных.
Миграция документов осуществляется автоматически в соответствии с частотой обращения к
документам.
DOCS Open позволяет вести off-line архивы документов. При этом в сервере библиотеки лежат
только учетные карточки документов.
Рис. 1. Структурная схема
DOCS Open
Документы редактируются непосредственно по месту хранения (т.е. прямо на серверах
документов). Впрочем, если доступ к документам медленный, то есть возможность
предварительного создания локальной копии документа (причем это происходит
автоматически).
Каждый документ в системе DOCS Open снабжается учетной карточкой, содержащей атрибуты
документов. При этом какая экранная форма будет использоваться определяется для какой
программы обработки и для какого пользователя ведется поиск (или регистрация)
документов.
Эта система позволяет находить документы не по учетной информации, а по содержанию
документа. Эта возможность просто необходима при аналитической работе с документами.
DOCS Open строит поиск на основе интерфейса QBE (Query By Example), т.е. для того чтобы
найти документ, Вы должны заполнить предполагаемую карточку документа (возможно не
полностью). В ответ на это деяние система выдает вам список документов соответствующих
веденным данным. Полученный результат поиска можно или расширить, или, наоборот,
уточнить. Полнотекстовой поиск осуществляется для пользователя прозрачным (т.е. незаметным)
образом. Просто в запросной форме добавляется еще одно поле - содержание документа. DOCS
Open автоматически транслирует запрос, определяет наиболее оптимальные пути выполнения
запроса и обеспечивает объединение полученных результатов. Для того чтобы не вводить
наиболее часто используемые запросы, DOCS Open позволяет сохранить типовые поисковые
запросы. При этом такие запросы определяют только критерии поиска документов, а
отображение определяется экранной формой результатов запроса (которых к стати говоря в
системе может быть несколько). Пользователи имеют возможность объединять документы в
папки. В папки документы объединяются произвольно (в том смысле, что перенос документа в
папку осуществляется чисто руками, без всякой связи с критериями отбора документа). Папки
могут быть связаны между собой произвольным образом (а не только иерархически, как в
системах электронной почты).
При распределенном поиске информации DOCS Open автоматически транслирует запрос,
определяет наиболее оптимальные пути выполнения запроса и обеспечивает объединение
полученных результатов. Для того чтобы не вводить наиболее часто используемые запросы,
DOCS Open позволяет сохранить типовые поисковые запросы. При этом такие запросы
определяют только критерии поиска документов, а отображение определяется экранной формой
результатов запроса (которых к стати говоря в системе может быть несколько). Пользователи
имеют возможность объединять документы в папки. Папки могут быть связаны между собой
произвольным образом (а не только иерархически, как в системах электронной почты).
DOCS Open поддерживает распределенную обработку документов. При этом документы всегда
лежат на тех серверах, куда они первоначально были положены. В случае запроса на поиск
документа DOCS Open распределяет поисковый запрос по всем необходимым серверам
библиотек. Они производят поиск документа у себя и возвращают списки найденных
документов. DOCS Open объединяет эти списки и выдает окончательный результат поиска
пользователю. Документ передается пользователю только в тот момент, когда он ему нужен для
обработки.
DOCS Open, в соответствии со своим названием, является открытой системой, причем открытой
полностью. И если первая особенность характерна для многих систем управления документов, то
вторая возможность является отличительным свойством именно DOCS Open.
Гибкость и компактность программного интерфейса, открытость внутренних структур данных
делает DOCS Open безусловным лидером среди систем управления документами по возможности
интеграции с другими приложениями.
DOCS Open 3.0 поддерживает полный спектр баз данных, сетей, операционных систем и
аппаратных платформ, позволяя без проблем интегрировать продукт практически в любую
компьютерную инфраструктуру предприятия. Многоуровневая архитектура пакета
обеспечивает:
Управление документами на предприятии
Масштабируемый и гибкий DOCS Open 3.0 предлагает поддержку гетерогенных сетевых сред, в
состав которых включены Windows NT, NOVELL, Banyan, DEC, UNIX и т.д. , настраиваемую
систему защиты документов и усовершенствованные возможности поиска и выборки
документов.
Расширение границ системы управления документами за пределы предприятия
Конкурентные продукты не предоставляют реализованные в новой версии DOCS Open
функциональные возможности, расширяющие системы управления документами за пределами
предприятий - средства для групп мобильных пользователей; клиентов и бизнес-партнеров,
взаимодействующих по сети с помощью приложений коллективной работы (включая Microsoft
Exchange и Lotus Notes), и средства безопасного управления документами в рамках Internet.
Дополнительно пакет поддерживает интеграцию различных продуктов работы с изображениями
документов и электронного документооборота; является ODMA-совместимым, поэтому способен
интегрироваться с другими системами управления документами.
Усовершенствованный поиск и выборка
DOCS Open 3.0 имеет усовершенствованный интерфейс поиска и более мощный механизм
полнотекстового поиска, основанный на технологии Verity. Возможности включают оценку
соответствия запроса, поиск по близости, фразе, "звучит как" и нечеткую логику. Версия 3.0
позволяет иметь в системе несколько индексных серверов на одну библиотеку. Verity на
сегодняшний день обладает самым широкими возможностями индексации и поиска документов,
в том числе, развитым языком запросов с возможностями поиска с использованием логических и
множества контекстных операторов связки слов и основ слов. Развивая стратегию PC DOCS по
поддержке открытых систем, новый продукт реализует несколько механизмов полнотекстовой
выборки.
Управление предприятием
В организациях с гетерогенными сетевыми средами DOCS Open 3.0 упрощает поддержку
идентификаторов пользователей различных сетей благодаря единой службе каталогов
предприятия, исключающей необходимость нескольких загрузок в систему, типичную для других
СУД.
Настраиваемые системы защиты
Только DOCS Open 3.0 предлагает различные методы защиты документов. Новый специальный
агент Document Sentre Agent (DSA), дополнительный 32-разрядный серверный модуль
разработан для сред, в которых предъявляются серьезные требования к защите информации,
например, в наукоемких областях промышленности. DSA создает брандмауэр между
пользователями и документами. Он помещается на сервере документов и дает пользователям на
время сеанс доступа к документам. В ходе сеанса все действия, производимые над документами,
записываются в контрольный журнал DSA. Журнал располагается за пределами брандмауэра,
поэтому к нему нельзя получить доступ и изменить. DSA обеспечивает наивысшую степень
защиты документов. Кроме того, в DOCS Open 3.0 есть служба Hierarchical Directory Service,
обеспечивающая систему защиты, полностью интегрированную с сетевой операционной
системой, и позволяющую защищать документы пользователям, группам и организационным
структурам.
Мобильное рабочее место пользователя - DOCS Unplugged
DOCS Unplugged (раннее назывался DOCS Mobile) совершенствует поддержку мобильных
пользователей (за которую PC DOCS уже получал награды), обеспечивая пользователей,
подсоединяющимся к системе по телефонным линиям лучшими средствами доступа.
Пользователям, работающим в локальной сети, DOCS Unplugged предлагает все
функциональные возможности СУД в случае, если корпоративная сеть стала недоступной или в
ней произошел сбой , что обеспечивает повышение отказоустойчивости всей системы работы с
документами. Все документы и информация из карточек документов автоматически сохраняется
или отображается как "теневая" на настольном компьютере пользователя, гарантируя
автоматическую синхронизацию и непрерывный доступ к документам DOCS Open.
Группы мобильных пользователей
В распоряжение удаленных рабочих групп, которым необходим доступ к библиотекам
документов предприятия во время работы вне офиса, находятся все функциональные
возможности управления документами. Один пользователь или рабочая группа peer-to-peer
выступает в качестве клиент/сервера группы, а все остальные пользователи - в качестве
клиентов. Сервер обеспечивает библиотечный доступ к библиотекам предприятия, позволяя по
мере необходимости получать доступ к документам и синхронизировать их.
DOCS Interchange
PC DOCS расширил семейство продуктов DOCS Interchange, предложив DOCS Interchange for
Microsoft Exchange. Цель - упростить электронную публикацию документов, необходимую как
сотрудникам предприятия, так и клиентам и деловым партнерам. Теперь документы DOCS Open
и метаданные карточек документов могут помещаться в папки Microsoft Exchange.
Продукты семейства Interchange позволяют в электронном виде публиковать информацию из
документов, используя программы для коллективной работы и общие сети, в тоже время
контролируя и управляя жизненным циклом документа посредством DOCS Open. Данные модули
позволяют выполнять как простые передачи данных из продукта в продукт, причем в
автоматическом режиме, так и организовывать сложный распределенный доступ до документов
архивов DOCS Open. При этом администратор архивной системы может организовать подписку
на документы, хранимые в DOCS Open. Interchange будет рассылать группам пользователей
Lotus Notes или в общие папки Microsoft Exchange списки всех новых поступлений по заданной
тематике. Тематика задается сохраненным запросом на поиск информации в DOCS Open,
который может включать в себя ссылки на атрибуты документа и содержание документа.
Администратор архива может определить состав информации: задать атрибуты, которые будут
рассылаться пользователям, документы (или ссылки на них) и т.д.. Конкретный пользователь
почтовой системы, просмотрев списки поступлений может заказать себе отдельные (или все)
статьи, послав ответ к Interchange. В ответ он получит все заказанные статьи. Семейство
Interchange включает Interchange for Microsoft Exchange и Interchange for Lotus Notes.
Если учесть то, что DOCS Open содержит в себе средства вычисления стоимости хранения
документов и стоимости работы пользователя, то можно с уверенностью сказать, что совместное
использование DOCS Open и Lotus Notes позволяет построить распределенный архив
информации (вплоть до платных библиотек электронных документов).
PC DOCS разработал технологию управления документами в Internet, совместимую с WEB
технологией. С ее помощью обеспечивается доступ к DOCS-хранилищу из любого web-броузера,
публикация документов на web-сервере и шифрование информации. Реализация этих функций
PC DOCS Inc. ведет в три этапа. Из них первый воплощен в готовом продукте - работа DOCS
Open через Web сервера. В рамках этого проекта должен быть создан мост из WEB сервера к
серверу DOCS Open. Для пользователя сильно облегчается поиск информации в больших
архивах. Для него будет достаточно задать критерии отбора информации, указывая при этом
атрибуты документа и/или контекстные запросы к содержанию документов. В ответ система
вернет список документов, удовлетворяющих заданным критериям. После этого пользователь
может отобрать необходимую информацию и получить у себя на рабочем месте. При этом у
пользователя используется только стандартные продукты, такие, как WEB-броузеров, например,
Microsoft Internet Explorer или Netscape Navigator. Срок реализации этого этапа - июль 1996
года.
Компания Весть выпустила целый ряд продуктов, расширяющих возможности DOCS Open и
улучшающие его интерфейс. Это следующие продукты:
DOCS Links. Это средство построение сложных связей между документами. Эта компонента
позволяет строить связи между документами не помещая их в папки. При этом поддерживаются
два типа связей: направленные вертикальные связи (типа "главный-подчиненный") и
ненаправленные горизонтальные связи (типа "родственные документы"). Данная система
позволяет построить сложный лес документов, типичный для таких сфер применения архивных
систем, как архивы нормативно-справочных документов или архив юридических
документов.
DOCS Browser. Этот компонент позволяет отобразить содержание архива в структурном виде (в
формате Explorer от Windows'95). Причем пользователь может выбрать формат представления
информации, критерии сортировки и группировки документов. Данная компонента упрощает
доступ к документам неподготовленных пользователей архивной системы, объединяет в себе
различные разрозненные компоненты в одном диалоге (типа документов, хранимых запросов и
папок документов).
[Назад]
[Содержание]
[Вперед]