Logo Море(!) аналитической информации!
IT-консалтинг Software Engineering Программирование СУБД Безопасность Internet Сети Операционные системы Hardware

Климов В.
Весть-Метатехнология

Концепция построения системы управления документами

по материалам публикаций сотрудников компании ВЕСТЬ-Метатехнология

Каждый из Вас определенное время тратит на разбор бумаг на своем столе или, что еще хуже, во всей организации. Что бы Вы не делали, каким организованным Вы не были, бумага это такая вещь, которая обладает невероятной живучестью и способностью накапливаться в неимоверных количествах. Папки, полки, шкафы и все забиты бумагой. Нужный документ трудно найти, а ненужные всегда под руками. После долгого поиска обнаруживается, что неделю назад Вы его отправили в машинку для переработки бумаг, а сервер вчера упал, и администратор заболел. Другая "картина маслом", с которой приходится сталкиваться практически каждому ответственному сотруднику, спектр задач которого на столько велик, что ему в помощь выделяют специального сотрудника, чаще сотрудницу. Рядовые на первый взгляд причины - болезнь сотрудника или одного из его близких, командировка или отпуск - может привести к тому, что его не окажется на рабочем месте…а вы совместными усилиями только вчера закончили подготовку документа, который сегодня был затребован клиентом. Согласитесь, что это является вполне "уважительной" причиной, чтобы у компьютера собралось совещание, среди которого присутствуют как люди, познавшие компьютер, так и сочувствующие, пытающиеся своим участием отвлечь озабоченного руководителя от мрачных мыслей - масса потерянного, времени, нервов. Картина приобретает более мрачный оттенок, если от этого документа зависит судьба миллионного контракта. Что делать? Как превратить компьютер из чудовища производящего документы, в симпатичного друга, организующего столь неорганизованное существо как человек.

В мире существуют два основных типа документов - бумажные и его клоны и электронные. Они существуют вместе, дружат и враждуют, но не могут жить друг без друга. Бумажные документы порождают электронные (например, сканирование документа) и наоборот электронные в бумажные документы (например, процесс печати документа). Существуют оценки западных консалтинговых компаний о том как живут и видоизменяются миры электронных и бумажных документов 1

  • Компания BIS оценивает, что 90 процентов всей корпоративной информации остается на бумаге
  • Компания XPLOR оценивает, что за последние три года доля электронных сообщений выросла с 29 процентов до 44 процентов от общей доли сообщений. Общий объем информации удваивается за 5 лет и учетверяется за 10 лет. Соотношение количества бумажных и электронных документов составит через пять лет 50 на 50 процентов, а через 10 лет - 30 на 70 процентов. Количество электронных документов удваивается за год, а бумажных документов растет только на 7 процентов.

Документ, как любая вещь, приносящая прибыль и помогающая в бизнесе, так же привносит долю расходов. Как известно, повышать прибыль бизнеса можно путем снижения затрат на этот бизнес. Западные консалтинговые компании потратили много сил для оценки расходов на обработку бумажных документов. Что не мало важно, эти оценки приведены не в долларах, а в разах, штуках и процентах. Это поможет избежать несоответствий при переносе этих оценок в российскую действительность. Дело в том, что до сих пор существуют значительные различия в стоимости оплаты труда у нас и на Западе, что, естественно, является немаловажным сдерживающим фактором в переходе к электронным документам.

  • Компания DELPHI оценивает, что 15 процентов всех бумажных документов безвозвратно теряется и рабочие группы тратят до 30 процентов своего времени в попытках их найти.
  • Компания Сoopers&Lybrand оценивает, что компании делают 19 копий каждого документа и что 7.5 процентов всех документов теряется безвозвратно.

Данные потери, которые в масштабах только Соединенных Штатов близкую к триллиону долларов в год. Поэтому понятно желание бизнесменов избавиться как можно быстрее от бумажных документов и перейти к электронным. Существуют оценки, насколько выигрывает каждая компания при переходе к электронным документам.

  • Nortan Nolan Institute оценивает рост производительности сотрудника в 25-50 процентов, уменьшение времени обработки одного документа более чем на 75 процентов и уменьшение расходов на оплату площади для хранения документов в 80 процентов. Приблизительно такие же оценки дает известная компании Ernst & Young.

Попробуем понять, почему же переход к электронным документам дает такие преимущества

Они позволяют

  • Обслуживать клиента лучше: цель любой организации обслуживать лучше своих клиентов. Внедрение систем позволяет выполнять эту задачу более эффективно. При работе с электронными документами время поиска документа, а следовательно время реакции на запрос гораздо меньше, чем при работе с бумажными документами. Следовательно, клиент получающий ответ быстрее, чем ранее, естественно, удовлетворен гораздо больше.
  • Управлять информацией более эффективно управление жизненно важными документами, сохраненными в электронном виде, радикально улучшается. Вы можете
    • получать доступ к документам более быстро
    • не терять документы
    • перестать неправильно сохранять документы (многим, кто знаком с компьютерами, известно такое понятие, как файловая система - страшная вещь, чем-то напоминающая полированную поверхность рояля - если крышка рояля неравнодушна к пыли, которая моментально появляется на ней, так и файловая система при любом удобном случае сразу же забивается различной информацией, разобраться в которой становится труднее с каждым днем…поэтому разумным решением этого вопроса было бы формирование информационного пространства(хранилища), в котором пользователи работают с "документами", а не с файлами, доступ и работа с которым происходит прозрачно для пользователей;
    • собирать, обрабатывать документов в гораздо большем количестве чем ранее, и, следовательно, принимать решения быстрее и точнее
  • Защищать документы лучше: Технология позволяет сохранять ключевую информация на оптических или магнитных носителях информации. Это сразу дает большое количество преимуществ. Как то

Защита от потери или повреждения

    потеря всей или какой либо части информации для предприятия может грозить значительными последствиями, вплоть до банкротства и полного прекращения деятельности. С бумагой все гораздо сложнее, чем с электронными носителями информации. Бумага подвержена многим болезням, как то старение, опасность нагрева и огня. Кроме того, очень трудно сделать копию всего архива бумажных документов на случай непредвиденных обстоятельств. Это вызвано, во-первых, высокой стоимостью хранения, во-вторых, высокой стоимостью и временем копирования документов. В случае с электронными носителями все наоборот. Компактность, быстрота и дешевизна копирования позволяет делать и хранить столько копий информации, сколько нужно для обеспечения надежности Вашего бизнеса

Защита от несанкционированного доступа

    Электронные носители позволяют сохранить больше информации в меньшем объеме. Следовательно меньший объем дешевле защищать. Кроме того электронная информация легче обрабатывается и процесс криптозащиты информации можно автоматизировать и выполнять быстрее (просто на лету) и дешевле.

    • Увеличить производительность труда: труд любого сотрудника разделить на две основные составляющие, производительный и обеспечивающий труд. В зависимости от категории работника и вида деятельности соотношения этих видов деятельности разное, но можно заметить, что при любом раскладе доля обеспечивающей деятельности остается немалой. Операции с бумажными и электронными документами относятся естественно к обеспечивающей деятельности и, следовательно, сокращая время на эти операции, мы сокращаем долю этой деятельности, высвобождая время для производительного труда. Кроме производительности труда отдельного человека, переход к электронным документам радикально повышает производительность труда рабочих групп (при этом переход к обработке электронных документов ни в коем случае не следует рассматривать как самоцель). Работа с электронными документами вкупе с сетевыми технологиями позволяет одновременно многим пользователям из рабочей группы получать доступ к документам, что довольно проблематично и дорого (копирование, совещания и т.п.) при работе с бумажными документами. Если Вы добавляете к электронным документам такие технологии как workflow и groupware, то это предоставляет возможность взаимодействия сотрудников внутри всех подразделений предприятия, что позволяет избежать дублирования функций и задач и, следовательно, еще снизить затраты.
    • Уменьшать затраты
      • на обработку бумаги
        С электронными документами вы не должны теперь делать фотокопии документов для того, чтобы они стали доступны другим сотрудникам предприятия одновременно с вами. Кроме того это снижает необходимость нанимать на работу курьеров для сбора и разноски документов, обеспечивающих инфраструктуру для передачи информации между различными сотрудниками.
      • на оборудование
        Сканер, факс-плата, программное обеспечение, соединенное с компьютером и принтером, которые в любом случае Вы имеете, могут стоить меньше, чем высокопроизводительное копировальное и факс оборудование (с учетом расходных материалов).

      • на поддержку процесса обработки
        Хранение документов в электронном виде может снизить потребность в таких предметах, как скрепки, степлеры, папки для бумаг, шкафы для бумаг.

      • на хранение
        Здесь можно говорить о высвобождении реальной, физической площади, необходимой для хранения документов (бесконечно долго можно рассматривать вопросы, связанные с обеспечением необходимых условий для хранения бумажных документов, создания копий документов, исчерпавших цикл жизни и т.п. )

Думается, что вышеприведенные факты показали преимущества обработки электронных документов и те мировые тенденции, которые свидетельствуют о постепенном переходе на новые, ресурсосберегающие электронные документы. Здесь хотелось бы сделать некоторые замечания, которые отражают специфику отечественного рынка работы с документами. По большому можно выделить трудности 3-х уровней при переходе на безбумажную технологию работы с документами:

  1. техническую неготовность организаций для работы с электронными документами (что может выражаться как в тривиальной проблеме отсутствия компьютера на столах у сотрудников, так и в том, что в организации нет необходимых программно-аппаратных средств для перевода документов из одной формы представления в другой - скажем, из бумажного представления в электронный из-за отсутствия сканера)
  2. технологическую недопустимость перевода отдельных категорий конфиденциальных документов в электронный вид (службы безопасности требуют, чтобы такого рода документы передавались под роспись через поверенного или курьера) так же нельзя упустить из поля зрения следующее обстоятельство, которое можно рассматривать как объективное "в конкретной ситуации" - многие высокопоставленные сотрудники или не имеют свободного времени для постоянного общения с компьютером, или же они просто не работают с "электронным другом". Здесь приходится прибегать к процедуре перевода документа из электронного вида в бумажный(через печать) или наоборот (путем сканирования) и создания, например, версий документа.
  3. законодательная база - даже если в пределах отдельно взятой компании или организации решили перейти к безбумажной работе с документами, компания все -равно не сможет существовать изолированно - между ней и внешним миром постоянно циркулируют различного рода документы. А именно здесь и возникает необходимость законодательного разрешения вопроса относительно того, что собственно понимается под электронным документом и какой вид электронного документа может иметь юридическую силу (вопросы, связанные с достоверностью пересылаемых документов), что получает особый оттенок в период построения правовых способов решения конфликтных ситуаций.

Еще раз хотелось бы подчеркнуть тот факт, что никто не стремится изжить бумажные документы как таковые, переход к обработке электронного представления документа позволит прежде всего повысить эффективность анализа, доступа и работы сотрудников с информацией - уменьшаются временные затраты на передачу документов, упрощается решение вопросов, связанных с обработкой связанных документов, аннотацией документа несколькими сотрудниками с последующим анализом сделанных замечаний и предложений и многое другое.

Естественно, электронные документы не существуют сами по себе, придумано множество технологий, программных продуктов, которые позволяют организовывать документы и работать с ними более эффективно. Для того, чтобы эффективно управлять документами, надо знать об источниках их происхождения. Исходя из схемы, существует множество источников и типов документов. Главная задача работы с документами - это перехват, регистрация и сохранение всех документов (или учетной информации по ним), связанных с жизнедеятельностью предприятия таким образом, чтобы мы могли быстро потом его найти в соответствии с правами доступа. Поэтому, вырисовывается следующие основные задачи при организации работы с документами

Уметь работать с бумажными документами (когда информация поступает и до определенного момента - быть может всегда - документ обрабатывается именно в бумажном виде, здесь система фиксирует различные атрибуты документа, на анализе которых можно получить представление относительно того, что же происходит с документом в конкретный момент времени)

Уметь переводить бумажные документы в электронный вид (и поддерживать последующую их обработку либо в виде образа, скажем в формате tiff, либо распознать посредством блока OCR)

Уметь перехватывать все создаваемые электронные документы, как то

  • Документы из приложений, которые создают документы, такие как текстовые процессоры, электронные таблицы, графические программы, программные пакеты для настольных издательств.
  • Факсовые сообщения, приходящие и уходящие через факс-сервер предприятия
  • Входящие, исходящие и внутренние сообщения из электронной почты равно как и документы, которые были к ним прикреплены.

Отчеты и другие документы, которые готовят разного рода информационные системы. Они обычно попадают сразу на печать или отправляются по факсу. Часть из них может быть востребована для анализа вторично, что подразумевает их принудительное размещение в хранилище электронных документов

Можно решать какую-либо конкретную задачу по перехвату тех или иных типов документов, например, проблему по вводу банковских документов, но всегда нужно помнить о том, что ваш сотрудник, которому нужен доступ к банковским документам, нужен также доступ к офисным документам. Создавать два отдельных рабочих места или устанавливать две отдельные системы со схожими задачами не разумно. Поэтому система, которая обеспечивает работу с электронными и бумажными документами должна по крайней мере поддерживать работу со всеми типами документов, обеспечивая прозрачную навигацию пользователей по всему доступному информационному пространству и, при необходимости, безболезненно подключать к системе другие типы документов, определяя при этом регламент их обработки.

Следовательно, основным принципом организации систем работы с электронными документами является принцип "информационного зонтика" - работать со всеми типами документов, которые связаны с жизнедеятельностью предприятия. Если говорить о принципах построения систем, то среди них можно отметить следующие

Масштабируемость

Данное свойство является необходимым с точки зрения защиты инвестиций пользователя, затраченных на создание и настройку системы, а так же обучение пользователей и обслуживающего персонала. Оно означает что система может работать как с одним пользователем, так и с 10.000, как с 10 документами, так и с 10 миллионами. При увеличении нагрузки на систему Вы можете сменить сервер, на котором работает система. Поэтому при построении решения нужно руководствоваться принципом поддержки максимально возможного количества операционных систем, там где это не удается, необходима поддержка, по крайней мере, Windows NT. Для того, что обеспечить переносимость данных, желательна поддержка многоплатформенных серверов баз данных, таких как Sybase, Oracle, Microsoft, Informix. Если данные принципы по возможности соблюдены, тогда пользователь может не беспокоится о будущем и подбирать конфигурацию программно-аппаратного окружения системы, в случае резкого увеличение числа пользователей и, следовательно, нагрузки на систему можно перейти на более мощную аппаратную платформу при неизменности самой системы и данных. Кроме того, под масштабируемостью понимается возможность наращивать мощность системы интенсивным образом, т.е. не повышая мощности сервера, а увеличивая количество серверов на предприятии. Особенно важно чтобы при этом система оставалась единым целым и не требовала "настройки с нуля".

Открытость

Мы должны гарантировать, что система аккуратно впишется в уже существующие или новые приложения, кроме того, комплекс зачастую обязан функционировать в гетерогенных и, что особенно важно, в распределенных средах. Это требование напрямую связано с требованием масштабируемости, только оно его расширяет, так как требует одновременной поддержки множества платформ, сетевых сред и серверов баз данных. Кроме того, предлагаемое решение должно обеспечивать легкое подключение внешних приложений, а это значит, что приложение должно иметь

  • открытое API
  • поддержку COM (DCOM), CORBA - технологий

Также к требованию открытости системы относится поддержка существующих стандартов в соответствующих областях, граничащих с решением задач, связанных с обработкой документов. К этим стандартам в области работы с документами относятся Shamrock и ODMA (Open Document Mangement API), в области управления деловыми процессами - WorkFlow Coalition API и т.д. Поддержка указанных стандартов позволит вам без труда переходить на новые версии приложений.

Модульность и технологичность

Не всегда необходимо внедрять весь комплекс работы с документами на предприятии сразу. Это может быть вызвано разными причинами: от нехватки средств в данный момент, до неспособности организации "с понедельника" резко перестроить свою работу. Поэтому система должна состоять из модулей, каждый из которых позволяет решить ту или иную задачу, причем эти модули могут без особого труда добавлены в работающую систему в произвольной последовательности. И что самое главное они по возможности должны быть независимы друг от друга, при сохранении глубокой интеграции между ними. Например, решение задачи автоматизации можно начать с решения задачи поддержки исполнения, а можно с электронного архива, но независимо от выбора, можно все равно прийти к полноценной системе. Невозможно найти систему, которая через 5 минут после инсталляции из коробки будет решать весь класс задач оптимальным образом для каждого пользователя (если, конечно, технология работы с документами в вашей компании полностью отвечают тем настройкам, которые поставляются с комплексом, что бывает крайне редко), но система должна требовать минимальное программирование и адаптацию под каждого пользователя. Выполнение данного принципа снижает цену, уменьшает время внедрения, что, естественно, повышает надежность в эксплуатации. Особое значение и важность для предприятий в настоящих условиях приобретает фактор простоты модификации настроек существующей системы силами обслуживающего персонала (Отдел разработки - это, безусловно, удобно, но довольно дорого для многих организаций), что может быть сопряжено с динамично изменяющимися внешними условиями на рынке.

Исходя из вышеизложенного, попробуем обрисовать составные части системы, работающей с документами:

  • система управления документами (СУД)
  • система массового ввода бумажных документов
  • функциональные блоки, интегрирующие СУД с различными источниками происхождения документов (офисные приложения, почта, факсимильные каналы, бумага, Internet и т.д.)
  • система автоматизации деловых процессов

Система управления документами

Ядром является система управления документами. К ее основным задачам относятся

  • Обеспечение регистрации поступающей информации (заполнение необходимых атрибутов документа)
  • Организация хранения документов
    Поддержка устройств хранения разных типов (от быстрых магнитных дисков до стримеров, в том числе поддержка работы со съемными носителями)

    Поддержка миграции документов между устройствами хранения в зависимости от изменения активности обращения к информации позволяет оптимизировать удельную стоимость хранения данных. Здесь может присутствовать как настраиваемая пользователем миграция документов2, так и автоматическая. Технология автоматической миграции документов называется Hierarchical Storage Management, а продукты ее поддерживающие - HSM продуктами.
  • Автоматические операции с документами (как то, копирование, восстановление, уничтожение)
  • Организация индексирования документов для дальнейшего их быстрого поиска.
    Сюда относятся поддержка индексов различных типов. Выделяют два основных типа. Атрибутивный индекс, когда документу присваивается набор текстовых, цифровых и других значений. Эти значения потом сохраняются в базе данных, и дальнейший поиск документа осуществляется по этим значениям. Например, Вновь созданному документу присваивается следующий набор
    • Тип документа: Договор
    • Создатель: Иванов
    • Дата создания: 18 Декабрь, 1995
    • Клиент: МММ

    В дальнейшем поиск документа осуществляется по эти значениям. Например, показать все документы, которые имеют тип: Договор для клиента: МММ. Естественно, результаты поиска документа не однозначны и выдаются списком документов, из которого можно выбрать нужный Вам или продолжить поиск, уточнив критерии.

    Другим широко применяемым типом индексирования документа является построение полнотекстового индекса по содержанию (слова, фразы) документа3. Кроме того, все слова, входящие в документ, можно подвергнуть морфологической обработке. Морфологическая обработка нормализует каждое слово таким образом, что отсекает от него окончания, которые возникают в различных склонениях и падежах. Индекс строится уже не по всему многообразию слов, а по их нормализованному состоянию, что значительно сокращает его размер и расширяет воронку поиска4. Кроме того применяются словари синонимов, которые позволяют расширить воронку поиска5.

    Вышеперечисленные два основных метода поиска документов не являются взаимоисключающими, они прекрасно дополняют друг друга. У каждого из них существуют вполне понятные преимущества и недостатки. Применение каждого из них зависит от конкретно стоящей задачи (например, если в организации имеется аналитический отдел или отдел безопасности и канал информации из СМИ, тогда возникает совершенное нормальное желание проводить анализ документов, поступающих из открытых источников, заполнять карточки для которых нет ресурсов - а анализировать нужно; здесь как раз мы переходим уже от понятия документа к понятию знание, что безусловно удобнее при работе тех категорий сотрудников, которые были упомянуты выше). В общем случае необходимо применять комбинацию из этих двух методов. Кроме того, существует метод семантического анализа содержания текста документа и выделения из него ключевых слов и помещения их в атрибутивную поисковую систему, что как бы сливает две системы поиска в одну. Отдельно стоит целый пласт задач, который подразумевает поиск и анализ информации, которая находится в нетекстовом формате - представьте себе, что необходимо выполнять поиск по мультимедиа-данным (звук, видео) или по изображениям (скажем, в газете промелькнула фотография человека и возникла необходимость подобрать видеоматериалы из видеотеки, где он присутствует). Конечно же, все необходимые функциональные блоки должны определяться на стадии предварительного проектирования системы, дабы в последствии избежать тупиковых ситуаций.

  • Аудит и обеспечение безопасности документов
    под этим имеется ввиду контроль доступа к документу и протоколирование всех событий с документом. Контроль доступа подразумевает разрешение или запрещения, в зависимости от полномочий пользователя, вошедшего в систему таких операций как
    • просмотр документа
    • копирование документа
    • уничтожение документа
    • редактирование документа
    • управление доступом к документу

    Также администратор может просматривать файл истории, в который записываются все события, которые происходят в системе при работе с документами, так что он в любое время сможет найти виновного и наказать его.

    Также система управления документами должна позволять рассчитывать стоимость использования документа. Естественно стоимость документа измеряется не в денежном выражении, а во временном (правда если Вы, как на Западе, все стараетесь оценить в $/час, то перевести минуты и часы в "зеленые" не составит для Вас трудности). Данная функция важна не только для анализа деятельности предприятия и конкретных сотрудников, но и просто для выставления счета на оплату клиенту, для которого Ваши сотрудники готовили документы или же оплатить работу адвокатов, которые производили юридическую правку контракта. Отдельно хотелось бы отметить возможность использования специализированных аппаратно-программных модулей криптозащиты данных, которые предоставляют дополнительные сервисы по защите документов (электронная подпись, шифрование).

  • Интеграция с приложениями обработки документа.
    Существует множество приложений, которые порождают документы. Если в компании установлен корпоративный стандарт на используемые приложения, то их число ограничивается десятком, если нет, то подобная задача превращается в ночной кошмар. Выделяют два типа приложений, с которыми может происходить интеграция.
    • Приложения, которые сохраняют результаты своей работы в файлах собственного формата.
    • Приложения, которые готовят и выводят результаты только на печать. К ним можно отнести большое количество информационных систем, которые производят невероятное количество отчетов и различного рода выходной информации. Данная информация может быть сохранена в промежуточных файлах или, чаше всего, сразу же выводится на печать

    Исходя из типов приложений, вытекает два типа интеграции

    • Интеграция на уровне операций с файлами. Операции создания нового, открытия и сохранения файла в стандартную файловую систему замещаются подобными операциями с системой управления документами. Такой вид интеграции сложен, так как требует индивидуальной работы с каждым приложением, причем с каждой версией по отдельности. В последнее время, производители подобных приложений, в особенности текстовых процессоров, стали поддерживать стандарт ODMA (с другой стороны существует универсальный подход интеграции с приложениями на уровне отдельных операций, таких, как "Открыть", "Сохранить", "Сохранить как…", который характерен для конкретной операционной системы и сопряжен определенными работами по настройке такого шлюза на приложение. Такой универсальный шлюз для среды Win32 был выполнен компанией ВЕСТЬ-Метатехнология). Пример тому, новая версия приложений MS Office поддерживает этот стандарт и интеграция в систему управления документами становится делом настройки конфигурационных файлов, а не дополнительного программирования. Данный вид интеграции интересен тем, что документ сохраняется в своем оригинальном формате, что позволяет обеспечить удобную дальнейшую его обработку ( редактирование, просмотр и т.п.).
    • Интеграция на уровне вывода на печать. Система управления документами перехватывает документы, которые уходят на печать и сохраняет их в себе. Такой вид интеграции более универсален, так как не зависит от типа приложений, а зависит только от операционной системы, которая используется на конкретном рабочем месте. Но полученный документ нельзя после сохранения редактировать, так он теряет формат, в котором он был создан и сохраняется в универсальном формате (например, PDF или PS). Данный тип интеграции хорошо подходит для документов, которые существуют в окончательном виде, как то сформированные отчеты, подготовленные договора и т.п. Тип систем, который перехватывает потоки вывода данных на печать носит название COLD (Computer OutPut to Laser Disk).

    В качестве отдельно стоящего вида интеграции можно выделить интеграцию с электронной почтой и факс-системами, как наиболее распространенными механизмами передачи информации. Это вызвано тем, что электронные и факс сообщения выделяются своим количеством, простотой доставки и важностью с одной стороны, и слабой приспособленностью почтовых серверов для выполнения функций электронного архива документов (сбор, хранение, быстрый поиск больших объемов информации).

    Интеграция с электронной почтой осуществляется через стандартные интерфейсы MAPI и VIM. Соответственно поддерживаются все программы электронной почты, которые соответствуют вышеуказанным интерфейсам. Возможен как ручной, когда пользователь самостоятельно определяет какую информацию следует поместить в архив, а какую - нет, и автоматический - когда почта приходит на заранее определенный адрес (что-нибудь sales@company.ru или support@company.ru ) и специальный робот, который был предварительно настроен, выполняет операцию переноса данных из почтовых фолдеров в электронный архив для последующей обработки данных сотрудниками компании.

    Для передачи информации по факсимильным каналам характерен определенный формат передаваемых документов, как правило, растр, что и определяет возможности (точнее их ограничение) по его последующей обработке. Интеграция с системами управления документами факс-сервер может осуществлять тремя основными методами.

    • Прямая интеграция, когда факс-сервер программным путем состыкован с конкретной системой управления документами
    • Через ODMA. Тогда факс-сервер должен поддерживать этот стандарт6
    • Через электронную почту. Многие факс-сервера имеют интерфейс через MAPI или VIM в стандартные программы электронной почты. Этот интерфейс позволяет посылать и принимать факс-сообщения через программу электронной почты. Так как система управления документами имеет интерфейс с системами электронной почты, то таким, не совсем простым способом, можно наладить взаимодействие систем электронной почты с системой управления документами.
  • Организация коллективной работы с документами.
    Как уже отмечалось ранее, организация коллективной работы с электронными документами дает серьезный выигрыш в производительности труда всего предприятия. Совместный доступ к электронным документам является основой для этого. Но кроме доступа для коллективной работы крайне необходимы еще несколько жизненно-важных функций которые повсеместно используются в реальном бумажном мире. И если Вы не предоставите их пользователю, то возвратитесь обратно в бумажный мир. К таким функциям относятся
    • При редактировании документа одним пользователем, он должен быть закрыт для редактирования другим пользователям (конфликты могут сниматься механизмом версионности документов). Единственный режим в котором от открыт - это режим "только для чтения".
    • Отслеживание версионности документов. В коллективной работе очень важно, кто какой документ отредактировал и какие изменения внес. Особенно это важно при коллективной разработке документа, как то планов, договоров и т.п. Поэтому для сохранения целостности информации система должна поддерживать создание и ведение версий документа, формируя при этом своего рода эволюционный след изменения документа, позволяя, при необходимости, выполнить "откат" на любую раннюю версию. Под ведением версий документа понимается контроль доступа к созданию версий7 и средства для сравнения и анализа различных версий документа.
    • Поддержка аннотирования документа. Очень часто приходится работать не с файлом, подготовленным в текстовом процессоре, который можно в него загрузить для исправления и аннотации8, а с неизменным изображением текстового документа9 в формате TIFF. Тогда нужно иметь средство для наложения своих комментариев на изображение документа. Причем комментарии каждого сотрудника должны накладываться отдельным слоем, не затрагивая основного изображения и пометок коллег. Другой сотрудник накладывает свой слой комментарий и так далее. В качестве элементов аннотации можно использовать стрелки, выделения цветом, красный карандаш для подчеркивания, заметки10 и так далее (заметьте на сколько в итоге упрощается работа по анализу и последующей консолидации мнений заинтересованных сотрудников).
  • Организация распределенных хранилищ документов
    Когда мы говорим о системах управления документами, очень часто возникает вопрос о поддержке распределенного в пространстве хранилища. Под требованием распределенности понимается следующее:
    • Доступ удаленных пользователей к хранилищу документов
      • в режиме on-line -
        • Вариант 1 - пользователь напрямую подсоединяется к центральной офисной сети и получает доступ к хранилищу документов.
        • Вариант 2 - пользователь, через Internet подсоединяется к WWW-серверу и таким образом получает доступ к хранилищу документов. Более общий случай, чем вариант 1, так как пользователь имеет доступ к системе управления документами не только через прямое подсоединение, но и через любого Internet-provider'а в любом городе (используемые при таком доступе протоколы должны опираться на поддержку механизмов выписки/возврата документов DMS).
      • в режиме off-line
        • Internet до сих пор в России не является широко распространенной услугой и поэтому организация доступа таким образом иногда становится проблематичным. Единственно отлаженным на сегодняшний день службой доставки сообщений является электронная почта. Поэтому было бы логичным использовать электронную почту для отработки механизмов заказа-доставки документов. Формально процедура получения документов выглядит следующим образом. Пользователь заполняет форму запроса к хранилищу документа и ему возвращается по электронной почте список документов, которые соответствуют запросу (при этом, если необходимо - скажем, документ отправлен на редактирование - производится блокировка отправленных документов по месту основного хранения). Выбирая документ из списка, пользователь по электронной почте отправляет запрос в центр и так же по почте получает заказанный документ. Такая схема может применяться не только для организации доступа единичных пользователей, но и как отличная схема для продажи информации из хранилища.
    • Взаимодействие нескольких хранилищ и одновременный доступ пользователей к информации, расположенной в разных архивах. Такого рода взаимодействие может быть построено на двух основных принципах
      • Взаимное тиражирование хранилищ. Технология, которая позволяет каждому пользователю в любом локальном офисе иметь доступ к информации со всех офисов. Но то, что прекрасно работает для офисной информации, с точки зрения объема хранения, не всегда будет работать для хранилищ документов серьезных размеров. Представьте себе 10 хранилищ по 100 Гигабайт, каждое. Для того, чтобы обеспечить доступ ко всем хранилищам вы должны сделать в каждом офисе, копии остальных. Это означает увеличение размеров хранения до 1 Терабайта - довольно дорогое удовольствие.
      • Технология распределенного доступа. Система регистрирует несколько хранилищ и как бы создает одно - глобальное информационное пространство. Пользователь делает один запрос к глобальному хранилищу и система сама делит запросы по реальным хранилищам, собирает с них ответы и выдает консолидированный результат пользователю. Для того, чтобы обеспечить быстрый доступ собственно к документу по запросу пользователя, он подгружается по глобальной сети в систему хранения локального офиса, далее он может видоизменяться пользователем и далее возвращаться на в свое месторасположение по глобальной сети. Для того, чтобы не нарушалась целостность хранения, применяется система блокирования документов.

Система массового ввода документов

Для организации обработки большого количества бумажных документов и перевода их в электронную форму предназначена система массового ввода документов. Слово массовый говорит о том, что данная система масштабируема и способна работать как с одним бумажным документом в день, так и с 100 тысячами бумажных документов в день. Данная подсистема присутствует практически в любой задаче, дело лишь в количестве обрабатываемых документов.

В технологии обработки документов выделяют две основные группы

  • Просто документы
  • Формы

Процесс обработки документов состоит из следующих элементов

  • Сканирование документа
  • Обработка изображения документа

    Является очень важной часть процесса обработки бумажных документов. Очевидно, что качество изображений документов после прохождения через сканер оставляет желать лучшего . Кроме того, любой документ (особенно формы) содержит множество дополнительной информации, облегчающей заполнение, но абсолютно ненужной, а часто мешающей при обработке изображения. Также эти функции применяются для уменьшения размера сохраняемого изображения. Для обработки изображения документов используются следующие специализированные функции

    • Очищение изображения - применяется для снятия с изображения отдельных элементов, как то отдельно стоящие точки, пятна и т.п.
    • Снятие фона и выделений- очень часто документы имеют общий фон с цветом отличным от белого (ценные бумаги, например). Для их обработки необходимо удалять фон.
    • Выравнивание изображения - для последующей обработки изображения и качества распознавания очень важно, чтобы документ попадал в строго вертикальном положении в процедуру распознавания. Данная функция позволяет выполнять процедуру выравнивания изображения (или по-другому - устранения перекосов в изображении).
    • Снятие элементов форм - для того, чтобы эффективно обрабатывать форму, необходимо удалять с изображения элементы форм. Как то линии, разграфки, таблицы и тому подобное.
    • Определение идентификатора форм - очень часто приходится вводить в систему самые разнообразные формы, отличные как по содержанию, так и по структуре. Для того, чтобы система могла работать с множественными формами, она должна определять что за форма поступила на обработку и загружать соответствующее, заранее настроенное и подготовленное описание формы 11.
    • Восстановление букв и символов - очень часто случается, что в заполненной форме буква оказывается пересеченной элементом формы (например линией). Для последующего успешного распознавания символа необходимо удалить линию, таким образом, что буква при таком удалении не пострадала.

    Кроме того к предварительной обработке изображения также относятся следующие функции

    • Вращение изображения на произвольный угол
    • Масштабирование изображения
    • Регулирование уровня серого
    • Компрессия и декомпресиия изображений

  • Распознавание и индексирование документа
    Анализ содержимого документа и извлечение данных. Которые могут быть впоследствии использованы для сохранения документов. Основной подсистемой, которая обеспечивает индексирование документа является система распознавания изображений. Существует огромное множество систем распознавания, отличающихся по стоимости, качеству и скорости работы. По крупному можно выделить два класса систем.
    • Системы оптического распознавания (OCR) - работают только с машинописным текстом
    • Интеллектуальные системы распознавания (ICR) - работают с рукописным тестом двух видов
      • Hand-Print - текст написанный от руки, но только печатными и большими буквами
      • Произвольный рукописный текст12.
        Кроме того этот класс систем решает специализированные задачи распознавания изображения, как то
      • распознавание штрих-кодов
      • распознавание специальных меток (Пример, когда Вы заполняете избирательный бюллетень, Вы ставите отметку (крестиком или галочкой) в специально напечатанном квадрате или кружке, напротив выбранного Вами кандидата. Система позволяет распознать Ваш выбор и автоматически ввести его в систему)

    Самой большой проблемой является обеспечение достаточного качества распознавания. Вопрос качества очень субъективен и зависит от конкретно решаемой задачи. Например для ввода офисных документов в систему может совсем не понадобится распознавание, одна секретарша вполне справится с вводом нескольких новых договоров в день, но если таких договоров десятки тысяч, то, очевидно, что лучше поставить специализированную систему распознавания, чем содержать полк секретарш для подобных операций. Так что вопрос качества, это в первую очередь финансовый вопрос: какую выгоду Вы получите от внедрения более качественной (и, естественно, более дорогой) системы распознавания. Одним из современных путей улучшения качества распознавания является применение голосующих систем распознавания. Системные интеграторы берут несколько модулей систем распознавания от разных производителей. Основным требованием к подбору таких модулей является использование различных технологий распознавания. Для OCR систем в основном используются три технологии

    • Матричная (Matrix-based),
    • Описательная (основана на описании правил построения символов)
    • Нейронная (основана на использовании нейронных сетей)

    Каждая из этих технологий дает лучшие результаты при определенных, причем отличных, условиях. Соответственно было бы разумным совместно использовать модули, использующие различные технологии распознавания. Единственным способом определения правильного результата трех систем является создание маленького, виртуального избирательного участка. Когда две системы говорят что распознанная буква - это "Б", а одна- что "Ь", то выносится общее решение, что все-таки это буква будет "Б".

    После того, как документ распознан, он поступает в систему управления документами, где проводится его индексирование. В зависимости от конкретной задачи и типа документа, он может быть загружен в полнотекстовый модуль или извлеченная из него информация попасть в систему атрибутивной индексации ( например, значения из полей формы попадают в карточку документа).

Вышеперечисленные функции решаются набором серверов приложений. Сколько же необходимо подобных серверов. Для обеспечения максимальной гибкости, естественно, хотелось на каждую операцию с изображением иметь свой отдельный сервер приложений. Но в тоже время, потери на меж серверное взаимодействие (открытие, сохранение файлов, увеличение сетевого трафика и тому подобное) при увеличении количество серверов приложений кажутся значительными. Поэтому выделяются два основных сервера приложений13

  • Сервер сканирования и предварительной обработки изображений
  • Сервер обработки изображения, распознавания. Данный сервер может существовать в двух ипостасях
    • сервер для обработки стандартных документов
    • сервер для обработки форм

Кроме этого необходимо специализированное клиентское программное обеспечение, которое предназначено для решения проблемы ручного индексирования документа, в том случае, если не удается сделать это автоматически. Также данное рабочее место может служить для контроля качества обработки документа.

Количество серверов каждого типа определяется конкретной производительностью каждого сервера в конкретной конфигурации на заданной программно-аппаратной платформе и требуемой производительностью системы массового ввода. В общем случае мы получаем разное количество серверов, как на уровне скан-станции, так и на уровне сервера обработки и распознавания. Это явно не одна линия и с этой прорвой серверов надо как-то управляться. Существуют два основных метода управления серверами массового ввода

  • Файловый
    Предлагается в качестве сервера управления использовать директорную структуру, причем организовывая ее таким образом, что каждой технологической операции соответствуют входящие и исходящие каталоги, в которые записываются файлы, на обработку и прошедшие обработку. Также существуют правила, по которым осуществляется переход от одной технологической операции к другой.
    • Преимущества
      • Простота и дешевизна
    • Недостатки
      • Решение слабо портируемое на различные операционные системы с различными файловыми системами
    • Трудность в организации сложных (многостатусных) обработок. Например, документ распознался и определяется качество распознавания. В зависимости от уровня качества документ может направляться по тому или иному пути14. В этом случае проектирование директорной структуры становится сложной задачей.
    • Трудно получить мгновенное состояние всех процессов. Если не ведется лог-файл, то невозможно получить историю процесса.
    • Необходимо придумывать и отписывать механизм блокировок файлов при их обработке
    • Существует вероятность потери целостности процесса. Например, документ взят на обработку, но в результате некого сбоя не ушел на следующую стадию. В этой схеме, даже при наличии файла истории процесса, возможны безвозвратные потери документов.
  • Использование сервера базы данных
    Предлагается в качестве сервера управления использовать специализированный сервер приложений, который взаимодействует с базой данных. Для каждого документа, который попадает в систему ввода документов создаются и контролируются задания. Переход на следующую стадию - это изменение статуса задания. Каждая обработка документа (процедура, связанная с изменением статуса задания) является выделенной транзакцией на сервере баз данных. Если обработка не выполняется по каким-либо причинам, то транзакция откатывается назад и задание на обработку остается невыполненным и идет снова на выполнение. Следовательно, мы гарантированы от потери документов при такой организации обработки. Также существует заранее описанный свод бизнес-правил, в котором указываются варианты движения документа в зависимости от его статусов. Документы хранятся на специальном промежуточном устройстве хранения, обязательно с малым временем доступа к информации.
    • Достоинства
      • Масштабируемость
      • Целостность и надежность
    • Недостатки
      • Дороговизна

Все вышеизложенные функции могут решаться как программным, так и аппаратным обеспечением. Естественно, программное обеспечение более гибко в настройке и содержит более новые технологии о обработке изображений документов, чем аппаратное решение, но платы дают ряд преимуществ по сравнению с программным решением

  • Платы имеют более высокую скорость обработки изображений, чем компьютер с установленным соответствующим программным обеспечение, особенно в отношении битово-ориентированных операций.
  • В связи с более высокой скоростью обработки мы можем сократить стоимость системы в целом

Кроме того, практически все скоростные сканеры достигают своей физической производительности через специализированные скоростные интерфейсы15, поддерживаемые платами обработки изображения. Платы могут применяться не только для ускорения ввода документов, но и для ускорения вывода на печать документов на принтер и экран.

Платы (или по-другому, процессоры документов) подразделяются на несколько типов

  • По типу поддерживаемых устройств
    • По отдельности, сканер, принтер, монитор
    • Принтер и сканер
    • Сканер и монитор
    • Принтер и монитор
    • Сканер, принтер и монитор
  • По функциям обработки изображения документа
    • Группа 1
      • Компрессия и декомпрессия изображения
      • Вращение
    • Группа 2
      • Выравнивание
      • Очищение изображение
      • Прочие функции повышения качества документа
    • Группа 3
      • Распознавание
      • Обработка форм
  • По месту установки
    • устанавливается в компьютер
    • устанавливается в сканер

Необходимо отметить, что для решения определенных задач, связанных с обработкой большого количества бумажных документов, существуют специальные технологии, позволяющие без потери качества избежать многих дорогостоящих операций, которые были рассмотрены выше. Для многих предприятий сегодня актуальной является проблема ретроконверсии - перевода документов с бумажных носителей в электронный вид для дальнейшего анализа. Скажем, имеется большой архив бумажных документов, содержание которых необходимо для повседневной работы сотрудников. Что же предлагается? Документы все или порциями сканируются, после чего автоматически распознаются имеющимся в Вашем распоряжении OCR16, после чего, без какой либо ручной правки ошибок распознавания, используется механизм нечеткого поиска (продукт Excalibur RW), который позволяет находить нужную информацию даже в тех документах, где слова были распознаны или же набиты (увы, зачастую случается и такое) с ошибками. Особенностями предлагаемого подхода для решения данной задачи являются:

  • возможность выполнения сканирования документов в фоновом режиме (по мере высвобождения техники и ресурсов, или же возникновения необходимости анализа конкретного блока бумажной информации в случае, когда выбирается путь поэтапного ввода документов в систему)
  • распознавание документов в фоновом режиме
  • отсутствие необходимости правки документов для их последующего анализа (как показывает статистика, стоимость сканирования 1 страницы А4 стоит около 10 центов, а правка распознанного документа17 …в 10 раз дороже)

В этом же пакете имеются специальные модули, которые позволяют анализировать графическую, аудио и видео информацию.

Системы автоматизации деловых процессов

Очень сложно говорить о системах данного типа, если в России не существует ясного понимания что есть, что. Единственным термином, который сейчас применяется для обозначения такого класса систем - это документооборот. В дальнейшем не хотелось бы применять этот устоявшийся термин, не отражающего реально проблему со всех сторон, так как является только составной частью класса систем автоматизации деловых процессов (в дальнейшем, АДП системы18). Для того, чтобы правильно сейчас и в последующем обсуждении понимать то о чем будет говорится, необходимо сначала дать определение терминам.

Над ниже приведенными определениям работала коалиция из 30-ти производителей подобных систем.

  • Задачи (tasks) - это совокупность действий, направленных на достижение некой деловой цели (конкретного сотрудника, отдела, предприятия в целом)
  • Участники делового процесса (participants) - конкретные сотрудники (роли, группы), которые выполняют задания в определенном порядке на основании заранее определенных условий или правил.
  • Инструменты (tools) -В реальной жизни информация, связанная с каждой отдельно взятой задачей обрабатывается не АДП- приложением, а специализированной информационной системой19. Приложения, которые обрабатывают информацию, связанную с задачей или задачами называются инструментами.
  • Процесс (process) - Собрание скоординированных последовательных и/или параллельных действий.
  • Деловой процесс (Business Process) - Собрание скоординированных последовательных и/или параллельных действий в контексте структуры организации и политики фирмы для достижения каких-либо деловых целей.
  • Описание процесса (Process definition) - Формализованное описание процесса. Описание процесса состоит из описание действий и их взаимосвязей и критериев которые определят начало и окончание процесса.
  • Действие (Activity) - Выделенный, логический шаг внутри делового процесса, который вносит вклад в достижение деловой цели. Это мельчайший (самый маленький, который мы способны выделить) элемент из делового процесса в целом, который мы способны описать с помощью модели, которая помогает нам формализовать деловые процессы.
  • Данные (Data) - Информация, которая необходима для осуществления действия. Выделяют два типа данных: данные процесса и внешние данные. Пример данных процесса: срока, даты. Примеры внешних данных: документ в самых разнообразных форматах (текстового процессора, электронной таблицы, изображение, голос, видео и т.п.)

Кроме того системы можно подразделить по типу движения задач

  • Свободная
    сотрудник в каждый момент времени может определить новый деловой процесс (в частном случае маршрут движения документа), тут же задать его параметры и запустить его на выполнение. Под параметрами процесса понимается список сотрудников, участвующих в нем, последовательность прохождения задания по сотрудникам, права каждого сотрудника по операциям с конкретным заданием, сроки, ответственные сотрудники.
  • Жесткая
    перед тем, как сотрудники начинают работать, неким аналитиком создается карта деловых процессов, которая проверяется, тестируется и потом преобразуется в АДП- приложение. Сформированное АДП- приложение запускается на сервере с помощью модуля исполнения. Некоторые сотрудники имеют право инициировать деловые процессы в рамках запущенного процесса20, некоторые имеют право только исполнять задания в тех же рамках.

Нельзя говорить о преимущества и недостатках того или иного способа движения задач. Каждый из них применим для конкретной ситуации на конкретном предприятии. Для того, что бы определится о том, как решать для конкретного случая проблему выбора, необходимо поговорить еще об одном важном элементе АДП- систем, как контроль исполнения.

Контроль исполнения также является интегрирующим термином. Для того, чтобы лучше понимать о чем идет речь, рассмотрим уровни контроля исполнения задания.

Уровни контроля исполнения задания

  • Контроль доставки - выдается информация инициатору задания, что его задание достигло места назначения.
  • Контроль прочтения - выдается информация инициатору заданию, что с его заданием ознакомились сотрудники, для которых это задание было предназначено.
  • Контроль выполнения - выдается информация инициатору задания, о том что задание выполнено.
  • Мониторинг - инициатор всегда может посмотреть кто и что сейчас делает с его заданием.
  • Извещение о нарушении сроков исполнения - АДП- система может известить инициатора, о том, что посланное им задание просрочено конкретным сотрудником.
  • История выполнения заданий

Информация может выдаваться в виде изменения статуса задания в окнах входящих и исходящих заданий или в виде нового задания сформированного системой инициатору задания или просто с помощью сообщения по электронной почте.

Итак, обобщая систему классификации и перекладывая ее на реальную жизнь, можно сказать, что:

  • Системы со свободным движением документов с контролем доставки и прочтения - это обычные системы электронной почты. С помощью дополнительного программирования к ним можно добавить еще и контроль выполнения.
  • Системы со свободным движением документов и со всеми функциями контроля исполнения, включая мониторинг, извещения и историю - это класс специализированных маршрутизаторов. К ним можно отнести маршрутизатор WorkRoute 1 Компании ВЕСТЬ-Метатехнология
  • Системы с жестким движением документов и со всеми функциями контроля исполнения - это высший класс АДП-систем. К ним можно отнести Action WorkFlow, StaffWare, IBM FlowMark, WorkRoute II.

Рассмотрим компоненты АДП-систем21 высшего класса.

  • Методология описания деловых процессов. В настоящее время без адекватной методологии трудно проектировать сложные деловые процессы. Это в основном связано с тем, что деловые процессы не являются некой жесткой структурой и меняются в течении жизни предприятия по самым разным причинам. К таким причинам можно отнести как изменяющиеся внешние условия жизни предприятия, так и естественное желание руководителя оптимизировать внутренние деловые процессы с целью высвобождения ресурсов и экономии средств. В результате мы имеем задачу с неопределенными внешними условиями. Следовательно, ее можно решать только через некий абстрактный уровень, который можно легко и быстро модернизировать и приводить соответствие с настоящей или желаемой ситуацией. Далее АДП- приложение использует этот абстрактный уровень для своей работы. В настоящее время с методологией описания деловых процессов существуют определенные проблемы. Самой распространенной методологией на сегодняшний день является методология направленного графа. Истоки этой методологии лежат в истоках АДП- систем. Первые АДП- системы были созданы для деловых процессов производственного (даже, конвейерного) толка, где сотрудники выполняли роль неких автоматов, работающих над конкретной технологической операцией. Сотрудник мог только выполнить операцию и отрапортовать об ее выполнении. В некоторых случаях он мог произвести выбор между несколькими состояниями и принять решение о дальнейшем направлении движения делового процесса. В дальнейшем АДП-системы стали применять для задач управления предприятием. Здесь такая методология не совсем подходит и вот почему. Во-первых она совершенно не учитывает влияние человека на конкретный деловой процесс. Если в конвейерной задаче, мы можем им пренебречь, то в разработке контракта, где человек является главной производящей силой - нет. Влияние человека на конкретный бизнес-процесс огромно. Оно может носить как отрицательный характер - человек забывает, поступает вопреки логике, просто не хочет выполнять ту или иную работу, так и положительный характер - человек проявляет творчество, изобретательность при исполнении делового процесса. В том случае если методология не учитывает реалии жизни22, то она все свои недостатки перенесет в АДП-приложение. Среди методологий, пытающихся сделать фокус на человеке, как главной производительной делового процесса можно отметить методологию компании Action Technologies23. В качестве элементарной составляющей делового процесса, она рассматривает некий цикл, который построен между заказчиком и исполнителем работы. В этот цикл включены все возможные действия, которые могут возникнуть в процессе взаимодействия двух сотрудников, например, отказ от выполнения работ, контрпредложение, отклонение контрпредложения и т.п. Цикл имеет следующие параметры: условия завершения, время завершения и стоимость процесса. Грубо говоря, цикл от Action - это заранее преопределенная совокупность направленных графов, которая полностью описывает взаимодействие двух персон. Последовательно запрещая все возможные действия Вы можете свести весь цикл к одному графу, который соединяет двух персон. Данная методология особенно хороша тем, что она целостна (система не допустит не замкнутой схемы), а это означает, что ни одно задание не потеряется и не зайдет в тупик.
    Обычно к методологии прикладывается графический редактор, который позволяет в удобной форме проектировать карты деловых процессов.
  • Преобразователь методологии в конкретное АДП- приложение. Данный модуль выступает связным звеном между методологией и конкретным АПД- приложением. Обычно это некий конвертор, который, исходя из карты деловы процессов и их заданных параметров, как то роли, персоны, время исполнения и т.п., формирует базу данных с соответствующей структурой и наполнением, а также создает триггера, которые отслеживают выполнение бизнес-правил.
  • Модуль исполнения АДП-приложения. Данный модуль взаимодействует со сформированными преобразователем методологии данными, программами и исполняет их.
  • Рабочее пространство пользователя. Можно сказать, что речь идет о рабочем месте пользователя и его интерфейсе. Он может быть отдельно стоящим, встроенным в какое-либо приложение или использующим для своей работы интерфейсы других программ24. Каким бы образом интерфейс пользователя не был бы организован, сколько кнопочек и бантиков на нем бы ни было, построение у всех одно и тоже. Это окно входящих заданий к пользователю и окно исходящих заданий от пользователя. Для каждого задания показывается его состояние и прочие его характеристики.

Кроме составных частей, которые описывают практически любую АДП-систему25, необходимо помнить, что АДП-системы не должны работать напрямую со списком конкретных сотрудников, а только через список ролей, которые могут исполнять конкретные сотрудники. Использование ролей позволяет

  • связывать структуру предприятия с конкретными деловыми процессами, что очень немаловажно
  • связывать деловые процессы с ролями, а не сотрудниками, что имеет, естественно, более общую постановку. "Есть сотрудник, нет сотрудника, обязанности все равно остаются".
  • динамически переназначать сотрудников на роли, что позволит системе более гибко реагировать на изменения, происходящие на предприятии.
  • более гибко управлять заданиями. Например, посылать задание на исполнение всем "менеджерам" и т.д.

После того, как мы обрисовали то, какие бывают и из чего состоит АДП-система, необходимо поговорить об архитектуре построения систем. Относительно архитектурного построения таких систем идут большие дебаты между специалистами в этой области. Но мир устроен таким образом, что не существует абсолютного оружия для всех целей. И ставить вопрос, что лучше, не разумно. Лучше спросить, что лучше в моем случае, для моей конкретной задачи. Обратимся к архитектурным моделям. В основном, они различаются по типу ориентации

  • Ориентированы на документ. В своей основе они рассматривают документ и процесс его движения между сотрудниками26. Системы, ориентированные на документ, в своем архитектурном построении идут от почтовых систем. Самой сильной стороной такой модели является поддержка удаленных пользователей и офисов, поддерживать работоспособность системы в самых разнообразных операционных и сетевых средах, поддерживать множество типов клиентов и серверов. Величайшая слабость такого подхода - это сложность в управлении правилами деловых процессов. Так система не предназначена с самого начала отслеживать деловой процесс, все попытки сохранить информацию в недрах системы не приводят к приемлемому результату. При таком подходе часто бывает трудно, а иногда невозможно, определить текущий статус данного делового процесса. Кроме того, в приложениях, которые построены на таком подходе и которые маршрутизируют документ, документ становится недоступным никому, кроме получателя почты. Это довольно значительное ограничение в приложениях, когда требуется непрерывный доступ к документу.
  • Ориентированы на деловой процесс или на задание, как составную часть делового процесса. Данные системы возникли от попыток не просто автоматизировать движение документов, а от попыток взглянуть на весь процесс управления предприятием в целом. Соответственно, основная логика построения таких систем выглядит следующим образом, деловой процесс-задание-документ. К заданию может быть прикреплен документ, а может и нет. В реальной жизни, подход от задания или делового процесса является более общим в документоориентированном подходе. Поэтому внимание уделяется не только поддержке документа ( в реальных системах, эти функции отдаются на откуп системам управления документами, см. выше), а в основном поддержке деловых процессов. Единственным местом, где можно хранить и обслуживать информацию о деловых процессах является база данных со всеми ее преимуществами и недостатками. В таком случае мы можем следить за состоянием и историей каждого задания и каждого делового процесса. Но мы получаем и определенные недостатки, связанные с трудностью организации распределенных систем и особенно с поддержкой удаленных пользователей. В случае, когда удаленный пользователь может регулярно подсоединяться к центральной базе данных, то эти проблемы решаются, но что делать если он находится в Владивостоке и единственная надежная связь - это электронная почта.

Какую модель выбрать для своей системы, это в основном зависит от Вас, от стиля работы Вашего предприятия, от задач, которые стоят перед Вами. В жизни никогда не побеждают крайности и последние версии ряда АДП-систем доказывают нам это. Корпорация KeyFile выпустила новую АДП-систему, которая в качестве транспортного механизма использует Microsoft Exchange, а объектную базу данных собственной разработки для информационного хранилища для деловых процессов. Также имеет право на жизнь и обратный подход, к существующей АДП-системе, основанной на базе данных прицепить почтового клиента, который поддерживает удаленных пользователей.

Все вышеизложенное выше не претендует на всесторонний анализ проблемы работы с электронными документами, но он может быть оказаться полезным для выбора той или иной системы. В данном обзоре не делалась попытка дать какие-либо рекомендации по выбору того или иного конкретного программного продукта, так как рекомендации должны быть всегда привязаны к конкретным требованиям и условиям заказчика. Компания ВЕСТЬ - Метатехнология имеет в своем портфеле набор программных продуктов и технологий, которые закрывает определенные задачи по консалтингу, управления документами ( организационно - распорядительными, чертежно-конструкторскими, финансовыми) и управления деловыми процессами. Но понимая то, что каким бы хорошим продукт не был, он не решит все задачи, которые иногда возникают в гениальном мозгу заказчика, нам пришлось обобщая накопленный опыт создавать новые программные продукты, которые дополняют функционал уже имеющихся. Почему же не написать все с нуля, задаст вопрос проницательный читатель. Идеи написания своей операционной системы, системы управления документами и подобных сложных управляющих комплексов посещают людей или никогда не писавших программы в своей жизни27, либо не желающих оглядеться вокруг и посмотреть, что, кто делает. Поэтому наша позиция сейчас следующая: от продуктов и технологий, которые максимально соответствуют всем принципам изложенным выше и решает все функции с багажом имеющегося опыта выполненных и работающих проектов создавать программно-аппаратные комплексы, представляющие представляют собой единый сбалансированный комплекс, удовлетворяющий требованиям Заказчика на 101 процент.


1Все эти и последующие оценки были взяты из Mantelman's Imaging Buyers Guide

2Например, по истечении заранее заданного срока документ перемещается с жесткого диска на стример

3Исключение составляют, так называемые стоповые слова, которые пропускаются при процессе индексирования документа. К ним относятся предлоги и другие незначимые в процессе поиска слова.

4Например, когда Вы ищете документ по слову "договор", система найдет все документы, в которых есть слова "договор", "договора", "договором", "договору" и т.п.

5Например, когда Вы ищете документ по слову договор, система находит все документы, в которых есть слова "договор", "соглашение", "контракт".

6На сегодняшний день у многих производителей это в планах, но не в реальном воплощении

7Например, одному пользователю Вы можете разрешить вносить изменения в созданный Вами документ, а другой пользователь должен создать для внесения правок новую версию.

8Смотри, прекрасные функции аннотирования в новом Word for Windows

9Не в том смысле, что его нельзя распознать и превратить в файл Word for Windows, а том, что незачем делать если этот документ - счет на оплату или накладная.

10Типа 3M"овских Post It

11зачастую возникает проблема обработки однородных форм, имеющих однотипное расположение полей, но отличающихся как по геометрическим параметрам, так и по качеству изготовления (скажем, те же платежные поручения могут быть с одинаковым успехом распечатаны как на матричном, так и на лазерном принтере)

12Здесь с качеством распознавания большие проблемы

13Подобное разделение связано с тем, что:
Производительность системы во многом определяется максимальной производительностью сканера (сканеров), которые используются в системе. Скан-станция, которая управляет сканером должна быть оборудована и настроена таким образом, чтобы поддерживать производительность сканера на максимальном для него уровне. Поэтому нецелесообразно загружать скан-станцию дополнительными функциями.
Функции индексирования уже выделены и готовы для использования в качестве отдельного сервера приложений. Кроме того, этот сервер может использоваться для общекорпоративных задач. Поэтому , нецелесообразно сливать этот сервер приложений с другими.

14Причем вариантов может быть больше двух.

15Так называемый видео-интерфейс

16при этом в архиве может хранится как отсканированный образ документа, так и тот документ, который получился в результате распознавания

17увы, сегодня ни один производитель систем распознавания текстов не дает 100% гарантии правильности распознавания

18в литературе часто можно встретить название workflow-системы

19Существуют примеры, когда АДП-функции встраиваются в конкретные специализированные информационные системы и тогда можно говорить о так называемых workflow-enabled информационных системах

20Например, если на сервере запущен только один деловой процесс - "Подготовка бюджета предприятия", то с помощью этой системы Вы не сможете попросить секретаршу принести чашечку кофе.

21Классификация из статьи Ronni T. Marshak, "WorkFlow: Applying Automation to Group Processes"

22Например, процесс творчества можно представить цикличным, итерационным, процессом с неизвестным заранее количеством циклов. Такой процесс довольно трудно реализовать с помощью направленного графа.

23Кстати, запатентованную в США двумя патентами

24Например, система выгружает информацию о входящих заданиях в InBox программы электронной почты Microsoft Mail

25В том случае, если какой-либо части в предлагаемой Вам системе нет, посмотрите, не инвалида Вы покупаете.

26Кстати отсюда появился термин маршрутизация.

27Допускаю, что они баловались в институте или на ящике с Паскалем славной фирмы Борланд

 

Новости мира IT:

Архив новостей

Последние комментарии:

Как стать программистом? (22)
Вторник 26.07, 21:56
Вышел web-браузер Chrome 52 (1)
Суббота 23.07, 18:51
Loading

IT-консалтинг Software Engineering Программирование СУБД Безопасность Internet Сети Операционные системы Hardware

Информация для рекламодателей PR-акции, размещение рекламы — adv@citforum.ru,
тел. +7 985 1945361
Пресс-релизы — pr@citforum.ru
Обратная связь
Информация для авторов
Rambler's Top100 TopList liveinternet.ru: показано число просмотров за 24 часа, посетителей за 24 часа и за сегодня This Web server launched on February 24, 1997
Copyright © 1997-2000 CIT, © 2001-2015 CIT Forum
Внимание! Любой из материалов, опубликованных на этом сервере, не может быть воспроизведен в какой бы то ни было форме и какими бы то ни было средствами без письменного разрешения владельцев авторских прав. Подробнее...