Адаптивное управление по прецедентам, основанное на классификации состояний управляемых объектов

2007 г.

Адаптивное управление по прецедентам, основанное на классификации состояний управляемых объектов ¹

Л. Е. Карпов, В. Н. Юдин,
Труды Института системного программирования РАН

Содержание

1. Введение
2. Исходные понятия
3. Понятие адаптивного управления
4. Управление плохо формализуемыми объектами
5. Направления в развитии систем поддержки принятия решений
6. Вывод, основанный на прецедентах
7. Адаптивное управление на основе прецедентов
8. Выбор прецедента
9. Адаптация решения
10. Понятие локальной контекстно-зависимой метрики
11. Описание локальной контекстно-зависимой метрики
12. Возможные приложения предлагаемого метода адаптивного управления
13. Заключение

1. Введение

"Классические" подходы к управлению (например, [1, 2] и другие) строятся на том предположении, что можно получить пусть сложную, но точную аналитически заданную форму функциональной зависимости входных и выходных сигналов системы управления с последующим уточнением значений входящих в нее коэффициентов. Однако при всей изощренности наработанного математического инструментария областью применения таких методов управления остаются сравнительно простые объекты управления с очевидными свойствами, то есть хорошо формализуемые объекты. На практике же типичными являются объекты управления, которые формализуются плохо. Их свойства априори плохо известны или изменяются в процессе функционирования. В силу недостаточности знаний об объекте и среде, в которой он функционирует, попытки получить точную модель поведения такого объекта не представляются возможными. Однако управление такими объектами представляет не меньший интерес и является не менее важным, чем управление хорошо формализуемыми объектами.

В последнее время активно развивается "неклассический" подход к теории управления. Этот подход связан с применением алгоритмов и методов интеллектуального управления автономными подвижными объектами на основе нечеткой логики, нейронных сетей и генетических алгоритмов. С этим же подходом связаны ситуационное управление на основе иерархических моделей с нечеткими предикатами; модели и алгоритмы принятия решений по защите информации на основе методов искусственного интеллекта. Авторы (см. также [3]) предлагают для этого использовать вывод по прецедентам - метод принятия решений, в котором используются знания о ранее возникавших ситуациях или случаях (прецедентах). При рассмотрении новой проблемы (текущего случая) отыскивается похожий прецедент. Вместо того чтобы каждый раз искать решение сначала, можно попытаться использовать решение, принятое в сходной ситуации, возможно, адаптировав его к текущему случаю.

В ситуации, когда известных параметров объекта управления и окружающей среды недостаточно для однозначного определения поведения этого объекта, управление необходимо осуществлять не по параметрам объекта, а по его состоянию, которое более полно определяет тенденцию его дальнейшего поведения. Возникает задача идентификации состояния объекта управления по его наблюдаемым (известным) параметрам. Для этого нужно уметь сформировать на основе априорной информации обобщенные образы - классы состояний объекта. Получить необходимые знания из набора имеющихся данных можно с помощью методов добычи данных - классификации и кластеризации. Если состояние объекта управления сводится к присутствию в одном из этих классов, то управляющее воздействие можно рассматривать как отображение объекта из одного класса в другой (в частности, как удержание объекта в том же классе).

В рассматриваемых ситуациях вместо точного вида математической модели объекта доступна только априорная информация о состояниях объекта управления, управляющих воздействиях на него и результатах воздействий. В терминах вывода по прецедентам информация о состоянии объекта - это описание проблемы, а выдача управляющего воздействия есть решение проблемы; тогда результат управляющего воздействия необходимо рассматривать как результат применения решения. В работе ставится задача смоделировать управление такого рода объектами по прецедентам, основываясь на классах состояний. Это означает, что предлагается подход к интеграции методов добычи данных, вывода на основе прецедентов и адаптивного управления в единой самообучающейся системе, позволяющей управлять объектами с плохо формализуемым поведением.

В этом подходе состояние объекта управления сравнивается с прецедентами из заранее накопленной базы данных. На основе некоей меры близости выбирается один из похожих прецедентов. Управляющее воздействие, связанное с ним, используется напрямую или адаптируется к текущему случаю, исходя из степени близости прецедента. Результат воздействия также прогнозируется по прецеденту. Итог воздействия заносится в базу прецедентов для последующего использования. Одновременно ставится и более частная задача выбора меры близости для определения сходства управляемого объекта с прецедентами. Искомая мера должна способствовать ограничению перебора возможных вариантов, их ранжированию при выборе управляющих воздействий, а также облегчению адаптации управляющего воздействия от прецедента к текущему состоянию объекта управления.

2. Исходные понятия

Основным в работе является понятие объекта управления (ОУ). Объект подвергается как возмущающим (посторонним для системы управления), так и управляющим воздействиям. Будем называть их входными параметрами объекта. Сам объект характеризуется набором признаков - выходных параметров. Изменения входных параметров влекут за собой изменение выходных параметров. Цель управления - достижение оптимального, в некотором смысле, поведения объекта.

Цель решения задачи управления - обнаружение способа изменения во времени входных параметров, при котором выходные параметры обеспечивали бы поставленные цели управления. Такой способ называют стратегией управления. Стратегия должна быть допустимой, то есть должна опираться лишь на те данные об ОУ, которые доступны в соответствующий момент времени (эти данные могут изменяться, например, в результате обновления информации в процессе управления), и обеспечивать выполнение некоторых общих условий протекания процесса управления.

Часто ОУ отождествляют с передаточной функцией, отображающей заданное множество входных параметров во множество выходных параметров.

Ö = O (Ï),

где Ï - вектор входных параметров объекта управления, Ö - вектор выходных параметров объекта управления.

Это отображение может иметь сложную функциональную форму, но обязано удовлетворять двум условиям:

Условие причинности: значения выходных параметров в каждый момент времени не должны зависеть от будущих значений входных параметров.
Устойчивость управления: для любого ограниченного во времени набора управляющих и возмущающих воздействий соответствующий процесс изменения выходных параметров также должен быть ограничен во времени. В некоторых приложениях требование устойчивости управления может выступать в качестве цели управления.

Формализованное описание входо-выходного отображения называют также математической моделью объекта управления.

3. Понятие адаптивного управления

Для раскрытия содержания термина адаптивность в теории управления необходимо рассмотреть основные типы управляющих систем.

При моделировании процессов управления обычно рассматривают три типа управления:

открытое, или разомкнутое,
замкнутое, или управление с обратной связью, и
адаптивное.

Первый тип - разомкнутое управление, которым предполагается наличие цели, определяющей управляющие воздействия для достижения этой цели. Структура разомкнутого управления (рис. 1) проста. Отсутствие обратной связи упрощает управление. При отклонении результата от запланированного проводится анализ, который объясняет причины отклонения, но не ставит задачи изменить что-либо в управлении.

Рис. 1. Структура разомкнутого управления.

Второй тип - замкнутое управление (управление с обратной связью), при котором (рис. 2) предполагается возможность изменять управление в зависимости от его воздействия на конечный результат. Эта методика управления рассчитана в основном на малые промежутки времени. Если же результат воздействия фактора проявляется через достаточно большое время, часто возникают значительные затруднения.

Рис. 2. Структура замкнутого управления.

Третий тип - адаптивное управление отличается от замкнутого наличием модели управляемого объекта (рис. 3), в которой анализируются возможные последствия управления (прогноз). Правильная реакция возможна лишь при построении максимально точной модели объекта, адекватно отображающей среду функционирования и сам объект управления.

Рис. 3. Структура адаптивного управления.

С термином адаптация связаны понятия адаптивного управления, адаптивной системы и адаптивной модели.

Адаптация - это процесс изменения параметров и структуры системы, а возможно, и управляющих воздействий на основе текущей информации с целью достижения определенного, обычно оптимального, состояния системы при начальной неопределенности в изменяющихся условиях работы [4, 5].
Адаптивной считают систему, которая может приспосабливаться к изменениям внутренних и внешних условий [4,6]. Адаптивная система сохраняет работоспособность при непредвиденных изменениях свойств управляемого объекта, целей управления или окружающей среды путем смены алгоритма своего функционирования, программы поведения или поиска оптимальных состояний.
Понятие управления с адаптацией (адаптивное управление) - это управление в системе с неполной априорной информацией об управляемом процессе, которое изменяется по мере накопления информации и применяется с целью улучшения качества работы системы.
Адаптивной моделью системы управления объектом считают такую модель, в которой в результате изменения характеристики внутренних и внешних свойств объекта происходит соответствующее изменение структуры и параметров регулятора управления с целью обеспечения стабильности функционирования объекта.

Невозможность точной математической формализации структуры объекта, погрешность измерений, отсутствие достоверной информации о начальных координатах, наличие непредсказуемых внешних воздействий предопределяет необходимость реагирования управляющих воздействий на изменения параметров объекта и характеристик внешней среды. Такого рода адаптация (приспособление) происходит путем изменения структуры и параметров регулятора.

Конкретизация определения адаптации связана с целями исследования и конструирования. Таким образом, основное свойство адаптивных систем - реализация цели управления в условиях недетерминированной внешней среды и изменяющихся параметров объекта.

4. Управление плохо формализуемыми объектами

До настоящего времени модель адаптивного управления рассматривалась разработчиками в основном для управления физическими процессами. Этот подход строится на предположении, что можно получить точную форму передаточной функции, отображающей множество входных параметров во множество выходных параметров управляемого объекта. Областью применения таких методов управления являются хорошо формализуемые, то есть сравнительно простые объекты управления с очевидными свойствами. На практике же типичными являются объекты управления, которые плохо формализуются, свойства которых априори плохо известны или изменяются в процессе функционирования,. Попытки аналитически описать их свойства быстро приводят к катастрофическому усложнению математических моделей.

В ситуации, когда известных параметров ОУ и окружающей среды недостаточно для полного и однозначного определения его поведения, нельзя принимать решение об управляющем воздействии на объект, зная только его входные параметры. Мы будем ближе к знанию поведения объекта, когда управление будет осуществляться не по его параметрам, а по его состояниям. Если удается сформировать на основе априорной информации обобщенные, или агрегированные образы - классы состояний ОУ с известной реакцией объекта каждого класса, то управляющее воздействие можно рассматривать как отображение ОУ из класса в класс (в том числе - в исходный класс).

Разобьем состояния ОУ на группы, состояния в каждой из которых эквивалентны друг другу с точки зрения управления, и назовем их классами состояний объекта (рис. 4).

Иногда цель управления состоит в том чтобы достичь или удержать объект в определенном состоянии. Но понятие цели не всегда может отождествляться с конкретным состоянием или классом состояний. Целью может быть управляемое поведение, учитывающее переходы объекта из одного класса состояний в другой. Так, при лечении хронических заболеваний задача восстановления больного органа невыполнима, потому при заболевании с той или иной скоростью происходит процесс дегенерации рабочей ткани (мы сейчас не рассматриваем вопросы пересадки органов). Целью управления можно считать стремление замедлить процесс уменьшения рабочей ткани (как можно дольше удерживать ОУ в текущем классе).

Рис. 4. Упрощенный вид переходов объекта управления.

Казалось бы, эту цель можно заменить более простой - естественным желанием удержать больного в определенной стадии заболевания. Однако, зная, что процесс все равно идет, даже в латентном состоянии (латентное - без заметных признаков заболевания), ставить такую цель - значит обманывать себя. В этом случае управление будет считаться заведомо неудачным. Если же процесс был растянут на достаточно большой (для данного заболевания) срок, значит, цель управления достигнута.

Другой пример - управление велосипедом-роботом. Здесь цель - не только удержать равновесие, но и покрыть некоторое расстояние из одного пункта в другой. Исходным классом можно считать начальный пункт вместе с параметрами объекта, в которые входят угол наклона велосипеда и скорость, а целевым классом - конечный пункт с таким же набором параметров.

Поэтому, говоря о цели, мы имеем в виду не только состояние, но, прежде всего оптимальное, с нашей точки зрения, поведение объекта, включающее в себя и состояния. Таким образом, управляющее воздействие определяется нами как воздействие на объект с целью достижения оптимального или близкого к нему поведения.

При таком подходе поведение ОУ, как при наличии управляющего воздействия, так и без него, представляет собой дискретный процесс, каждый шаг которого, в общем случае, - это переход объекта из одного класса состояний в другой.

Следует заранее оговориться, что множество классов состояний объекта не обязательно должно быть упорядоченным, поэтому переход из класса в класс не всегда есть приближение на шаг к цели или отдаление от нее. Формализация такого понятия и возможность упорядочения классов состояний, конечно, во многом зависит от конкретного приложения.

При отсутствии управления (или в случае управления, не приводящего к цели) объект может попасть в режим, в котором дальнейшее управление становится невозможным или бессмысленным. Это может быть как одно состояние, так и множество состояний. С точки зрения управления, они все образуют класс эквивалентности. Назовем его классом неуправляемых состояний.

Сущность предлагаемой модели управления заключается в следующем. Наши знания об объекте управления и о среде, в которой он функционирует, являются неопределенными. Известна лишь принадлежность объекта к некоторому классу состояний. Цель - достижение оптимального поведения объекта, выражающегося в виде последовательности определенных классов состояний. Необходимо найти алгоритм управления (адаптивный регулятор), обеспечивающий достижение цели за конечное число управляющих воздействий.

5. Направления в развитии систем поддержки принятия решений

Различают два направления в развитии систем поддержки принятия решений:

вывод, основанный на правилах;
вывод, основанный на прецедентах.

Практически все ранние экспертные системы моделировали процесс принятия экспертом решения как чисто дедуктивный процесс с использованием вывода, основанного на правилах. Это означало, что в систему закладывалась совокупность правил вида "если...то...", согласно которым на основании входных данных генерировалось то или иное заключение по интересующей проблеме. Такая модель являлась основой для создания экспертных систем первых поколений, которые были достаточно удобны как для разработчиков, так и для пользователей-экспертов. Однако с течением времени было осознано, что дедуктивная модель моделирует один из наиболее редких подходов, которому следует эксперт при решении проблемы.

Идея вывода по правилам является привлекательной, потому что она подразумевает наличие хорошо формализованной задачи, для которой существуют научные методы, доказавшие свою применимость и позволяющие получить решение, не требующее дополнительных доказательств.

Но окружающий мир сложен. Существует много слабо формализованных задач, для которых, возможно, будут найдены решения. Кроме того, существует ряд задач, для которых никогда не будет найдено формальное решение (судопроизводство, медицина). Актуальность проблемы обусловлена и многочисленностью таких задач, и практической потребностью найти хотя бы одно сколько-нибудь подходящее решение там, где из-за отсутствия формализованного метода нельзя найти все решения или оптимальное решение.

На самом деле, вместо того чтобы решать каждую задачу, исходя из первичных принципов, эксперт часто анализирует ситуацию в целом и вспоминает, какие решения принимались ранее в подобных ситуациях. Затем он либо непосредственно использует эти решения, либо, при необходимости, адаптирует их к обстоятельствам, изменившимся для конкретной проблемы.

Моделирование такого подхода к решению проблем, основанного на опыте прошлых ситуаций, привело к появлению технологии вывода, основанного на прецедентах (Case-Based Reasoning, или CBR), и, в дальнейшем - к созданию программных продуктов, реализующих эту технологию.

6. Вывод, основанный на прецедентах

Вывод на основе прецедентов - это метод принятия решений, в котором используются знания о предыдущих ситуациях или случаях (прецедентах). При рассмотрении новой проблемы (текущего случая) находится похожий прецедент в качестве аналога. Можно попытаться использовать его решение, возможно, адаптировав к текущему случаю, вместо того, чтобы искать решение каждый раз сначала. После того, как текущий случай будет обработан, он вносится в базу прецедентов вместе со своим решением для его возможного последующего использования. Более формальное определение дано в [7].

Прецедент - это описание проблемы или ситуации в совокупности с подробным указанием действий, предпринимаемых в данной ситуации или для решения данной проблемы.

Согласно [8], прецедент включает:

Описание проблемы.
Решение этой проблемы.
Результат (обоснованность) применения решения.

Описание проблемы должно содержать всю информацию, необходимую для достижения цели вывода. Например, если цель врача - диагностировать заболевание, то описательная информация должна содержать симптомы больного, результаты лабораторных исследований. Если цель врача - выбор лечения, то понадобятся еще хронология состояния больного, аллергия на лекарственные средства и так далее. Все этапы примененного к больному лечения сохраняются в описании решения.

Исход как результат применения решения - это обратная связь, полученная от применения решения. Описание результата может содержать:

перечень того, что выполнено,
результат,
способ восстановления (в случае отказа),
перечень того, что можно сделать, чтобы избежать отказа,
результаты восстановления.

Описание результата может также включать ссылки на другие прецеденты, текстовую информацию (рис. 5).

Рис. 5. Цикл вывода на основе прецедентов

Прецедент может содержать не только положительный исход. Тот факт, что больной не почувствовал улучшения в результате примененного лечения, надо также сохранять в ведущейся базе прецедентов, чтобы избежать подобных исходов в будущем. Объяснение того, какой отказ произошел и почему, может быть использовано при лечении других пациентов. Некоторые системы могут сохранять обоснование решения и даже его альтернативы.

Имеются много способов представления прецедента: от записей базы данных, древовидных структур до предикатов и фреймов. Представление должно соответствовать целям системы. Проблема представления прецедента - это прежде всего проблема решения, что сохранить в прецеденте, нахождения соответствующей структуры для описания содержания прецедента и выбора способа организации и индексирования базы знаний прецедентов для эффективного поиска и многократного использования.

7. Адаптивное управление на основе прецедентов

Идея, предложенная в настоящей работе, заключается в использовании метода вывода по прецедентам для адаптивного управления объектами.

При недостаточности наших знаний об объекте и среде, в которой он функционирует, не представляется возможным получить точную модель поведения объекта. Вместо этого мы владеем только априорной информацией о состояниях ОУ, управляющих воздействиях на него и результатах воздействий. Это совпадает с тремя составляющими понятия "прецедент" - описанием проблемы, примененным решением и результатом применения этого решения.

Предлагается следующая структура прецедента для адаптивного управления:

Состояние ОУ до воздействия. Описание объекта (набор признаков, принадлежность к классу состояний).
Управляющее воздействие. Описание воздействия (здесь возможна формализация, в частности, классификация управляющих воздействий). Как частный случай, возможно отсутствие воздействия.
Состояние после воздействия. Описание объекта (набор признаков, принадлежность к классу состояний).
Исход (положительный исход/отрицательный/спорный).

Рис. 6. Схема адаптивного управления по прецедентам.

Наполнение базы прецедентов может происходить как до момента начала управления на основе априорной информации, с помощью реальных или смоделированных прецедентов, так и в процессе управления, после обработки итога управляющего воздействия. Классификация состояний ОУ может производиться с привлечением экспертного знания или путем предварительной кластеризации. Схема адаптивного управления, приведенная на рис. 3, в этом случае будет выглядеть иначе (рис. 6).

После применения регулирующего воздействия и оценки итога этого воздействия текущая ситуация превращается в прецедент, который заносится в базу прецедентов. Отрицательный результат также является информативным и заносится в базу.

Данная модель должна обеспечить решение следующих задач:

Формирование обобщенных образов состояний ОУ на основе априорной информации (обучение).
Идентификация состояния ОУ по его выходным параметрам (задача распознавания образов).
Определение влияния входных параметров на перевод ОУ в различные состояния (обратная задача распознавания).
Прогнозирование поведения ОУ в условиях полного отсутствия управляющих воздействий.
Прогнозирование поведения ОУ при различных вариантах управляющих воздействий.

8. Выбор прецедента

В таких системах одной из самых важных является проблема выбора подходящего прецедента. После того, как прецеденты извлечены, нужно выбрать "наиболее подходящий" из них. Это определяется сравнением признаков ОУ в текущей ситуации и в выбранных прецедентах. Определение метода, на котором будет основываться нахождение меры сходства прецедентов, решается во время создания системы ее разработчиками. Наиболее популярным и часто используемым является метод "ближайшего соседа" [9]. В его основе лежит тот или иной способ измерения степени близости прецедента и текущего случая по каждому признаку (будь это текстовый, числовой или булевский), который пользователь сочтет полезным для достижения цели.

Говоря более строгим языком, вводится метрика (расстояние) на пространстве всех признаков, в этом пространстве определяется точка, соответствующая текущему случаю, и в рамках этой метрики находится ближайшая к ней точка из точек, представляющих прецеденты. Описанный здесь алгоритм очень прост. Реально применяются некоторые его модификации. Обычно прогноз делается на основе нескольких ближайших точек, а не одной. Такой метод более устойчив, поскольку позволяет сгладить отдельные выбросы, случайный шум, всегда присутствующий в данных.

Каждому признаку назначают вес, учитывающий его относительную ценность. Полностью степень близости прецедента по всем признакам можно вычислить, используя обобщенную формулу типа:

где w_j - вес j-го признака, sim - функция подобия (метрика), x_ij и x_ik - значения признака x_j для текущего случая и прецедента, соответственно. После вычисления степеней подобия для всех прецедентов получаем их единый ранжированный список.

Метод прост, может быть реализован очень эффективно, но требует для работы большой памяти, так как в процессе нахождения значения зависимой переменной для новой записи используется вся существующая база данных.

В методе ближайшего соседа, в классическом его представлении, используются только признаки текущего случая и прецедента. Но в управлении важен еще и результат воздействия, то, насколько он приближает к цели. При вводе метрики можно учесть и этот критерий. Считая, что цель должна быть достигнута за конечное число шагов, можно считать более близким прецедент, позволяющий достичь цели за меньшее число шагов. Мы пока не рассматриваем более сложные случаи управления, когда прецеденты выстраиваются в определенный порядок (в общем случае - в некоторые структуры). Так, например, в медицине лечение иногда проводят этапами, выводя больного из комы сначала в некоторое промежуточное состояние, не граничащее с комой, а затем уже стараются приблизить его показатели ближе к норме.

В общем случае, можно представить многоуровневую метрику, где прецеденты сравниваются по:

Состоянию до воздействия;
Воздействию;
Состоянию после воздействия.

9. Адаптация решения

В случае если найденный прецедент не является полным аналогом текущей ситуации, должна выполняться адаптация - модификация решения, которое имеется в выбранном прецеденте и направлено на решение целевой проблемы. Невозможно выработать единый вариант для такой адаптации, так как это в большой степени зависит от прикладной области. Если существуют алгоритмы адаптации, они обычно предполагают наличие зависимости между признаками прецедентов и признаками содержащихся в них решений. Такие зависимости могут задаваться человеком при построении базы прецедентов или обнаруживаться в базе автоматически методами добычи знаний.

Процесс модификации решения может включать ряд шагов, от простой замены некоторых компонентов в имеющемся решении, корректировки или интерполяции (числовых) признаков или изменения порядка операций до более существенных действий. Имеются и другие подходы:

повторная конкретизация переменных в существующем прецеденте и присвоение им новых значений;
уточнение параметров: некоторые прецеденты могут содержать числовые значения, например, время выполнения какого-либо этапа плана; это значение должно быть уточнено в соответствии с новым значением другого свойства;
поиск в памяти: иногда требуется найти способ преодоления затруднения, возникшего как побочный эффект замены одних компонентов решения другими.

Процесс адаптации может быть весьма сложным; в большой степени он зависит от проблемной области.

10. Понятие локальной контекстно-зависимой метрики

В традиционных методах анализа многомерных данных используется представление об общем пространстве признаков для всех объектов и об одинаковой мере, применяемой для оценки их сходства или различия. Такое представление уместно, например, при изучении однородных физических феноменов на статистическом уровне системной организации, в которых объект можно рассматривать как реализацию многомерной случайной величины с ясным физическим смыслом, когда есть все основания интерпретировать зафиксированные особенности объектов как случайные отклонения, обусловленные воздействием шумов, погрешностями измерительных приборов и т.п.

В задачах, которые можно объединить под общим названием "формирование знаний" (к ним относятся добыча данных и рассматриваемый нами метод вывода по прецедентам), каждый объект следует рассматривать как самостоятельный информационный факт (совокупность зафиксированных значений признаков), имеющий ценные уникальные особенности.

Эти особенности раскрываются путем конструирования собственного пространства признаков для любого объекта и нахождения индивидуальной меры его сходства с другими объектами. Без такого раскрытия описания объектов нивелированы, они могут содержать много ненужных, шумящих, отвлекающих и даже вредных деталей.

Это, в свою очередь, требует знаний о предметной области, то есть сведений, выражающих закономерности, определяющие отношения между объектами из баз данных, в которых хранятся прецеденты.

Задачей методов добычи данных, которые включают в себя решение задач классификации, является не только поиск закономерностей, но и интерпретация этих закономерностей. Это позволяет сконструировать для каждого объекта индивидуальную локальную метрику, обеспечивающую ему максимально возможную "сферу действия", которой нельзя достигнуть при построении общего пространства признаков и использовании одинаковой метрики для всех объектов.

Описание каждого эмпирического факта в этом случае оказывается полностью избавленным от неинформативных элементов, что позволяет в дальнейшем иметь дело с чистыми, "незашумленными" структурами данных. В этом описании остается только то, что действительно важно для отражения сходства и различия эмпирического факта с другими фактами в контексте решаемой задачи.

В свете представлений о локальных метриках очевидно, что один и тот же объект может поворачиваться разными гранями своего многомерного описания сообразно заданному контексту. К любому объекту, запечатленному в памяти как целостная многомерная структура, может быть привязан набор различных локальных метрик, каждая из которых оптимизирует его сходства и различия с другими объектами соответственно целям определенной задачи отражения отношений между объектами.

В результате построения локальных метрик отношения между объектами выражаются матрицей удаленностей. Так как локальная метрика привязана к объекту, метрики разных объектов могут не совпадать, и для элементов матрицы могут не выполняться требования симметричности и неравенства треугольника. Поэтому данная матрица, хотя и отражает отношения различия между объектами, не может истолковываться как матрица расстояний.

Образно говоря, если взглянуть на множество объектов с точки, которую занимает объект в пространстве, специально сконструированном для этого объекта, то для такого взора объекты выстроятся в специфический ряд по степени удаленности от данной точки. С другой точки и в другом пространстве ряд удаленностей тех же самых объектов будет иметь свой специфический вид.

Как уже указывалось, особенности объекта раскрываются в собственном пространстве признаков. На практике это означает, что локальная метрика зависит от степени полноты описания объекта, от наличия тех или иных признаков. Так, у пациента некоторые показатели могут отсутствовать по причине нехватки средств, времени или оборудования для проведения подробного анализа.

Как сами окружающие объекты, так и сформированные о них знания (например, описания классов) могут иметь свое признаковое пространство. Так, в медицине каждое заболевание характеризуется своим набором симптомов. По отношению к этому набору часть соответствующих признаков у пациента могут отсутствовать.

Если ввести понятие контекста, который определяет отношения между объектами и, в частности, степень описания самого объекта, то этот контекст проявляется в проекции классов на пространство признаков объекта. Недостаточно описанный объект может быть ошибочно отнесен к классу, которому он не принадлежит, потому что у него не хватает признака, дифференцирующего его от этого класса. Очевидно, что чем меньше степень описания объекта, тем больше пересекаются проекции классов в этом пространстве и тем худшего качества будет привязанная к объекту локальная метрика, которая определяет его сходство (различие) с другими объектами. Поэтому к такой метрике кроме понятия "локальная" мы добавляем понятие "контекстно-зависимая".

11. Описание локальной контекстно-зависимой метрики

Существуют разные способы разбиения множества объектов на классы:

Привлечение экспертного знания. Оно может выражаться, например, в ограничениях, накладываемых на диапазоны изменений признаков объектов, или же в формулировании набора правил для разбиения объектов на классы (построение классификатора).
Разбиение на основе обучающей выборки, представленной экспертом (обучение с учителем).
Кластеризация.

Локальная метрика, основанная на классах эквивалентности, делит все объекты на две группы: входящие в один класс с текущим и не входящие в этот класс. Она может принимать только два значения. Если исследуемый объект попал в класс, то близкими (равными по метрике) ему могут считаться объекты этого же класса. Остальные - не равны. Такая метрика не полностью учитывает взаимоотношения между текущим объектом и окружающими (контекст), особенно когда объект попадает в область пересечения классов.

Формирование классов происходит до рассмотрения исследуемого объекта и естественно, не в его признаковом пространстве. На этапе предварительной обработки, когда объекты собирают в классы, признаковым пространством для класса будет пространство, общее для всех признаков этого класса. Далее, после того, как классы сформированы, естественно рассматривать их в общем для них признаковом пространстве (в транзитивном замыкании пространств всех объектов).

При рассмотрении исследуемого объекта он может быть отнесен сразу к нескольким классам. Такая ситуация может возникать, если у объекта часть признаков по отношению ко всем этим классам отсутствует. Это же может произойти из-за недостаточной или некачественной информации при обучении или при разделении на классы. На практике возникновение подобных ситуаций не является редкостью. Проиллюстрируем их на простом примере (рис. 7).

Рис. 7. Отнесение недостаточно описанного объекта к двум классам.

Два непересекающихся класса A и B описаны в пространстве признаков {X₁, X₂}. Объект исследования O представлен одним признаком X₁, признак X₂ у него отсутствует. В этом пространстве признаков {X₁} проекции классов пересекаются, и объект попадает в это пересечение.

Для более точной оценки нужно было бы добавить к контрольному объекту значение признака X₂ (так же поступают и в медицине: если имеющихся показателей не хватает для дифференцирования заболеваний, только дополнительное исследование позволит сделать окончательный вывод), но на практике это не всегда возможно.

До сих пор считалось, что попадание объекта в область пересечения классов является препятствием для оценки объекта. Поскольку от этой ситуации избавиться не удается, ее надо постараться использовать. Для этого будем использовать аналоги - объекты соответствующих классов, попадающие в ту же область пересечения.

При рассмотрении объекта соответствующая ему точка сравнивается с расположением классов в проекции на пространство его признаков. Другие объекты, входящие в один класс с ним, считаются близкими к нему. Объекты могут также попадать в область пересечения классов. Все объекты можно разделить на группы (рис. 8), основываясь на сложности этого пересечения. Объекты, находящиеся в той же области пересечения, что и исследуемый объект, естественно считать более близкими к нему, чем те, которые находятся вместе с ним в каком-нибудь одном из классов, не входя в область пересечения. Этому можно найти простое объяснение: если считать, что введением классов мы разбили множество объектов на основные понятия, то с тем же набором признаков, что и текущий объект, они подобны ему по принадлежности к понятиям, обозначаемым классами.

Сравнив введенное понятие близости с тем, что говорилось ранее, нетрудно заметить, что предложенная метрика является локальной и контекстно-зависимой. Локальной, потому что привязана к рассматриваемому объекту, контекстно-зависимой - потому что зависит от его набора признаков. Приведем более строгое определение предлагаемой меры:

Расстояние от текущего объекта до другого равно разности количества классов, куда попал текущий объект, и количества классов из этого числа, в котором находится другой.

Это значит, в частности, что расстояние между текущим объектом и другим объектом, находящимся в той же области пересечении классов, равно нулю. На рис. 8 цифрами помечены области с соответствующим этим цифрам расстоянием от текущего объекта до объекта из этой области.

Предложенная мера не является метрикой в классическом понимании, а только имеет интерпретацию расстояния. Для нее не гарантируется выполнение правила симметричности, потому что она привязана к объекту, и, при переходе к другому объекту, будет рассматриваться уже в его пространстве признаков. По этой же причине не гарантируется выполнение правила треугольника. Однако она позволяет учитывать контекст взаимоотношений объекта с окружающими, особенно в непосредственной близости от него.

Рис. 8. Степени близости объектов.

12. Возможные приложения предлагаемого метода адаптивного управления

К приложениям с плохо формализуемыми объектами, для которых бессмысленно пытаться получить явный вид передаточной функции, можно отнести, в первую очередь, медицинские приложения, затем управление предприятием, игру на валютном рынке, системы защиты информации (обнаружение информационных воздействий) и другие.

Адаптивное управление предприятием, или "включенное" оперативное управление чаще подразумевает собой действия, направленные на преодоление кризисной ситуации на предприятии [10]. Модель адаптивного управления должна содержать критерий, относительно которого принимается решение, и характеристики объекта в виде совокупности управляемых переменных.

Управление должно происходить в условиях неполного, нечеткого и неточного знания характеристик объекта управления и характеристик окружающей среды, в которой функционирует этот объект. Кроме того, в ходе реализации экономического процесса, происходящего в условиях неопределенности, обычно меняются параметры объектов-участников процесса и характеристик окружающей их среды. В такой ситуации не представляется возможным получить четкую форму модели объекта управления, как параметрическую, так и структурную.

Метод управления по прецедентам предлагается в качестве основы реализации таких адаптивных регуляторов экономических процессов.

В настоящее время становится очевидным, что качественно новый уровень защищенности сложных и многофункциональных информационных систем может быть достигнут лишь за счет реализации адаптивного управления процессами защиты информации. При этом под "адаптивным управлением" понимается процесс целенаправленного изменения параметров и структуры системы защиты информации с целью поддержания требуемого уровня защищенности систем.

Современные сетевые технологии уже трудно представить без механизмов защиты. Однако при их детальном анализе всегда возникают несколько вопросов: насколько эффективно реализованы и настроены имеющиеся механизмы, как противостоит атакам инфраструктура защиты, может ли администратор безопасности своевременно узнать о начале таких атак?

Противостояние атакам - важное свойство защиты. Казалось бы, если в сети установлен межсетевой экран (firewall), то безопасность гарантирована, но это распространенное заблуждение может привести к серьезным последствиям.

Например, межсетевой экран не способен защитить от пользователей, прошедших аутентификацию. А квалифицированному хакеру не составляет труда добыть идентификатор и пароль авторизованного пользователя. Кроме того, межсетевой экран не только не защищает от проникновения в сеть через модем или иные удаленные точки доступа, но и не может обнаружить такого злоумышленника.

Обнаружение атак - это процесс оценки подозрительных действий в корпоративной сети, который реализуется посредством анализа журналов регистрации операционной системы и приложения (log-файлов) либо сетевого трафика. Компоненты программного обеспечения обнаружения атак размещаются на узлах или в сегментах сети и "оценивают" различные операции, в том числе с учетом известных уязвимостей.

Адаптивный компонент позволяет модифицировать процесс анализа защищенности, предоставляя самую последнюю информацию о новых уязвимостях. Он также модифицирует компонент обнаружения атак, дополняя его последней информацией о подозрительных действиях и атаках. Примером адаптивного компонента может служить механизм обновления баз данных антивирусных программ, которые являются частным случаем систем обнаружения атак.

13. Заключение

Интеграция трех самостоятельных направлений, относящихся к методам генерации нового знания и использования этого знания при управлении поведением объектов, позволяет получить новый импульс в развитии интеллектуальных средств управления. В работе показаны возможные выгоды от такой интеграции, наибольший интерес из которых представляет, по-видимому, возможность накапливания знаний о возможном поведении в случае возникновения каких-либо ситуаций и постоянно растущая вероятность верного прогноза поведения в ситуациях, ранее не встречавшихся или ранее не явно не распознававшихся.

Особенным достоинством метода является возможность накопления знаний о ситуациях (прецедентах) во внешней, по отношению к объектам, базе данных и использования этих знаний другими объектами, подключенными к той же базе.

Метод важен и интересен тем, что его можно применять по отношению к реальным биологическим объектам, в том числе - при изучении поведения человека. Адаптация поведения любого живого существа, в том числе, человека, в окружающей среде, с момента рождения происходит на основе прецедентов. В начальной стадии жизнедеятельности один из основных способов накопления знаний (пополнения базы прецедентов) - это игра. Когда собственная база прецедентов мала, собственный опыт проб и ошибок оказывается незаменимым, особенно он важен, если плата за ошибки относительно мала. Одновременно база прецедентов начинает пополняться чужим опытом (например, с помощью наблюдения), иными словами, происходит процесс передачи знаний от одной системы управления в другую.

Развиваемый подход не является панацеей и не может быть абсолютизирован. В определенных ситуациях, связанных управлением и обучением объектов с хорошо формализуемым поведением, применение "классических" методов будет, несомненно, более выигрышным. Однако метод интеллектуального адаптивного управления с предварительной и перманентной классификацией новых ситуаций позволяет работать с объектами, поведение которых слабо изучено или (в начальный момент) совсем неизвестно, расширяя сферу применения всех трех методов: адаптивного управления, добычи данных и вывода на основе прецедентов.

Литература

1.обратно	Я. З. Цыпкин. "Адаптация и обучение в автоматических системах". М.: Наука, 1968.
2.обратно	Н. Г. Загоруйко. "Прикладные методы анализа данных и знаний". Новосибирск, ИМ СО РАН, 1999.
3.обратно	Л. Е. Карпов, В. Н. Юдин. "Методы добычи данных при построении локальной метрики в системах вывода по прецедентам", М., ИСП РАН, препринт № 18, 2006.
4.обратно	В. И. Скурихин, В. А. Забродский, Ю. В. Копейченко. "Проектирование систем адаптивного управления производством". Харьков, "Вища школа", 1984.
5.обратно	А. А. Жданов. "Метод автономного адаптивного управления". Известия Академии наук. Теория и системы управления, 1999, № 5, стр. 127-134.
6.обратно	Математика и кибернетика в экономике. - М.: Экономика, 1975.
7.обратно	Alan Bundy, editor. "Artificial Intelligence Techniques". Springer Verlag, 1997.
8.обратно	Klaus-Dieter Althof, Eric Auriol, Ralph Barlette, and Michel Manago. "A Review of Industrial Case-Based Reasoning Tools", AI Intelligence, 1995.
9.обратно	S. S. Anand, J. G. Hughes, D. A. Bell and P. Hamilton. "Utilising Censored Neighbours in Prognostication, Workshop on Prognostic Models in Medicine", Eds. Ameen Abu-Hanna and Peter Lucas, Aalborg (AIMDM'99), Denmark, pp. 15-20, 1999.
10.обратно	В. В. Кузьменко, Д. В. Гришин. "Теоретические аспекты функционирования адаптивной системы управления предприятием". Вестник СевКавГТУ. Серия "Экономика". № 2 (10), 2003. ISBN 5-9296-0140-2. Северо-Кавказский государственный технический университет.

¹(к тексту)

Работа поддержана грантами Российского фонда фундаментальных исследований № 06-07-89098-а и № 06-01-00503-а.

Адаптивное управление по прецедентам, основанное на классификации состояний управляемых объектов 1

Содержание

Адаптивное управление по прецедентам, основанное на классификации состояний управляемых объектов ¹