2008 г.
Методы бикластеризации для анализа интернет-данных
Дмитрий Игнатов,
кафедра анализа данных и искусственного интеллекта ГУ-ВШЭ
Назад Содержание Вперёд
2.1.2. Формальный анализ понятий (ФАП)
Определение 2.11
Формальный контекст
есть тройка
, где
—
множество, называемое множеством
объектов,
— множество,
называемое множеством
признаков,
—
отношение.
Отношение
интерпретируется следующим образом: для
,
имеет место
, если объект
обладает признаком
.
Для формального контекста
и произвольных
и
определена пара отображений:
которые задают
соответствие Галуа между частично упорядоченными
множествами
и
(см.
Раздел
2.1.1), а оператор
является
оператором замыкания на
— дизъюнктном
объединении
и
, т.е. для произвольного
или
имеют место следующие
соотношения [
1]:
-
(экстенсивность),
-
(идемпотентность),
- если
, то
(изотонность).
Множество
называется замкнутым, если
[1].
Определение 2.12
Формальное понятие формального контекста
есть
пара
, где
,
,
и
. Множество
называется
объёмом, а
—
содержанием понятия
.
Очевидно, что объем и содержание произвольного формального понятия
являются замкнутыми множествами.
Множество формальных понятий контекста
, которое мы будем
обозначать посредством
, частично упорядочено по вложению
объёмов: формальное понятие
является менее общим
(более частным), чем понятие
,
,
если
, что эквивалентно
(
— обобщение
).
В работе [1] было показано, что подмножества
произвольного множества, замкнутые относительно заданной на нем
операции замыкания, образуют полную решётку, а в работах
[83,33] — что множество
всех понятий формального контекста
образует полную решётку.
Определение 2.13
Множество понятий контекста
образует решётку
, где
. и
. Такие решётки
называют
решётками понятий, или
решётками
Галуа [
33].
Любая полная решётка изоморфна решётке понятий некоторого формального
контекста [33]. В качестве объектов этого контекста
нужно выбрать
-неразложимые элементы, а в качестве признаков
—
-неразложимые элементы исходной решётки. Тогда объект
в
контексте будет обладать признаком
, если элемент решётки,
соответствующий ,
находится "под" элементом, соответствующим
.
Определение 2.14
Строчно- (столбцево-)редуцированным называется такой
формальный контекст, в котором всякое объектное (признаковое)
понятие является
-неразложимым
(
-неразложимым).
Редуцированным называется
формальный контекст, являющийся одновременно строчно- и
столбцево-редуцированным.
Определение 2.15
Пусть дан
— формальный контекст и
,
тогда
выражение
называется
импликацией (на множествах
признаков), если
(или
), т.е. все объекты из
, обладающие
множеством признаков
, обладают также множеством признаков
.
Аналогичным образом определяются импликации на множествах объектов.
Наличие импликации
в контексте
соответствует тому, что в
диаграмме решётки
формальное понятие
находится ниже формального понятия
.
Импликации формального контекста удовлетворяют аксиомам
Армстронга [33] для произвольных
:
-
;
- если
то
;
- если
и
то
.
Помимо определённых выше однозначных (one-valued) формальных
контекстов в анализе формальных понятий изучаются многозначные
(many-valued) контексты:
Определение 2.16
Многозначный формальный контекст есть четвёрка
,
где
,
,
— множества (объектов,
признаков и значений признаков, соответственно), а
— тернарное
отношение
,
задающее значение
признака
,
причём:
и
влечёт
.
Многозначные признаки могут рассматриваться как отображения ,
таким образом, можно обозначать
вместо
.
Процедура сведения многозначных контекстов к однозначным называется
шкалированием (scaling). Для шкалирования
каждый признак многозначного контекста представляется формальным
контекстом, называемым шкалой.
Определение 2.17
Шкала для признака
многозначного контекста
есть (однозначный) контекст
такой, что
. Объекты в шкале называются
значениями
шкалы, а признаки —
признаками шкалы.
Определение 2.18
Пусть задан многозначный контекст
и шкалы
, тогда
производным контекстом будем называть контекст
, где множество признаков
(
) и отношение
и
.
В нашей работе для построения таксономии алгоритмов использовалось два варианта шкалирования —
порядковое шкалирование и номинальное шкалирование. Порядковая шкала
используется для признаков, значения которых упорядочены относительно
некоторого порядка
, а обладание объектом некоторым значением
признака влечёт обладание всеми меньшими значениями признака. С помощью номинальной шкалы
представляют несравнимые между собой значения признаков, например, цвет.
Возможные виды шкалирования рассмотрены в [33].
Назад Содержание Вперёд