Распределенный интеллект Сети
Сергей Кузнецов
11.12.2002
Открытые системы, #12/2002
Обзор ноябрьского, 2002 года номера журнала Computer (IEEE Computer Society, V. 15, No. 11, 2002)
Наконец-то вышел номер журнала Computer, целиком посвященный одной теме — Web Intelligence. Памятуя о продолжительной дискуссии в Internet по поводу должного русского эквивалента термина Business Intelligence, я предпочел не вводить в обзоре русский аналог термина Web Intelligence, а по мере возможности использовать аббревиатуру WI.
Приглашенные редакторы ноябрьского номера — Нин Жонг (Ning Zhong), Джимин Лиу (Jiming Liu) и Йию Яо (Yiyu Yao); их вводная заметка называется «В поисках Паутины мудрости» (In Search of the Wisdom Web). Чтобы пояснить, что означает WI в понимании редакторов, процитирую начало заметки. «WI предлагает новое направление научных исследований и разработок, подталкивая технологию к манипулированию смыслом данных и создавая распределенный интеллект, который действительно сделает это возможным. WI исследует фундаментальное и практическое влияние, которое искусственный интеллект и развитые информационные технологии будут оказывать на следующее поколение систем, служб и сред, оснащенных возможностями Web... Мы не можем предсказать, какой парадигме будет следовать Web в будущем. Однако мы предполагаем, что Web преобразуется в интеллектуальную сущность — отсюда термин Web intelligence». Кратко обсуждается ряд аспектов WI.
n Автономная поддержка Web. Интеллектуальная Сеть функционирует как автономная сущность, автоматически регулируя функции и взаимодействия со связанными Web-сайтами и доступными прикладными службами.
- Представление. Агенты интеллектуальной Сети могут использовать язык Problem Solver Markup Language для спецификации своих ролей, установок и связей по отношению к любым другим службам. Также должна обеспечиваться возможность обработки и понимания естественного языка.
- Самонаведение и самообучение. Помимо семантических знаний, извлекаемых и обрабатываемых путем интеллектуального поиска, агенты интеллектуальной Сети должны также включать динамически создаваемый источник метазнаний, имеющих дело со связями между понятиями, и знания о пространственных и временных ограничениях для планирования использования служб.
- Персонализация. Интеллектуальная Сеть может персонализировать взаимодействия путем запоминания текущих предпочтений пользователей и учета тем и сайтов, к которым обращался пользователь в течение различных сеансов.
Первая статья номера называется «Web и социальные сети» (Web and Social Networks); ее авторами являются Рави Кумар (Ravi Kumar), Прабхакар Рагхаван (Prabhakar Raghavan), Сридхар Раджагопалан (Sridhar Rajagopalan) и Эндрю Томкинс (Andrew Tomkins). Современная теория социальных сетей основана на работах Стэнли Милграма. Исследователь в 1967 году провел серию экспериментов, в которых он просил нескольких человек, проживающих в городе Омаха (штат Небраска), передать письмо своему коллеге в Бостоне. По условиям эксперимента эти люди могли передать письмо только тому человеку, с которым они были знакомы по имени. Задача состояла в том, чтобы переправить письмо с наименьшим числом «скачков». Было обнаружено, что медиана числа скачков для успешно доставленных писем равнялась шести. В статье приводится обзор современного состояния исследований и разработок в областях поиска в Web на основе анализа связей, паттернов сообществ (patterns of community), связности и Web-диаметра.
Вторую статью написал Тойоаки Нишида (Toyoaki Nishida). Не стану переводить на русский язык оригинальное название статьи — «Social Intelligence Design for the Web» (это означало бы попытку введения русского аналога термина social intelligence, а к этому я не готов). Новые технологии, подобные WI, часто приводят к потреблению финансовых ресурсов без обеспечения полезной отдачи. Поэтому необходимо уделять внимание социальным аспектам интеллекта, стараясь обеспечивать ясную картину того, каким образом Web может улучшить процессы добычи и обработки знаний. На передний план выходят процессы добычи и обработки знаний в небольших и слабо связанных группах людей или сообществах. Исследователи групповых структур сообществ обращаются к таким проблемам, как оказание помощи при взаимном знакомстве людей, обсуждение общих вопросов, разрешение конфликтов, создание общественной осведомленности, достижения общего согласия. Автор статьи считает, что для создания общественно значимых интеллектуальных Web-приложений необходимо обратиться к нескольким темам: социальный контекст; создание агентов, представляющих пользователей; обеспечение возможности сотрудничества и т. д.
Автор третьей статьи, «Q: язык описания сценариев для интерактивных агентов» (Q: A Scenario Description Language for Interactive Agents), — Тору Ишида (Toru Ishida). Существует несколько языков описания поведения агентов и протоколов их взаимодействия. Однако, по мнению автора, в контексте Web должны учитываться потребности непрофессиональных разработчиков приложений. Q предназначен для описания сценариев взаимодействия агентов и пользователей на основе внешних ролей агентов. Он обеспечивает интерфейс между компьютерными профессионалами и создателями сценариев. Язык является расширением известного языка Scheme, представляющего собой диалект языка Lisp.
Название четвертой статьи — «О поведенческом интеллекте в Semantic Web» (Toward Behavioral Intelligence in the Semantic Web). Статья написана Джоанной Брайсон (Joanna Bryson), Дэвидом Мартином (David Martin), Шейлой Макилрейт (Sheila McIlraith) и Линн Андреа Стейн (Linn Abdrea Stein). Предлагается расширить концептуальную основу Semantic Web путем включения поведения как неотъемлемой части этой основы. Такое расширение позволит добиться использования полного потенциала Semantic Web не только в качестве хранителя знаний, но и как нечто, могущее производить действия с этими знаниями. При использовании предлагаемого подхода к построению Semantic Web система выглядит как набор агентов, человекоподобных акторов со своими мнениями, намерениями и возможностями. Для достижения возможности создания нового облика Semantic Web требуется разработать методологию построения агентов, могущих безопасно расширять свое поведение, и развить методы разметки Semantic Web для поддержки этого типа расширения. Предлагается использовать агенто-ориентированный подход к инженерии программного обеспечения, названный авторами BOD (Behavior-Oriented Design). Соответствующий язык разметки базируется на языке DAML-S (www.daml.org/services).
Следующая статья, написанная Дитером Фенселем (Dieter Fensel), называется «Управление знаниями, основанное на онтологии» (Ontology-Based Knowledge Management). Статья является кратким отчетом о текущем состоянии проекта www.ontoknowledge.org. Разрабатываемый в проекте набор программных средств предназначен для эффективной обработки большого числа разнородных, распределенных и полуструктурированных документов. Поисковая технология Semantic Web интегрируется с операциями преобразования, автоматическим извлечением информации и семантической поддержкой сопровождения информации и обеспечения пользовательских представлений. Все средства основаны на трехуровневой архитектуре. На нижнем уровне путем задания запросов на естественном языке извлекаются метаданные из структурированных и полуструктурированных документов. На среднем уровне репозиторий аннотированных данных обеспечивает доступ к метаданным, которые используются для поддержки оперативно доступных источников. На верхнем уровне клиенты и провайдеры могут использовать развитые методы для изучения и модификации областей знаний. На всех трех уровнях для обеспечения структурных и семантических определений документов используются онтологии — согласованные, совместно используемые, формальные описания важных концепций домена.
У шестой статьи три автора — Мишель Миссикофф (Michele Missikoff), Роберто Навигли (Roberto Navigli) и Паола Веларди (Paola Velardi). Ее название — «Интегрированный подход к изучению и конструированию Web-онтологий» (Integrated Approach to Web Ontology Learning and Engineering). Для разработки Semantic Web с целью повышения семантического уровня компьютеров, объединенных через Internet, требуется семантическое, ориентированное на компьютерное использование представление мира. Такую модель мира часто называют онтологией. Несмотря на большую интенсивность исследований, онтологии все еще не получили широкого распространения. Текущие исследования главным образом касаются базовых принципов, таких как формализм представления знаний. Меньшее внимание уделяется более практическим аспектам — методам и средствам, содействующим реальному построению онтологий. Авторы разработали программную среду, основанную на инструментарии OntoLearn, которая обеспечивает возможность построения и оценки онтологий предметных областей при интеллектуальной интеграции информации в виртуальных сообществах пользователей.
Седьмая статья называется «Добыча данных для WI» (Data Mining for Web Intelligence). Авторами являются Джиавей Хан (Jiawei Han) и Кевин Чен-Чуан Чанг (Kevin Chen-Chuan Chang). Авторы полагают, что по мере развития методов добычи данных они будут играть возрастающую роль при решении задач создания WI. Анализируют основные факторы, ограничивающие возможности доступа к Web: отсутствие качественного поиска по ключевым словам, отсутствие эффективного доступа к подключенным к Web базам данных, отсутствие автоматически конструируемых каталогов, отсутствие примитивов семантически-ориентированных запросов и т.д. Далее перечисляются и обсуждаются задачи, стоящие перед исследователями и разработчиками средств категории Web-mining: добыча данных в поисковых машинах; анализ структур связей в Web; автоматическая классификация Web-документов; добыча структур и семантического содержания Web-страниц и т. д.
У последней тематической статьи ноябрьского номера — From Computational Intelligence to Web Intelligence — шесть авторов; назову первого по списку: Ник Керкоун (Nick Cercone). Авторы обсуждают три темы, связанные с Computational Intelligence, — интерфейсы на основе естественных языков, машинная трансляция и машинное обучение — и размышляют об их влиянии на WI.
Должен сказать, что и после прочтения номера у меня не сложилось четкого понимания того, что же такое Web Intelligence и чем «оно» отличается от Semantic Web. Скорее всего, специалисты в этой области сказали бы, что Semantic Web является составной частью WI. Но ясно, что от терминов Business Intelligence, Web Intelligence, Computational Intelligence и тому подобных словосочетаний нам никуда не деваться. Поэтому стоит договориться о правилах образования соответствующих русскоязычных терминов. В русских аналогах должно быть какое-то единообразие. Мне кажется, например, что термин Business Intelligence ничуть не более раскрывает смысл стоящего под ним явления, чем транслитерация бизнес-интеллект. Может быть, стоит не мудрить и пользоваться транслитерацией? Лично меня это бы не смутило. Однако требуется общее согласие.
В обзоре книг ноябрьского номера числится третье издание знаменитой книги Джона Хеннесси, Дэвида Паттерсона и Дэвида Голдберга «Архитектура компьютеров: количественный подход» (John L. Hennessy, David A. Patterson, David Goldberg. Computer Architecture: A Quantitative Approach. Morgan Kaufmann Publishers; ISBN: 1558605967; 3rd edition, 2002).
С наступающим вас Новым Годом! Не забудьте заплатить членские взносы за следующий год в IEEE Computer Society (www.computer.org). Сергей Кузнецов, kuzloc@ispras.ru.