2009 г.
Расширение реляционной модели для лучшего отражения семантики
Э. Ф. Кодд
Перевод: М.Р. Когаловский
Назад Содержание
16. СВОДКА ВОЗМОЖНОСТЕЙ RM/T
Систематическое использование доменов сущностей (если при этом
избегать несущностных ассоциаций) позволяет RM/T поддерживать широкий
диапазон точек зрения на атомарную семантику, от крайней позиции,
выражающейся в том, что минимальной смысловой единицей всегда является
бинарное отношение, до более умеренных позиций. RM/T поддерживает
четыре измерения (четырехмерное пространство) молекулярной семантики &ndash
декартову агрегацию, обобщение, агрегацию покрытия и предшествование
событий (см. рис. 10).
Рис. 10. Четыре измерения RM/T
Приведем теперь краткую сводку специальных объектов и операций,
которые мы ввели в расширенной реляционной модели. В Таблице I
перечислены все объекты, а в Таблице II – алгебраические операции.
Таблица I
Объект RM/T | Назначение |
Суррогат | Контролируемый системой представитель сущности |
relname | Строковое представление имени отношения базы данных |
reltype | Строковое представление типа отношения |
E-null | * Суррогат, обозначающий "сущность неизвестна" |
E-домен | * Домен активных суррогатов |
PER-домен | * Домен меток категорий |
RN-домен | * Домен relname |
E-атрибут | Атрибут, определенный на E-домене |
RN-атрибут | Атрибут, определенный на RN-домене |
PER-атрибут | Метка в графовом отношении |
SEP-атрибут | Отделение одного узла от другого |
SUB-атрибут | Подчиненный в графовом отношении |
SUP-атрибут | Главенствующий в графовом отношении |
CATR-отношение | %* Список всех имен_отношений и соответствующих типов_отношений |
CATRA-отношение | %* Отношения и их атрибуты |
CATA-отношение | %* Список всех атрибутов |
CATAD-отношение | %* Атрибуты и их домены |
CATD-отношение | %* Список всех доменов |
CATC-отношение | %* Список всех категорий |
CATRC-отношение | %* Категории и их типы сущностей-вершины |
E-отношение | Список суррогатов для всех заданных типов сущностей |
P-отношение | Непосредственные свойства типа сущностей |
PG-отношение | * Граф свойств |
CG-отношение | * Граф характеристик |
AG-отношение | * Граф ассоциаций |
UGI-отношение | * Граф безусловного обобщения по включению |
AGI-отношение | * Граф альтернативного обобщения по включению |
US-отношение | * Граф безусловных преемников |
AS-отношение | * Граф альтернативных преемников |
UP-отношение | * Граф безусловных предшественников |
AP-отношение | * Граф альтернативных предшественников |
KG-отношение | * Принадлежность типам агрегатов покрытия |
Примечание: Для
каждого типа, помеченного звездочкой, в любой базе данных RM/T имеется только один объект. Для отношений, помеченных символом
"%", имеются двойники – E-отношений, не перечисленные здесь явно.
Таблица II
Операция | Область определения аргументов | Область значений результата |
NOTE | Отношение | Relname |
TAG | Отношение | Отношение |
DENOTE | Relname | Отношение |
| Множество relname | Множество отношений |
COMPRESS | Множество отношений | Отношение |
APPLY | Множество отношений | Множество отношений |
PATT | Отношение | Множество отношений |
PTUPLE | Отношение | Множество отношений |
PREL | Отношение | Множество отношений |
SETREL | Отношение (Отношения) | Множество отношений |
OPEN | Графовое отношение | Графовое отношение |
CLOSE | Графовое отношение | Графовое отношение |
STEP | Графовое отношение | Графовое отношение |
Множества n-арных отношений были введены как дополнительный тип
объектов для алгебраических манипуляций. К этим множествам более
высокого порядка применимы традиционные теоретико-множественные
операторы UNION, INTERSECTION и SET
DIFFERENCE. К ним могут быть применены также
различные другие операторы (например OUTER UNION). Чтобы создавать эти множества отношений,
манипулировать ими и манипулировать графовыми отношениями, были введены
дополнительные операции (см. Таблицу II).
17. ЗАКЛЮЧЕНИЕ
Мы попытаемся определить расширенную реляционную модель, которая
позволяет удерживать больше смысла данных. Смысловые единицы
информации, более крупные, чем отдельные
n-арные отношения, были
введены таким образом, что, по-видимому, все конкурирующие
семантические подходы, где-либо описанные, могут быть представлены
здесь или транслированы в эту среду. Результат представляет собой
модель с более богатым многообразием объектов, чем первоначальная
реляционная модель, с дополнительными правилами
вставки-удаления-обновления, а также с некоторыми дополнительными
операциями, которые делают эту алгебру более мощной (и, к сожалению,
более сложной). Мы повторяем, что включение в модель более крупных
смысловых единиц – это задача, которая никогда не будет завершена, и,
следовательно, эта модель является лишь несколько более семантичной,
чем предыдущая.
Модель данных, которая может использоваться как:
- концептуальный каркас для определения широкого класса форматированных баз данных;
- посредник между хранимыми представлениями и "взглядами" пользователей;
должна, вероятно, обладать, по крайней мере, четырьмя группами
возможностей: табличными возможностями (например, расширениями отношений
реляционной модели); теоретико-множественными возможностями
(например, реляционной алгеброй); возможностями дедуктивных цепочек
формул (например, логикой предикатов в современной нотации);
теоретико-графовыми возможностями (например, возможностью использовать помеченные
ориентированные гиперграфы для отношений). Табличная форма требуется
для показа и/или модификации экстенсиональных данных (особенно для тех
пользователей, которых необходимо оградить от подробностей организации
знаний, содержащих экстенсиональные данные). Теоретико-множественные
возможности требуются для поддержки поиска без навигации. Возможности
логики предикатов позволяют использовать выражение интенсиональных
знаний в форме цепочек формул и применять общие методы вывода.
Графические возможности позволяют рисовать психологически
привлекательные изображения для специального класса пользователей,
которые проектируют базу данных, обеспечивают поддержку знаний или
разрабатывают специализированные методы вывода.
Заметим, что в данной работе представлены только табличные и
теоретико-множественные аспекты RM/T. Ясно, что имеется несколько видов
графов, которые могут быть ассоциированы с RM/T. Помимо
возможности представления n-арных отношений гиперграфами, для каждого графового отношения
имеется непосредственное представление в виде ориентированного графа (в
некоторых случаях – с помеченными ребрами).
Исследуются также другие расширения реляционной модели, например,
дополнительная поддержка для временного измерения и исторических данных. Есть
надежда, что RM/T может быть развита в универсальную реструктурирующую
алгебру для баз данных. Следует, однако, напомнить, что расширения в
RM/T предназначены, главным образом, для не слишком широкого круга,
состоящего из проектировщиков баз данных и изощренных пользователей.
Большинство же пользователей, вероятно, предпочтет простоту базисной
реляционной модели.
БЛАГОДАРНОСТИ
Автор в значительной мере заимствовал идеи, опубликованные Смит (Smith) и
Смитом (Smith); Лакруа (LaCroix) и Пироттом (Pirotte); Холлом (Hall), Оулеттом (Owlett) и Тоддом (Todd); Шмидом (Schmid) и
Свенсоном (Swenson); Хаммером (Hammer) и Маклеодом (McLeod). Написать эту статью побудили
многочисленные высказывания о полезности такой работы, которые содержатся в
Трудах конференций IFIP TC-2, состоявшихся в 1976 и 1977 годах [24,
25]. Автор благодарен Вильяму Армстронгу (William Armstrong), Дональду Камерону (Donald Cameron), Кристоферу
Дейту (Christopher
Date), Рональду Фейгину (Ronald Fagin), Джону Сова (John Sowa), Стефану Тодду (Stephen Todd) и рецензентам за
полезные замечания по первоначальному варианту этой статьи.
ЛИТЕРАТУРА
Замечание: Источники [1, 7, 21, 36] не цитируются в тексте статьи.
1. Aho, A.H., Beeri, C., and Ullman, J. The theory of joins in
relational databases. Proc. 19th IEEE Symp. on Foundation of Computer
Sci., 1977.
2. Astrahan, M.M., et al. System R: Relational approach to
database management. ACM Trans. Database Syst. 1, 2 (June 1976),
97-137.
3. Beeri, C., Bernstein, P., and Goodman, N. A sofisticate"s
introduction to database normalization theory. Proc.Int. Conf. on Very
Large Data Bases, Berlin, Sept. 1978, pp. 113-124.
4. Cadiou, J.M. On semantic issues in the relational model of
date. Proc. 5th Symp. on Math. Foundation of Computer Sci., 1976,
Gdansk, Poland, Lecture Notes in Computer Science 45, Springer-Verlag,
pp. 23-38.
5. Codd, E.F. A relational model of data for large shared data
banks. Comm. ACM 13,6 (June 1970), 377-387. Есть русск. пер.: Е.Ф.Кодд.
Реляционная модель данных для больших совместно используемых банков
данных. СУБД, # 1, 1995. – с. 145-160.
6. Codd, E.F. Further normalization of the database relational
model. In Database Systems, Courant Computer Science Symposia 6,
R.Rustin, Ed., Prentice-Hall, Englewood Cliffs, N.Y., 1971, pp. 65-98.
7. Codd, E.F. Recent investigations in relational database
systems. Information Processing 74, North-Holland Pub.Co., Amsterdam,
1974, pp. 1017-1021.
8. Codd, E.F. Understanding relations (Unstalment # .7). FDT (Bulletin of ACM SIGMOD) 7, 3-4 (Dec. 1975), 23-28.
9. Codd, E.F. Extending the database relational model. Invited
talk presented at the Australian Computer Sci. Conf., Hobart, Tasmania,
Feb.1-2, 1979.
10. Fagin, R. Multivalued dependencies and a new normal form for
relational databases. ACM Trans. Database Syst., 2, 3 (Sept.1977),
262-278.
11. Fagin, R. Normal forms and relational database operators. Proc. ACM SIGMOD Conf., Boston, Mass., May 30 – June 1, 1979.
12. Falkenberg, E., Concepts for modelling information. In
Modelling in Data Base Management Systems, G.M.Nijssen, Ed.,
North-Holland Pub. Co., Amsterdam, 1976.
13. Goldstein, R.C., and Strnad, A.L. The MACAIMS data management
system. Proc. 1970 ACM SIGFIDET Workshop on data Description and
Access, Houston, Tex., Nov. 15-16, 1970.
14. Hall, P., Owlett, J., and Todd, S. Relations and Entities. In
Modelling in Data Base Management Systems, G.M.Nijssen, Ed.,
North-Holland Pub. Co., Amsterdam, 1976.
15. Hammer, M.M. and McLeod, D.J. The semantic data model: A
modelling mechanism for database applications. Proc. ACM SIGMOD Conf.,
Austin, Tex., May 31 – June 2, 1978.
16. Heath, I.J. Private communication, April 1971.
17. Hemphill, L.G., and Rhyne, J.R. A model for knowledge
representation in natural language query systems. IBM Res. Rep. RJ2304,
IBM Res. Lab., San Jose, Calif., Sept. 1978.
18. Hendrix, G.G. Encoding knowledge in partitioned networks. Tech. Note 164, SRI International, Menlo Park, Calif., June 1978.
19. Jordan, D.E. Implementing production systems with relational
data bases. Proc. ACM Pacific Conf., San Francisco, Calif., April 1975.
20. LaCroix, M., and Pirotte, A. Generalized joins. SIGMOD Record (ACM) 8, 3 (Sept. 1976), 14-15.
21. LaCroix, M., and Pirotte, A. Example queries in relational
languages. Tech. Note # 107, Manufacture Belge de Lampes et de Materiel
Electronique, Brussels, Belgium, Jan. 1976, revised Sept. 1977.
22. Lipski, Jr., W. On semantic issues connected with incomplete
information databases. ACM Trans. Database Syst. 4, 3 (Sept. 1979),
268-296.
23. Merrett, T.H. Relations as programming language elements. Inform. Processing Lett., 6, 1 (Feb. 1977), 29-33.
24. Nijssen, G.M., Ed., Modelling in Database Management Systems. North-Holland Pub. Co., Amsterdam, 1976.
25. Nijssen, G.M., Ed., Architecture and Models in Database Management Systems. North-Holland Pub. Co., Amsterdam, 1977.
26. Pirotte, A. The entity-property-association model: An
information-oriented database model. Rep. R343, Manufacture Belge de
Lampes et de Materiel Electronique, Brussels, Belgium, March 1977.
27. Pirotte, A. Linguistic aspects of high-level relational
languages. Rep. R367, Manufacture Belge de Lampes et de Materiel
Electronique, Brussels, Belgium, Jan. 1978.
28. Reiter, R. On closed world data bases. In Logic and Data
Bases. H. Gallaire and J. Minker, Eds., Plenum Press, new York, 1978.
29. Rissanen, J. Independent components of relations. ACM Trans. Database Syst. 2, 4 (Dec. 1977), 317-325.
30. Rissanen, J. Theory of relations for databases – a tutorial
survey. proc. Symp. on Math. Foundations of Computer Sci., 1978,
Zacopane, Poland, Lecture Notes in Computer Science, Springer-Verlag,
pp. 536-551.
31. Roussopoulos, N., and Mylopoulos, J. Using semantic networks
for database management. Proc. Int. Conf. on Very Large Databases,
Sept. 1975.
32. Schmid, H.A., and Swenson, J.R. On the semantics of the
relational data model. Proc. ACM SIGMOD Conf. on Management of data,
San Jose, Calif., May 1975, pp.211-223.
33. Smith, J.M., and Smith, D.C.P. Database abstractions: Aggregation. Comm. ACM 20, 6 (June 1977), 405-413.
34. Smith, J.M., and Smith, D.C.P. Database abstractions:
Aggregation and Generalization. ACM Trans. Database Syst. 2, 2 (June
1977), 105-133. Есть русск. перевод: Д.М.Смит и Д.К.Смит. Абстракции
баз данных: Агрегация и обобщение. СУБД, # 2, 1996. – с. 141-160.
35. Sowa, J.F. Conceptual structures for a database interface. IBM J. Res. Develop. 20, 4 (July 1976), 336-357.
36. Sowa, J.F. Definitional mechanisms for conceptual graphs.
Proc. Int. Workshop on Graph Grammars, Bad Honnef, west Germany, Nov.
1978.
37. Stonebraker, M., Wong, E., Kreps, P., and Held, G. The design
and implementation of INGRES. ACM Trans. Database Syst. 1, 3 (Sept.
1976), 189-222.
38. Todd, S.J.P. The Peterlee relational test vehicle. IBM Syst. J. 15, 4 (1976), 285-308.
39. Ullman, J.D. Theory of Relational Databases. To appear.
40. Vassiliou, Y. Null values in data base management: A
denotational semantics approach. Proc. ACM SIGMOD 1979 Int. Conf. on
Management of Data, Boston, Mass., May 30-June 1, 1979.
41. Whitney, V.K.M. RDMS: A relational data management system.
Proc. Fourth Int. Symp. on Computer and Inform. Sci., Miami Beach,
Fla., Dec. 14-16, 1972, Plenum Press, New York.
42. Wiederhold, G., Database Design. McGraw-Hill, New York, 1977.
43. Wong, H.K.T., and Mylopoulos, J. Two views of data semantics:
A survey of data models in artificial intelligence and database
management. Informatics 15, 3 (Oct. 1977), 344-383.
44. Zaniolo, C. Analysis and design of relation schemata for
database systems. Tech. Rep. UCLA-ENG-7669, Ph.D. Th., Universitet of
California at Los Angeles, Los Angeles, Calif., July 1976.
45. Zaniolo, C., and Melkanoff, M.A. A formal approach to the
definition and design of conceptual schemas for database systems. To
appear in ACM Trans. Database Syst.
46. Zloof, M.M. Query-by-example: A data base language. IBM Syst.
J. 16, 4 (1977), 324-343. Есть русск. перевод.: М.М. Злуф.
Query-by_example: язык баз данных. СУБД # 3, 1996. – с. 149-160.
1) Э.Кодд, вероятно,
имел в виду подготавливаемую в то время к печати и вышедшую
в 1980 г. монографию Jeffrey D. Ullman: Principles of Database Systems.
Stanford University. Computer Science Press. Есть русск. пер.: Дж.
Ульман. Основы систем баз данных. – М.: Финансы и статистика, 1983. -
Прим. пер.
2) Заметим, что автор, таким образом, отождествляет далее термины
"характеристический (ассоциативный, стержневой) тип сущностей" и "тип
характеристических (ассоциативных, стержневых) сущностей". Поэтому мы
будем использовать обе эти группы терминов. – Прим. пер.
3) Имеются в виду измерения многомерного информационного пространства, поддерживаемого RM/T. – Прим. пер.
4) Здесь диграф – ориентированный граф (от англ. digraph=directed graph). – Прим. пер.
Назад Содержание