Applications of JAVA Programming Language to Database Management
SIGMOD Record, Web edition, March 1998
оригинал статьи можно найти по адресу
www.cs.umd.edu/areas/db/record/issues/9803/burton.ps
Bradley F. Burton, Victor W. Marek,
Department of Computer Science University of Kentucky
- Мотивация
- Реализация
- Пользовательский интерфейс
1. Мотивация
С самого начала язык Java позиционировался как язык программирования для использования в среде Web. На Java разрабатывалось много простых приложений (игры, часы, тикеры и т.д.) информативных, новаторских Web-узлов. Но следует заметить, что языковые компоненты и конструкции, первоначально внедренные в язык для расширения его функциональных возможностей как Web-ориентированного языка, могут применяться и в других областях. Язык Java обеспечивает разработчиков средствами, пригодными для создания новых сетевых приложений, приложений баз данных и графических пользовательских интерфейсов (GUI Graphical User Interface). Java и связанные с этим языком технологии, такие как API JDBC, драйверы JDBC, многопоточность и AWT обеспечивают поддержку разработки независимых от платформы и используемой базы данных приложений. Вот компоненты, которые играют важную роль при построении интерфейсов с базами данных:
- JDBC. Модуль Java Database Connectivity предоставляет
стандартизованное решение проблемы доступа к базам данных (JDBC
входит в пакет поставки Java начиная с версии 1.1).
- Java Threads. Java - это многопотоковый язык программирования.
Поддерживается возможность создания и выполнения нескольких
нитей (легковесных квази-процессов) при выполнении в то же время
нескольких разных задач.
- AWT. Набор инструментальных средств Abstract Window Toolkit
позволяет строить независимые от платформы графические
пользовательские интерфейсы.
Комбинация перечисленных компонентов составляет базовые
строительные блоки, используемые для разработки интерфейсов к
распределенным базам данных. Пакет Java Distributed Query
Dispatcher (JavaDQD) является независимым от платформы
GUI-приложением, позволяющим направлять запросы одновременно к
нескольким разнородным базам данных. В основе JavaDQD лежат
следующие идеи:
- JavaDQD устанавливает подключение к базе данных с
использованием API и драйверов JDBC. Использование API дает
возможность обеспечить единообразный доступ к любой базе данных,
поддерживающей драйвер JDBC. Тем самым, пользователь может
подключиться к любой такой базе данных. Например, для доступа к
базам данных Sybase используется драйвер FastForward, а для
доступа к базам данных MiniSQL - драйвер mSQL-JDBC. (Для
достижения требуемой функциональности mSQL-JDBC авторам пришлось
доработать.) По мере появления драйверов JDBC JavaDQD позволит
работать и с другими базами данных.
- В JavaDQD используются нити Java для обеспечения пользователей
возможностью одновременного подключения к нескольким базам
данных. Пользователь может задать запрос, касающийся нескольких
баз данных. В этом случае для каждой затрагиваемой глобальным
запросом базы данных запускается нить Java, получающая строку
запроса, обращающая к базе данных и в итоге получающая результат.
- В JavaDQD применяются AWT и другие компоненты для
предоставления пользователям интерфейса в стиле QBE
(Query-By-Example). Этот интерфейс создает единое виртуальное
окружение, в котором отображается информация обо всех текущих
подключениях. В результате пользователи в едином интерфейсе могут
запрашивать данные из разных баз данных так, как если бы это была
одна база данных.
2. Реализация
Методология, Java и JDBC
Для разработки JavaDQD использовался пакет Java Development Kit
(JDK) 1.1, выпущенный весной 1997 г. В состав JDK входят
компилятор и интерпретатор, а также модуль JDBC.
По мнению авторов, разработанный компанией SunSoft язык Java
является превосходным языком программирования. Язык относительно
прост, обладает свойствами объектной ориентированности,
распределенности и мобильности. Одно из наиболее важных свойств
языка состоит в обеспечении возможности создавать
платформо-независимые программы. Java-программа может быть
разработана в виде апплета, загружаемого через Internet и
запускаемого на стороне клиента, или в виде приложения, постоянно
находящегося на стороне клиента. В любом случае у программиста
имеется возможность с использованием встроенных классов и методов
получать доступ к удаленным данным Web-пространства и
использовать эти данные (текст, графические образы, звук) в своей
программе. Наличие JDBC позволяет Java-программисту подключаться
к удаленным базам данных и направлять к ним запросы.
JDBC - это пакет, обеспечивающий API для единообразного доступа к
различным источникам данных на основе языка баз данных SQL.
Реально API представляет собой набор абстрактных классов, которые
должны быть определены для конкретных источников данных. Поэтому
возможно абстрактное представление JDBC высокого уровня и
конкретное представление на низком уровне конкретной базы данных.
Представление высокого уровня дается JDBC API, в котором имеются
методы для подключения к нескольким базам данных, запросов и
манипулирования данными. Конкретное представление заставляет
интерпретировать JDBC как набор абстрактных классов, которые
должны быть реализованы для конкретной базы данных. Такая
реализация, называемая драйвером JDBC, должна быть обеспечена,
чтобы Java-программист мог получить доступ к базе данных. После
реализации драйвера для конкретного источника данных это драйвер
становится абстрактным обработчиком SQL-операторов, детали
реализации которого скрыты и доступ к которому возможен через
высокоуровневый API.
Распределенный подход
Распределенные запросы реализуются в JavaDQD с использованием
нитей Java и пре- и пост-обработки. Вкратце, методология состоит
в следующем.
- Запрос пользователя подвергается пре-обработке для создания
строк запросов. Должны быть выявлены строки запросов, требуемые
для направления локального запроса каждой из участвующей в общем
запросе базе данных. Аналогично, требуется сконструировать
финальную строку запроса, чтобы собрать окончательный результат
общего запроса.
- Для каждой полученной строки локального запроса образуется
нить. В каждой нити ее строка запроса используется для запроса
соответствующей базы данных, а получаемый результат помещается во
временную базу данных. Позже из таблиц временной базы данных
будет произведена выборка в соответствии с финальной строкой
запроса. В реализации нитей используются методы
ResultSetMetaData, позволяющие определить типы данных и размеры
столбцов новой таблицы, создаваемой во временной базе данных.
- Ожидается завершение выполнения всех нитей.
- Производится выборка из временной базы данных по строке
финального запроса. Результаты запроса отображаются в окне
пользователя.
Пользователю JavaDQD не требуется знать о подключениях к
индивидуальным базам данных. Использование API и драйверов JDBC
позволяет сделать прозрачной для пользователей распределенную
природу запросов. Ответственность за безопасность несут драйверы
JDBC.
3. Пользовательский интерфейс
Пользовательский интерфейс JDBC дает возможность строить
распределенные запросы в графической среде таким образом, что
несколько запрашиваемых баз данных представляются как одна база
данных. От пользователей не требуется знание схемы каждой
подключаемой базы данных. JavaDQD анализирует метаданные этих баз
данных и предоставляет пользователям информация об их схемах.
Диалог подключения к базе данных дает возможность подключиться к
локальным или удаленным базам данных и к временной базе данных.
Для выполнения подключения требуется указать URL базы данных и,
если это требуется, имя пользователя и пароль. В URL базы данных
указываются драйвер JDBC, источник данных и порт базы данных. Для
упрощения действий URL и имя пользователя могут быть сохранены в
конфигурационном файле, загружаемым во время инициализации
JavaDQD.
Для формулировки запросов и манипулирования данными используется
интерфейс в стиле QBE, при разработке которого использованы
средства GUI Java и MCT (Microline Component Toolkit). Компоненты
GUI и наличие в JDBS API возможности зондирования схемы базы
данных дают возможность динамического построения QBE-подобного
интерфейса после подключения к базе данных. Интерфейс дает
возможность создания и уничтожения объектов базы данных, а также
выборки, занесения, модификации и удаления строк таблиц.
Интерфейс создания таблицы состоит из трех основных компонентов.
Во-первых, выдается список всех текущих баз данных. Пользователь
может выбрать базу данных, в которой будет создана новая таблица.
Во-вторых, выдается текстовое поле для ввода имени новой таблицы.
В-третьих, выдается решетка, в которой можно определить столбцы
таблицы: имя столбца, поддерживаемый тип данных и длину столбца.
Поддерживаемые типы данных определяются динамически путем
зондирования схемы выбранной базы данных.
Интерфейс выборки позволяет пользователям выбрать данные из
распределенной базы данных. Эти данные затем показываются во
фрейме результата. Интерфейс выборки показывает список доступных
таблиц, из которых могут быть выбраны данные. Этот список
включает все таблицы всех баз данных, к которым к этому времени
существуют подключения. Для идентификации таблицы используется
URL и имя таблицы. После выбора таблицы конструируется решетка
выборки для указания критерия, которому должны соответствовать
результирующие данные. Через строку view можно указать, какие
столбцы должны содержаться в результате. Кроме того, можно ввести
пример того, как должна выглядеть строка результата. Для задания
условия на значения столбца можно использовать предикаты =, <, >,
<=, >=, LIKE и <> и литеральные значения (строки символов и
числа). Условия, задаваемые в одной строке рассматриваются как
конъюнктивные; условия, задаваемые в разных строках, составляют
дизъюнкцию конъюнктов. Наконец, если из числа возможных таблиц
выбираются две или более таблицы, но на экране появляется строка
соединения, позволяющая задать условие соединения.
Отмечая удобство использования средств Java и JDBC для разработки
интерфейсов для доступа к базам данных, авторы указывают на ряд
ограничений, имеющихся в их реализации JavaDQD. В основном эти
ограничения сводятся к некоторым особым требованиям, которым
должны удовлетворять драйверы ODBC.