1999 г
Ключевой темой июньского номера журнала являются средства и методы автоматизации настройки систем баз данных и основанных на них приложений. Это очень актуальная тема, поскольку постоянно возрастающая сложность систем и приложений делает чрезвычайно трудной работу по администрированию и сопровождению. Не случайно редактором этого номера является Сураджит Чаудхари из Microsoft, один из наиболее активных сотрудников лаборатории баз данных, поскольку в MS SQL Server 7.0 действительно много сделано в этом направлении. Материал номера кажется мне очень интересным и поучительным.
Bulletin of the Technical Committee on
Data Engineering
June 1999, Vol. 22, No. 2
Toward Self-Tuning Memory Management for Data Servers
Gerhard Weikum, Arnd Christian Konig
University of Saarland, D-66041 Saarbrucken, Germany
{weikum, koenig}@cs.uni-sb.de
Achim Kraiss
Dresden Bank AG, D-60301 Frunkfurt, Germany
achim.kraiss@dresdner-bank.com
Markus Sinnwell
SAP AG, D-69185 Walldorf, Germany
markus.sinnwell@sap-ag.de
Постоянное возрастание объемов памяти в компьютерах не означает отсутствия проблем с памятью в различных серверах данных. Указываются три основных причины, по которым эффективность серверов может страдать из-за проблем, связанных с памятью:
- Серверы (операционные системы, системы баз данных, брокеры объектных заявок, серверы приложений) являются сложными программными продуктами. Часто они разрабатываются очень быстро, в соответствии с требованиями рынка, и не включают средств оптимизации использования памяти.
- Типичный современный сервер данных работает в многопользовательском режиме, распределяя ресурсы между процессами выполнения запросов, транзакций, хранимых процедур и Web-приложений. Часто в конкуренции за память участвуют требующие многих ресурсов запросы, относящиеся к области поддержки принятия решений.
- Неограниченно возрастают объемы данных, с которыми приходится иметь дело серверам. Это связано и с повышающейся популярностью мультимедийных данных (графические образы, звук, видео и т.д.), и с распространением исторических баз данных, требуемых для оперативной аналитической обработки.
В статье приводится обзор методов "самонастройки" серверов для оптимизации использования памяти. Главным образом обсуждаются различные методы кэширования данных в основной памяти: автоматическое кэширование на стороне сервера, настройка кэширования, использование рапспределенной памяти, особенности кэширования в Web-серверах. Рассматриваются подходы, применяемые в конкретных современных серверах данных.
DB2 Universal Database Performance Tuning
Berni Schiefer, Gary Valentin
{schiefer,valentin}@ca.ibm.com
IBM Toronto Lab, 1150 Eglinton Avenue East
Toronto, Ontario, Canada M3C-1H7
IBM DB2 Universal Database является одним из самых зрелых серверных продуктов управления реляционными базами данных, основываясь на ряде передовых исследовательских проектов компании (System R, R*, Starburst). В статье приводится краткий обзор процесса настройки системы. Обсуждаются методы организации хранения данных и современные средства администрирования, основанные на использовании Java. Приводится введение в средства автонастройки DB2 Universal Database.
Статья начинается с рассмотрения принципов конфигурирования аппаратуры. Обсуждаются подходы к распределению дисковой памяти с учетом возможности использования разного рода дисковых массивов (RAID). Далее в связи с этой темой описываются базовые идеи физического проектирования баз данных (размещение таблиц, загрузка данных, создание индексов и поддержание статистики). В разделе, посвященном средствам автонастройки, наибольший интерес представляет механизм поддержки правильного выбора набора индексов Index Advisor. Наконец, в заключение статьи приводится краткая сводка возможностей администратора баз данных, применение которых полезно в особо сложных ситуациях, когда автоматическая настройка становится недостаточной.
Self-Tuning Technology in Microsoft SQL Server
Surajit Chaudhuri, Eric Christensen, Goetz Graefe, Vivek Narasayya, Michael Zwilling
Microsoft Corporation
One Microsoft Way, Redmond, WA, 98052
Email Contact: surajitc@microsoft.com
Статья посвящена рассмотрению средств самонастройки, облегчающих работу администратора баз данных в среде Microsoft SQL Server 7.0. Статья начинается с обсуждению одного из наиболее интересных новых средств, появившихся в составе MS SQL Server 7.0, - Index Tuning Wizard. Это средство основано на использовании информации о рабочей загрузке базы данных (потоке запросов на выборку данных и их обновлению). Наиболее важным результатом, производимым Index Tuning Wizard, является список рекомендуемых индексов. В следующем разделе описываются возможности самонастройки, имеющиеся в компонентах управления памяти и обработки запросов MS SQL Server 7.0. По поводу управления памятью обсуждаются применяемые алгоритмы кэширования. В число новых приемов обработки запросов входят развитые методы сбора и обработки статистики в целях оптимизации запросов. Наконец, в заключительном разделе статьи обсуждают возможности самонастройки, применяемые в ядре MS SQL Server 7.0 - Storage Engine, отвечающем за поддержку методов доступа, управление мультидоступом, буферизацию, восстановление и т.д. Здесь возможности самонастройки главным образом связаны с увеличением эффективности использования ресурсов.
Performance Challenges in Object-Relational DBMSs
Muralidhar Subramanian, Vishu Krishnamurthy
Oracle Corporation
Redwood Shores
CA 94065
В статье обсуждаются основные проблемы, связанные с эффективным управлением данными в объектно-реляционных СУБД (ОРСУБД). В первом из основных разделов статье рассматриваются достоинства и недостатки двух способов хранения объектных данных: в виде бинарных данных и в виде строк таблиц. Отмечается, что второй способ позволяет лучшим способом использовать методы индексации, обеспечивает больший уровень параллелизма и более тонкие методы журнализации. Следующий раздел посвящен управлению данными, специфичными для приложений (графика, карты, видео- и аудио данные и т.д.). Невозможно реализовать в одном сервере баз данных все потенциально требуемые механизмы индексации. Поэтому ОРСУБД должна быть расширяемой, обеспечивая средства для определения новых типов индексов. Далее речь идет об обработке навигационных запросов (с использованием ссылок между объектами). Обсуждаются возможности преобразования таких запросов в запросы с внешними соединениями. В следующем разделе в связи с наличием у объектов методов подчеркивается важность поддержки функциональных индексов. В последнем разделе статьи кратко рассматриваются проблемы кэширования объектов, управляемых ОРСУБД, на стороне клиента.
Performance Tuning for SAP R/3
Alfons Kemper, Donald Kossmann, Bernhard Zeller
University of Passau, Germany
http://www.db.fmi.uni-passau.de
SAP R/3 является одним из наиболее развитых продуктов категории ERP (Enterprise Resource Planning). Система основана на трехзвенной архитектуре "клиент/сервер":
- Уровень представления обеспечивает графический пользовательский интерфейс на PC, связанных с серверами приложений через локальную или глобальную сеть.
- На прикладном уровне выполняются предопределенные или определяемые пользователями приложения категорий OLTP или OLAP. Обычно серверы приложений связываются с сервером баз данных через локальную сеть.
- На уровне баз данных функционирует один из коммерческих серверов баз данных (например, Adabas D, IBM UDB, Informix Dynamic Server, Microsoft SQL Server или Oracle8).
Приложения для SAP R/3 пишутся на интерпретируемом языке четвертого поколения ABAP/4 (Advanced Business Application Language). За исключением небольшого ядра, вся система R/3 написана на ABAP/4. Для доступа к базам данных в ABAP/4 поддерживаются два интерфейса: Native SQL и Open SQL. Для управления транзакциями (LUW - Logical Unit of Work - в терминологии SAP) компанией реализован собственный монитор транзакций. Для использования в режиме обработки транзакций R/3 включает возможности настройки компонентов управления памятью и кэширования данных на серверах приложений. Имеются две собственные возможности оптимизации запросов к базам данных (при использовании Open SQL): кэширование курсора и кэширование данных. В R/3 имеются также развитые средства мониторинга и оценки производительности.
Tuning Time Series Queries in Finance:
case studies and recommendations
Dennis Shasha
Courant Institute of Mathematical Sciences
Department of Computer Science
New York University
shasha@cs.nyu.edu
http://cs.nyu.edu/cs/faculty/shasha/index.html
В статье практически нет речи о "настройке запросов". В первой части статьи ("case studies") рассматривается несколько примеров запросов, типичных для финансовой деятельности. Вторая часть ("recommendations") содержит предложения по расширению реляционного подхода к управлению базами данных с тем, чтобы можно было работать не только со множествами, но и с последовательностями.