PostgreSQL FAQ

Данные Разработка Безопасность Инфраструктура Курсы и книги

2005 г.

Ответы на часто задаваемые вопросы по PostgreSQL

Дата последнего обновления: Понедельник 14 февраля 23:35:09 EST 2005

Английский вариант сопровождает: Брюс Момьян (Bruce Momjian) (pgman@candle.pha.pa.us)

Перевел на русский: Виктор Вислобоков (corochoone@perm.ru)

Самую свежую английскую версию документа можно найти на PostgreSQL.org.

Самая свежая версия русского перевода - на сайте linuxshare.ru

Ответы на вопросы специфичные для конкретных платформ можно найти на http://www.PostgreSQL.org/docs/faq/.

Общие вопросы

1.1) Что такое PostgreSQL? Как произносится это название?
1.2) Каковы авторские права на PostgreSQL?
1.3) На каких платформах работает PostgreSQL?
1.4) Где можно взять PostgreSQL?
1.5) Где получить поддержку?
1.6) Как мне сообщить об ошибке?
1.7) Какая версия последняя?
1.8) Какая документация имеется в наличии?
1.9) Как найти информацию об известных ошибках или отсутствующих возможностях?
1.10) Как научиться SQL?
1.11) Как присоединится к команде разработчиков?
1.12) Как сравнивать PostgreSQL с другими СУБД?

Вопросы пользователей по клиентской части

2.1) Какие интерфейсы есть для PostgreSQL?
2.2) Какие инструменты существуют для использования PostgreSQL через Web?
2.3) Есть ли у PostgreSQL графический интерфейс пользователя?

Вопросы администрирования

3.1) Как мне установить PostgreSQL в место отличное от /usr/local/pgsql?
3.2) Как мне управлять соединениями с других компьютеров?
3.3) Какие настройки мне нужно сделать для улучшения производительности?
3.4) Какие возможности для отладки есть в наличии?
3.5) Почему я получаю сообщение "Sorry, too many clients" когда пытаюсь подключиться к базе?
3.6) Почему необходимо делать dump и restore при обновлении выпусков PostgreSQL?
3.7) Какое компьютерное "железо" я должен использовать?

Вопросы эксплуатации

4.1) Как выполнить SELECT только для нескольких первых строчек запроса? Для произвольной строки?
4.2) Как мне найти какие таблицы, индексы, базы данных и пользователи существуют? Как мне увидеть запросы, которые использует psql для получения этой информации?
4.3) Как изменить тип данных колонки?
4.4) Каковы максимальные размеры для строк в таблице, таблиц и базы данных?
4.5) Как много дискового пространства в базе данных нужно для сохранения данных из обычного текстового файла?
4.6) Почему мои запросы работают медлено? Почему они не используют мои индексы?
4.7) Как посмотреть на то, как оптимизатор выполняет мой запрос?
4.8) Как мне выполнить поиск регулярного выражения и поиск независимый от регистра букв поиск регулярного выражения? Как мне использовать индекс для поиска независимого от регистра букв?
4.9) Как я могу определить, что значение поля равно NULL в каком-либо запросе?
4.10) Каковы отличия между разными символьными типами?
4.11.1) Как мне создать поле serial/с-авто-увеличением?
4.11.2) Как мне получить значение при вставке SERIAL?
4.11.3) Не может ли получиться так, что использование currval() и nextval() приведет к зациклированию с другими пользователями?
4.11.4) Почему числа из моей последовательности не используются снова при отмене транзакции? Почему создаются разрывы при нумерации в колонке, где я использую последовательность/SERIAL?
4.12) Что такое OID? Что такое TID?
4.13) Почему я получаю ошибку "ERROR: Memory exhausted in AllocSetAlloc()"?
4.14) Как мне узнать, какая версия PostgreSQL запущена?
4.15) Почему при работе с моим большим объектом я получаю ошибку "invalid large obj descriptor"?
4.16) Как мне создать колонку которая по умолчанию будет содержать текущее время?
4.17) Как выполнить внешнее связывание?
4.18) Как выполнять запросы, использующие несколько баз данных?
4.19) Как мне вернуть из функции несколько строк таблицы?
4.20) Почему я получаю ошибку "missing oid", когда обращаютсь к временным таблицам в функциях PL/PgSQL?
4.21) Какие опции шифрования существуют?

Расширения PostgreSQL

5.1) Я написал функцию определяемую пользователем. Когда я запускаю ее в psql, почему я получаю core dump?
5.2) Как я могу внести некоторые классные новые типы и функции в PostgreSQL?
5.3) Как мне написать C функцию, возвращающую строку таблицы?
5.4) Я изменил исходный файл. Почему после перекомпиляции я не вижу изменений?

Общие вопросы

1.1) Что такое PostgreSQL? Как произносится это название?

PostgreSQL произносится Post-Gres-Q-L (Пост-Грес-Кью-Эл), также часто говорят просто Postgres.

PostgreSQL - это объектно-реляционная система управления базами данных (СУБД), которая имеет традиционные возможности коммерческих СУБД с расширениями, которые есть в СУБД нового поколения. PostgreSQL - это свободное и полностью открытое программное обеспечение.

Разработку PostgreSQL выполняет команда разработчиков, разбросанная по всему миру и связанная через Интернет. Разработка является общественным проектом и не управляется какой-либо компанией. Подробности смотрите в FAQ для разработчиков, http://www.PostgreSQL.org/files/documentation/faqs/FAQ_DEV.html

1.2) Каковы авторские права на PostgreSQL?

PostgreSQL распространяется по классической лицензии BSD. Эта лицензия не содержит ограничений на то, как будет использоваться исходный код. Нам нравится эта лицензия и у нас нет намерений её менять.

Вот эта лицензия BSD, которую мы используем:

Система Управления Базами Данных PostgreSQL

Предоставляются права на использование, копирование, изменение и распространение данного программного обеспечения и его документации для любых целей, бесплатно и без подписания какого-либо соглашения, при условии что для каждой копии будут предоставлены данное выше замечание об авторских правах, текущий параграф и два следующих параграфа.

КАЛИФОРНИЙСКИЙ УНИВЕРСИТЕТ НЕ НЕСЕТ НИКАКОЙ ОТВЕТСТВЕННОСТИ ЗА ЛЮБЫЕ ПОВРЕЖДЕНИЯ, ВКЛЮЧАЯ ПОТЕРЮ ДОХОДА, НАНЕСЕННЫЕ ПРЯМЫМ ИЛИ НЕПРЯМЫМ, СПЕЦИАЛЬНЫМ ИЛИ СЛУЧАЙНЫМ ИСПОЛЬЗОВАНИЕМ ДАННОГО ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ ИЛИ ЕГО ДОКУМЕНТАЦИИ, ДАЖЕ ЕСЛИ КАЛИФОРНИЙСКИЙ УНИВЕРСИТЕТ БЫЛ ИЗВЕЩЕН О ВОЗМОЖНОСТИ ТАКИХ ПОВРЕЖДЕНИЙ.

КАЛИФОРНИЙСКИЙ УНИВЕРСИТЕТ СПЕЦИАЛЬНО ОТКАЗЫВАЗЫВАЕТСЯ ПРЕДОСТАВЛЯТЬ ЛЮБЫЕ ГАРАНТИИ, ВКЛЮЧАЯ, НО НЕ ОГРАНИЧИВАЯСЬ ТОЛЬКО ЭТИМИ ГАРАНТИЯМИ: НЕЯВНЫЕ ГАРАНТИИ ПРИГОДНОСТИ ТОВАРА ИЛИ ПРИГОДНОСТИ ДЛЯ ОТДЕЛЬНОЙ ЦЕЛИ. ДАННОЕ ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ ПРЕДОСТАВЛЯЕТСЯ НА ОСНОВЕ ПРИЦИПА "КАК ЕСТЬ" И КАЛИФОРНИЙСКИЙ УНИВЕРСИТЕТ НЕ ОБЯЗАН ПРЕДОСТАВЛЯТЬ СОПРОВОЖДЕНИЕ, ПОДДЕРЖКУ, ОБНОВЛЕНИЯ, РАСШИРЕНИЯ ИЛИ ИЗМЕНЕНИЯ.

1.3) На каких платформах работает PostgreSQL?

Обычно, PostgreSQL может работать на любой современной платформе совместимой с Unix. В инструкции по установке, вы найдете список тех платформ, на которых были проведены тестовые запуски PostgreSQL к моменту выхода данной версии.

Начиная с версии 8.0, PostgreSQL без всяких ухищрений работает на операционных системах Microsoft Windows, основанных на NT, таких как Win2000, WinXP и Win2003. Пакет инсталлятора доступен по адресу http://pgfoundry.org/projects/pginstaller. Версии Windows, основанные на MS-DOS (Win95, Win98, WinMe) могут запускать PostgreSQL с помощью Cygwin.

Также существует версия спортированная под Novell Netware 6 на http://forge.novell.com, и версия для OS/2 (eComStation)

1.4) Где можно взять PostgreSQL?

Например, воспользовавшись анонимным доступом на ftp сайт PostgreSQL ftp://ftp.PostgreSQL.org/pub. Список зеркал вы найдете на нашем основном сайте.

1.5) Где получить поддержку?

Сообщество PostgreSQL предоставляет помощь множеству пользователей через E-mail. Основной web-сайт для подписки на списки рассылки по E-mail это: http://www.postgresql.org/community/lists/. Хорошим местом для того, чтобы начать задавать вопросы являются списки general (общие вопросы) или bugs (ошибки).

Главным IRC каналом является #postgreql, расположенный на сервере Freenode (irc.freenode.net). Чтобы подключиться, вы можете использовать в Unix вызов программы irc -c '#postgresql' "$USER" irc.freenode.net или любой другой IRC клиент. На этом же сервере существуют каналы на испанском (#postgresql-es) и французском (#postgresqlfr) языках. Также существует канал по PostgreSQL на сервере EFNet.

Список коммерческой поддержки компаний доступен на http://techdocs.postgresql.org/companies.php.

1.6) Как мне сообщить об ошибке?

Посетите страничку со специальной формой отчёта об ошибке в PostgreSQL по адресу: http://www.postgresql.org/support/submitbug.

Также проверьте наличие более свежей версии PostgreSQL на нашем FTP сайте ftp://ftp.PostgreSQL.org/pub.

1.7) Какая последняя версия?

Последний выпуск PostgreSQL - это версия 8.0.1

Мы планируем выпускать новые версии каждые 10-12 месяцев.

1.8) Какая документация имеется в наличии?

PostgreSQL содержит много документации, включая большое руководство, страницы электронного руководства man и некоторые маленькие тестовые примеры. Смотрите в каталог /doc. Вы также можете просматривать документацию в Интернет по адресу http://www.PostgreSQL.org/docs.

Существует две книги по PostgreSQL доступные по адресам http://www.PostgreSQL.org/docs/books/awbook.html и http://www.commandprompt.com/ppbook/. Список книг по PostgreSQL, которые можно купить доступен по адресу http://techdocs.postgresql.org/techdocs/bookreviews.php. Кроме того, по адресу http://techdocs.PostgreSQL.org/ вы можете найти коллекцию технических статей посвященных PostgreSQL.

Клиент командной строки psql имеет несколько команд \d для отображения информации по типам, операторам, функциям, агрегатам и т.д. - используйте \? для получения списка доступных команд.

Наш сайт содержит еще больше информации.

1.9) Как найти информацию об известных ошибках или отсутствующих возможностях?

PostgreSQL поддерживает расширенный подкласс SQL-92. Смотрите наш список TODO на предмет известных ошибок, отсутствующих возможностей и будущих планов.

1.10) Как мне научиться SQL?

Книга по PostgreSQL на http://www.PostgreSQL.org/docs/books/awbook.html научит SQL. Существует другая книга по PostgreSQL на http://www.commandprompt.com/ppbook. Есть прекрасный учебник на http://www.intermedia.net/support/sql/sqltut.shtm, на http://ourworld.compuserve.com/homepages/graeme_birchall/HTM_COOK.HTM, и на http://sqlcourse.com.

Еще один учебник - это книга "Teach Yourself SQL in 21 Days, Second Edition" (Освой самостоятельно SQL за 21 день, Вторая редакция) на http://members.tripod.com/er4ebus/sql/index.htm

Многим из наших пользователей нравится книга The Practical SQL Handbook, Bowman, Judith S., et al., Addison-Wesley. Другим нравится The Complete Reference SQL, Groff et al., McGraw-Hill.

1.11) Как присоединится к команде разработчиков?

Для начала, скачайте последнюю версию исходных текстов и прочтите FAQ и документацию для разработчиков PostgreSQL на нашем сайте или в дистрибутиве. Затем, подпишитесь на списки рассылки pgsql-hackers и pgsql-patches. Далее, отправляйте исправления (patches) высокого качества в список pgsql-patches.

Существует ограниченный список людей, который имеют привелегию вносить изменения в CVS архив PostgreSQL. Каждый из этих людей в свое время отправил так много высококачественных исправлений, что их было невозможно оставить без внимания и они были удостоены превилегии вносить изменения, и мы уверены, что те исправления, которые они внесут будут высокого качества.

1.12) Как сравнивать PostgreSQL с другими СУБД?

Существует несколько методов сравнения программного обеспечения: возможности, производительность, надежность, поддержка и цена.

Возможности: PostgreSQL имеет большинство возможностей представленных в больших коммерческих СУБД, такие как: транзакции, подзапросы, триггеры, представления, ссылочной целостности вторичного ключа и разные блокировки. У нас есть некоторые возможности, которых нет у них: типы, определяемые пользователем, механизм наследования, правила и конкуретное многоверсионное управление для работы с содержимым блокировок.
Производительность: Производительность PostgreSQL сходна с другими коммерческими СУБД и с СУБД с открытым исходным кодом. В каких-то вещах мы быстрее, в каких-то медленнее. В сравнении с MySQL или линейной СУБД, мы быстрее, когда пользователей много, а также на сложных запросах и при чтении/записи загрузки запроса. MySQL быстрее для простых SELECT запросов, выполняемых небольшим количеством пользователей. И разумеется, MySQL не имеет каких-либо возможностей из перечисленых выше, в секции Возможности. Мы делаем упор на надежность и расширенные возможности, но мы также продолжаем увеличивать производительность с каждым выпуском.
Надежность: Мы понимали, что наша СУБД должна быть надежной или она ничего не будет стоить. Мы стараемся выпускать хорошо проверенный, стабильный код, который содержит минимум ошибок. Каждый выпуск проходит стадию бета-тестирования по крайней мере в течении одного месяца и наша история выпусков показывает что мы можем предоставлять стабильные, монолитные выпуски, которые готовы к продуктивному использованию. Мы верим, что мы производим проверку не хуже, чем у других СУБД.
Поддержка: Наш список рассылки предоставляет возможможность общения с большой группой разработчиков и пользователей, которые могут помочь решить любые возникшие проблемы. В то же время, мы не гарантируем какие-либо исправления, но и разработчики коммерческих СУБД не всегда делают исправления. Прямой доступ к разработчикам, сообществу пользователей, руководствам и исходным текстам часто делают поддержку PostgreSQL превосходящей другие СУБД. Существует коммерческая поддержка по результам возникших инцидентов, которая доступна для тех кому она нужна. (Смотрите Секцию 1.5.)
Цена: Наш продукт бесплатен как для коммерческого так, и не для коммерческого использования. Вы можете добавлять свой код в наш продукт без ограничений, за исключением тех, что описываются в нашей лицензии стиля BSD, которая приведена выше.

Вопросы пользователей по клиентской части

2.1) Какие интерфейсы есть для PostgreSQL?

Установка PostgreSQL включает только C и встроенный (embedded) C интерфейсы. Все другие интерфейсы являются независимыми проектами и загружаются отдельно; самостоятельность проектов позволяет им организовать собственное расписание выпусков новых версий и иметь собственную команду разработчиков.

Некоторые языки программирования, такие как PHP включают в себя интерфейс к PostgreSQL. Интерфейсы для таких языков как Perl, TCL, Python и многих других, доступны на http://gborg.postgresql.org в секции Drivers/Interfaces, а также через поиск в Интернет.

2.2) Какие инструменты существуют для использования PostgreSQL через Web?

Прекрасное введение во взаимодействие баз данных и Web можно найти на: http://www.webreview.com

Для интеграции с Web, PHP http://www.php.net является неплохим интерфейсом.

В сложных случаях, многие пользуются Perl и CGI.pm или mod_perl.

2.3) Есть ли у PostgreSQL графический интерфейс пользователя?

Да, существует несколько графических интерфейсов для PostgreSQL. Они включают PgAdmin III (http://www.pgadmin.org), PgAccess (http://www.pgaccess.org), RHDB Admin (http://sources.redhat.com/rhdb/), TORA (http://www.globecom.net/tora/ частично коммерческое ПО) и Rekall ( http://www.rekallrevealed.org/). Также есть PhpPgAdmin ( http://phppgadmin.sourceforge.net/) - интерфейс к PostgreSQL, основанный на Web.

Вопросы администрирования

3.1) Как мне установить PostgreSQL в место отличное от /usr/local/pgsql?

Задайте опцию --prefix когда запускаете configure.

3.2) Как мне управлять соединениями с других компьютеров?

По умолчанию, PostgreSQL разрешает только соединения на локальной машине через сокеты домена Unix или TCP/IP соединения. Для того, чтобы другие машины смогли подключиться к базе вы должны изменить listen_addresses в postgresql.conf, разрешить host-авторизация в файле $PGDATA/pg_hba.conf и перестартовать сервер.

3.3) Какие настройки мне нужно сделать для улучшения производительности?

Существует три главных области, которые потенциально могут увеличить производительность:

Изменение запроса

Это означает модификацию запросов для получения лучшей производительности:

Создание индексов, включая индексы выражений и частичные индексы
Использование COPY вместо множества INSERT
Группировка нескольких операторов в единую транзакцию для уменьшения нагрузки при выполнении завершения транзакции
Использование CLUSTER, когда из индекса берётся множество строк
Использование LIMIT для того, чтобы возвращалась только часть вывода от запроса
Использование Подготовленных (Prepared) запросов
Использование ANALYZE для обслуживания статистики оптимизатора
Регулярное использование VACUUM или pg_autovacuum
Удаление индексов во время больших изменений данных

Настройка сервера

Некоторые установки в postgresql.conf влияют на производительность. Подробный полный список установок см. в Administration Guide/Server Run-time Environment/Run-time Configuration, а комментарии см. в http://www.varlena.com/varlena/GeneralBits/Tidbits/annotated_conf_e.html и http://www.varlena.com/varlena/GeneralBits/Tidbits/perf.html.

Выбор "железа" - аппаратного обеспечения

Влияние "железа" на производительность подробно описано в http://candle.pha.pa.us/main/writings/pgsql/hw_performance/index.html и http://www.powerpostgresql.com/PerfList/.

3.4) Какие возможности для отладки есть в наличии?

Есть множество установок в настройках сервера, начинающихся на log_*, позволяющих протоколировать запросы и статистику работы процесса, которая очень полезна для отладки и измерения производительности.

Для предоставления более детальной информации разработчикам сервера при отладке какой-либо проблемы должны пользоваться следующие инструкции.

Таким же образом можно производить и отладку севера, если он работает неправильно. Во-первых, при запуске configure с опцией --enable-cassert, многие вызовы assert() позволяют отслеживать работу backend процесса и остановку программы при возникновении каких-либо неожиданностей.

Если postmaster не запущен, вы можете запустить postgres backend из командной строки и ввести ваш оператор SQL напрямую. Это рекомендуется только для целей отладки. Заметим, что в этом режиме, запрос завершается символом новой строки, а не точкой с запятой. Если вы производили компиляцию с отладочными символами, вы можете использовать любой отладчик, чтобы посмотреть, что случилось. Поскольку backend запускается не из postmaster, он не запускается в идентичном окружении и значит проблемы итераций блокировок/backend не могут быть воспроизведены.

Если postmaster запущен, запустите psql в одном окне, затем найдите PID процесса postgres, используемый psql, используя SELECT pg_backend_pid(). Используйте отладчик для подключения к postgres PID. Вы можете установить точки прерывания в отладчике и запустить запрос из psql. Если вы производите отладку запуска postgres, вы можете установить PGOPTIONS="-W n", и затем запустить psql. Эта опция приводит к задержке процесса запуска на n секунд, в течение которых вы можете подключить к процессу отладчик, установить любые точки прерывания и продолжить запуск.

Вы также можете скомпилировать PostgreSQL с профилированием для того, чтобы увидеть какие функции сколько времени выполняются. Файлы профилирования backend'а находятся в каталоге pgsql/data/base/dbname. Файл профилирования клиента будет помещен в текущий каталог клиента. В Linux для выполнения профилирования требуется компиляции с -DLINUX_PROFILE.

3.5) Почему я получаю сообщение "Sorry, too many clients" когда пытаюсь подключиться к базе?

Вы достигли установленного по умолчанию ограничения на 100 сессий подключения к базе данных. Вам необходимо увеличить для postmaster лимит на количество конкурентных backend процессов, изменив значение max_connections в файле postgresql.conf и перестартовать postmaster.

3.6) Почему необходимо делать dump и restore при обновлении выпусков PostgreSQL?

Разработчики PostgreSQL делают только небольшие изменения между подвыпусками. Таким образом обновление с версии 7.4 до 7.4.1 не требует выполнения dump и restore. Однако при выходе очередного выпуска (т.е. при обновлении например, с 7.3 на 7.4) часто меняется внутренний формат системных таблиц и файлов данных. Эти изменения часто носят комплексный характер, так что нет возможности обеспечить обратную совместимость файлов данных. Выполение dump позволяет получить данные в общем формате, который затем может быть загружен при использовании нового внутреннего формата.

В тех выпусках, где формат данных на диске не меняется, для проведения обновления может быть использован сценарий pg_upgrade без использования dump/restore. Комментарии к выпуску говорит когда можно использовать pg_upgrade для этого выпуска.

3.7) Какое компьютерное "железо" я должен использовать?

Поскольку "железо" персональных компьютеров является наиболее совместимым, люди склонны верить, что такое "железо" имеет одинаковое качество. Это не так. Память ECC, SCSI и качественные материнские платы являются более надёжными и имеют более лучшую производительность, чем менее дорогое "железо". PostgreSQL будет работать на любом "железе", но если для вас важны надёжность и производительность, то с вашей стороны будет мудро поставить соответствующее "железо". Обсудить разное "железо" можно в наших списках рассылки.

Вопросы эксплуатации

4.1) Как выполнить SELECT только для нескольких первых строчек запроса? Произвольной строки?

Для получения только нескольких строк, если вы знаете их количество на момент выполнения SELECT используйте LIMIT.

Если есть какой-либо индекс, который совпадает с ORDER BY, то возможно, что весь запрос выполнен и не будет. Если вы не знаете количества необходимых строк на момент выполнения SELECT, используйте курсор и FETCH.

To SELECT a random row, use:

    SELECT col
    FROM tab
    ORDER BY random()
    LIMIT 1;

4.2) Как мне найти какие таблицы, индексы, базы данных и пользователи существуют? Как мне увидеть запросы, которые использует psql для получения этой информации?

Чтобы просматривать таблицы в psql, используйте команду \dt. Полный список команд в psql вы можете получить, используя \?. Кроме того, вы можете посмотреть исходный код psql в файле pgsql/src/bin/psql/describe.c. Он содержит команды SQL которые генерируются при вводе в psql команд, начинающихся с обратной косой черты. Вы также можете запустить psql с опцией -E так, чтобы эта программа выдавала запросы, которые она использует для выполнения заданных вами команд. PostgreSQL также предоставляет SQL совместимый с INFORMATION SCHEMA интерфейс, с помощью которого, вы можете сформировать запрос на получение информации о базе данных.

Также существуют системные таблицы, начинающиеся с pg_.

Используйте psql -l для получения списка всех баз данных.

Также посмотрите файл pgsql/src/tutorial/syscat.source. Он показывает многие из операторов SELECT необходимых для получения информации из системных таблиц базы данных.

4.3) Как изменить тип данных колонки?

В 8.0 и более поздних версиях, изменение типа колонки выполняется очень легко через ALTER TABLE ALTER COLUMN TYPE.

В более ранних версиях сделайте так:

    BEGIN;
    ALTER TABLE tab ADD COLUMN new_col new_data_type;
    UPDATE tab SET new_col = CAST(old_col AS new_data_type);
    ALTER TABLE tab DROP COLUMN old_col;
    COMMIT;

4.4) Каковы максимальные размеры для строк в таблице, таблиц и базы данных?

Существуют следующие ограничения:

Максимальный размер базы? неограничен (существуют базы на 32 TB)

Максимальный размер таблицы? 32 TB

Максимальный размер строки? 1.6 TB

Максимальный размер поля? 1 GB

Максимальное количество строк в таблице? неограничено

Максимальное количество колонок в таблице? 250-1600 в зависимости от типа

Максимальное количество индексов в таблице? неограничено

Разумеется, понятие "неограничено" на самом деле ограничивается доступным дисковым пространиством и размерами памяти/своппинга. Когда значения перечисленные выше неоправдано большие, может пострадать производительность.

Максимальный размер таблицы в 32 TB не требует чтобы операционная система поддерживала файлы больших размеров. Большие таблицы хранятся как множество файлов размером в 1 GB, так что ограничения, которые накладывает файловая система не важны.

Максимальный размер таблицы и максимальное количество колонок могут быть увеличены в четыре раза, если размер блока по умолчанию будет увеличен до 32k.

4.5) Как много дискового пространства в базе данных нужно для сохранения данных из обычного текстового файла?

СУБД PostgreSQL может потребоваться дискового пространства до 5 раз больше для сохранения данных из простого текстового файла.

В качестве примера, рассмотрим файл в 100,000 строк в каждой, из которых целое число и текстовое описание. При этом длина текста, в среднем, составляет 20 байт. Размер простого файла составит 2.8 MB. Размер базы PostgreSQL, содержащей эти же данные составит приблизительно 6.4 MB из которых:

    32 байт: на каждый заголовок строки в таблице (приблизительно)
  + 24 байта: одно поле с целочисленным типом и одно текстовое поле
  +  4 байта: указатель на странице для всей табличной строки
   ----------------------------------------
    60 байт на строку в таблице

   Размер страницы данных в PostgreSQL составляет 8192 байт (8 KB), так что:

   8192 байт на страницу
   ---------------------   =  136 строк в таблице на страницу БД (округлённо)
     60 байт на строку в таблице

     100000 строк данных
   ----------------------- =  735 страниц в БД (округлённо)
   128 строк в таблице на страницу

   735 страниц БД * 8192 байт на страницу = 6,021,120 байт (6 MB)

Индексы не требуют так много, но поскольку они создаются для большого количества данных, они также могут быть велики.

Значения NULL хранятся как битовые карты и поэтому они занимают очень мало места.

4.6) Почему мои запросы работают медлено? Почему они не используют мои индексы?

Индексы не используются для каждого запроса автоматически. Они используются только если таблица больше минимального размера и запрос выбирает только маленький процент строк в таблице. Так устроено, потому что доступ к диску с применением рандомизации при сканировании индексов может быть медленнее, чем простое чтение таблицы или ее последовательное сканирование.

Чтобы определить необходимость использования индекса для какой-либо таблицы, PostgreSQL должен иметь статистику по этой таблице. Эта статистика собирается при использовании VACUUM ANALYZE или просто ANALYZE. Используя статистику, оптимизатор узнает о том как много строк в таблице и если он должен использовать индексы, то он может принимать лучшие решения. Статистика также влияет на определение оптимального порядка связывания и метода связывания. При изменении содержимого таблицы должен периодически выполнятся сбор статистики.

Обычно индексы не используются для ORDER BY или для выполнения связываний. Последовательный перебор следующий за явной сортировкой обычно быстрее, чем поиск по индексам в большой таблице. Однако, ORDER BY часто комбинируется с LIMIT и в этом случае индекс будет использоваться, поскольку при выполнении будет возвращаться небольшая часть таблицы. Фактически MAX() и MIN() не используют индексы, но индекс используется при построении запросов с ORDER BY и LIMIT:

    SELECT col
    FROM tab
    ORDER BY col [ DESC ]
    LIMIT 1;

Если вам кажется, что оптимизатор некорректно выбирает последовательный перебор, используйте SET enable_seqscan TO 'off' и запустите тесты, чтобы увидеть, не стало-ли сканирование индексов быстрее.

Когда используются операции с шаблонами, например LIKE или ~, индексы могут быть использованы в следующих случаях:

Начало строки поиска должно совпадать с началом искомой строки, т.е.:
- LIKE шаблоны не должны начинаться с %..
- ~ шаблоны регулярных выражений должна начинаться на ^.
Строка поиска не должна начинаться с символа класса, т.е. [a-e].
Поиск независимый от регистра, такой как ILIKE и ~* не использует индексы. Вместо него, используйте индексы выражений, которые описываются в секции 4.8.
Во время initdb должна использоваться локаль по умолчанию C, потому что не существует возможности узнать следующий наибольший символ для не-C локали. Вы можете для таких случаев создать специальный индекс text_pattern_ops который работает только для LIKE индексирования.

В выпусках до версии 8.0, индексы часто нельзя было использовать, если типы данных точно не совпадали с индексными типами колонок. Это особенно касалось int2, int8 и numeric индексов колонок.

4.7) Как посмотреть на то, как оптимизатор выполняет мой запрос?

Смотрите страницу руководства посвященную EXPLAIN.

4.8) Как мне выполнить поиск регулярного выражения и поиск независимый от регистра букв поиск регулярного выражения? Как мне использовать индекс для поиска независимого от регистра букв?

Оператор ~ производит поиск регулярного выражения, а оператор ~* производит независимый от регистра букв поиск регулярного выражения. Независимый от регистра вариант LIKE называется ILIKE.

Независимое от регистра сравнение обычно выражается так:

    SELECT *
    FROM tab
    WHERE lower(col) = 'abc';

Эта конструкция не будет использовать стандартный индекс. Однако, если вы создадите индекс выражения, он будет использован:

    CREATE INDEX tabindex ON tab (lower(col));

4.9) Как я могу определить, что значение поля равно NULL в каком-либо запросе?

Вы просто сравниваете значение с IS NULL и IS NOT NULL.

4.10) Каковы отличия между разными символьными типами?

Тип Внутреннее имя Замечания

VARCHAR(n) varchar размер задает максимальную длину, нет заполнения

CHAR(n) bpchar заполняется пустотой до фиксированной длины

TEXT text нет задаваемого верхнего ограничения или длины

BYTEA bytea массив байт переменной длины (можно использовать null-байт без опаски)

"char" char один символ

Тип	Внутреннее имя	Замечания
VARCHAR(n)	varchar	размер задает максимальную длину, нет заполнения
CHAR(n)	bpchar	заполняется пустотой до фиксированной длины
TEXT	text	нет задаваемого верхнего ограничения или длины
BYTEA	bytea	массив байт переменной длины (можно использовать null-байт без опаски)
"char"	char	один символ

Внутреннее имя вы можете увидеть, когда смотрите системные каталоги и в некоторых сообщениях об ошибках.

Первые четыре типа являются "varlena" типами (т.е., первые четыре байта на диске являются длинной, за которой следуют данные). Таким образом, фактически используемое пространство больше, чем обозначенный размер. Однако, эти типы данных также поддаются сжатию или могут быть сохранены не в строком виде через TOAST, так что занимаемое дисковое пространство может также быть и меньше, чем ожидалось.

VARCHAR(n) - это лучшее решение, когда нужно хранить строки переменной длины, не превышающие определенного размера. TEXT - это лучшее решение для строк неограниченной длины, с максимально допустимой длиной в 1 гигабайт.

CHAR(n) - это лучшее решение для хранения строк, которые обычно имеют одинаковую длину. CHAR(n) заполняется пустотой до заданной длины, в то время как VARCHAR(n) хранит только символы, из которых состоит строка. BYTEA используется для хранения бинарных данных, значения которых могут включать NULL байты. Все типы описанные здесь, имеют сходные характеристики производительности.

4.11.1) Как мне создать поле serial/с-авто-увеличением?

PostgreSQL поддерживает тип данных SERIAL. Он автоматически создает последовательность. Например:

    CREATE TABLE person ( 
        id   SERIAL, 
        name TEXT 
    );

автоматически транслируется в:

    CREATE SEQUENCE person_id_seq;
    CREATE TABLE person ( 
        id   INT4 NOT NULL DEFAULT nextval('person_id_seq'),
        name TEXT 
    );

Смотрите подробности о последовательностях на странице руководства посвященной create_sequence.

4.11.2) Как мне получить значение при вставке SERIAL?

Один из способов состоит в получении следующего значения SERIAL из объекта sequence с помощью функции nextval() перед вставкой и затем вставлять это значение явно. Используйте таблицу-пример в 4.11.1, пример в псевдоязыке покажет как это делается:

new_id = execute("SELECT nextval('person_id_seq')");
execute("INSERT INTO person (id, name) 
                 VALUES (new_id, 'Blaise Pascal')");

Затем вы должны также сохранить новое значение в переменной new_id для его использования в других запросах (например таких как внешний ключ для таблицы person). Заметим, что имя автоматически созданного объекта SEQUENCE будет <table>_<serialcolumn>_seq, где table и serialcolumn являются соответственно именами вашей таблицы и вашей колонки SERIAL.

В качестве альтернативы, вы можете получить назначенное значение SERIAL с помощью функции currval() после проведения обычной операции вставки, например

execute("INSERT INTO person (name) VALUES ('Blaise Pascal')");
new_id = execute("SELECT currval('person_id_seq')");

4.11.3) Не может ли получиться так, что использование currval() и nextval() приведет к зациклированию с другими пользователями?

Нет. currval() возвращает текущее значение, назначенное вашей сессией, а не другими сессиями.

4.11.4) Почему числа из моей последовательности не используются снова при отмене транзакции? Почему создаются разрывы при нумерации в колонке, где я использую последовательность/SERIAL?

Для реализации конкуретности, значения последовательностей, при необходимости выдаются во время запуска транзакций и не блокируются до полного выполнения транзакций. Это может вызывать разрывы в нумерации при отмене транзакций.

4.12) Что такое OID? Что такое TID?

Каждая, создаваемая в PostgreSQL табличная строка, получает уникальный индентификатор OID за исключением случая когда использовалось WITHOUT OIDS. OID - это автоматически назначаемое уникальное 4-х байтовое целое число. Однако, после того как его значение превысит 4 миллиарда, значения OID начинают дублироваться. PostgreSQL использует OID для связывания своих внутренних таблиц.

Для уникальных значений в колонках таблицы пользователя, лучшим способом является использование SERIAL вместо OID, потому что последовательности SERIAL уникальны только внутри таблицы и таким образом меньше подвержены переполнению. Для хранения значений 8-ми байтной последовательности доступен тип SERIAL8.

TID используется для идентификации специальных физических записей с блочными и offset значениями. TID изменяется после того как строки в таблице были изменены или перегружены.

TID используется индексными записями в качестве указателя на физические записи.

4.13) Почему я получаю ошибку "ERROR: Memory exhausted in AllocSetAlloc()"?

Предположительно у вас закончилась виртуальная память или что ваше ядро имеет маленький лимит на определенные ресурсы. Попытайтесь перед запуском postmaster выполнить следующие команды:

    ulimit -d 262144
    limit datasize 256m

В зависимости от командного интерпретатора shell, только одна из данных команд выполнится успешно, но она позволит вам установить больший сегмент данных процесса и возможно решит проблему. Эта команда изменяет параметры текущего процесса и всех его потомков, созданных после её запуска. Если у вас возникла проблема с SQL клиентом, потому что backend возвращает слишком большой объем данных, попытайтесь выполнить эту команду перед запуском клиента.

4.14) Как мне узнать, какая версия PostgreSQL запущена?

Из psql, наберите SELECT version();

4.15) Почему при работе с моим большим объектом я получаю ошибку "invalid large obj descriptor"?

Вам нужно при использовании большого объекта поместить в начале BEGIN WORK и в конце COMMIT, а внутри получившегося блока lo_open ... lo_close.

В настоящий момент PostgreSQL требует, чтобы при закрытии большого объекта происходило выполнение транзакции. Таким образом, первая же попытка сделать что-либо с большим объектом, не соблюдая данного правила приведет к сообщению invalid large obj descriptor, так как код выполняющий работу над большим объектом (по крайней мере в настоящий момент) будет генерировать сообщение об ошибке если вы не используете транзакцию.

Если вы используете такой интерфейс клиента как ODBC, вам возможно понадобится установить auto-commit off.

4.16) Как мне создать колонку которая по умолчанию будет содержать текущее время?

Используйте CURRENT_TIMESTAMP:

CREATE TABLE test (x int, 
               modtime TIMESTAMP DEFAULT CURRENT_TIMESTAMP );

4.17) Как мне выполнить внешнее связывание?

PostgreSQL поддерживает внешнее связывание, используя стандартный синтаксис SQL. Вот два примера:

    SELECT *
    FROM t1 LEFT OUTER JOIN t2 ON (t1.col = t2.col);

или

    SELECT *
    FROM t1 LEFT OUTER JOIN t2 USING (col);

Это идентичные запросы связывания t1.col и t2.col, также возвращают любые несвязанные строки в t1 (которые не совпадают с t2). RIGHT связывание должно добавить несвязанные строки t2. FULL связывание должно возвратить совпавшие строки плюс все несвязанные строки из t1 и t2. Слово OUTER является необязательным и назначается в LEFT, RIGHT и FULL связываниях. Обычные связывания называются INNER связывания.

4.18) Как выполнять запросы, использующие несколько баз данных?

Не существует способа создать запрос к базам данных отличным от текущей. Поскольку PostgreSQL загружает системные каталоги специфичные для базы данных, непонятно даже, как должен себя вести такой межбазовый запрос.

contrib/dblink позволяет запросы между базами, используя вызовы функций. Разумеется, клиент может одновременно также устанавливать соедиенения с различными базами данных и таких образом объединять информацию из них.

4.19) Как мне вернуть из функции несколько строк таблицы?

Вы можете легко использовать функции, возвращающие список, http://techdocs.postgresql.org/guides/SetReturningFunctions.

4.20) Почему я получаю ошибку "missing oid", когда обращаютсь к временным таблицам в функциях PL/PgSQL?

PL/PgSQL кэширует сценарии функции и один из негативных эффектов этого состоит в том, что если функция PL/PgSQL обращается к временной таблице и эта таблица позднее удаляется и пересоздается, а функция затем вызывается снова, то ее вызов приведет к ошибке, потому что скэшированное содержимое функции содержит указатель на старую временную таблицу. Чтобы решить эту проблему, используйте EXECUTE для доступа к временным таблицам в PL/PgSQL. Использование этого оператора заставит запрос перегенерироваться каждый раз.

4.21) Какие опции шифрования существуют?

contrib/pgcrypto содержит много функций шифрования для использования в SQL запросах.
Для шифрования передаваемых данных от клиента к серверу, на сервере в файле postgresql.conf, опция ssl должна быть установлена в true, в файле pg_hba.conf должна быть соответствующая запись host или hostssl и на стороне клиента sslmode не должен быть запрещён через disable. (Заметим, что также возможно использование независимых внешних шифрующих транспортов, таких как stunnel или ssh, вместо собственных SSL соединений PostgreSQL).
Пароли пользователей к базе данных автоматически шифруются, при сохранении в системных таблицах.
Сервер можно запустить, используя шифрованную файловую систему.

Расширения PostgreSQL

5.1) Я написал функцию определяемую пользователем. Когда я запускаю ее в psql, почему я получаю core dump?

Проблема может заключаться в нескольких вещах. Попытайтесь сперва протестировать вашу функцию в отдельной самостоятельной программе.

5.2) Как я могу внести некоторые классные новые типы и функции в PostgreSQL?

Отправьте ваши расширения в список рассылки pgsql-hackers и они по возможности будут помещены в подкаталог contrib/.

5.3) Как мне написать C функцию, возвращающую строку таблицы?

В версиях PostgreSQL, начиная с 7.3, функции, возвращающие таблицы полностью поддерживаются в C, PL/PgSQL и SQL. Подробности смотрите в Руководстве Программиста. Пример возвращающей таблицу функции, написанной на C, можно найти в contrib/tablefunc.

5.4) Я изменил исходный файл. Почему после перекомпиляции я не вижу изменений?

Файлы Makefile не имеют правильных зависимостей для include файлов. Вы должны выполнить make clean и затем make. Если вы используете GCC вы можете использовать опцию --enable-depend в configure чтобы поручить компилятору автоматически отслеживать зависимости.

Новости IT

17 июля 2026

GitHub добавила метрики использования Copilot на уровне репозиториев

17 июля 2026

Первые операционные спутники FireSat для обнаружения пожаров выведены на орбиту

17 июля 2026

Профсоюз Hyundai усиливает забастовку на фоне спора о роботах Atlas

17 июля 2026

Copilot для Windows получит экспериментальную диагностику ПК

17 июля 2026

TikTok тестирует инструмент для поиска ИИ-копий авторов

17 июля 2026

«Яндекс» опроверг заявление Грефа о зависимости от китайской модели Qwen

17 июля 2026

Chai Discovery привлекла $400 млн на ИИ-платформу для проектирования молекул

17 июля 2026

OpenAI предложила считать отдачу от корпоративного ИИ по стоимости успешной задачи

17 июля 2026

Опрос VentureBeat: 54% компаний уже сталкивались с инцидентами или почти инцидентами с ИИ-агентами

17 июля 2026

Databricks привлекает финансирование при оценке $188 млрд

17 июля 2026

Торвальдс отказался объявлять ядро Linux «анти-AI»-проектом

17 июля 2026

Маск купил APR Energy с парком мобильных турбин для ИИ-ЦОДов

17 июля 2026

Спрос на память для ИИ ударил по рынку смартфонов Индии

17 июля 2026

Сан-Франциско потребовал от Apple и Google удалить приложения для AI-«раздевания»

17 июля 2026

Google переименовала NotebookLM в Gemini Notebook и добавила кодовую среду для анализа данных

17 июля 2026

США запустили Gold Eagle для координации ИИ-поиска уязвимостей

17 июля 2026

Kimi анонсировала K3 с 2,8 трлн параметров и обещает открыть веса до 27 июля

17 июля 2026

Совет Федерации одобрил рамочный закон о регулировании ИИ в России

17 июля 2026

OpenAI признала риск удаления файлов в Codex на GPT-5.6

16 июля 2026

NVIDIA представила Cosmos 3 Edge для локального ИИ в роботах и расширяет коалицию Cosmos в Японии

Все новости →

Связь с редакцией

Максимальный размер базы?	неограничен (существуют базы на 32 TB)
Максимальный размер таблицы?	32 TB
Максимальный размер строки?	1.6 TB
Максимальный размер поля?	1 GB
Максимальное количество строк в таблице?	неограничено
Максимальное количество колонок в таблице?	250-1600 в зависимости от типа
Максимальное количество индексов в таблице?	неограничено