Особенности индексов в PostgreSQL
PostgreSQL — система, которая была унаследована от команды Майкла Стоунбрейкера и его учеников и аспирантов в Массачусетском технологическом институте. Многие решения, заложенные в PostgreSQL, опередили время и были очень удачными, что и привело к успеху разработки.
Поговорим об особенностях индексов в PostgreSQL и тем, что их отличает от других РСУБД. Речь пойдёт о стандартных для реляционных СУБД B-tree индексах: 1. Индексы, строго говоря, являются B+ деревом, что даёт возможность прочитать страницы одного уровня, не возвращаясь каждый раз по иерархии к корневому узлу. 2. Индексы в СУБД PostgreSQL не содержат ссылку на кластерный индекс или первичный ключ, как в некоторых других (MySQL, MS SQL Server). Вместо этого, индекс в PostgreSQL содержит указатель на строку таблицы на диске (TID). 3. Ещё одно отличие индексов в PostgreSQL: индекс не содержит информации об актуальной версии, поэтому нет возможности вычитать все данные и вернуть пользователю из индекса, даже если в SELECT выбираются только поля, входящие в индекс. Всё равно необходимо обращение к основной таблице, чтобы получить информацию об актуальных строках и вернуть их в результатах запроса.
Эти особенности важно учитывать при планировании и создании индексов для БД, а также анализировать, насколько индекс используется и используется ли вообще, ведь иногда оптимизатор имеет своё мнение, которое может сильно отличаться от замысла автора запроса и индекса.
Подробнее можно почитать здесь: 1. Цикл Егора Рогова на Хабре. 2. Laurenz Albe Get rid of your unused indexes.