Мифы про Count(1) vs Count(*) | OTUS

Мифы про Count(1) vs Count(*)

SQL_Deep_3.02-5020-df713a.png

Многие наверняка знают про то, что если написать Count(*) по таблице, получите количество строк в таблице. Довольно часто я встречаю мнение, что лучше писать Count(1), так как это будет использовать меньше ресурсов сервера, потому что вы указываете скалярное выражение вместо всех полей таблицы.

Так что же использовать?

SELECT COUNT(*)
FROM Sales.CustomerTransactions;
Или же 
SELECT COUNT(1)
FROM Sales.CustomerTransactions;

Возможно, когда-то для некоторых СУБД это было правдой и Count(1) экономил ресурсы, но не для SQL Server — даже в далёкой версии 2005 оба выражения работали одинаково эффективно.

Давайте в этом убедимся

Выполним запрос и посмотрим на актуальный план:

1-20219-2eef3b.png Видим, что план одинаковый и оптимизатор оценивает стоимость выполнения обоих запросов, как равную. Теперь посмотрим на часть по статистике ввода-вывода:

2-20219-3854a0.png

Количество сканирований и логических чтений для обоих запросов абсолютно идентично. Значит оба варианта равноценны по производительности для SQL Server. Обращаю внимание, что для других РСУБД результат может быть иной.

Миф о том, что Count(1) менее ресурсоёмкий возник довольно давно и связан с тем, что символ звездочка * указывает на выборку всех полей, а значит, логически подумав, можно предположить, что считать строки, используя все поля таблицы, будет значительно дороже, чем посчитать, используя скалярное выражение — 1.

Также есть ситуации, когда пишут Count(FieldName). В этом случае всегда нужно помнить, что если поле FieldName может содержать NULL, то Count проигнорирует такие строки, а значит и результат Count(*) и Count(FieldName) может быть разный.

А вы используете в своем проекте Count(1)? Пишите в комментариях!

Не пропустите новые полезные статьи!

Спасибо за подписку!

Мы отправили вам письмо для подтверждения вашего email.
С уважением, OTUS!

Автор
0 комментариев
Для комментирования необходимо авторизоваться
Популярное
Сегодня тут пусто