SQL – язык запросов. Он позволяет работать с базами данных в различных СУБД. Наиболее распространенной системой управления является MySQL. Она проста в освоении и подойдет как новичкам, так и более опытным разработчикам.

При работе с таблицами в базах данных используются специальные команды. Они позволяют выполнять такие действия, как выборка, сортировка и пр. Особое внимание следует уделить оператору group by в SQL. Далее он будет изучен более подробно. Эта информация пригодится не только начинающим, но и уже продвинутым программистам, а также системным администраторам.

Описание

Предложения Group By отвечают за группировку. При помощи таких запросов в SQL можно сопоставлять строки. Они встречаются в операциях с агрегатными функциями (Min, AVG, SUM, Count и Max).

Функция group by в языке SQL будет сообщать системе, как агрегировать данные в неагрегированном столбце, который был запрошен пользователем. Он используется для распределения строк – результата запроса по группам. Группировка данных в SQL при помощи соответствующей команды может осуществляться как по одному параметру, так и по нескольким одновременно.

Подготовка к работе

Чтобы лучше понять, как работает упомянутый оператор, рекомендуется рассматривать процесс на наглядных примерах. Для этого придется провести небольшую предварительную подготовку. Она заключается в создании исходной таблицы с информацией. Пусть она называется sales и отображает простое представление продаж в магазинах. В ней будут поля:

  • название локации (место);
  • имя продукта;
  • стоимость;
  • время продажи.

Для работы с группировкой в SQL-запросах типы полей в столбцах будут простыми TEXT (текстовыми). В уже существующем приложении обычно используются внешние ключи к другим таблицам.

Группировка в SQL

Выше – описание таблицы, которую предстоит использовать далее для изучения принципов функционирования group by.

В предложенном примере имеются три локации: HQ, 1st Street и Downtown. Здесь поддерживаются всего два продукта – кофе (coffee) и бублики (bagel). Продажи будут вноситься с разными значениями sold_at. Это требуется для демонстрации количества продукции, проданной в различные дни и время.

Примеры, рассмотренные далее, будут отображать реализацию продукции «сегодня», «вчера», «позавчера».

Принцип работы оператора

Рассматривая примеры использования group by, необходимо понимать, как функционирует соответствующая команда. Рекомендуется для этого изучить жизненный случай.

Дана комната, в которой много людей. Они родились в самых разных странах. Требуется вычислить средний рост людей в разрезе по месту рождения. Для этого сначала происходит разделение людей на группы по странам, из которых они прибыли. Только после этого удастся рассчитать средний рост в каждом сформированном «классе».

Аналогичным образом функционирует рассматриваемый оператор. Теперь ясно, как работает group by. Эта функция группирует информацию по строкам. Сначала нужно определить, как будет осуществляться классификация. После – произвести необходимые вычисления или агрегации.

Форма записи

Предложение Group By будет зависеть от непосредственного использования группирования. Общая форма записи следующая:

   SELECT название_столбцов 

   FROM имя_имеющейся_таблицы

   [WHERE необходимые условия для выборки полей]

   GROUP BY имена_стоблцов_в_таблице

 Если необходимо вывести всего один столбец, по которому осуществляется группировка, оператор будет выбирать уникальные значения. Дубликаты из результирующей таблицы убираются. В данном случае group by функционирует точно также, как и ключевое слово DISTINCT.

Множественные группы

Рассматриваемый оператор позволяет группировать информацию в самое разное количество групп и подгрупп. Представленные при помощи group by примеры далее наглядно продемонстрируют соответствующие операции.

Предложения группировки в SQL применяются тогда, когда можно использовать такие обороты как:

  • по чему-то;
  • в каждом.

Примеры – людей можно разделить по среднему росту по стране рождения, а также выяснить общее количество лиц в каждом «классе» с тем или иным цветом волос. В случае с подготовленной ранее таблицей администратор способен уточнить общее количество продаж по каждому продукту.

Примеры работы

Далее будут приведены несколько наглядных примеров использования group by в программном коде. Сам оператор составляется легко: достаточно указать соответствующее ключевое слово и прописать поля, по которым осуществляется группировка:

Группировка в SQL

В Select as размещают описание локации. Данные будут группироваться по соответствующему столбцу. Чтобы увидеть имена созданных групп, необходимо воспользоваться следующей записью group by:

Группировка в SQL
Группировка в SQL

Если посмотреть на необработанную часть таблицы, можно заметить 4 строчки с локацией HQ, две – с Downtown и 1st street.

Группировка в SQL

При grouping by location база возьмет соответствующие входные строки и определит среди них уникальные локации. Они будут выступать в виде «групп», по которым осуществляется дальнейшая классификация.

Если выбрать столбец product, команда будет несколько иной:

Группировка в SQL

Результатом станет ошибка:

Группировка в SQL

Связано это с тем, что 8 строк, имеющихся в базе, при помощи group by пользователь попытался «поместить» в 3. Оставшиеся столбцы не получится возвращать просто так. Для применения всех данных из таблицы необходимо выделить соответствующую информацию из «остатка» в три локационные groups. Это значит, что сведения должны быть или агрегированы, или над ними обязательно выполняются вычисления для вывода результирующих данных.

Агрегатные функции

Далее предстоит рассмотреть несколько примеров с агрегатными функциями относительно group by. Каждая запись в sales – это информация об одной продаже. Это значит, что число продаж по локации = строки в каждой группе при разделении по локациям.

Для получения информации о том, сколько в каждом «месте» было продано продукции, используется такая запись с group by:

Группировка в SQL

При помощи count вычисляется количество строк в каждой группе. С выражениями команда тоже совмещается.

База выполняет запрос так:

  • from sales – получение всех записей из таблицы sales;
  • group by location – определение уникальных групп по типу локаций;
  • select… – выбор имени «места» и счет количества строк в группе.

Для вывода информации в читабельной форме, количество строк (результат) будет иметь псевдоним as number_of_sales. Итоговая таблица предлагает две колонки:

Группировка в SQL

Сумма

Sum – команда, которая помогает при помощи group by суммировать информацию. Пример – расчет общей выручки в каждом городе:

Группировка в SQL
Группировка в SQL

Выше – пример обработки соответствующего запроса.

Среднее значение

Для расчета среднего значения в group by необходимо пользоваться AVG:

Группировка в SQL

Вот – пример средней суммы выручки.

Несколько групп

Чтобы разделить группы на подгруппы достаточно добавить к предложению group by второе условие классификации:

Группировка в SQL

Результат может быть возвращен при помощи select. Order by добавлено для удобства:

Группировка в SQL

Вот пример продаж по каждому продукту:

Группировка в SQL

Ничего трудного в процессе нет. Но group by может работать с функциями.

Использование функций

Можно попытаться найти общее количество продаж в день. Для этого используется шаблон, который применялся со столбцом sold_at:

Группировка в SQL

Для получения данных в нужном формате необходимо конвертировать значения даты и времени для каждой записи в обычную дату. После – все записи о продажах, совершенных в один и тот же день, отнести к одной «общей» группе.

Группировка в SQL

Здесь можно увидеть больше примеров использования изученного оператора. Прокачать навыки работы с базами данных можно на курсах Otus.