Колоночные СУБД | OTUS

Колоночные СУБД

Среди NoSQL-систем управления базами данных следует выделить колоночные. Практика показывает, что это неплохой вариант для обработки больших данных. Колоночные СУБД характеризуются высокой производительностью, прекрасной масштабируемостью и эффективным сжатием данных.

В системах этого типа данные хранятся в качестве разреженной матрицы, в которой столбцы и строки применяются как ключи. Как и в таблице, семейство столбцов включает и строки, и столбцы. Однако существует четкое различие от таблиц: тут столбец не охватывает все строки, а содержится в строке. Значит это следующее: разные строки способны иметь разные столбцы.

Кроме столбцов, любая строка еще имеет и идентификатор -- ключ. Вдобавок к этому, любой столбец содержит имя, метку времени и значение. Если подытожить, то в колоночной БД данные тоже хранятся в таблице, но таблица эта по факту состоит из совокупности колонок, причем каждую из этих колонок, по сути, тоже можно назвать отдельной таблицей.

Как это может выглядеть, посмотрим ниже. На картинке синим выделены ключи, справа от ключей находятся столбцы. И если в реляционных СУБД любая запись должна иметь одинаковое количество столбцов, то в колоночных это совершенно необязательно.

db2_1-20219-086eed.png

Для чего все это надо? Ну, к примеру, в целях быстрого получения данных из БД для анализа. Допустим, вам надо извлечь из реляционной БД сумму среднего чека клиента. Для решения задачи вы будете искать это значение в каждой строке, тогда как в колоночной СУБД вы сможете сразу же забрать интересующую информацию из нужной колонки.

Среди наиболее известных баз данных вышеописанного типа можно вспомнить Cassandra.

1-20219-d02dc0.png

По материалам https://mcs.mail.ru/blog.

Не пропустите новые полезные статьи!

Спасибо за подписку!

Мы отправили вам письмо для подтверждения вашего email.
С уважением, OTUS!

Автор
0 комментариев
Для комментирования необходимо авторизоваться
Популярное
Сегодня тут пусто