Arenadata DB — распределенная аналитическая БД для highload-проектов | OTUS

Arenadata DB — распределенная аналитическая БД для highload-проектов

Зачастую, облачные технологии не гарантируют той скорости отклика, которая необходима для работы с highload-системами. В этой статье мы рассмотрим решение, построенное на платформе VK Cloud Solutions. Речь идет о запуске полностью управляемой Arenadata DB Cloud, для работы которой используют быстрые диски High IOPS SSD. Производительности этих дисков хватает для большинства программных приложений. Если же речь идет о системах с особо высокими нагрузками, когда время задержки важно минимизировать до десятых долей миллисекунды, то возможно подключение сверхбыстрых дисков Low Latency NVMe — наиболее подходящее решение для случаев, когда скорость отклика в максимальном приоритете.

default_opengraph_1-1801-9c098d.png

Вышеупомянутая СУБД позволяет в кратчайшие сроки обслуживать большое число аналитических запросов к данным, однако данный режим функционирования повышает требовательность к производительности дисков: этой самой производительности должно быть достаточно для обеспечения быстрого отклика системы. В результате базу данных Arenadata развернуть в облаке не так уж просто: «под капотом»‎ должны находиться быстрые диски, плюс должна присутствовать возможность выбора типа дисков в зависимости от нагрузок проекта — это важно для достижения необходимой скорости работы.

Быстрые и сверхбыстрые диски -- делаем правильный выбор

От чего зависит достаточная производительность дисков? Как правило, от того, какие именно запросы станут выполняться над данными, ну и, разумеется, от количества этих запросов. То есть невозможно с лету сказать, какая конкретно производительность дисковой подсистемы нужна будет на проекте, ведь итоговое значение будет зависеть от множества факторов.

Анализ исходных данных проекта позволит подобрать количество нод, объемы дисков, число процессоров, однако сама производительность определяется уже посредством тестов.

Что касается Arenadata DB, рекомендуется использовать один из следующих видов дисков:

1. Быстрые High-IOPS SSD

Это отказоустойчивые диски, которые используются повсеместно. Они имеют полосу пропускания и время отклика, подходящие для большинства случаев использования. Однако для слишком высоких нагрузок, возможностей этих дисков может и не хватить.

2. Сверхскоростные Low Latency NVMe

У них повышенная пропускная способность (как и величина IOPS), если сравнивать с High-IOPS SSD. При этом провайдер гарантирует время отклика дисковой подсистемы не более 0,5 миллисекунд при любых нагрузках. По сути, эти диски идеальны для сверхнагрузок. Их отказоустойчивость обеспечивается двумя инструментами: регулярным снапшотом дисков и RAID-режимом работы дисков NVME. То есть два этих инструмента обеспечивают отказоустойчивость и доступность данных фактически в любой момент, причем без задержки производительности.

Разница между вышеописанными дисками при объеме дисков 250 GB представлена в таблице ниже:

1-1801-dbdf09.png

По материалам https://mcs.mail.ru/blog/.

Не пропустите новые полезные статьи!

Спасибо за подписку!

Мы отправили вам письмо для подтверждения вашего email.
С уважением, OTUS!

Автор
0 комментариев
Для комментирования необходимо авторизоваться
Популярное
Сегодня тут пусто