Arenadata DB — распределенная аналитическая БД для highload-проектов
Зачастую, облачные технологии не гарантируют той скорости отклика, которая необходима для работы с highload-системами. В этой статье мы рассмотрим решение, построенное на платформе VK Cloud Solutions.
Вышеупомянутая СУБД позволяет в кратчайшие сроки обслуживать большое число аналитических запросов к данным, однако данный режим функционирования повышает требовательность к производительности дисков: этой самой производительности должно быть достаточно для обеспечения быстрого отклика системы. В результате базу данных Arenadata развернуть в облаке не так уж просто: «под капотом» должны находиться быстрые диски, плюс должна присутствовать возможность выбора типа дисков в зависимости от нагрузок проекта — это важно для достижения необходимой скорости работы.
Быстрые и сверхбыстрые диски -- делаем правильный выбор
От чего зависит достаточная производительность дисков? Как правило, от того, какие именно запросы станут выполняться над данными, ну и, разумеется, от количества этих запросов. То есть невозможно с лету сказать, какая конкретно производительность дисковой подсистемы нужна будет на проекте, ведь итоговое значение будет зависеть от множества факторов.
Анализ исходных данных проекта позволит подобрать количество нод, объемы дисков, число процессоров, однако сама производительность определяется уже посредством тестов.
Что касается Arenadata DB, рекомендуется использовать один из следующих видов дисков:
1. Быстрые High-IOPS SSD
Это отказоустойчивые диски, которые используются повсеместно. Они имеют полосу пропускания и время отклика, подходящие для большинства случаев использования. Однако для слишком высоких нагрузок, возможностей этих дисков может и не хватить.
2. Сверхскоростные Low Latency NVMe
У них повышенная пропускная способность (как и величина IOPS), если сравнивать с High-IOPS SSD. При этом провайдер гарантирует время отклика дисковой подсистемы не более 0,5 миллисекунд при любых нагрузках. По сути, эти диски идеальны для сверхнагрузок. Их отказоустойчивость обеспечивается двумя инструментами: регулярным снапшотом дисков и RAID-режимом работы дисков NVME. То есть два этих инструмента обеспечивают отказоустойчивость и доступность данных фактически в любой момент, причем без задержки производительности.
Разница между вышеописанными дисками при объеме дисков 250 GB представлена в таблице ниже:
По материалам https://mcs.mail.ru/blog/.