Расширяем PostgreSQL с помощью Rust

Свободная система управления базами данных PostgreSQL не только предоставляет высокопроизводительный движок для выполнения запросов, но и может быть расширена с помощью расширений, которые могут добавлять новые типы данных, дополнительные типы индекса и возможности поиска, сбор статистики, поддержку новых языков для встроенных функций и многое другое. В этой статье мы рассмотрим один из возможных вариантов по созданию собственного расширения для PostgreSQL с использованием библиотеки pgx. Читать


Представляем вашему вниманию Artie Transfer

Будучи активным пользователем хранилища данных (DWH) на разных ролях, я всегда находил определенные ограничения в связи с задержкой данных между нашим DWH и данными, которые находятся в онлайновых транзакционных (OLTP) базах данных. В зависимости от того, где я работал, задержка составляла от нескольких часов до суток (дней), причем более крупные компании, как правило, работали медленнее. Читать далее


Сравнение MySQL и PostgreSQL в 2023 году

PostgreSQL и MySQL — это надежные, безопасные и масштабируемые базы данных, которые существуют уже много лет. Каждая из них имеет уникальные сильные и слабые стороны, что делает какую‑либо из них более подходящей для конкретных нужд. В этой статье мы проведем их сравнение, чтобы помочь с принятием обоснованного решения в 2023 году. Перейти к статье


Проектирование реляционных баз данных: основные принципы

Представьте, что у вас есть огромная база с данными, и вы должны ее грамотно поддерживать и обновлять. Как вы будете организовывать все эти данные? Ведь вы не просто должны их просто хранить, но и легко извлекать, изменять, удалять и т.д. Именно здесь и приходит на помощь знание принципов проектирования реляционных баз данных, эти знания позволяют организовать вашу базу данных таким образом, чтобы минимизировать ошибки и неэффективность запросов, а также упростит ее поддержку в будущем. Продолжение


Безопасность в базах данных

Безопасность баз данных — это как щит, защищающий сокровища, которые хранятся внутри. Изначально базы данных были направлены на сбор и хранение данных. Это стало крайне удобным инструментом, позволяющим легко и быстро получать и обрабатывать информацию. Однако, с появлением многих проблем, связанных с безопасностью БД, мы должны обеспечить надежную защиту нашей информации. Читать полностью


Дисперсионный анализ (ANOVA)

Дисперсионный анализ (ANOVA) — это статистический метод, который используется для сравнения средних значений двух или более выборок. Он позволяет определить, различаются ли средние значения между группами, или же различия случайны. ANOVA используется в различных областях, включая науку, инженерию, медицину, социологию и многие другие, где необходимо доказать связь между переменными. Читать далее


Анализ сингулярного спектра

Сингулярный спектральный анализ (SSA) – это метод анализа временных рядов, который использует линейную алгебру и теорию сигналов для извлечения информации из данных. Суть метода заключается в том, что временной ряд разбивается на компоненты сингулярного разложения и затем эти компоненты используются для анализа и прогнозирования.

SSA широко применяется в различных областях, таких как транспортная доступность, анализ экономических данных, мониторинг технического состояния оборудования и других. Читать


SQL Server 2022: измерение влияния Extended Events на производительность

Вы когда-нибудь задавались вопросом, насколько Extended Events влияют на производительность вашей рабочей нагрузки (workload)? Я много писал о Extended Events и был активным сторонником их использования в качестве альтернативы SQL Trace даже дольше, чем я работаю на SQLskills.com. Но хоть Extended Events и дают нам множество преимуществ при сборе данных с минимальными накладными расходами, все же бывают случаи, когда нам не обойтись без дополнительных накладных расходов на наблюдение (observation overheads) даже при использовании Extended Events. Читать далее


SQL Server 2022: что можно сделать с VLF?

Виртуальные файлы журналов (Virtual Log Files – VLF) — это внутреннее разбиение реальных физических файлов, которое создает Database Engine SQL Server для работы с журналом транзакций. За VLF числится дурная слава, которая заключается в том, что слишком большое количество VLF может вызвать ряд проблем, среди которых можно выделить существенное снижение скорости запуска базы данных, операции резервного копирования и восстановления журналов. Чем больше VLF было сгененрировано, тем дольше процесс восстановления базы данных, что может привести к превышению времени ожидания, ошибкам, связанным с памятью, и целому ряду других проблемам. Продолжение