Недетерминированный Update | OTUS
⚡ Подписка на курсы OTUS!
Интенсивная прокачка навыков для IT-специалистов!
Подробнее

Курсы

Программирование
Python Developer. Professional
-3%
Разработчик на Spring Framework
-5%
iOS Developer. Professional
-8%
Golang Developer. Professional
-6%
Базы данных
-12%
Agile Project Manager
-5%
Android Developer. Professional
-11%
Microservice Architecture
-5%
C++ Developer. Professional
-5%
Highload Architect
-6%
JavaScript Developer. Basic
-8%
Backend-разработчик на PHP
-9%
Архитектура и шаблоны проектирования C# Developer. Professional
-9%
Team Lead
-6%
Kotlin Backend Developer
-9%
Разработчик программных роботов (RPA) на базе UiPath и PIX Unity Game Developer. Basic Разработчик голосовых ассистентов и чат-ботов Node.js Developer Интенсив «Оптимизация в Java» Супер - интенсив по паттернам проектирования Супер - интенсив по Kubernetes iOS Developer. Basic Супер-интенсив «СУБД в высоконагруженных системах» Супер-интенсив "Tarantool"
Инфраструктура
DevOps практики и инструменты
-12%
Базы данных
-12%
Network engineer. Basic
-10%
Network engineer
-4%
Инфраструктурная платформа на основе Kubernetes
-6%
Экспресс-курс по управлению миграциями (DBVC)
-10%
Мониторинг и логирование: Zabbix, Prometheus, ELK
-10%
Administrator Linux. Professional
-6%
Разработчик IoT
-13%
Основы Windows Server Cloud Solution Architecture Разработчик голосовых ассистентов и чат-ботов VOIP инженер Супер-практикум по работе с протоколом BGP NoSQL Супер-практикум по использованию и настройке GIT Супер-интенсив «СУБД в высоконагруженных системах» Экспресс-курс «IaC Ansible»
Специализации Курсы в разработке Подготовительные курсы
+7 499 938-92-02

Недетерминированный Update

SQL_Deep_15.7_site-5020-1c972a.png

В SQL Server есть конструкция UPDATE .. FROM которая отличается от стандартной и позволяет вам сразу написать JOIN таблицы, которую вы меняете с другими. В результате может получиться так, что на одну строку изменяемой таблицы приходятся две и более строк из результирующего набора. Какая строка в этом случае будет использоваться для UPDATE?

Случайная. Такой эффект называется недетерминированный UPDATE и, к сожалению, SQL Server не выводит никаких ошибок или предупреждений в таком случае.

Хочу рассказать вам историю про недетерминированный Update. Вспоминая страшные сказки на ночь, программисты вспоминают страшные истории с предыдущих проектов. Одну из таких историй я хочу сейчас вам рассказать.

В чёрном-чёрном городе тёмной-тёмной ночью... а нет, не то.

Был в проекте программист, который не очень хорошо понимал, что выдаётся в результате SELECT. Ну, или понимал, но, может, был уставшим и не подумал. А правил он процедуру, которая обновляет баланс у клиента. Конечно, баланс можно было рассчитать по транзакциям, но в системе было поле, которое использовалось для отображения клиентам.

В процедуре использовался не стандартный UPDATE, а существующий только в SQL Server UPDATE From. И написал программист такую конструкцию:

UPDATE customer
SET balance = balance + SUM(transaction_queue.amount)
FROM customer
                JOIN transaction_queue
                On transaction_queue.CustomerId = customer.CustomerId
GROUP BY transaction_queue.CustomerId, transaction_queue.date

И, к сожалению, как это часто бывает, в большинстве случаев всё работало, потому что в transaction_queue были только движения за последние 10 минут, и программист даже ошибок никаких не увидел. Ошибка происходила только при смене даты: в конце суток транзакций было не так много, поэтому проблему заметили не сразу. И такой код работал на продакшн около месяца. Пришлось потом срочно править процедуру, пересчитывать баланс по клиентам и долго извиняться и рассказывать клиентам, что произошла ошибка и поэтому у них отображалось неверное количество средств на счету.

Давайте посмотрим, в чём же было дело?

Если бы разработчик сначала написал select (а именно это я рекомендую делать, чтобы проверить), то было бы видно, что группировка по двум (!) полям, а join по одному. В данном случае это означает, что на одного клиента придётся несколько полей, если в исходной таблице оказываются данные за несколько дат. А такое всегда бывает на границе суток.

SELECT CustomerId, balance as BalanceCurrent, balance + SUM(transaction_queue.amount) AS BalanceNew, SUM(transaction_queue.amount) AS Delta
FROM customer
                JOIN transaction_queue
                On transaction_queue.CustomerId = customer.CustomerId
GROUP BY transaction_queue.CustomerId, transaction_queue.date

При использовании такого UPDATE всегда проверяйте, нет ли у вас недетерминированного изменения таблицы или используйте конструкцию WITH для изменения данных.

Будьте аккуратны с такими Update’ами!

Не пропустите новые полезные статьи!

Спасибо за подписку!

Мы отправили вам письмо для подтверждения вашего email.
С уважением, OTUS!

Автор
0 комментариев
Для комментирования необходимо авторизоваться