Недетерминированный Update
В SQL Server есть конструкция UPDATE .. FROM которая отличается от стандартной и позволяет вам сразу написать JOIN таблицы, которую вы меняете с другими. В результате может получиться так, что на одну строку изменяемой таблицы приходятся две и более строк из результирующего набора. Какая строка в этом случае будет использоваться для UPDATE?
Случайная. Такой эффект называется недетерминированный UPDATE и, к сожалению, SQL Server не выводит никаких ошибок или предупреждений в таком случае.
Хочу рассказать вам историю про недетерминированный Update. Вспоминая страшные сказки на ночь, программисты вспоминают страшные истории с предыдущих проектов. Одну из таких историй я хочу сейчас вам рассказать.
В чёрном-чёрном городе тёмной-тёмной ночью... а нет, не то.
Был в проекте программист, который не очень хорошо понимал, что выдаётся в результате SELECT. Ну, или понимал, но, может, был уставшим и не подумал. А правил он процедуру, которая обновляет баланс у клиента. Конечно, баланс можно было рассчитать по транзакциям, но в системе было поле, которое использовалось для отображения клиентам.
В процедуре использовался не стандартный UPDATE, а существующий только в SQL Server UPDATE From. И написал программист такую конструкцию:
UPDATE customer SET balance = balance + SUM(transaction_queue.amount) FROM customer JOIN transaction_queue On transaction_queue.CustomerId = customer.CustomerId GROUP BY transaction_queue.CustomerId, transaction_queue.date
И, к сожалению, как это часто бывает, в большинстве случаев всё работало, потому что в
Давайте посмотрим, в чём же было дело?
Если бы разработчик сначала написал select (а именно это я рекомендую делать, чтобы проверить), то было бы видно, что группировка по двум (!) полям, а join по одному. В данном случае это означает, что на одного клиента придётся несколько полей, если в исходной таблице оказываются данные за несколько дат. А такое всегда бывает на границе суток.
SELECT CustomerId, balance as BalanceCurrent, balance + SUM(transaction_queue.amount) AS BalanceNew, SUM(transaction_queue.amount) AS Delta FROM customer JOIN transaction_queue On transaction_queue.CustomerId = customer.CustomerId GROUP BY transaction_queue.CustomerId, transaction_queue.date
При использовании такого UPDATE всегда проверяйте, нет ли у вас недетерминированного изменения таблицы или используйте конструкцию WITH для изменения данных.
Будьте аккуратны с такими Update’ами!