Вероятность коллизии хэш-функции | OTUS
⚡ Подписка на курсы OTUS!
Интенсивная прокачка навыков для IT-специалистов!
Подробнее

Курсы

Программирование
iOS Developer. Professional Kotlin Backend Developer Flutter Mobile Developer Symfony Framework C++ Developer. Basic Unity Game Developer. Basic Java Developer. Professional
-35%
Highload Architect Unity Game Developer. Professional React.js Developer Специализация Java-разработчик
-25%
Алгоритмы и структуры данных
-16%
Scala-разработчик C# Developer. Professional
-23%
Разработчик голосовых ассистентов и чат-ботов Team Lead Архитектура и шаблоны проектирования NoSQL Web-разработчик на Python Golang Developer. Professional PostgreSQL Vue.js разработчик Супер-практикум по использованию и настройке GIT Разработчик IoT Подготовка к сертификации Oracle Java Programmer (OCAJP) Программист С HTML/CSS
Инфраструктура
Инфраструктурная платформа на основе Kubernetes Microservice Architecture Базы данных Highload Architect Reverse-Engineering. Professional
-8%
Network engineer. Basic Administrator Linux.Basic MongoDB Infrastructure as a code MS SQL Server Developer Cloud Solution Architecture Мониторинг и логирование: Zabbix, Prometheus, ELK Супер-практикум по использованию и настройке GIT Разработчик IoT Экcпресс-курс «ELK» Супер-интенсив "Tarantool" Экспресс-курс «CI/CD или Непрерывная поставка с Docker и Kubernetes» Экспресс-курс «Введение в непрерывную поставку на базе Docker»
Корпоративные курсы
Безопасность веб-приложений Экосистема Hadoop, Spark, Hive Пентест. Практика тестирования на проникновение Node.js Developer Java QA Engineer. Basic
-18%
Reverse-Engineering. Professional
-8%
DevOps практики и инструменты NoSQL Reverse-Engineering. Basic Cloud Solution Architecture Внедрение и работа в DevSecOps Супер-практикум по работе с протоколом BGP Game QA Engineer Супер - интенсив по Kubernetes Дизайн сетей ЦОД Экспресс-курс «IaC Ansible» Экспресс-курс по управлению миграциями (DBVC) Экспресс-курс "Версионирование и командная работа с помощью Git" Основы Windows Server
Специализации Курсы в разработке Подготовительные курсы Подписка
+7 499 938-92-02

Вероятность коллизии хэш-функции

Представьте, что вам дана хэш-функция h(x) = x mod p (остаток от целочисленного деления x на p). Какова вероятность того, что хэш-функция совпадёт для каких-либо двух чисел из набора n случайных целых чисел? И для каких значений n эта вероятность станет равна 100 %?

Немного истории

Математическая задача, которую мы описали выше, представляет собой обобщение известного парадокса дней рождения. Этот парадокс говорит о том, что если у нас есть группа из 23 и больше человек, то вероятность того, что дни рождения хотя бы двоих из них придутся на один день, превышает 50 %.

Но в классическом смысле этот парадокс парадоксом на самом деле не является. И когда мы решим задачу, всё станет на свои места.

Решение

В первую очередь следует сказать, что результатом вышеописанной хэш-функции могут быть лишь значения в пределах от 0 до p-1. А значит это то, что мы сможем заменить числа в наборе остатками от их деления на p.

Как итог — у нас появляется возможность переформулировать задачу так: какова вероятность, что в наборе из n целых чисел c возможным значением от 0 до p-1 два числа совпадут?

Чтобы решить задачу, следует сначала посчитать вероятность того, что все числа будут разными. Тут нам поможет формула комбинаторики: всего наборов может быть pn (число размещений с повторениями), а наборов, в которых все числа будут различными (так называемых благоприятных исходов), — p ⋅ (p-1) ⋅ (p-2) ⋅ … ⋅ (p-n+1) = p! / (p-n)! (число размещений).

В результате вероятность того, что все числа в нашем наборе будут разными составляет p! / (pn ⋅ (p-n)!), следовательно, вероятность того, что какие-либо 2 числа совпадут, составляет 1 — p!/(pn ⋅ (p-n)!).

Остаётся дать ответ на последний вопрос: для каких значений n вероятность будет равняться ста процентам? Очевидно, что для n ≥ p+1. Исходя из вышесказанного и с учётом принципа Дирихле, хотя бы одному значению на интервале 0 .. p-1 станут соответствовать 2 числа из нашего набора.

Итак, мы только что решили задачу и вывели формулу вероятности. Причём вы можете проверить её, используя возможности длинной арифметики в языке программирования Java:

/* package whatever; // don't place package name! */

import java.util.*;
import java.lang.*;
import java.io.*;
import java.math.*;

/* Name of the class has to be "Main" only if the class is public. */
class Ideone
{
    public static void main (String[] args) throws java.lang.Exception
    {
        System.out.println(getCollisionProbability(23, 365));
    }

    static BigDecimal getCollisionProbability(int n, int p){
        return (new BigDecimal("1")).subtract(fact(p).divide((new BigDecimal(String.valueOf(p))).pow(n).multiply(fact(p-n)), 6, RoundingMode.HALF_UP));
    }

    static BigDecimal fact(int n){
        if (n==1) return BigDecimal.ONE; else return fact(n-1).multiply(new BigDecimal(String.valueOf(n)));
    }
}

Источник

Не пропустите новые полезные статьи!

Спасибо за подписку!

Мы отправили вам письмо для подтверждения вашего email.
С уважением, OTUS!

Автор
0 комментариев
Для комментирования необходимо авторизоваться