Реализация алгоритма «Случайный лес»

«Случайный лес» (Random forest) — это довольно популярный алгоритм контролируемого машинного обучения, который заключается в применении комитета (можно сказать, «Ансамбля») решающих деревьев. Давайте посмотрим, как выглядит его реализация на Python.

Прежде всего, скажем, что «Ансамбль» в данном контексте значит, что алгоритм берет «слабых учеников», а потом объединяет их, что позволяет сформировать один сильный предиктор. При этом «слабые ученики» представляют собой все случайные реализации деревьев решений, объединяющихся в целях формирования случайного леса как сильного предсказателя. Это если в двух словах. Но если хотите подробнее, вот тематическое видео: https://www.youtube.com/watch?v=D_2LkhMJcfY.

Теперь давайте реализуем случайный лес на Python, тем более это не займет много времени.

Начало:

Реализация:

По материалам «The Hitchhiker’s Guide to Machine Learning in Python»: https://medium.freecodecamp.org/the-hitchhikers-guide-to-machine-learning-algorithms-in-python-bfad66adb378.