Реализация алгоритма «Случайный лес»
«Случайный лес» (Random forest) — это довольно популярный алгоритм контролируемого машинного обучения, который заключается в применении комитета (можно сказать, «Ансамбля») решающих деревьев. Давайте посмотрим, как выглядит его реализация на Python.
Прежде всего, скажем, что «Ансамбль» в данном контексте значит, что алгоритм берет «слабых учеников», а потом объединяет их, что позволяет сформировать один сильный предиктор. При этом «слабые ученики» представляют собой все случайные реализации деревьев решений, объединяющихся в целях формирования случайного леса как сильного предсказателя. Это если в двух словах. Но если хотите подробнее, вот тематическое видео: https://www.youtube.com/watch?v=D_2LkhMJcfY.
Теперь давайте реализуем случайный лес на Python, тем более это не займет много времени.
Начало:
Реализация:
По материалам «The Hitchhiker’s Guide to Machine Learning in Python»: https://medium.freecodecamp.org/the-hitchhikers-guide-to-machine-learning-algorithms-in-python-bfad66adb378.