Метод главных компонент в Machine learning

Principal Component Analysis (PCA) — это алгоритм сокращения размерности, который бывает весьма полезным для аналитиков. Основное тут то, что этот алгоритм способен существенно снизить размерность данных в процессе работы с сотнями и даже тысячами разных функций. Этот алгоритм не контролируется, однако пользователю следует анализировать результаты и отслеживать, чтобы сохранялось порядка 95 % первоначального набора данных.

Если интересуют подробности, можете посмотреть соответствующее видео: https://www.youtube.com/watch?v=kw9R0nD69OU.

Но давайте лучше посмотрим, как выглядит реализация этого ML-алгоритма на Python.

Начало работы:

Реализация:

По материалам «The Hitchhiker’s Guide to Machine Learning in Python»: https://medium.freecodecamp.org/the-hitchhikers-guide-to-machine-learning-algorithms-in-python-bfad66adb378.