Блог Machine Learning → Полезные материалы по Machine Learning

19.06.21 в 16:59

Machine Learning → Полезные материалы по Machine Learning

Смартап представляет собой мультимодальное приложение, с помощью которого пользователь получает красивый интерфейс и множество способов взаимодействия с этим интерфейсом: касанием, голосом, пультом, текстовым вводом и даже виртуальным геймпадом. Давайте посмотрим, где и как запускаются смартапы.

0

11

Андрей Павленко

07.05.21 в 20:36

Прямой и обратный отбор в ML

Machine Learning → Полезные материалы по Machine Learning

Прямой отбор в машинном обучении представляет собой технику, которая заключается в использовании пошаговой регрессии. При этом построение модели в данном случае начинается с полного нуля, то есть речь идет о пустой модели, к которой каждая последующая итерация добавляет переменную, вносящую улучшение в создаваемую модель.

0

4

Андрей Павленко

07.05.21 в 20:32

Рекурсивное исключение признаков

Machine Learning → Полезные материалы по Machine Learning

Recursive Feature Elimination (RFE) — широко известная и популярная техника, предназначенная для выбора точного количества значимых признаков. Давайте уделим ей немного своего внимания.

0

6

Андрей Павленко

04.05.21 в 18:30

Регуляризация в Machine Learning

Machine Learning → Полезные материалы по Machine Learning

Регуляризация используется в машинном обучении в целях контроля баланса между bias (предвзятостью) и variance (отклонением). Предвзятость нужна, чтобы показать, насколько модель переобучилась на тренировочном наборе данных, а отклонение — насколько предсказания между тренировочным датасетами и тестовым датасетами отличались. Давайте посмотрим, какие существуют техники регуляризации.

0

9

Андрей Павленко

29.04.21 в 19:52

Восстанавливаем данные с помощью k-NN

Machine Learning → Полезные материалы по Machine Learning

В одной из предыдущих статей мы рассматривали процесс импутации данных с помощью глубокого обучения. Однако восстановить значения в неполном наборе данных можно и с помощью алгоритма k-Nearest Neighbour. Давайте посмотрим, как это работает.

0

3

Андрей Павленко

29.04.21 в 18:35

Импутация данных с помощью Deep Learning

Machine Learning → Полезные материалы по Machine Learning

Иногда бывает, что реальные наборы данных неполны. Это случается по техническим причинам либо если датасет собирают из нескольких источников с различными наборами параметров. В такой ситуации в таблице находятся пустые ячейки или заглушки — NaN. Если заглушек слишком много,— тренировка на этих данных значительно ухудшит качество модели. Что же делать? Один из вариантов — импутация данных.

0

4

Андрей Павленко

24.04.21 в 20:02

Решаем проблему кластеризации методом k-средних

Machine Learning → Полезные материалы по Machine Learning

Метод k-средних представляет собой алгоритм неконтролируемой классификации обучения, который часто используется при решении проблемы кластеризации. В данном случае k обозначает число кластеров, введенных пользователем.

0

2

Андрей Павленко

16.04.21 в 18:14

Метод главных компонент в Machine learning

Machine Learning → Полезные материалы по Machine Learning

Principal Component Analysis (PCA) — это алгоритм сокращения размерности, который бывает весьма полезным для аналитиков. Основное тут то, что этот алгоритм способен существенно снизить размерность данных в процессе работы с сотнями и даже тысячами разных функций.

0

11

Андрей Павленко

16.04.21 в 17:48

Реализация алгоритма «Случайный лес»

Machine Learning → Полезные материалы по Machine Learning

«Случайный лес» (Random forest) — это довольно популярный алгоритм контролируемого машинного обучения, который заключается в применении комитета (можно сказать, «Ансамбля») решающих деревьев. Давайте посмотрим, как выглядит его реализация на Python.

0

4

Андрей Павленко

16.04.21 в 17:33

Машинное обучение: метод k-ближайших соседей

Machine Learning → Полезные материалы по Machine Learning

KNN или K-Nearest Neighbors — это контролируемый алгоритм обучения, используемый преимущественно при решении задач классификации. Этот алгоритм обеспечивает наблюдение за различными центрами (центроидами), сравнивая расстояние между ними, причем для этого используются разные функции (как правило, речь идет о евклидовом расстоянии).

0

8

Сценарист игр и Нарративный дизайнер