R для аналитика

Цель курса познакомить и влюбить аналитика в точность и элегантность языка R. Как динамично развивающийся opensourse продукт, R уже получил большое признание и распространение заграницей для задач анализа и визуализации данных
Начало занятий
20 сентября
Что даст вам этот курс

  • Решение ваших рабочих задач эффективным и стабильно-работающим способом
    (можно и нужно "приносить" на занятия свои задачи из ежедневной практики для решения их функционалом R);

  • Актуализация понимания ключевых концептов и терминов современной аналитики;

  • Знание основных пакетов R для решения аналитических задач;

  • Навыки использования данных пакетов на примере кейсов из практики.


  • Почему стоит изучать R?
  • Язык содержит широчайший спектр инструментов анализа данных, средств визуализации, создания статистических отчетов и приложений;

  • Статистические модели пишутся в несколько строк, а работа со сложными вычислениями значительно упрощена;

  • R позволяет производить все действия в одной среде (минуя прямое взаимодействие с базами данных, сайтами, и др. инструментами).



  • Актуальность:


    занятия наполнены методами,

    востребованными на рынке

    Top-down approach:


    сначала объясняем "как делать", потом все остальные важные аспекты

    Ориентация на практику:


    каждое ДЗ — реальный мини-кейс из опыта преподавателей или ваша задача с работы

    Долгосрочный вклад:


    Материалы будут вам полезны, как reference point, в будущих задачах (+cheat-sheets по темам)



    Кому адресован курс:
  • Аналитикам, которые стремятся перейти от Excel/ SPSS/ Statistica к более продвинутым средствам анализа;

  • Cпециалистам, которым необходимо искать закономерности в большом количестве данных, визуализировать их и строить статистически корректные выводы: исследователи, социологи, бизнес и финансовые аналитики, маркетологи и HR.

  • Программистам с опытом анализа на Python, готовым оценить всю прелесть и точность операций на специально созданном для анализа данных языке R;

  • "Бывшим" студентам, у кого когда-то был вводный курс по R или Matlab, а теперь есть потребность перейти к практическому внедрению R в рабочие задачи;
Преподаватель
Алексей Катин
PhD в North Carolina State University
PhD (аспирант 3 года) в North Carolina State University, USA.
Область профессиональных интересов: анализ полевых и лабораторных данных качества водной среды для последующего построения прогнозных моделей. R является основным инструментом, в работе применяются регрессионный анализ и байесовый подход.

Образование: магистратура Dresden University of Technology по специальности гидролог, бакалавриат: МИСиС по специальности инженером-эколог.

Опыт преподавания: 2 года в роли ассистента профессора в North Carolina State University.

Участник международных конференций: 15th Estuarine and Coastal Modeling Conference (ECM15) в 2018 и North Carolina's Coastal Conference в 2017.
Преподаватель
Алексей Катин
PhD в North Carolina State University
PhD (аспирант 3 года) в North Carolina State University, USA.
Область профессиональных интересов: анализ полевых и лабораторных данных качества водной среды для последующего построения прогнозных моделей. R является основным инструментом, в работе применяются регрессионный анализ и байесовый подход.

Образование: магистратура Dresden University of Technology по специальности гидролог, бакалавриат: МИСиС по специальности инженером-эколог.

Опыт преподавания: 2 года в роли ассистента профессора в North Carolina State University.

Участник международных конференций: 15th Estuarine and Coastal Modeling Conference (ECM15) в 2018 и North Carolina's Coastal Conference в 2017.
Минимальные знания
ОЧЕНЬ НУЖНО ЗАПОЛНИТЬ
Процесс обучения
Обучение проходит в формате онлайн-вебинаров на русском языке.
Регулярность занятий: 2 раза в неделю по 2 академических часа (1.5 астрономических часа).

Каждую неделю предполагается выполнение 1 домашнего задания (время на выполнение: 2-4 академических часа). По всем практическим заданиям команда преподавателей дает развернутый фидбек.

Для прохождения курса потребуется только компьютер с доступом в интернет, софт (R.Studio и т.д.) настроим в самом начале курса совместно.
Программа обучения
Модуль 1
Введение в анализ данных на R
Модуль 2
Data Wrangling: методы программирования и оптимальные функции для подготовки данных
Модуль 3
Прикладное использование алгоритмов Data Mining
Модуль 4
Построения web-приложений.
Модуль 5
Экосистема языка R
Модуль 6
Проектная работа
Введение в анализ данных на R
1.1. Знакомство с R. Установка R. Обзор возможностей. Преимущества и недостатки. Сравнение с похожими аналитическими инструментами.
1.2. Загрузка данных. Текстовые файлы.
1.3. Объекты языка R: Vector, Factor, Dataframe, Matrix, List. Типы данных.
1.4. Базовый синтаксис языка. Организация написания кода.
1.5. Пакеты R. Установка и обновление.
1.6. Увеличиваем продуктивность – Rstudio. Описание IDE, навигация в программе.
1.7. Источники данных: SQL-database, Excel, DBF, XML, HTML
Data Wrangling: методы программирования и оптимальные функции для подготовки данных
2.1. Векторизация вычислений
2.2. Управляющие конструкции. IF-FOR-WHILE
2.3. Функции
2.4. Продвинутое программирование. Технология Tidyverse.
2.5. Продвинутые возможности – R project и Git
2.6. Создание отчетности, пакет Rmarkdown
2.7. Построение выводов по данным
Прикладное использование алгоритмов Data Mining
3.1. Data Mining: очистка и предобработка данных
3.2. Data Mining: задачи ассоциации
3.3. Data Mining: кластеризация
3.4. Data Mining: классификация и регрессия. Статистические методы
3.5. Data Mining: классификация и регрессия. Машинное обучение
3.6. Анализ и прогнозирование временных рядов
3.7. Ансамбли моделей
3.8. Сравнение моделей
3.9. Поддержка русскоязычного сообщества R
Построения web-приложений.
4.1. Пакет Shiny. Обзор и возможности, минимальное приложение
4.2. Реактивные функции
4.3. Запуск и развёртывание приложений
Экосистема языка R
5.1. Мировое R-сообщество, поддержка пользователей в России
5.2. RStudio
Проектная работа
Дата выдачи сертификата:
Ваш сертификат
otus.ru
Константин Константинопольский
успешно закончил курс
«R для аналитика»
Успешных заданий:
16 из 16
Проектная работа:
Распределённая система сетевого мониторинга
Виталий Чибриков
Генеральный директор
№ 0001
otus.ru
Константин Константинопольский
успешно закончил курс
«R для аналитика»
Успешных заданий:
16 из 16
Проектная работа:
Распределённая система сетевого мониторинга
Виталий Чибриков
Генеральный директор
№ 0001
Партнеры ждут выпускников этого курса