Анонсирую свой семинар-практикум "HR-Аналитика в R", Москва, даты 21-22 ноября 2019.
Место проведения: PM ExpertАдрес: г. Москва, ул. Каланчёвская, д. 15, м. Красные ворота
Подать заявку можно в форме ниже
На семинаре разыграем несколько книг по R (литература любезно предоставлена КТК Галактика - это лучшее издательство для аналитиков!):
Почему R
Самый популярный инструмент аналитики в Мире – программа R. В группах по HR-аналитике на linkedin я
задавал вопрос, каким инструментом чаще всего пользуются hr-аналитики. Самый популярный ответ - R
Кого бы я хотел видеть на семинаре
- В идеале вы прошли мой Он-лайн курс "Введение в R для HR"
- Или очный семинар Аналитика для HR.
- Вы знакомы с R на начальном уровне, хотели бы получить знания и навыки анализа данных;
- Вы знакомы со матстатистикой (регрессия, R^2, корреляция, классификация вам знакомы), но не знакомы с R.
- Вы не знакомы со статистикой, не знакомы с R, но на "ты" с excel - вы не просто знаете формулы, но понимаете дух ВПР и т.п..
- Вы не были на моих семинарах, не знакомы со матстатистикой, не знакомы с R, но у Вас есть желание осваивать новое и, главное, готовность выносить крышеснос.
Требования к участникам
Ноутбук с установленными программами R и Rstudio и необходимыми пакетами
для работы. После подачи заявки на семинар вы получите ссылки на установку
программ, перечень необходимых пакетов для работы, инструкцию по установке, и
файл с данными для загрузки.
Формат
Семинар-практикум. В течение двух дней по восемь астрономических часа мы будем решать кейсы по HR-аналитике.
Результат семинара
- Знакомство с R/Rstudio;
- Понимание круга задач HR-аналитики, решаемых с помощью данного инструмента;
- Знание и применение базовых техник работы в R/Rstudio: загрузка данных, описательные статистики, чистка данных, визуализация данных и т.п..;
- Знание и применение базовых алгоритмов предиктивной аналитики в R/Rstudio;
- Главное: код, который у вас будет в качестве шаблона для анализа, для дальнейшего осмысления и развития.
Содержание
- Типы задач в HR-аналитике
- Начинаем работу: Базовые операции
- Загрузка данных;
- Структура данных;
- Типы данных;
- Описательные статистики;
- Подготовка и "чистка" данных (plyr, dplyr, regexr);
- Выбираем необходимый диапазон данных, фильтрация (subset).
- Построение выводов на основе статистических критериев:
- Формулируем гипотезу;
- A/B testing;
- Проверка нормальности распределения;
- Использование критериев: Хи квадрат, Т- тест, Манн-Уитни, Краскел-Уолисс.
- Типы моделей
- Регрессия;
- Классификация;
- Дожитие.
- Подготовка данных.
- Проверка нормальности распределения;
- Преобразование категориальных переменных;
- Шкалирование и логарифмирование метрических переменных;
- Работа с пропущенными значениями (импутация).
- Настройка и качество модели
- Показатели качества модели;
- Кросс-валидация;
- Train-test split;
- Выбор гиперпараметров.
- За пределами линеарности – непараметрические модели
- KNN-алгоритм;
- Решающие деревья (decision trees);
- Случайный лес (Random forest);
- Xgboost
- Визуализация результатов ggplot2
- Управление текучестью персонала
- Работа с датами (lubridate);
- Два подхода к построению модели прогноза увольнения;
- Регрессия Кокса.
- Построение моделей через пакеты фреймфорки: caret, mlr
- Временные ряды – time series.
- Чего не было на семинаре, куда двигаться дальше
Заключение. Подведение итогов семинара
Стоимость участия:
27 500 рублей для юр лиц, 16 500 для физ лиц
Комментариев нет:
Отправить комментарий