20-21 июня состоялся первый в России семинар HR-Аналитика в R, на который пришли пятеро участников.
Надеюсь. что первый блин не комом.
Самое вкусное скажу в начала: участник разыграли книги издательства ДМК Пресс по аналитике, и самая вкусная книга досталась Людмиле Роговой (на моя взгляд, самая вкусная) - Введение в статистическое обучение с примерами на языке R - если у Вас есть желание развиваться в аналитике, обязательно купите эту книгу. Она не самая дешевая, но дешевле семинара, а знаний там больше!
Остальным участникам тоже неплохая книга досталась - R в действии. Анализ и визуализация данных на языке R - это хороший справочник по выполняемым действиям в R.
В идеале стоило бы стоило сделать курс с последовательным изложением тем, примерами и последующими заданиями, но как показывает практика, очень сложно собрать участников на такой курс, они отваливаются по ходу курса. Поэтому я создал двух дневный семинар.
Понимая все риски такого подхода, где главная проблема - проблема закрепления навыков, я построил семинар так, чтобы дать участникам семинара максимум шаблонов готового кода в R для решения большинства известных задач предиктивной аналитики в HR. И каждый скрипт представлял из себя решение какой либо задачи. Начиная от самого важного этапа аналитики - знакомства и чистки данных.
В этом смысле, кстати, семинар отличался от многих курсов по машинному обучению, где чаще даются знания об алгоритмах машинного обучения. Я же постарался дать код и знания про то, как бороться с мусором в данных.
И конечно же, упор был на алгоритмах машинного обучения, мы решали задачки:
- регрессии;
- классификации;
- дожития.
Разбирали подходы к кросс - валидации, обучению различных алгоритмов на одинаковых данных, выбор лучшей модели на основе метрик качества модели.
Ну и плюс дополнительно посмотрели анализ текста, и я дал скрипт, который позволяет автоматизировать обсчет результатов корпоративного опроса: вы его запусаете, а он вам в итоге дает одну картинку про все.
Ну вот как-то так.
Важный элемент семинара: участник должны выполнить домашнее задание. Они получили сет с данными, в котором им самим нужно выбрать решаемую задачу, далее они чистят данные, тренируют несколько разных алгоритмов и выбирают лучшую модель. Ну и безусловно, я буду отвечать на вопросы участников, которые возникают по ходу выполнения домашнего задания.
И я для себя решил: не будет выполненных домашних заданий от участников, не буду больше проводить семинар. Ибо а нафиг тогда?
Тем не менее, если у Вас есть желание поучаствовать в семинаре, вы можете подать заявку, пройдя по ссылке
Семинар-практикум "HR-Аналитика в R", Москва - даты не определены, но я буду понимать, есть ли желающие, я с Вами свяжусь, обсудим ожидания, программу, ваш запрос и т.п...
Ждем их постов в блоге. Жестко? Год назад я бы не поверил, что решусь на такое: за два дня давать XGBoost, KNN, кросс валидацию, caret, анализ текста и все такое.
Теперь понимаю, что можно такое делать. Принципиально концепцию менять не буду, но акценты надо таки акцентировать.
Комментариев нет:
Отправить комментарий