Share |

суббота, 24 сентября 2016 г.

Тренировка по машинному обучению от Яндекса (что HR-ы могут взять для себя)

Был сегодня на мероприятии Яндекса - Тренировка по машинному обучению. Если вас жжет как хочется самим узнать, что было, можно пройти по ссылке и посмотреть запись. Заодно можно подписаться на рассылку Яндекса по подобным событиям.
Посещение таких ивентов бесплатно, даже кормят плюшками с чаем и кофе, но типа не всех пускают: надо показать свой профиль на Кагле и Гитхабе, но меня пустили, значит порог не такой серьезный.
Кстати, к вопросу о корысти Яндекса: у меня был тут спор о цели Яндекса в таких ивентах. Наверное, Яндекс не бескорыстен, организуя такие мероприятия, но это бесплатно для участников, дают плюшки, так что я совсем не против того, чтобы за такой подход Яндекс свою корысть поимел.
Ивент можно смот реть он лайн, но рекомендую хоть раз сходить оф лайн - подышать воздухом. Я был не единственным старым пердуном на мероприятии, хотя, конечно, соновная аудитория - молодые парни.
И Мир таки тесный: я познакомился с парнем из Красноярска: он прошел КЛШ, Нооген, теперь учится в Вышке. Как все тесно, правда? Красноярск, привет!
Сам ивент проходит как выступления участников соревнования Каггла. Для тех, кто не в курсе: kaggle - сайт, где компании выкладывают свои данные, на основе которых они хотели бы построить прогнозы. И любой желающий может поучаствовать в соревновании, кто лучше сделает прогноз. И лучшие получают деньги. Самый популярный набор данных - Титаник. Данные о пассажирах Титаника, задача - спрогнозировать, выживет пассажир или нет.
Помимо воздуха ивента ценность состоит в знаниях.
Хотя ценность xgboost уже давно не подвергается сомнению, но результаты в соревнованиях обеспечиваются больше на за счет настройки алгоритма, а за счет фишек преобразования данных (а на фото ребята из МГУ рассказывают как раз о настройке алгоритма работы с несбалансированными данными: в HR это интересно для случаев прогноза fruad - мошенничества, поскольку на 100 принятых ворует 1-2. Ритейл согласится?).
Тренировка по машинному обучению от Яндекса

Например, в задаче прогноза, какую страховую компанию выберет автовладелец, можно посчитать общее количество предложений конкретному автомобилисту. Это самый простой пример. Т.е. вы берете исходные данные, а с ними что то делаете, получая при этом новые переменные.
К тому я это все говорю, что нам - HR-ам, при нашей скудности данных, придется прибегать вот к таким манипуляциям с данными. И очень скоро тех из нас, кто придет на HR-ивент с кейсом "Прогноз эффективности на основе теста ...Х", будут закидывать помидорами.
Хочется вам попасть на такой HR-ивент? А хотели бы в таком зале провести такой HR-ивент?
И формат ивента очень простой: выходит HR-аналитик, рассказывает кейс:

  • Задача
  • Данные, выборка 
  • Алгоритм, точность модели
  • Обсуждение результатов, гипотезы (может быть самое интересное)
  • Последствия для бизнеса

Придете на такой ивент?
Тренировка по машинному обучению от Яндекса

Комментариев нет:

Отправить комментарий