.

Сделать репост в соц сети!

вторник, 11 июля 2017 г.

Какие качества работников влияют на текучесть персонала

Название тупое, специально,чтобы привлечь побольше аудитории. На самом деле я хочу помимо содержательной части коснуться методологии управления текучестью персонала. И это первый пост, когда я оппонирую коллегам - HR аналитикам на достойном уровне. Если Вас не интересует методология, сразу к картинкам ниже переходите.

Методология

Оппонирую докладам hr аналитиков компании Делойт и КПМГ, которые на конференции по hr-аналитике журнала Штат представили свои модели текучести персонала. Модели были построены как классификации, доработает ли работник до определенного срока в компании или нет.
Я понимаю, что такие модели строят на Кагле, я также понимаю, что такой способ работы с текучестью имеет определенный смысл. Но и такой способ имеет кучу недостатков.
Одни из моделей была построена как классификация, проработает ли работник до 2 лет в компании или больше двух лет. А если он проработает 1,5 года? А если он проработает 4 года? И в первом случае 1,5 года будут приравнены к, например, результату в 3 месяца, а во втором к, например, 2,5 года. Хотя очевидно, что для бизнеса это могут быть разными историями.
Таким образом, в идеале стоило бы предсказывать не доживет ли до определенного периода, а стаж работы в компании. Но в этом месте и зарыта самая большая проблема: к сожалению для HR аналитиков, большая часть работников еще работает в компании, а следовательно, в уравнение линейной регрессии их не включишь, поскольку мы не знает, какое количество месяцев он отработает в компании.
Эта проблема решается регрессией Кокса, но регрессия Кокса в качестве аутпута выдает не стаж, а риски дожития, а это слишком не очевидная вещь, она труднопонимаема с т.з.простого человеческого разума. Вот и берутся за задачу классификации, поскольку это наиболее выгодное решение - компромисс.
Тем не менее, задача прогноза времени работы сотрудник в компании решается линейной регрессией, несмотря на незакрытый стаж, и я покажу одно из таких решений.

Задача

Я беру данные нашего исследования (вы поучаствовали? нет? тогда не читайте дальше)
В качестве Y я беру лог-стаж (поскольку распределение стажа у нас далеко от нормального, мы его должны прологарифмировать), и брал я, конечно же, только волюнтарную текучесть, а в качестве предикторов я беру шкалы тестов Большая пятерка и КТО Лаборатории Гуманитарные Технологии, любезно согласившиеся предоставить тесты для научных нужд:
Тест КТО

  1. Общий балл;
  2. Вербальный интеллект;
  3. Числовой интеллект;
  4. Эрудиция;
  5. Обработка информации.

И Большая пятерка

  1. Интроверсия - экстраверсия;                                                                   
  2. Независимость - согласие;                                                                     
  3. Импульсивность - самоконтроль;                                                                
  4. Тревожность- стабильность;                                                                    
  5. Консерватизм- новаторство.

Результат

Какие качества работников влияют на текучесть персонала
Итого, на первом месте в нашем хит-параде импульсивность-самоконтроль: люди с более высоким самоконтролем дольше задерживаются в компании. Что кажется логичным. И сразу на контрасте: на том же датасете обычная регрессия Кокса показывает только данную шкалу значимой с т.з. прогноза рисков работы в компании. На втором месте шкала Консерватизм - Новаторство, и новаторы у нас засиживаются в компании дольше, что вполне согласовывается с западными исследованиями Браузер скажет о кандидате то, что не скажет уровень учебной успеваемости.
А вот высокий интеллект увеличивает риски расставания с компанией: думать надо меньше, коллеги. Ну и высокая тревожность немного влияет на время работы в компании.
И самое вкусное: качество модели

Какие качества работников влияют на текучесть персонала

  • По оси X - прогнозное значение в попугаях логарифмированном стаже
  • По оси Y - реальное значение стажа.

На тест сете два теста объясняют менее 1 % дисперсии стажа работников компании.
Таким образом, полученный пример интересен в научных целях, а не практических.
Можно возразить, что влияние тестов может быть опосредованно позицией, профессией, полом, жизненным опытом и т.п.. Согласен полностью, но тогда это говорит, что мы не сможем построить универсальный продукт по прогнозу текучести на основе тестов. А жаль.
Если у вас есть другие данные - поделитесь.

Понравился пост? 

и Вы захотите выразить мне благодарность, просто покликайте на директ рекламу ниже на странице - у вас это отнимет несколько секунд, а мне принесет немного денег. Или поучаствуйте в исследовании в знак благодарности.
На этом все, читайте нас в фейсбуке 

4 комментария:

  1. Доброе утро, Эдуард!

    А можно попросить Вас проверить важность предикторов еще с помощью random forest? интересно будут ли отличаться результаты, учитывая что линейная регрессия довольно плохо объясняет дисперсию в данной модели.

    ОтветитьУдалить
    Ответы
    1. данивапрос, только скажите, какой пакет мне использовать для проверки?
      я в R работаю

      Удалить
  2. пакет RandomForest, строить модель можно встроенной функцией rf либо через caret. Важность предикторов вычисляется с помощью функции importance

    ОтветитьУдалить
    Ответы
    1. да нет, не подойдет этот пакет.
      Как Вы будете там обрабатывать незакрытый стаж?
      И давайте договоримся: я общаюсь только с людьми, а не анонимами

      представьтесь, дайте мне свой е майл, я вам дам датасет, а вы сделайте случайный лес на основе этих данных, оки?

      Удалить