Продолжение кейса Как влияют переработки на текучесть персонала - 2 (кейс по hr-аналитике).
Суть вкратце: я исходил из версии, что переработки отрицательно влияют на текучесть, т.е. увеличивают текучесть.
Однако анализ показал другое.
Систематические переработки снижают риск увольнения в 2,6 раза в сравнении с теми, кто не перерабатывает в компании.
Если же работник имел переработки в первый месяц работы, то риск увольнения в сравнении с теми, кто не имел переработок в первый месяц снижается в 1, 34 раза.
Давайте посмотрим на график
По оси X - стаж работы в месяцах. ось Y - процент сотрудников, оставшихся работать в компании на том или ином месяце стажа. Синей линией показана динамика тех, кто перерабтывал в первый месяц работы в компании, пунктирной - кто не перерабатывал.
Т.е. например, через полгода работы в компании осталось чуть более 50 % тех, кто не перерабатывал и примерно две трети (66 %) тех, кто переработал в первый месяц работы в компании.
Я думаю, есть повод для разговора с Заказчиком, правда?
Есть несколько версий:
Суть вкратце: я исходил из версии, что переработки отрицательно влияют на текучесть, т.е. увеличивают текучесть.
Однако анализ показал другое.
Систематические переработки снижают риск увольнения в 2,6 раза в сравнении с теми, кто не перерабатывает в компании.
Если же работник имел переработки в первый месяц работы, то риск увольнения в сравнении с теми, кто не имел переработок в первый месяц снижается в 1, 34 раза.
Давайте посмотрим на график
Т.е. например, через полгода работы в компании осталось чуть более 50 % тех, кто не перерабатывал и примерно две трети (66 %) тех, кто переработал в первый месяц работы в компании.
Я думаю, есть повод для разговора с Заказчиком, правда?
Есть несколько версий:
- Если переработки назначаются случайным образом, то получается, что люди получили дополнительные деньги и их это вдохновило на дальнейшую работу;
- Если переработки не случайны, т.е. работники сами напрашиваются, то по тому, кто накинулся на переработки в первый месяц работы, можно прогнозировать стаж человека в компании (хотя версия вызывает сомнения, поскольку переработки возникают не по желанию администрации (ну нет смысла ей переплачивать);
- Совсем коварный вариант: приписывают переработки своим людям.
- Мотивация: допустим, что на мотивированных переработки влияют позитивно (они оплачиваются вдвойне), а на не мотивированных они сказываются негативно. У Наследова в книге "Математические методы психологического исследования" приводится классный пример двухфакторного дисперсионного анализа, когда разные уровни измерения двух номинативных переменных оказывают разное влияние на метрическую переменную.
Проверка мотивационной версии
В идеале процедура должна была выглядеть примерно так: мы измеряем мотивацию работников и оцифровываем: 1 - мотивированный, 0 - не мотивированный. Кроме того, у нас есть переработки: 1 - есть переработки на первом месяце работы в компании, 0 - нет переработок в компании на первом месяце.
Почему я беру переработки на первом месяце? С тем, чтобы избежать получения корреляции вместо причинности. Т.е. вполне возможно, что тех, кто работает дольше нагружают больше. И в этом смысле переработки могу являться следствием, а не причиной более длительного стажа. Поэтому я исхожу из указания Заказчика, что в первый месяц переработки достаются случайным образом. И дальше возможна такая ситуация:
- мотивированные воспринимают переработки как возможность дополнительного заработка, т.е. со знаком плюс;
- немотивированные - как дополнительную нагрузку или со знаком минус.
И для первых тогда коэффициент регрессии должен быть положительным, а для вторых - отрицательным - снижающим срок жизни в компании.
У нас нет возможности вычислить мотивированных и не мотивированных, поэтому я придумал простой ход.
Он спорный, но за неимением лучшего смотрите.
Я, как указывал ранее, брал только тех, кто устроился на работу в 2014 году. Те, кто за это время не уволился, можно считать мотивированными, а тех, кто успел устроиться на работу и уволиться же - немотивированными. (Условно говоря!!!)
Далее я беру только "немотивированных", т.е. только тех, кто устроился и уволился в 2014 году. Если моя гипотеза верна, то переработка в первый месяц будет в уравнении регрессии со знаком минус или снижать срок работы в компании
Далее я беру только "немотивированных", т.е. только тех, кто устроился и уволился в 2014 году. Если моя гипотеза верна, то переработка в первый месяц будет в уравнении регрессии со знаком минус или снижать срок работы в компании
Нам надо построить уравнение регрессии для двух переменных: 1) стаж и 2) наличие / отсутствие переработок в первый месяц работы в компании
Линейная регрессия в данном случае нам не очень подходит для стажа, поскольку стаж носит не нормальное распределение
См. распределение стажа принятых и уволенных работников в 2014 году
По оси X - время работы в компании в днях.
Данные
Min. 1st Qu. Median Mean 3rd Qu. Max.
34.0 62.0 89.0 104.7 136.0 285.0
И здесь замечу, что я брал только тех, кто отработал не менее 30 дней в компании, чтобы наличие / отсутствие переработок искажалось тем фактом, что человек уволился до того, как успел дожить до этих переработок.
Чтобы построить линейную регрессию, логарифмируем стаж и получаем вот такое распределение
Min. 1st Qu. Median Mean 3rd Qu. Max.
3.526 4.127 4.489 4.527 4.913 5.652
Считаем регрессию для логарифмированной переменной стажа
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 4.47380 0.03267 136.959 < 2e-16 ***
n 0.17249 0.05878 2.935 0.00358 **
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 0.4911 on 325 degrees of freedom
Multiple R-squared: 0.02582, Adjusted R-squared: 0.02282
F-statistic: 8.613 on 1 and 325 DF, p-value: 0.003576
R^2 как то совсем скромный, но коэффициент значим на уровне 0.00358 и, главное, он положителен.
И это не опровергает гипотезу про немотивированных, но ставит ее под большое сомнение.
В качестве интересного дополнения давайте сравним показатели регрессии, если мы не будем логарифмировать стаж
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 99.155 3.551 27.921 < 2e-16 ***
n 18.013 6.390 2.819 0.00511 **
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 53.39 on 325 degrees of freedom
Multiple R-squared: 0.02387, Adjusted R-squared: 0.02087
F-statistic: 7.947 on 1 and 325 DF, p-value: 0.005111
Мы видим, что коэффициент также значим, а разница в коэффициенте несущественная.
Зато смысл коэффициента становится осязаемым: наличие переработок в первый месяц работы в компании добавляет от 6 до 30 дней работы в компании (с учетом 95 % интервала).
Комментариев нет:
Отправить комментарий