Приятно, что данные прислали по результатам семинара Управление текучестью персонала на основе данных.
Есть данные о загруженности рабочих. Гипотеза простая - влияет ли загруженность (или величина нагрузки) на текучесть персонала.
Начнем с описательных статистик
30.00 46.00 52.00 53.68 60.00 134.00 5
Видно, что нагрузка носит ненормальный характер, поэтому мы можем прологорифмировать переменную, чтобы избежать искажений Преобразование переменной для получения нормального распределения. Также мы можем отсечь тех, у кого нагрузка более 100 - это явные выбросы.
Это некая естественная убыль рабочих при среднем значении. По оси X - стах в месяцах, по оси Y - % доработавших до определенного срока (верхняя и нижняя линии - границы 95 % ошибки). Т.е. на рубеже 48 месяцев у нас доживает до своему желанию 90 % работников. Можно спросить, а что не устраивает в текучести бизнес, но это не наше дело, есть запрос - отвечаем.
Далее мы строим уравнение регрессии, которое нам отвечает, что риск увольнения при увеличении нагрузки на одну единицу возрастает на три процента.
Что это значит на "физическом уровне"? Если у нас средний риск увольнения на рубеже 48 месяцев составляет 10 %, то эти 10 % соответствуют средней загрузке рабочего (см. описательные статистики), если же работник имеет нагрузку в третьем квартиле (60 единиц нагрузки), то риск увольнения возрастает на 6 единиц (от величины нагрузки рабочего отнимаем среднее значение) * 3 % = 18 %, итого суммарный риск увольнения такого работника равен 28 %, что уже существенно отличается от "среднего риска".
Посмотрим на эмпирически более понятном примере
Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
30.0 46.0 51.0 53.1 59.0 112.0 3
$Уволившиеся
Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
36.00 50.00 54.00 57.24 63.00 134.00 2
Заметно, что нагрузка уволившихся больше, чем у "живущих". Это подтверждает всеми любимый Манн Уитни. И диаграмма
Различие совсем смешное, да объясненная дисперсия - 1,5 %, но это еще один кирпичик в объяснение текучести.
Есть данные о загруженности рабочих. Гипотеза простая - влияет ли загруженность (или величина нагрузки) на текучесть персонала.
Начнем с описательных статистик
Показатели нагрузки
Min. 1st Qu. Median Mean 3rd Qu. Max. NA's30.00 46.00 52.00 53.68 60.00 134.00 5
График выбытия
Далее строим график выбытия рабочих с предприятия по собственному желаниюДалее мы строим уравнение регрессии, которое нам отвечает, что риск увольнения при увеличении нагрузки на одну единицу возрастает на три процента.
Что это значит на "физическом уровне"? Если у нас средний риск увольнения на рубеже 48 месяцев составляет 10 %, то эти 10 % соответствуют средней загрузке рабочего (см. описательные статистики), если же работник имеет нагрузку в третьем квартиле (60 единиц нагрузки), то риск увольнения возрастает на 6 единиц (от величины нагрузки рабочего отнимаем среднее значение) * 3 % = 18 %, итого суммарный риск увольнения такого работника равен 28 %, что уже существенно отличается от "среднего риска".
Посмотрим на эмпирически более понятном примере
Нагрузка уволившихся и работающих
$РаботающиеMin. 1st Qu. Median Mean 3rd Qu. Max. NA's
30.0 46.0 51.0 53.1 59.0 112.0 3
$Уволившиеся
Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
36.00 50.00 54.00 57.24 63.00 134.00 2
Заметно, что нагрузка уволившихся больше, чем у "живущих". Это подтверждает всеми любимый Манн Уитни. И диаграмма
Различие совсем смешное, да объясненная дисперсия - 1,5 %, но это еще один кирпичик в объяснение текучести.
Комментариев нет:
Отправить комментарий