<!--
Данная статья подготовлена для учебных целей. В ней используются вымышленные данные. Любые совпадения с реальными бизнесами или компаниями являются случайными.
Все расчеты и визуализация сделаны в R. Отчет – в R Markdown.
Введение
Идея этого небольшого исследования состоит в том, чтобы ответить на вопрос, есть ли закономерность во времени (месяц) увольнении сотрудников из кадрового резерва.
Например, существует стереотип, что “многие менеджеры ждут годовых бонусов, а уже после их получения увольняются из компании”. Если это действительно так, тогда цифры должны нам все показать. Т.е. если компания выплачивает годовой бонус, например, в марте, тогда в апреле-мае нужно ожидать гораздо больших увольнений, нежели в другие месяцы года.
Исходные данные
Предположим, что у нас есть данные за последние 5 лет по увольнениям из кадрового резерва.Всего таких наблюдений 59:
## # A tibble: 59 <U+00D7> 2
## NoMonth Month
## <int> <fctr>
## 1 1 январь
## 2 2 февраль
## 3 2 февраль
## 4 2 февраль
## 5 2 февраль
## 6 2 февраль
## 7 3 март
## 8 3 март
## 9 3 март
## 10 3 март
## # ... with 49 more rows
Предобработка данных
Теперь давайте проведем предобработку исходных данных. Для этого нам нужно посчитать количество увольнений в каждый месяц за все 5-ть лет:## # A tibble: 12 <U+00D7> 3
## Month NofFired NofMonth
## <fctr> <int> <int>
## 1 январь 1 1
## 2 февраль 5 2
## 3 март 6 3
## 4 апрель 4 4
## 5 май 6 5
## 6 июнь 4 6
## 7 июль 8 7
## 8 август 5 8
## 9 сентябрь 4 9
## 10 октябрь 6 10
## 11 ноябрь 5 11
## 12 декабрь 5 12
Подготовка к построению контрольной карты Шухарта
Для целей нашего анализа очень хорошо подходят контрольные карты Шухарта. Я не буду подробно останавливаться на том, что это такое и как их использовать. Самые любопытные смогут об этом прочитать здесь:Для построения карты Шухарта нам понадобятся следующие данные:
- Среднее значение:
4.9166667
- Стандартное отклонение:
1.6764862
- и +/- 2 стандартных отклонения:
“+”8.2696391
“–”1.5636942
Карта Шухарта
Теперь у нас есть все данные для построения карты Шухарта.В виде гистограммы:
Или в более привычном для карт Шухарта — в виде графика:
Как читать карту Шухарта? На данном графике показано количество увольнений в каждый месяц за 5 лет суммарно. Пунктирной зеленой линией нанесено среднее значение (
Мы помним из закона нормального распределения, что +/- два стандартных отклонения описывают 95% всех событий. Следовательно, все что выходит за данные рамки, мы можем считать важными отклонениями, на которые стоит обратить внимание. Это будет указывать на то, что за данными отклонениями стоят какие-то причины, которые нужно детальней изучить и принять управленческое решение.4.9166667
). Красной линией показано +2 стандартных отклонения
(8.2696391
) и –2 стандартных отклонения
(1.5636942
).Как видно из нашего графика, отклонений свыше плюс два стандартных отклонения у нас нет. Хотя можно глубже изучить март и июль, где мы видим 6 и 8 увольнений соответственно.
Но давайте вернемся к цели нашего исследования, а именно к проверке гипотезы о том, что “многие менеджеры ждут выплаты годовых бонусов, а затем увольняются”. Т.е. мы должны ожидать существенно большего количества уволенных после выплаты бонуса (т.е. после марта).
Как видно из нашего графика такого увеличения количества увольнений не происходит.
Расчет \(X^2\)-критерий Пирсона
Теперь давайте прибегнем к помощи аналитики и соответствующих статистических критериев.Для данной задачи (выявление различий в распределении признака) был выбран критерий \(X^2\) Пирсона. Именно данный критерий поможет нам проверить гипотезу о том, насколько сильно наше эмпирическое наблюдение (т.е. количество увольнений в каждый месяц) отличается от теоретического распределения (т.е. когда бы в каждый месяц мы наблюдали одинаковое количество увольнений).
Т.е критерий \(X^2\) Пирсона сможет нам ответить на вопрос, значимы ли данные различия. Давайте сформулируем наши гипотезы:
Нулевая гипотеза (\(H_0\)):
"Распределение количества уволенных в каждый месяц не отличается от равномерного распределения".
Альтернативная гипотеза (\(H_1\)):
"Распределение количества уволенных в каждый месяц отличается от равномерного распределения".
Давайте теперь рассчитаем \(X^2\)-критерий:
##
## Chi-squared test for given probabilities
##
## data: df_KR_data$NofFired
## X-squared = 6.2881, df = 11, p-value = 0.8535
Евгений, картинки слетели
ОтветитьУдалить