Я уже не аноснирую наше исследование в начале, пишу так много, что не ожидаю незнакомых людей в нем, но если и появятся, ссылка на исследование текучести внизу, проголосуйте - оно по прежнему актуально.
Если вся эта аналитическая фигня неинтересна - читайте внизу вывод жирным
Если вся эта аналитическая фигня неинтересна - читайте внизу вывод жирным
Логика проверки заключается, в первую очередь , в очищении
эффекта корреляции пары «возраст – стаж».
Представьте ситуацию, что представитель поколения X устроился
на работу в 1985 году и работает по сю пору. Это здорово, но это не значит, что
поколение X более стабильно: просто представитель поколения Y в
1985 году в лучшем случае сидел на горшке и сравнивать поколения в данном
разрезе некорректно.
Поэтом у справедливо было бы посмотреть ситуацию, в которой
оба поколения X и Y дееспособны.
Я взял следующие границы поколений:
Поколение X
= 1963 : 1981
Поколение Y = 1982 : 1992
Верхнюю границу поколения Y я не стал поднимать до 1995 года,
потому что:
Я решил взять выборку респондентов, трудоустроившихся после
после 1 января 2012 года. В этом году даже самым молодым представителям
поколения Y уже 19 лет, они вполне трудоспособны.
Далее мы посмотрим значимость различий в стаже между
поколениями X и Y.
Всего в этот период устроилось на работу 637 респондентов,
из них
X Y
227 410
Call:
lm(formula = log(r1$stag, base = exp(1)) ~ XYZ, data =
r1)
Residuals:
Min 1Q
Median 3Q Max
-2.2638 -0.4720
0.1341 0.5165 1.2741
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept)
2.19159 0.04842 45.264
<2e-16 o:p="">2e-16>
XYZY
0.07218 0.06035 1.196
0.232
---
Signif. codes:
0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 0.7295 on 635 degrees of
freedom
Multiple R-squared:
0.002248, Adjusted R-squared: 0.0006766
F-statistic: 1.431 on 1 and 635 DF, p-value: 0.2321
Либо банальный Манн Уитни
> wilcox.test(stag ~ XYZ, data=r1, paired = FALSE)
Wilcoxon
rank sum test with continuity correction
data: stag by
XYZ
W = 43647.5, p-value = 0.1938
alternative hypothesis: true location shift is not
equal to 0
Для тех, кто не знает, как читать данный тип диаграмм Как читать диаграмму boxplot.
$X
Min. 1st
Qu. Median Mean 3rd Qu. Max.
1.00 5.00
9.00 10.09 14.75
26.00
$Y
Min. 1st
Qu. Median Mean 3rd Qu. Max.
1.00
6.00 11.00 11.66
16.00 32.00Вывод: мы не наши различий стаже Y-ов и X-ов.
У данного метода есть несколько недостатков, главный, на моя взгляд, в том, что я не беру в анализ незаконченные случаи, т.е. те ситуации, когда человек устроился на работу в указанный промежуток времени (после 1 января 2012 года), но еще не уволился. Эти ситуации также можно анализировать, но данная информация изначально искажена в нашем исследовании, поэтому я не могу полноценно ее включить.
Как мы можем сделать проверку? У нас в этот же промежуток
времени 54 респондента указали пустой дату увольнений, т.е. они продолжали
работать на момент заполнения опросника.
16 из них относятся к
поколению X
38 – к
поколению Y
Напомню, что ранее я давал цифры
X Y
227 410
Это те, кто указал дату увольнения, т.е. закончил работать
Далее составляем таблицу сопряженности
поколение X
|
поколение Y
|
|
продолжает работать
|
16
|
38
|
уволился
|
227
|
410
|
Хиквадрат = 0, 374 без поправки на непрерывность. С
поправкой – еще выше будет.
Вывод: мы не смогли доказать утверждение,что представители
поколения Y чаще меняют работу, чем поколение X.
Для продвинутых аналитиков скажу, почему не сделал анализ типа Каплан Майер: у нас опрос более года длился, а дату заполнения анкеты не фиксировал, поэтому анализ дожития был бы некорректным.
Но я исправился, и в новой анкете учтены недостатки, а вы сейчас пойдете и поучаствуете в опросе Ключевые факторы удержания и текучести персонала
Черт подери, я ставил на игриков :)
ОтветитьУдалить