.

Сделать репост в соц сети!

среда, 7 января 2015 г.

Поколения X и Y: кто чаще меняет работу



Я уже не аноснирую наше исследование в начале, пишу так много, что не ожидаю незнакомых людей в нем, но если и появятся, ссылка на исследование текучести внизу, проголосуйте - оно по прежнему актуально.
Если вся эта аналитическая фигня неинтересна - читайте внизу вывод жирным 
Логика проверки заключается, в первую очередь , в очищении эффекта корреляции пары «возраст – стаж».
Представьте ситуацию, что представитель поколения X устроился на работу в 1985 году и работает по сю пору. Это здорово, но это не значит, что поколение X более стабильно: просто представитель поколения Y в 1985 году в лучшем случае сидел на горшке и сравнивать поколения в данном разрезе некорректно.
Поэтом у справедливо было бы посмотреть ситуацию, в которой оба поколения X и Y дееспособны.
Я взял следующие границы поколений:
Поколение X = 1963 : 1981
Поколение Y = 1982 : 1992
Верхнюю границу поколения Y я не стал поднимать до 1995 года, потому что:
Я решил взять выборку респондентов, трудоустроившихся после после 1 января 2012 года. В этом году даже самым молодым представителям поколения Y уже 19 лет, они вполне трудоспособны.
Далее мы посмотрим значимость различий в стаже между поколениями X и Y.
Всего в этот период устроилось на работу 637 респондентов, из них
X   Y
227 410


Call:
lm(formula = log(r1$stag, base = exp(1)) ~ XYZ, data = r1)

Residuals:
    Min      1Q  Median      3Q     Max
-2.2638 -0.4720  0.1341  0.5165  1.2741

Coefficients:
            Estimate Std. Error t value Pr(>|t|)   
(Intercept)  2.19159    0.04842  45.264   <2e-16 o:p="">
XYZY         0.07218    0.06035   1.196    0.232   
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 0.7295 on 635 degrees of freedom
Multiple R-squared:  0.002248, Adjusted R-squared:  0.0006766
F-statistic: 1.431 on 1 and 635 DF,  p-value: 0.2321
 Либо банальный Манн Уитни
> wilcox.test(stag ~ XYZ, data=r1, paired = FALSE)

        Wilcoxon rank sum test with continuity correction

data:  stag by XYZ
W = 43647.5, p-value = 0.1938
alternative hypothesis: true location shift is not equal to 0
Для тех, кто не знает, как читать данный тип диаграмм Как читать диаграмму boxplot.
Поколения X и Y: кто чаще меняет работу

$X
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.
   1.00    5.00    9.00   10.09   14.75   26.00

$Y
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.
   1.00    6.00   11.00   11.66   16.00   32.00
Вывод: мы не наши различий стаже Y-ов и X-ов.
У данного метода есть несколько недостатков, главный, на моя взгляд, в том, что я не беру в анализ незаконченные случаи, т.е. те ситуации, когда человек устроился на работу в указанный промежуток времени (после 1 января 2012 года), но еще не уволился. Эти ситуации также можно анализировать, но данная информация изначально искажена в нашем исследовании, поэтому я не могу полноценно ее включить.
Как мы можем сделать проверку? У нас в этот же промежуток времени 54 респондента указали пустой дату увольнений, т.е. они продолжали работать на момент заполнения опросника.
16  из них относятся к поколению X
38 – к поколению Y
Напомню, что ранее я давал цифры
X   Y
227 410
Это те, кто указал дату увольнения, т.е. закончил работать
Далее составляем таблицу сопряженности

поколение X
поколение Y
продолжает работать
16
38
уволился
227
410

Хиквадрат = 0, 374 без поправки на непрерывность. С поправкой – еще выше будет.

Вывод: мы не смогли доказать утверждение,что представители поколения Y чаще меняют работу, чем поколение X.
Для продвинутых аналитиков скажу, почему не сделал анализ типа Каплан Майер: у нас опрос более года длился, а дату заполнения анкеты не фиксировал, поэтому анализ дожития был бы некорректным.
Но я исправился, и в новой анкете учтены недостатки, а вы сейчас пойдете и поучаствуете в опросе Ключевые факторы удержания и текучести персонала

1 комментарий: