Вот такую идею я сегодня хочу проверить. Сразу извиняюьс на кучу грамматических и стилистических ошибок - время полночь, сил нет, делаю запись набегу.
Часто работодатель, чтобы удержать работника, увеличивает ему зарплату. И, соответственно, чем больше стаж ценных сотрудников, тем больше зарплата.
Если визуализировать графически, то у ценных сотрудников линия тренда более круто завернута кверху.
И вот тут у меня возникла мысль проверить, кто более ценный для работодателя: мужчины или женщины. Конечно, я как всякая порядочная мужская сволочь ставил на мужиков, как на ценных работников.
Дальше тем, кто ничего не понимает в статистике советую сначала пройти наш опрос Исследование времени поиска работы, а потом перейти в самый даун поста - прочитать выводы
Во - первых очистил от влияния фактора даты увольнения - среди мужчин и женщин этот показатель не значим (ну т.е. респонденты заполняли данные о себе по разным годам своей работы, а зарплата зависит среди прочего также от года работы, т.е. те, кто заполнял про 2012 получал в среднем меньше, чем тот, кто заполнял анкету за 2014 - и я посчитал, что для М и Ж этот фактор различается незначимо, поэтому мы можем им пренебречь..
vars n mean sd median trimmed mad min max range skew kurtosis se
1 1 315 35.07 39.82 21.01 27.62 21.11 0.13 314.27 314.14 2.62 10.28 2.24
--------------------------------------------------------------------------------
group: М
vars n mean sd median trimmed mad min max range skew kurtosis se
1 1 139 35.16 37.48 22.98 27.89 20.76 2.04 222.54 220.5 2.18 5.65 3.18
Эти данные указаны в месяцах стажа, Манн Уитни показывает значимость 0, 64.
ну и картинка. Я обрезал картинку 120 месяцами стажа. Из картинки видно, что различия не значимы.
vars n mean sd median trimmed mad min max range skew kurtosis se
1 1 315 73.89 59.6 55 63.89 44.48 5 350 345 1.88 4.48 3.36
--------------------------------------------------------------------------------
group: М
vars n mean sd median trimmed mad min max range skew kurtosis se
1 1 139 118.78 83.27 100 107.52 74.13 15 350 335 1.19 0.89 7.06
И здесь невооруженным глазом видно, что мужики честно получают больше: медиана - 100 000 рублей для М, 55 000 для Ж.
Картинка (можно кликнуть для увеличения)
Дальше мы логарифмируем стаж и зарплату и получаем вот такую картинку
Содержательно мы здесь мало что поймем, видимо - это логарифмы
А вот дальше самое смешное
Residuals:
Min 1Q Median 3Q Max
-1.81412 -0.44130 0.04517 0.45896 1.51052
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 10.8533 0.4065 26.700 2e-16
стаж 0.0893 0.0619 1.443 0.151
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.7492 on 137 degrees of freedom
Multiple R-squared: 0.01497, Adjusted R-squared: 0.007776
F-statistic: 2.082 on 1 and 137 DF, p-value: 0.1514
lm(formula = зп ~ стаж, data = qf)
Residuals:
Min 1Q Median 3Q Max
-2.13750 -0.56650 -0.00783 0.52336 1.83034
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 9.9987 0.2417 41.367 2e-16 ***
стаж 0.1454 0.0371 3.919 0.000109 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.7393 on 312 degrees of freedom
Multiple R-squared: 0.04692, Adjusted R-squared: 0.04387
F-statistic: 15.36 on 1 and 312 DF, p-value: 0.0001092
Смешно, правда? на 1 % прироста стажа зарплата женщин при растает на 0, 14 %, если я правильно помню интерпретацию логарифмированных переменных.
Картинка, конечно, не корректная, но по ней видно, что женщины в перспективе 20 лет стажа не догоняют мужиков по зарплате.
Уровень оплаты мужчин на момент увольнения не зависит от проработанного стажа, у женщин такая связь есть: с возрастанием стажа зарплата на дату увольнения растет.
Сложно сказать, кого больше ценит работодатель, но результаты получились интересные.
Хотелось бы услышать ваши содержательные интерпретации. Спасибо
Часто работодатель, чтобы удержать работника, увеличивает ему зарплату. И, соответственно, чем больше стаж ценных сотрудников, тем больше зарплата.
Если визуализировать графически, то у ценных сотрудников линия тренда более круто завернута кверху.
И вот тут у меня возникла мысль проверить, кто более ценный для работодателя: мужчины или женщины. Конечно, я как всякая порядочная мужская сволочь ставил на мужиков, как на ценных работников.
Дальше тем, кто ничего не понимает в статистике советую сначала пройти наш опрос Исследование времени поиска работы, а потом перейти в самый даун поста - прочитать выводы
Данные взяты по 315 респондентам женщинам и 139 мужчинам.теперь к аналитикам обращаюсь: скажите, где может быть засада (понятно, что отрасль влияет - женская или мужская, но сейчас я пока не могу это проверить, позже).
Респонденты указывали дату приема на работу, дату увольнения, зарплату на момент увольнения
Во - первых очистил от влияния фактора даты увольнения - среди мужчин и женщин этот показатель не значим (ну т.е. респонденты заполняли данные о себе по разным годам своей работы, а зарплата зависит среди прочего также от года работы, т.е. те, кто заполнял про 2012 получал в среднем меньше, чем тот, кто заполнял анкету за 2014 - и я посчитал, что для М и Ж этот фактор различается незначимо, поэтому мы можем им пренебречь..
Теперь показатель стажа
group: Жvars n mean sd median trimmed mad min max range skew kurtosis se
1 1 315 35.07 39.82 21.01 27.62 21.11 0.13 314.27 314.14 2.62 10.28 2.24
--------------------------------------------------------------------------------
group: М
vars n mean sd median trimmed mad min max range skew kurtosis se
1 1 139 35.16 37.48 22.98 27.89 20.76 2.04 222.54 220.5 2.18 5.65 3.18
Эти данные указаны в месяцах стажа, Манн Уитни показывает значимость 0, 64.
ну и картинка. Я обрезал картинку 120 месяцами стажа. Из картинки видно, что различия не значимы.
Зарплата
group: Жvars n mean sd median trimmed mad min max range skew kurtosis se
1 1 315 73.89 59.6 55 63.89 44.48 5 350 345 1.88 4.48 3.36
--------------------------------------------------------------------------------
group: М
vars n mean sd median trimmed mad min max range skew kurtosis se
1 1 139 118.78 83.27 100 107.52 74.13 15 350 335 1.19 0.89 7.06
И здесь невооруженным глазом видно, что мужики честно получают больше: медиана - 100 000 рублей для М, 55 000 для Ж.
Картинка (можно кликнуть для увеличения)
Дальше мы логарифмируем стаж и зарплату и получаем вот такую картинку
Содержательно мы здесь мало что поймем, видимо - это логарифмы
А вот дальше самое смешное
Уравнение регрессии для мужиков (данные логарифмированы)
lm(formula = зп ~ стаж, data = qm)Residuals:
Min 1Q Median 3Q Max
-1.81412 -0.44130 0.04517 0.45896 1.51052
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 10.8533 0.4065 26.700 2e-16
стаж 0.0893 0.0619 1.443 0.151
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.7492 on 137 degrees of freedom
Multiple R-squared: 0.01497, Adjusted R-squared: 0.007776
F-statistic: 2.082 on 1 and 137 DF, p-value: 0.1514
И для женщин
Call:lm(formula = зп ~ стаж, data = qf)
Residuals:
Min 1Q Median 3Q Max
-2.13750 -0.56650 -0.00783 0.52336 1.83034
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 9.9987 0.2417 41.367 2e-16 ***
стаж 0.1454 0.0371 3.919 0.000109 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.7393 on 312 degrees of freedom
Multiple R-squared: 0.04692, Adjusted R-squared: 0.04387
F-statistic: 15.36 on 1 and 312 DF, p-value: 0.0001092
Смешно, правда? на 1 % прироста стажа зарплата женщин при растает на 0, 14 %, если я правильно помню интерпретацию логарифмированных переменных.
Интерпретация
Дам физически понятную картинкуКартинка, конечно, не корректная, но по ней видно, что женщины в перспективе 20 лет стажа не догоняют мужиков по зарплате.
Уровень оплаты мужчин на момент увольнения не зависит от проработанного стажа, у женщин такая связь есть: с возрастанием стажа зарплата на дату увольнения растет.
Сложно сказать, кого больше ценит работодатель, но результаты получились интересные.
Хотелось бы услышать ваши содержательные интерпретации. Спасибо
эээээээм.....мне срочно нужно логическое объяснение!
ОтветитьУдалитьну как вариант: по мужчинам слишком разнородная выброка. Т.е. в кучу смешались айтишники, HR и прочая...
Удалитьхотя я сам не понимаю, почему в каше не может быть зависимости
по идее должно быть по барабану, какая отрасль, территория и т.п..
зарплата должна расти со стажем...
Эдуард, а если отдельно по отраслям сделать?
ОтветитьУдалитьМаксим, у вас 139 мужчин, с десяток отраслей....
Удалитьнамек понятен?
да, маловато для каждой...
УдалитьКак одна из гипотез: мужчины просто слегка преувеличили свои зарплаты....
ОтветитьУдалитьУ мужчин на уровень зарплаты влияют другие факторы :))
ОтветитьУдалитьА вообще для далеко идущих выводов нужно обязательно учесть отрасль. В разных отраслях разное соотношение женщин и мужчин, разный уровень зарплаты. Сравните то же самое для какой-нибудь одной-двух отраслей для примера.
Олеся, вы сами проголосовали?
Удалить