.

Сделать репост в соц сети!

вторник, 28 июля 2015 г.

Кого больше старается удержать работодатель: мужчин или женщин

Вот такую идею я сегодня хочу проверить. Сразу извиняюьс на кучу грамматических и стилистических ошибок - время полночь, сил нет, делаю запись набегу.
Часто работодатель, чтобы удержать работника, увеличивает ему зарплату. И, соответственно, чем больше стаж ценных сотрудников, тем больше зарплата.
Если визуализировать графически, то у ценных сотрудников линия тренда более круто завернута кверху.
И вот тут у меня возникла мысль проверить, кто более ценный для работодателя: мужчины или женщины. Конечно, я как всякая порядочная мужская сволочь ставил на мужиков, как на ценных работников.
Дальше тем, кто ничего не понимает в статистике советую сначала пройти наш опрос Исследование времени поиска работы, а потом перейти в самый даун поста - прочитать выводы
Данные взяты по 315 респондентам женщинам и 139 мужчинам.
Респонденты указывали дату приема на работу, дату увольнения, зарплату на момент увольнения
теперь к аналитикам обращаюсь: скажите, где может быть засада (понятно, что отрасль влияет - женская или мужская, но сейчас я пока не могу это проверить, позже).
Во - первых очистил от влияния фактора даты увольнения - среди мужчин и женщин этот показатель не значим (ну т.е. респонденты заполняли данные о себе по разным годам своей работы, а зарплата зависит среди прочего также от года работы, т.е. те, кто заполнял про 2012 получал в среднем меньше, чем тот, кто заполнял анкету за 2014 - и я посчитал, что для М и Ж этот фактор различается незначимо, поэтому мы можем им пренебречь..

Теперь показатель стажа

group: Ж
  vars   n  mean    sd median trimmed   mad  min    max  range skew kurtosis   se
1    1 315 35.07 39.82  21.01   27.62 21.11 0.13 314.27 314.14 2.62    10.28 2.24
--------------------------------------------------------------------------------
group: М
  vars   n  mean    sd median trimmed   mad  min    max range skew kurtosis   se
1    1 139 35.16 37.48  22.98   27.89 20.76 2.04 222.54 220.5 2.18     5.65 3.18

Эти данные указаны в месяцах стажа, Манн Уитни показывает значимость 0, 64.
ну и картинка. Я обрезал картинку 120 месяцами стажа. Из картинки видно, что различия не значимы.
Кого больше старается удержать работодатель: мужчин или женщин

Зарплата

group: Ж
  vars   n  mean   sd   median trimmed   mad     min    max    range  skew kurtosis   se
1    1 315 73.89 59.6     55     63.89      44.48       5        350   345    1.88     4.48     3.36
--------------------------------------------------------------------------------
group: М
  vars   n   mean    sd     median trimmed   mad min max range skew kurtosis   se
1    1 139 118.78 83.27    100      107.52   74.13  15 350   335 1.19     0.89       7.06

И здесь невооруженным глазом видно, что мужики честно получают больше: медиана - 100 000 рублей для М, 55 000 для Ж.
Картинка (можно кликнуть для увеличения)
Кого больше старается удержать работодатель: мужчин или женщин
Дальше мы логарифмируем стаж и зарплату и получаем вот такую картинку

Содержательно мы здесь мало что поймем, видимо - это логарифмы
Кого больше старается удержать работодатель: мужчин или женщин

А вот дальше самое смешное

Уравнение регрессии для мужиков (данные логарифмированы)

lm(formula = зп ~ стаж, data = qm)

Residuals:
     Min       1Q   Median       3Q      Max
-1.81412 -0.44130  0.04517  0.45896  1.51052

Coefficients:
            Estimate Std. Error t value         Pr(>|t|)  
(Intercept)  10.8533     0.4065  26.700   2e-16
стаж          0.0893     0.0619   1.443         0.151    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.7492 on 137 degrees of freedom
Multiple R-squared:  0.01497, Adjusted R-squared:  0.007776
F-statistic: 2.082 on 1 and 137 DF,  p-value: 0.1514


И для женщин

Call:
lm(formula = зп ~ стаж, data = qf)

Residuals:
     Min       1Q   Median       3Q      Max
-2.13750 -0.56650 -0.00783  0.52336  1.83034

Coefficients:
            Estimate Std. Error t value          Pr(>|t|)  
(Intercept)   9.9987     0.2417  41.367   2e-16 ***
стаж          0.1454     0.0371   3.919      0.000109 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.7393 on 312 degrees of freedom
Multiple R-squared:  0.04692, Adjusted R-squared:  0.04387
F-statistic: 15.36 on 1 and 312 DF,  p-value: 0.0001092

Смешно, правда? на 1 % прироста стажа зарплата женщин при растает на 0, 14 %, если я правильно помню интерпретацию логарифмированных переменных.

Интерпретация

Дам физически понятную картинку
Кого больше старается удержать работодатель: мужчин или женщин

Картинка, конечно, не корректная, но по ней видно, что женщины в перспективе 20 лет стажа не догоняют мужиков по зарплате.
Уровень оплаты мужчин на момент увольнения не зависит от проработанного стажа, у женщин такая связь есть: с возрастанием стажа зарплата на дату увольнения растет.
Сложно сказать, кого больше ценит работодатель, но результаты получились интересные.
Хотелось бы услышать ваши содержательные интерпретации. Спасибо

8 комментариев:

  1. эээээээм.....мне срочно нужно логическое объяснение!

    ОтветитьУдалить
    Ответы
    1. ну как вариант: по мужчинам слишком разнородная выброка. Т.е. в кучу смешались айтишники, HR и прочая...

      хотя я сам не понимаю, почему в каше не может быть зависимости

      по идее должно быть по барабану, какая отрасль, территория и т.п..

      зарплата должна расти со стажем...

      Удалить
  2. Эдуард, а если отдельно по отраслям сделать?

    ОтветитьУдалить
    Ответы
    1. Максим, у вас 139 мужчин, с десяток отраслей....

      намек понятен?

      Удалить
    2. да, маловато для каждой...

      Удалить
  3. Как одна из гипотез: мужчины просто слегка преувеличили свои зарплаты....

    ОтветитьУдалить
  4. У мужчин на уровень зарплаты влияют другие факторы :))
    А вообще для далеко идущих выводов нужно обязательно учесть отрасль. В разных отраслях разное соотношение женщин и мужчин, разный уровень зарплаты. Сравните то же самое для какой-нибудь одной-двух отраслей для примера.

    ОтветитьУдалить