В предыдущей
статье «Первый подход» я начал
изучать датасет Эдуарда и рассмотрел три идеи:
- Есть ли связь между стажем работы и зарплатой (белая/серая)
- Есть ли связь между инициатором увольнения и полом сотрудника
- А также построил график, который показал нам, что работодатель увольняет по своей инициативе более дорогих сотрудников
Вступление
Сегодня мы
пойдем еще дальше и углубимся в тему, которую подняли в прошлом материале. А
именно:
- Посмотрим, связаны ли переменные Инициатор увольнения и Уровень позиции
- Посмотрим, как М и Ж распределяются по уровням позиции
- А затем объединим все три переменные (Пол, Уровень позиции и Инициатор увольнения) на одном графике
P.S. Эдуард, спасибо за вопросы и наводку!
Идея №1
Давайте
посмотрим на данные, которые есть у нас в датасете по двум переменным: Уровень
позиции и Инициатор увольнения:
Теперь
давайте рассчитаем Хи2:
Мы
получили значимый результат. Теперь, чтобы проинтерпретировать остатки, которые
и покажут нам, в каких группах мы нашли этот значимый результат, построим
график mosaicplot (НУ – начальный
уровень, С – специалист, ВС – ведущий специалист, РНЗ – руководитель начального
звена, РСЗ – руководитель среднего звена, РВЗ – руководитель высшего звена):
Мы уже
знаем, как читать данный график. Нас интересуют синие (отклонения в большую
сторону) и красные (отклонения в меньшую сторону) квадраты. Т.е. два синих
квадрата внизу показывают нам, что работодатель увольняет по своей инициативе
чаще сотрудников с уровней Руководитель среднего звена и Руководитель высшего
звена, чем с других уровней.
А красный
прямоугольник внизу означает, что с позиции Руководитель высшего звена сами сотрудники
уходят гораздо реже.
Идея №2
Теперь давайте посмотрим, как распределяются мужчины и
женщины по уровням управления. По нашим данным имеем следующий результат:
Напомню
также, что в нашем датасете женщин в два раза больше чем мужчин:
Хи2 дает
следующие результаты:
Теперь
давайте построим mosaicplot и посмотрим, где есть значимые отклонения.
Мужчины чаще
находятся на позиции Руководитель высшего звена (нижний синий квадрат). При
этом женщины, как раз, занимают эту позицию реже.
Идея №3
А теперь
давайте объединим все три переменные (Пол, Уровень позиции и Инициатор
увольнения) на одном графике:
Данный
график выглядит несколько иначе, чем те, которые мы выше рисовали (он рисуется
пакетом «vcd»), но смысл и интерпретация аналогичная. Здесь синим и темно розовым
цветом отмечены стандартизированные остатки, которые рассчитываются как разница
между ожидаемыми и фактическими частотами.
Мы видим,
что мужчин, которые занимают позицию Руководитель среднего звена и Руководитель
высшего звена работодатель увольняет гораздо чаще. Т.е. это значимое отклонение
(светло-синий и темно-синий квадраты внизу справа)
При этом
женщины чаще уходят с Начальных позиций и с позиции Специалиста именно по
собственному желанию. Это два светло-синих квадрата вверху слева.
Вывод
1. Работодатель
чаще увольняет сам сотрудников с позиций Руководитель среднего звена и
Руководитель высшего звена.
2. Мужчины
чаще занимают позицию Руководитель высшего звена и Руководитель начального
звена. Женщины чаще занимают позицию Специалист.
3. Руководителей высшего звена и Руководителей
среднего звена мужчин работодатель увольняет чаще по своей инициативе. Женщины
Начального уровня и Специалисты чаще уходят по своей инициативе.
Пора уже на логистическую регрессию выходить)
ОтветитьУдалитья в свое время поразился, что у нас руководителей чаще выводят работодатели
единственная гипотеза на тот момент у меня была, что это текущая ситуация - связанная с кризисом.
было бы еще интересно посмотреть динамику Сам / работодатель по годам.
я наверное это и сделаю, посмотрю
Мы в свое время с Игоремм Бычковым придумали этот показатель кризиса
Да, Эдуард, все ближе и ближе к ней) Вокруг ещё столько всего интересного по пути к ней.
ОтветитьУдалить