Share |

четверг, 30 июня 2016 г.

С кем чаще расстаются работодатели

автор Люда Рогова
 
Часто в аналитических исследованиях главной целью является  изучение влияния различных факторов на исследуемую переменную.  Я  до этого момента в основном делала упор на построение моделей, повышение их качества и особенно не старалась строить какие-то выводы по самим данным, детально разбираться а как именно i-фактор влияет на зависимую переменную. Сейчас я попробую сделать именно это - не просто получить коэффициенты в модели, а попытаться разобраться, что именно вошло в эту модель, и как это влияет на результат.
Любимая тема последних лет - борьба с текучестью персонала. Многие компании разрабатывают целый комплекс мер по удержанию персонала. Но при этом, многие сотрудники покидают свои рабочие места не по собственному желанию, а по инициативе работодателя. Вот я и попробую разобраться, с кем работодатели предпочитают расставаться и какие факторы являются наиболее значимыми в этом случае.
Из модели я исключила данные о зарплате при приеме на работу и на момент увольнения. Скорее всего, это окажется одним из самых значимых факторов. В будущем я хочу проверить гипотезу, что увольняют сотрудников с более высокой ЗП. Но сегодня я сознательно исключила эту переменную. В опросе принимали участие люди из разных регионов с разным уровнем жизни. Сравнение их доходов в сыром виде может привести к некорректным выводам. Данные нужно приводить к единому знаменателю. Есть много способов сделать это, но каждый из них имеет свои недостатки. Когда-нибудь в будущем займусь этим, а сейчас пока вынесу за скобки. Аналогично убрала информацию о регионах. В опросе наибольшее количество участников из Москвы и Питера. Понятно, что если оставить в анализе эту переменную, то она окажется на вершине моего хит парада. При этом регион и уровень доходов опять же связаны между собой - удалила одно, надо и второе убирать. Остальные переменные не трогала, оставила как есть.
Для построения модели использовала xgboost, модель получилась среднего качества (площадь под auc-кривой на обучении – 0,74, на тесте – 0,64). Можно было бы и дальше настраивать параметры в попытке повысить точность модели, но у меня иная цель.  Я не ставила задачу максимально точно предсказать вероятность увольнения сотрудников по инициативе работодателя, мне хотелось разобраться какие факторы окажутся самыми значимыми, и заодно посмотреть, чем значения этих факторов отличаются для обеих групп.
Ниже представлены исследуемые факторы в порядке убывания их значимости.
 

Первым по значимости оказался возраст.
 
 
Уволенные по инициативе работодателя оказались немного старше группы, в которой сотрудники сами принимали решения о том уйти им или остаться. Медианный возраст для первой группы 37 лет, для второй 34.
Пол сотрудников тоже оказался в лидерах. Чаще всего расстаются с мужчинами, это факт. Распределение по полу среди уволенных и остальных отличается (хи2= 4,00E-09). Интересно, это женщин больше жалеют или среди них просто меньше руководителей? Ниже по тексту еще будет упоминаться уровень позиции при увольнении.
Третьим в списке значимых факторов оказался график работы. И тут тоже весьма интересный результат. По инициативе работодателя чаще уходят те, кто постоянно задерживается на работе... Не справляются с задачами в течение рабочего дня? Хотя по данному вопросу, если смотреть на распределение, ответ может показаться спорным. Тем не менее моя модель поставила этот фактор на третье место.
 
 
 
А вот и уровень позиции при увольнении. Для меня не стало неожиданностью, что среди уволенных достаточно много руководителей среднего и высшего звена. Я скорее удивилась, что этот фактор оказался лишь на четвертом месте. Требования к руководителям всегда жестче, от них зависит многое, и компании не могут позволить себе долго мириться с неугодными им товарищами. Специалисту могут прощать постоянные ошибки, а руководителю нет. Хотя иногда я видела и обратные ситуации...
Следующими в списке оказалось знание иностранного языка и отрасль. Не буду тут приводить графики, их и так уже достаточно. Скажу лишь только, что чаще увольняют сотрудников с более высоким уровнем владения иностранным языком... Среди отраслей пятерка наиболее часто применяющая крайние меры выглядит так: "Банки/Инвестиционный бизнес/Страхование" ( 12,37%), "Розничная торговля" (11,84%), "ИТ", "Оптовая торговля", "Промышленность" (у всех оказался одинаковый процент - 9,74%).
Дошла очередь до тестов. Данных о тестировании не так много, но что имеем, то имеем.  Сразу хочу отметить, что уволенные по инициативе работодателя охотнее проходят тестирование по сравнению с теми, кто сам принимает решение уволится или продолжать работать. Доля прошедших тестирование среди первой группы 26,32%, для второй группы 20,36%. Я даже интервальные оценки для этих долей посчитала. Выглядит все это как-то так:
 

Интервалы немного пересекаются, так что формально, глядя только на полученные границы этих интервалов,  я не могу утверждать, что разница между группами существенна).  Ниже на картинке три графика для первых наиболее значимых теста: "Тревожность - стабильность", "Числовой IQ" и "Импульсивность - самоконтроль".
Получается, что под раздачу попадают в основном в меру тревожные люди, не отличающиеся ни чрезмерной импульсивностью, ни чрезмерным самоконтролем, с достаточно высоким результатом по числовому IQ.

Далее по моему списку еще значатся много факторов для исследования и интерпретации, но по сравнению с уже перечисленными они не оказывают такого существенного влияния на исследуемый результат. В этих факторах тоже будет интересно поразбираться в поисках отличий, но я пока оставлю это до лучших времен.
Глядя на все эти графики, у меня стало складываться впечатление, что по инициативе работодателя часто увольняются весьма уверенные в себе люди, которые просто не хотят прогибаться под диктуемые им правила, достаточно четко оценивающие свои силы и способности. Люди, которые умеют достойно проигрывать? 
 

16 комментариев:

  1. ну почему в меру тревожные?
    график распределения нам дает опосредованное представление, поскольку xgboost пилит в многомерном пространстве, мы не знаем. в каком он сочетании выпиливает узор в тревожности

    и тут есть еще одна фишка

    эти люди проходили опрос после увольнения

    можем мы предполодить, что у них тревожность повысилась после увольнения? а не была такой до?

    ОтветитьУдалить
  2. насчет гипотеза
    Глядя на все эти графики, у меня стало складываться впечатление, что по инициативе работодателя часто увольняются весьма уверенные в себе люди, которые просто не хотят прогибаться под диктуемые им правила, достаточно четко оценивающие свои силы и способности. Люди, которые умеют достойно проигрывать?

    не уверен....
    если взять отрасли, то это влияние кризиса
    если взять уровень позиции, то это кризис

    про тесты тоже может быть объяснение

    так что вопрос тебе возвращаю: как мы можем вычленить, где человека не просто сократили из за кризиса, а он попал под раздачу, а где его уволили, как несгибаемого борца

    ОтветитьУдалить
    Ответы
    1. Говорить о кризисе мы можем только в промежутке где-то с октября 2008 по декабрь 2009, и второй временной промежуток с декабря 2014 года. Уволенные между январем 2010 и ноябрем 2014 попали под раздачу явно не из-за кризиса. Я посмотрю отдельно только на этих людей и постараюсь найти что-то общее.

      Удалить
    2. Боюсь только, что данных будет очень мало, с того времени многие успели найти новую работу, а в опросе только про последнее место

      Удалить
    3. ну... вот и попалась)
      вот тебе простое задание: проверь гипотезу " Уволенные между январем 2010 и ноябрем 2014 попали под раздачу явно не из-за кризиса."
      как будешь проверять?)

      Удалить
    4. Получается, что мои уволенные разбиваются на 2 группы по датам сокращения. То есть мне надо найти статистически значимые различия между этими группами по каким-либо факторам. Если такие отличия находятся, то есть группы действительно разные, то считаю гипотезу подтвержденной. Если отличий между группами нет, значит гипотеза отвергается, думаю дальше

      Удалить
    5. совершенно верно!
      я уже знаю эти признаки, если конечно, ты с границами кризиса угадала
      Например, это увольнение из банков и ритейла

      Удалить
    6. и сделай простую аналитику: % уволенных работодателем по годам. Все станет сразу ясно, в т.ч. границы кризиса

      Удалить
    7. Предположу, что увижу на графиках начало где-то в марте 2015 года. Большинство все-таки должны были получить уведомление о сокращении как минимум за 2 месяца. Сделаю вечером

      Удалить
    8. а есть еще одна переменная, которую в принципе никак не учла.
      Если ты хочешь отделить гордых от попавших под раздачу, то можно посмотреть на стаж

      Удалить
  3. Гипотеза ("Глядя на все эти графики, у меня стало складываться впечатление, что по инициативе работодателя часто увольняются весьма уверенные в себе люди, которые просто не хотят прогибаться под диктуемые им правила, достаточно четко оценивающие свои силы и способности"), если рассуждать логически, звучит вполне разумно. Однако, чтобы проверить ее с точки зрения статистической значимости, скорее всего потребуется отдельно разработанный вопросник.

    ОтветитьУдалить
    Ответы
    1. Виктор, вряд ли в обозримом будущем появится новый опрос. У меня пока не самый большой опыт в HR-аналитике, но я уже успела убедиться, что одной из самых больших проблем остается проблема сбора данных, придется учиться обходится тем, что есть). И такой момент - статистическая значимость - это просто инструмент проверки гипотез, который говорит либо в пользу нулевой, либо в пользу альтернативной гипотезы. Что даст новый опросник с этой точки зрения? Или Вы имеете в виду, что новый вопросник должен содержать доп вопросы/тесты для более детальной оценки личностных характеристик, а сейчас их просто недостаточно?

      Удалить
  4. вот цена твоих слов
    "Глядя на все эти графики, у меня стало складываться впечатление, что по инициативе работодателя часто увольняются весьма уверенные в себе люди, которые просто не хотят прогибаться под диктуемые им правила, достаточно четко оценивающие свои силы и способности. Люди, которые умеют достойно проигрывать? "

    я уже увидел пост в инете, где болван это использует не как гипотезу, а как данность....

    ОтветитьУдалить
  5. Наконец-то реалистичный взгляд на вещи! Ваша статистика подтвердила, что «экономика» раздаточная, а руководителей ставят «по знакомству». У этих «руководителей» низкий IQ и хищнические интересы, им не нужны профессионалы. Поэтому перед увольнением нужно профессионала заставить как можно больше выполнить работы, выжить все соки, заставляя работать по 14 часов, естественно не оплачивая переработку по закону, а затем обгадив выгнать (об увольнении уже решено заранее, это такая система на предприятии, даже термин есть «пропеллер»). Очень эффективно и незатратно. А вы тут стругаете целые талмуды стругаете «как избавиться от текучести» - смешно.

    ОтветитьУдалить