Share |

пятница, 16 сентября 2016 г.

Анализ причин текучести персонала: открытые вопросы exit интервью

Продолжаю тему анализа текстов. Сегодня покажу набросок на тему анализа открытых вопросов exit интервью.
Выражаю благодарность Людмиле Роговой и Ивану Безуглову за помощь в работе над постом. К сожалению, становится все сложнее делать посты одному: сложность возрастает.
Проблема у нас в прежнем: мы можем собирать кучу информации при увольнении, в т.ч. задавать открытые вопросы в exit интервью, но
  • кто эти все анкеты будет читать? 
  • как из этого извлечь пользу? Как понять, что конкретная анкета говорит о тенденции, а не о личной проблеме конкретного работника? 
Для это применяется математика. Единственное требование - все эти ответы должны быть в электронном виде, а не на бумаге или в ушах кадровика.
У меня на сегодня нет данных exit интервью конкретной компании, не снабдил меня никто этим. Поэтому я пользуюсь результатами своего исследования факторов текучести персонала (ссылка дана с тем, чтобы вы поучаствовали в опросе). Последний вопрос исследования - открытый, дословно звучит так
Напишите (по желанию) в нескольких предложениях отзыв о работодателе (конфиденциальность гарантируем): особенности работодателя, особенности корпоративной культуры, менеджмента и коллектива, причины, по которым вы уволились или работаете в компании и т.п.
Я этот вопрос, уж простите, решил принять как открытый вопрос exit интервью.

Цель

А цель очень проста: выяснить, какого типа отзывы о компании связаны с высоким риском ухода из компании. Если совсем тупо, то какая причина увольнения заставляет работников покидать компанию быстрей.

Результат

Ну давайте посмотрим, что получилось. Чтобы получить ответ на заданный вопрос, нам нужно сгруппировать все ответы вокруг нескольких тем. Эту задачу выполняют несколько методов, в идеале стоило бы попробовать Латентное размещение Дирихле, см. пост Обратная связь сотрудников как инструмент диагностики корпоративной культуры. Я использовал Kmeans. Отличие в том, что Kmeans относит каждый отзыв о компании или каждую анкету exit интервью к одной теме / топику, а Латентное размещение Дирихле может каждую анкету exit интервью отнести к нескольким темам. Это, наверное, будет более корректным, поскольку респондент может писать о нескольких причинах увольнения, о нескольких особенностях компании. Но я сегодня делаю первый заход, мне хотелось просто потрогать инструмент, попытаться выделить ключевые темы.
Итак, я взял инструмент кластеризации Kmeans и выделил четыре кластера (я оставлю за скобками, почему именно четыре, но просто скажу, что игрался достаточно долго с разными параметрами, эта лучшая комбинация).
Анализ причин текучести персонала: открытые вопросы exit интервью
Невооруженным глазом заметно, что машинка разделяет не очень хорошо, не считая черный кластер - но там всего три точки, которые не оказывают влияния на общую картинку текучести. Но открою страшную тайну, у нас в этом исследовании всего 103 респондента, которые оставили отзыв о компании, я нетерпеливый, не смог дождаться, стал делать, со временем мы сможем получить более устойчивые кластеры.
Но и тем не менее, нас интересует не сами по себе кластеры. Нас интересует текучесть персонала, и как эти кластеры связаны с текучестью.
Используем полюбившийся вам анализ дожития. Я убираю из анализа "черный" кластер, как малочисленный, и смотрю на уровень текучести по каждому кластеру: в каком кластере работники убегают быстрее из компании.
Анализ причин текучести персонала: открытые вопросы exit интервью
Как читать такой тип диаграммы - Анализ и визуализация дожития: чем HR похож на медиков.
  • По оси Y - вероятность, что работник доработает до этого момента стажа в компании.
  • По оси X - число месяцев стажа
И вот у нас "синий" (или четвертый) кластер выбивается в лидеры текучести персонала. Смотрим регрессию Кокса
Call:
coxph(formula = Surv(months, as.numeric(event)) ~ cl, data = q1)

  n= 100, number of events= 63

      coef exp(coef) se(coef)     z Pr(>|z|)
cl3 0.1766    1.1932   0.4566 0.387   0.6988
cl4 0.5573    1.7459   0.2675 2.083   0.0373 *
И приз наш: мы зафиксировали значимые различия между вторым и четвертым кластером! Правда, значимость всего 0, 037, но не забывайте, что наша выборка будет увеличиваться.

Самое вкусное

Я в конце скажу о главном: что кластеры обозначают. У нас четвертый кластер оказался значимо "текучей", чем второй, давайте посмотрим на них.
  • Четвертый кластер включает наиболее "тяжелые" слова: "директор" "директора" "компания" "причина" "руководитель" "руководство" "стороны"    "увольнения"   
  • Второй кластер: "внимания" "возможность" "з/п" "заработная" "корпоративная" "культура" "профессионального" "развиваться" "руководитель"  
Вы заметили, что кластеры очень неточно делят топики? И это главная проблема на сегодня. Тем не менее, четвертый кластер у нас имеет достаточно четко очерченный смысл. И этот смысл повышает риски увольнения в компании. Сейчас найдется куча офигенно продвинутых "аналитиков", которые скажут: ну это же очевидно, что фактор отношений с руководителем играет первостепенную роль. А мне вот лично это не очевидно, поэтому я кручу проблему с разных сторон.
Ждите постов дальше на эту тему. и принимаем участие в исследовании факторов текучести

Понравился пост?

если Вы захотите выразить мне благодарность за интересный пост, вы можете перевести небольшую сумму мне на Яндекс кошелек (кликните по кнопке Перевести) 
или сделать перевод на карту Сбербанка,
Номер карты 676 280 38 921 538 46 57 
Или просто покликайте на директ рекламу ниже на странице - у вас это отнимет несколько секунд, а мне принесет немного денег. 
спасибо!

Комментариев нет:

Отправить комментарий

рек

Популярные сообщения