На выходные набрал новых результатов нашего опроса ключевых факторов текучести персонала (ссылка дана того, чтобы вы прошли и поучаствовали в опросе). Данные опроса я "сметчил" (термин, знакомый всем, кто работает с данными) с результатами тестов Лаборатории Гуманитарные Технологии.
Я этот вопрос воспринимаю, как вопрос психологической совместимости руководитель - подчиненный. Любители попинать могут это сделать, я не буду сейчас погружаться в обоснование, почему так, моя задача состоит в том, чтобы спрогнозировать по результатам тестов ответ респондента - будут ли его инициативы приняты руководителем или нет. И эта аналитика имеет практический аспект: какой смысл нам принимать на работу любого крутого чувака, если его крутость будет отвергнута руководителем. У нас, к сожалению, нет данных по руководителям, это значительно улучшило бы аналитику, но что есть, то есть.
Модель
Напомню, что мы использовали для тестирования тесты КТО
И Большая пятерка
Precision recall curve для тестовых данных
Под "1" здесь понимается не принятие руководителем инициатив подчиненного, "0" - принятие.
Эти шкалы - не единственные, участвующие в прогнозе, но эти - одни из самых сильных.
Красиво?
Собственно к задаче.
У нас в исследовании есть такой вопрос "Выходили (выходите) ли Вы со своими инициативами на руководителя" и четыре варианта ответов, среди которых:- Да, и как минимум некоторые были приняты
- Да, но все было отвергнуто
Я этот вопрос воспринимаю, как вопрос психологической совместимости руководитель - подчиненный. Любители попинать могут это сделать, я не буду сейчас погружаться в обоснование, почему так, моя задача состоит в том, чтобы спрогнозировать по результатам тестов ответ респондента - будут ли его инициативы приняты руководителем или нет. И эта аналитика имеет практический аспект: какой смысл нам принимать на работу любого крутого чувака, если его крутость будет отвергнута руководителем. У нас, к сожалению, нет данных по руководителям, это значительно улучшило бы аналитику, но что есть, то есть.
Итак
У нас в исследовании 161 респондент указали, что их инициативы принимались руководителем, 42 респондента указали, что все их инициативы отвергались руководителем. В этом месте сразу хочу показать кривую обучения алгоритма, которая показывает точность модели в зависимости от размера трейн и тест сети дает нам понимание, что для нашей выборки увеличение размера выборки не даст увеличения точности.Модель
Напомню, что мы использовали для тестирования тесты КТО
- Общий балл;
- Вербальный интеллект;
- Числовой интеллект;
- Эрудиция;
- Обработка информации.
И Большая пятерка
- Интроверсия - экстраверсия;
- Независимость - согласие;
- Импульсивность - самоконтроль;
- Тревожность- стабильность;
- Консерватизм- новаторство.
Качество модели
Я работал с градиентным бустингом.Precision recall curve для тестовых данных
Confusion matrix для тестовых данных
col_0
|
False
|
True
|
All
|
0
|
48
|
1
|
49
|
1
|
3
|
9
|
12
|
All
|
51
|
10
|
61
|
Согласитесь, неплохая точность.
ROC curve
И для тех, кому интересна в первую очередь содержательная интерпретация, сообщу, что высокую прогностическую ценность имеют шкалы Интроверсия - Экстраверсия и Независимость - Согласие
Картинка, поясняющая связь между шкалами теста и ответом опроса
- По оси X - шкала Независимости Согласия;
- Ось Y - шкала Интроверсии - Экстраверсии
Эти шкалы - не единственные, участвующие в прогнозе, но эти - одни из самых сильных.
Красиво?
Понравился пост?
если Вы захотите выразить мне благодарность за интересный пост, вы можете перевести небольшую сумму мне на Яндекс кошелек (кликните по кнопке Перевести)
или сделать перевод на карту Сбербанка,
Номер карты 676 280 38 921 538 46 57 - укажите "Технологические решения в области people analytics ".
Или просто покликайте на директ рекламу ниже на странице - у вас это отнимет несколько секунд, а мне принесет немного денег.
спасибо!
Комментариев нет:
Отправить комментарий