Share |

суббота, 30 июля 2016 г.

Кейс по прогнозу эффективности работников

Прелесть данного кейса в том, что я впервые в качестве предиктора данные не только самих работников, но данные руководителя
Всего были использованы такие данные в модели:
  1. Стаж работы в должности
  2. Данные подразделения, должности, региона и т.е..
  3. Пол, возраст сотрудника
  4. Пол руководителя, соотношение полов руководитель / подчиненный;
  5. Тест интеллекта сотрудника;
  6. Личностный тест сотрудника;
  7. Тест интеллекта руководителя;
  8. Личностный тест руководителя.

Результаты

Практически все указанные факторы внесли свой в точность модели (см. на самой нижний картинке значимость факторов - не расшифровываю названия, поскольку кейс реальный, соблюдаю конфиденциальнсоть). На первом месте по значимости  стаж работы. Т.е. рост эффективности в первую очередь определяется стажем.
Далее факторы идут в вперемешку (хотя менее значимы факторы пола, соотношения полов руководитель / подчиненный) , но в качестве главного вывода исследования можно сказать, что результаты руководителя влияют не меньше, чем результаты самого работника.
Звездоболам не рекомендую открывать рот и говорить, что это очевидно.

Вопрос

В этом месте я обращаюсь за помощью к профи: я в качестве предиктора использовал просто шкалы теста, но подозреваю, что важным является не просто наличие или отсутствие того или иного качества у руководителя или подчиненного, а взаимодействие этих качеств у руководителя и подчиненного (на примере пола я показываю, что мы смотрим не просто пол руководителя или пол подчиненного, а взаимодействие полов, т.е. их возможные сочетания: ММ, МЖ, ЖМ, ЖЖ). Т.е. говоря математически, мы должны проверить гипотезы об интеракции факторов. Но просто перебор шкалы со шкалой чересчур трудоемкая работа: даже ели бы у нас был Big5 у руководителя и подчиненного, то количество возможных сочетаний будет 25, а у нас не Big5, поэтому количество проверяемых гипотез больше в десятки раз.
Подскажите, как можно поступить в данном случае? Кластерный анализ?

Картинки

Ну и без того, у нас модель получилась выше плинтуса. Я тренировал модель на RMSE - отклонении прогнозного значения от фактического, но поскольку без масштаба будет непонятно, то даю R^2. Он в нашей модели получился 0, 23.
Маловато, не спорю.
В этом месте вы выходим на один важный вопрос, который я еще в дискурсиях не встречал ни разу: какова в принципе возможна прогнозируемая точность на основе входных данных? Поскольку на эффективность влияет куча других, динамичных факторов, таких как ситуация на рынке, отношения в коллективе, маркетинговая политика компании и другие политики, мотивация и обучения персонала и т.п.. 
На картинке точность так выглядит
Кейс по прогнозу эффективности работников


По оси X - прогнозные значения;
По оси Y - фактические
И посмотрите, какое количество факторов было в модели
Кейс по прогнозу эффективности работников
* можно увеличить картинку, кликнув по ней

Понравился пост?

если Вы захотите выразить мне благодарность за интересный пост, вы можете перевести небольшую сумму мне на Яндекс кошелек (кликните по кнопке Перевести) 
или сделать перевод на карту Сбербанка,
Номер карты 676 280 38 921 538 46 57 - укажите "за результаты исследования ". 
Или просто покликайте на директ рекламу ниже на странице - у вас это отнимет несколько секунд, а мне принесет немного денег. 
спасибо!

2 комментария:

  1. Может быть для проверки гипотезы об интеракции факторов попробовать канонический и/или дискриминантный анализ?

    ОтветитьУдалить

рек