Share |

воскресенье, 2 марта 2014 г.

Кейс "HR-бизнес партнер" (Статистика Байеса в HR-аналитике)

Кейс с моего семинара Аналитика для HR: я задаю следующие вопросы участникам:
Насколько хорошо в Вашей компании развита HR-аналитика? (и варианты ответов)
  1. отлично
  2. средне
  3. плохо
Является ли HR Вашей компанией партнером бизнеса?
  1. да
  2. скорее да, чем нет
  3. скорее нет, чем да
  4. нет
Базовая идея: посмотреть, насколько взаимосвязаны между собой "Hr-бизнес партнерство" и "уровень развития hr-аналитики" в компании.
Я уже публиковал этот кейс (см. Аналитика для HR: кейс "HR-бизнес партнер"). Если посмотреть комменты, то предлагались разные решения, ближе всего решение было с использованием статистического критерия Манн-Уитни. На сегодня появилось больше данных, расширяющих перечень возможных критериев (регрессия, Хи квадрат), но я хотел показать, как работать со статистикой Байеса в данном случае.
Чем вызвано применение статистики байеса? Посмотрите на распределение вариантов ответа.

Таблица №1. Таблица сопряженности ответов на вопросы об уровне развития hr-аналитики и hr бизнес партнерства (абсолютные значения)

Является ли HR Вашей компанией партнером бизнеса?
Названия строк
да
скорее да, чем нет
скорее нет, чем да
нет
Общий итог
Насколько хорошо в Вашей компании развита HR-аналитика?
отлично
10
3


13
средне
50
60
10
4
124
плохо
33
57
33
27
150
Общий итог
93
120
43
31
287

Диаграмма №1 Диаграмма сопряженности ответов на вопросы об уровне развития hr-аналитики и hr бизнес партнерства (абсолютные значения)

Кейс "HR-бизнес партнер" (Статистика Байеса в HR-аналитике)

На диаграмме заметно, что распределение не равномерно, и Хи квадрат покажет, очевидно, значимость различий, но распределение нам не очень нравится (да простите за ненаучность) - нам бы хотелось, чтобы зеленые столбцы возвышались более в правой части диаграммы, показывая, что те компании, у кого "плохо" развита hr-аналитика, не склонны причислять себя к hr партнерам бизнеса (на данной диаграмме тенденции таковы: те, у кого с  hr-аналитикой все в порядке, причисляют себя к hr бизнес партнерам. а те, у кого не все в порядке, тоже причисляют, но реже). Но как в этой ситуации лучше всего описать взаимосвязи между уровнем развития hr-аналитики и hr бизнес партнерством.
Вопрос можно сформулировать так: какова вероятность случая, что респондент, причисливший себя к hr-бизнес партнерам, будет иметь "плохой" уровень развития hr-аналитики?
Для этого мы пользуемся статистикой Байеса. И первый шаг - создаем таблицу нормированных значений (от общей суммы наблюдений)

Таблица №2 Диаграмма сопряженности ответов на вопросы об уровне развития hr-аналитики и hr бизнес партнерства (нормированная)

Является ли HR Вашей компанией партнером бизнеса?
Названия строк
да
скорее да, чем нет
скорее нет, чем да
нет
Общий итог
Насколько хорошо в Вашей компании развита HR-аналитика?
отлично
0,0348
0,0105
0,0000
0,0000
0,0453
средне
0,1742
0,2091
0,0348
0,0139
0,4321
плохо
0,1150
0,1986
0,1150
0,0941
0,5226
Общий итог
0,3240
0,4181
0,1498
0,1080
1
Далее мы считаем вероятность случая, что респондент, причисливший себя к hr-бизнес партнерам, будет иметь "плохой" уровень развития hr-аналитики?
0, 115 (совместная вероятность событий "да, hr бизнес партнер" + "плохой уровень развития hr-аналитики") / 0, 324 (маржинальная, предельная вероятность события "да, hr бизнес партнер") = 0, 35 или приблизительно 35 % - такова вероятность того, что респондент, считающий себя hr бизнес партнером, будет иметь плохой уровень hr аналитики в компании.
При этом, 77 % респондентов, с уровнем развития hr-аналитики на "отлично", уверенно причисляют себя к hr-бизнес партнерам.
Считается, что статистика Байеса в подобных кейсах дает более точный прогноз. Не считал сам, но более наглядная - точно. И точнее описывает отношения между переменными.

Кейс открытых социальных сетей и готовности рекомендовать компанию

Вынужден признаться в своем позоре - долгое время не мог понять сути байесовской статистики, пытаясь изучать ее по учебникам, хотя интуитивно сам подошел к ее применению на примере выше. Я уже делал заход на статистику Байеса - см. Hr-бренд и теорма Байеса.
Кейс простой:


Готовы рекомендовать компанию
Не готовы
Есть доступ в соц сети
445
109
Нет доступа
94
62


Мы берем сопряженность двух вопросов нашего исследования HR-бренда :
Готовы ли Вы рекомендовать свою компанию в качестве работодателя своим знакомым и т.п.?
  • да
  • нет
Есть ли доступ в социальные сети с рабочих компьютеров?
  • да 
  • нет
Переформатируем таблицу в нормированную таблицу

Готовы рекомендовать компанию
Не готовы

Есть доступ в соц сети
0,6268
0,1535
0,7803
Нет доступа
0,1324
0,0873
0,2197

0,7592
0,2408
1
И отвечаем, например, на вопрос: какова вероятность того факта, что работник будет рекомендовать компанию в качестве работодателя, если у него открыты социальные сети на рабочем компьютере.
0, 6268 / 0, 7803 = приблизительно 81 % -в 81 % работник будет рекомендовать свою компанию в качестве работодателя, если у него открыты социальные сети на рабочем компьютере.

Благодарности и источники

Пост появился благодаря курсу "Анализ данных и статистические выводы" от Duke University Dr. Mine Çetinkaya-Rundel. Спасибо преподавателю: я наконец то понял статистику Байеса. Рекомендую файл с лекцией по статистике Байеса - файл PDF на английском, но достаточно понятный. Можно начинать со страницы 12 файла (или он маркирован в самом файле как 79 - разница такова, поскольку данный файл часть учебника). На странице 12 (79) начать с раздела 2.2 Conditional probability и вплоть до теоремы Байеса.

Комментариев нет:

Отправить комментарий