Кейс с моего семинара Аналитика для HR: я задаю следующие вопросы участникам:
Насколько хорошо в Вашей компании развита HR-аналитика? (и варианты ответов)
Я уже публиковал этот кейс (см. Аналитика для HR: кейс "HR-бизнес партнер"). Если посмотреть комменты, то предлагались разные решения, ближе всего решение было с использованием статистического критерия Манн-Уитни. На сегодня появилось больше данных, расширяющих перечень возможных критериев (регрессия, Хи квадрат), но я хотел показать, как работать со статистикой Байеса в данном случае.
Чем вызвано применение статистики байеса? Посмотрите на распределение вариантов ответа.
На диаграмме заметно, что распределение не равномерно, и Хи квадрат покажет, очевидно, значимость различий, но распределение нам не очень нравится (да простите за ненаучность) - нам бы хотелось, чтобы зеленые столбцы возвышались более в правой части диаграммы, показывая, что те компании, у кого "плохо" развита hr-аналитика, не склонны причислять себя к hr партнерам бизнеса (на данной диаграмме тенденции таковы: те, у кого с hr-аналитикой все в порядке, причисляют себя к hr бизнес партнерам. а те, у кого не все в порядке, тоже причисляют, но реже). Но как в этой ситуации лучше всего описать взаимосвязи между уровнем развития hr-аналитики и hr бизнес партнерством.
Вопрос можно сформулировать так: какова вероятность случая, что респондент, причисливший себя к hr-бизнес партнерам, будет иметь "плохой" уровень развития hr-аналитики?
Для этого мы пользуемся статистикой Байеса. И первый шаг - создаем таблицу нормированных значений (от общей суммы наблюдений)
Далее мы считаем вероятность случая, что респондент, причисливший себя к hr-бизнес партнерам, будет иметь "плохой" уровень развития hr-аналитики?
0, 115 (совместная вероятность событий "да, hr бизнес партнер" + "плохой уровень развития hr-аналитики") / 0, 324 (маржинальная, предельная вероятность события "да, hr бизнес партнер") = 0, 35 или приблизительно 35 % - такова вероятность того, что респондент, считающий себя hr бизнес партнером, будет иметь плохой уровень hr аналитики в компании.
При этом, 77 % респондентов, с уровнем развития hr-аналитики на "отлично", уверенно причисляют себя к hr-бизнес партнерам.
Считается, что статистика Байеса в подобных кейсах дает более точный прогноз. Не считал сам, но более наглядная - точно. И точнее описывает отношения между переменными.
Кейс простой:
Мы берем сопряженность двух вопросов нашего исследования HR-бренда :
Готовы ли Вы рекомендовать свою компанию в качестве работодателя своим знакомым и т.п.?
И отвечаем, например, на вопрос: какова вероятность того факта, что работник будет рекомендовать компанию в качестве работодателя, если у него открыты социальные сети на рабочем компьютере.
0, 6268 / 0, 7803 = приблизительно 81 % -в 81 % работник будет рекомендовать свою компанию в качестве работодателя, если у него открыты социальные сети на рабочем компьютере.
Насколько хорошо в Вашей компании развита HR-аналитика? (и варианты ответов)
- отлично
- средне
- плохо
- да
- скорее да, чем нет
- скорее нет, чем да
- нет
Я уже публиковал этот кейс (см. Аналитика для HR: кейс "HR-бизнес партнер"). Если посмотреть комменты, то предлагались разные решения, ближе всего решение было с использованием статистического критерия Манн-Уитни. На сегодня появилось больше данных, расширяющих перечень возможных критериев (регрессия, Хи квадрат), но я хотел показать, как работать со статистикой Байеса в данном случае.
Чем вызвано применение статистики байеса? Посмотрите на распределение вариантов ответа.
Таблица №1. Таблица сопряженности ответов на вопросы об уровне развития hr-аналитики и hr бизнес партнерства (абсолютные значения)
Является ли HR Вашей компанией партнером бизнеса?
|
||||||
Названия строк
|
да
|
скорее да, чем нет
|
скорее нет, чем да
|
нет
|
Общий итог
|
|
Насколько хорошо в Вашей компании развита
HR-аналитика?
|
отлично
|
10
|
3
|
13
|
||
средне
|
50
|
60
|
10
|
4
|
124
|
|
плохо
|
33
|
57
|
33
|
27
|
150
|
|
Общий итог
|
93
|
120
|
43
|
31
|
287
|
Диаграмма №1 Диаграмма сопряженности ответов на вопросы об уровне развития hr-аналитики и hr бизнес партнерства (абсолютные значения)
На диаграмме заметно, что распределение не равномерно, и Хи квадрат покажет, очевидно, значимость различий, но распределение нам не очень нравится (да простите за ненаучность) - нам бы хотелось, чтобы зеленые столбцы возвышались более в правой части диаграммы, показывая, что те компании, у кого "плохо" развита hr-аналитика, не склонны причислять себя к hr партнерам бизнеса (на данной диаграмме тенденции таковы: те, у кого с hr-аналитикой все в порядке, причисляют себя к hr бизнес партнерам. а те, у кого не все в порядке, тоже причисляют, но реже). Но как в этой ситуации лучше всего описать взаимосвязи между уровнем развития hr-аналитики и hr бизнес партнерством.
Вопрос можно сформулировать так: какова вероятность случая, что респондент, причисливший себя к hr-бизнес партнерам, будет иметь "плохой" уровень развития hr-аналитики?
Для этого мы пользуемся статистикой Байеса. И первый шаг - создаем таблицу нормированных значений (от общей суммы наблюдений)
Таблица №2 Диаграмма сопряженности ответов на вопросы об уровне развития hr-аналитики и hr бизнес партнерства (нормированная)
Является ли HR Вашей компанией партнером бизнеса?
|
||||||
Названия строк
|
да
|
скорее да, чем нет
|
скорее нет, чем да
|
нет
|
Общий итог
|
|
Насколько хорошо в Вашей компании развита
HR-аналитика?
|
отлично
|
0,0348
|
0,0105
|
0,0000
|
0,0000
|
0,0453
|
средне
|
0,1742
|
0,2091
|
0,0348
|
0,0139
|
0,4321
|
|
плохо
|
0,1150
|
0,1986
|
0,1150
|
0,0941
|
0,5226
|
|
Общий итог
|
0,3240
|
0,4181
|
0,1498
|
0,1080
|
1
|
0, 115 (совместная вероятность событий "да, hr бизнес партнер" + "плохой уровень развития hr-аналитики") / 0, 324 (маржинальная, предельная вероятность события "да, hr бизнес партнер") = 0, 35 или приблизительно 35 % - такова вероятность того, что респондент, считающий себя hr бизнес партнером, будет иметь плохой уровень hr аналитики в компании.
При этом, 77 % респондентов, с уровнем развития hr-аналитики на "отлично", уверенно причисляют себя к hr-бизнес партнерам.
Считается, что статистика Байеса в подобных кейсах дает более точный прогноз. Не считал сам, но более наглядная - точно. И точнее описывает отношения между переменными.
Кейс открытых социальных сетей и готовности рекомендовать компанию
Вынужден признаться в своем позоре - долгое время не мог понять сути байесовской статистики, пытаясь изучать ее по учебникам, хотя интуитивно сам подошел к ее применению на примере выше. Я уже делал заход на статистику Байеса - см. Hr-бренд и теорма Байеса.Кейс простой:
Готовы рекомендовать компанию
|
Не готовы
| |
Есть доступ в соц сети
|
445
|
109
|
Нет доступа
|
94
|
62
|
Мы берем сопряженность двух вопросов нашего исследования HR-бренда :
Готовы ли Вы рекомендовать свою компанию в качестве работодателя своим знакомым и т.п.?
- да
- нет
- да
- нет
Готовы
рекомендовать компанию
|
Не готовы
|
||
Есть
доступ в соц сети
|
0,6268
|
0,1535
|
0,7803
|
Нет
доступа
|
0,1324
|
0,0873
|
0,2197
|
0,7592
|
0,2408
|
1
|
0, 6268 / 0, 7803 = приблизительно 81 % -в 81 % работник будет рекомендовать свою компанию в качестве работодателя, если у него открыты социальные сети на рабочем компьютере.
Комментариев нет:
Отправить комментарий