Введение
Пост рассчитан на участников семинара Аналитика для HR и всех, кто занимается hr-аналитикой в компании, проводит корпоративные опросы и исследования. На семинарах мы смотрим более высокие материи типа статистических критериев, постановки гипотез, обсуждение интерпретаций и т.п., но основные ресурсы забирает не «высокие материи», а черновая работа, которая иногда отвращает к занятиям аналитикой. Вот и решил потихоньку открывать приемы, которые позволяют экономить силы и нервы на обработке результатов.Проблема
Часто при проведении исследований мы встаем перед проблемой, как задать переменную «возраст», «стаж», «зарплата» и т.п.. Можно спросить год рождения или количество полных лет, но нам в обработке результатов нужен не конкретный год, а страта – разряд в несколько лет - предполагая, что респонденты в рамках этих страт обладают общностью.Пример страт (хотя строго говоря, страты это больше, чем просто деление на группы по возрасту, поэтому на семинаре по аналитике я использую выражение "переводим переменную из метрической в номинативную" - хотя это тоже не корректно при строгом взгляде):
- до 25 лет;
- 25-34 года;
- 35-44 года;
- старше 45 лет.
В этом случае соблазнительно сразу так и задать вопрос: ваш возраст …. 1) до 25 лет и т.д… Но беда в том, что мы не всегда можем корректно угадать границы страт, а еще есть причина более технологическая: если мы используем при обработке Хи квадрат (ау, дорогие мои слушатели семинара Аналитика для HR, вспоминаются кейсы?), то ограничения по теоретической частоте заставляют нас гибко подходить к границам страт.
Остается один вариант: спрашивать год рождения или количество полных лет, но потом переводить в страты. Долго? Предлагаю
Решение
Решение в файле Стратификация. Вы в принципе сможете сами быстро в нем разобраться. Немного комментариев.Решение имеет две альтернативы: функции ЕСЛИ и ВПР.
ЕСЛИ
рекомендую использовать в случае, когда достаточно 2-3-х страт, когда больше, то формула уже раздутая получается, и проще использовать ВПР. Обратите внимание то, как правильно выставить «больше»/ « >» или «больше или равно» /«>=».Пример синтаксиса функции
=ЕСЛИ(A2<30 30="">=45;"старше 45";"30-44")) 30>
ВПР
применяется для большего количества страт. Вы заводите отдельную таблицу с границами страт (обратите внимание, а) таблица формируется в порядке возрастания и б) на правила формирования границ страта – здесь нет возможности устанавливать знак «больше или равно», поэтому границы нужно устанавливать значениями – это особенности применения функции ВПР, и я не буду тратить время на детали. Всегда можно погуглить). В левой колонке таблицы вы устанавливаете границы страт, в правой – то, как страта должна быть названа.Пример синтаксиса функции
=ВПР(A2;$I$14:$J$21;2)
Обратите внимание, что в синтаксисе не указан четвертый элемент функции – интервальный просмотр. По умолчанию указывается значение ИСТИНА. Выставьте ради интереса значение ЛОЖЬ и посмотрите разницу в результатах.
Напишите мне в комментах что-нибудь, если материал оказался полезным.
И удачи вам в проведении корпоративных исследованиях!
Реклама
И посмотрите расписание открытых семинаров Аналитика для HR, чтобы записаться на ближайший или приглашайте провести корпоративный семинар - контакты
Или, в качестве отдельного семинара. можно провести семинар Вычисления в Excel
Вау))) даже не подозревала, что ВПР можно и так использовать))) круто, спасибо
ОтветитьУдалитьне совсем поняла логику-как он (ВПР) понимает, что 19 это больше 18 и меньше 20, видимо действительно понимает выстроенный порядок как границы.
спасибо, это точно нужно бывает
ага, попробуйте у себя в исследовании подумать, как можно стаж и возраст по диапазонам разбить
Удалить