Share |

воскресенье, 25 августа 2013 г.

Как быстро создавать страты (управляем переменными исследования)

Введение

Пост рассчитан на участников семинара Аналитика для HR и всех, кто занимается hr-аналитикой в компании, проводит корпоративные опросы и исследования. На семинарах мы смотрим более высокие материи типа статистических критериев, постановки гипотез, обсуждение интерпретаций и т.п., но основные ресурсы забирает не «высокие материи», а черновая работа, которая иногда отвращает к занятиям аналитикой. Вот и решил потихоньку открывать приемы, которые позволяют экономить силы и нервы на обработке результатов.

Проблема

Часто при проведении исследований мы встаем перед проблемой, как задать переменную «возраст», «стаж», «зарплата» и т.п.. Можно спросить год рождения или количество полных лет, но нам в обработке результатов нужен не конкретный год, а страта – разряд в несколько лет - предполагая, что респонденты в рамках этих страт обладают общностью.
Пример страт (хотя строго говоря, страты это больше, чем просто деление на группы по возрасту, поэтому на семинаре по аналитике я использую выражение "переводим переменную из метрической в номинативную" - хотя это тоже не корректно при строгом взгляде):

  1. до 25 лет;
  2. 25-34 года;
  3. 35-44 года;
  4. старше 45 лет.

В этом случае соблазнительно сразу так и задать вопрос: ваш возраст …. 1) до 25 лет и т.д… Но беда в том, что мы не всегда можем корректно угадать границы страт, а еще есть причина более технологическая: если мы используем при обработке Хи квадрат (ау, дорогие мои слушатели семинара Аналитика для HR, вспоминаются кейсы?), то ограничения по теоретической частоте заставляют нас гибко подходить к границам страт.
Остается один вариант: спрашивать год рождения или количество полных лет, но потом переводить в страты. Долго? Предлагаю

Решение

Решение в файле Стратификация. Вы в принципе сможете сами быстро в нем разобраться. Немного комментариев.
Решение имеет две альтернативы: функции ЕСЛИ и ВПР.

ЕСЛИ 

рекомендую использовать в случае, когда достаточно 2-3-х страт, когда больше, то формула уже раздутая получается, и проще использовать ВПР. Обратите внимание то, как правильно выставить «больше»/ « >» или «больше или равно» /«>=».
Пример синтаксиса функции
=ЕСЛИ(A2<30 30="">=45;"старше 45";"30-44")) 

ВПР 

применяется для большего количества страт. Вы заводите отдельную таблицу с границами страт (обратите внимание,  а) таблица формируется в порядке возрастания и б) на правила формирования границ страта – здесь нет возможности устанавливать знак «больше или равно», поэтому границы нужно устанавливать значениями – это особенности применения функции ВПР, и я не буду тратить время на детали. Всегда можно погуглить). В левой колонке таблицы вы устанавливаете границы страт, в правой – то, как страта должна быть названа.
Пример синтаксиса функции
=ВПР(A2;$I$14:$J$21;2)
Обратите внимание, что в синтаксисе не указан четвертый элемент функции – интервальный просмотр. По умолчанию указывается значение ИСТИНА. Выставьте ради интереса значение ЛОЖЬ и посмотрите разницу в результатах.
Напишите мне в комментах что-нибудь, если материал оказался полезным.
И удачи вам в проведении корпоративных исследованиях!

Реклама

И посмотрите расписание открытых семинаров Аналитика для HR, чтобы записаться на ближайший или приглашайте провести корпоративный семинар - контакты
Или, в качестве отдельного семинара. можно провести семинар Вычисления в Excel

2 комментария:

  1. Вау))) даже не подозревала, что ВПР можно и так использовать))) круто, спасибо
    не совсем поняла логику-как он (ВПР) понимает, что 19 это больше 18 и меньше 20, видимо действительно понимает выстроенный порядок как границы.
    спасибо, это точно нужно бывает

    ОтветитьУдалить
    Ответы
    1. ага, попробуйте у себя в исследовании подумать, как можно стаж и возраст по диапазонам разбить

      Удалить

рек

Популярные сообщения