Перевод статьи What smoking did for people analytics в рамках нашего проекта переводы статей по hr-аналитике на английском. Обратите внимание на ресурс - towardsdatascience - очень качественные материалы по машинному обучению. Но требуют знаний.
Перевод сделала Мария Герасимова (по ссылке - профиль автора в Линкедине. По традиции приглашаю френдиться!). И это первый перевод Марии в нашем блоге!
Итак,
Что курение сделало для HR-аналитики
Любой, кто, как и я, является фанатом сериала Безумцы (прим переводчика : wiki), вспомнит что значимая сюжетная линия и исторический контекст этого замечательного драматического сериала вращается вокруг курения. В 1960-х медицинский истеблишмент США переходил к мнению, что курение - это привычка, ведущая к раку, хотя признать это им было весьма сложно, потому что почти все они сами курили.Сегодня значительно меньше людей курят постоянно или эпизодически. Мы, конечно, еще не полностью решили вопрос, но за 50 лет изменения существенны. Впрочем, 50 лет - это долгий период, и естественно задаться вопросом, почему для изменения требуется так много времени.
Один очевидный ответ - курение ужасно быстро вызывает привыкание. И менять привычки, вызванные зависимостями, сложнее всего. Другая же причина в том, что требуется много времени, чтобы собрать доказательства, что курение коррелирует с негативными последствиями для выживания, и еще больше времени, чтобы показать, что курение приводит к раку.
Те из нас, кто работает с HR-аналитикой, тем не менее, могут кое-что получить из исследований курения и его последствий для здоровья. Именно эти исследования привели к тому, что на передний план вышли методы эпидемиологической аналитики, что сегодня для нас невероятно ценно в изучении людей и организаций. В период с 1960-х до 1980-х, когда медицинский истеблишмент ввязался в затянувшуюся борьбу с табачными гигантами, анализ выживаемости появился, чтобы нанести решающий удар.
Анализ выживаемости (анализ дожития)
Выживание (дожитие) самый важный результат в медицине, поэтому не удивительно, что был основан раздел статистики, сфокусировавшийся на лучшем понимании драйверов выживания. Однако, до середины ХХ века многие исследования выживаемости были сфокусированы на острых заболеваниях - бактериальных или вирусных инфекциях, которые могли убить одних за несколько дней или недель, при этом другие показывали быстрое восстановление после болезни или оставались невредимыми. Смертоносная "Испанка", которая в 1918-1920 гг. убила от 50 до 100 миллионов человек по всему миру, стала существенным фактором для ранних эпидемиологических исследований.К 1950-м на сцене появились антибиотики и острые заболевания внезапно стали гораздо менее опасны. Внимание переключилось на другой тип эпидемий. Одна из которых широко распространилась, но не была острой. Болезнь убивала некоторых, но не затрагивала других, поражала на разных стадиях жизни и могла длиться от многих лет до нескольких десятилетий. Рак стал новым вызовом для эпидемиологов в изучении выживаемости. Долгосрочное наблюдение (прим переводчика: лонгитюдное исследование) за выживаемостью стало необходимым.
Таким образом, истеблишмент в медицинских исследованиях начал готовиться вести учет людей десятилетиями, а не просто днями и месяцами. И не только тех, кто был болен. Здоровых тоже стало необходимо отслеживать, чтобы получить понимание, какие факторы в образе жизни привели к большинству случаев угрожающих жизни заболеваний, таких как рак. Это стало предвестником прорыва в методах, системах и процессах, результатом которого стали некоторые огромные долгосрочные исследования, которые сегодня публикуются в СМИ.
Но также это привело к новым подходам в анализе и представлении выживаемости - всему, что чрезвычайно полезно сегодня в изучении людей в более широком смысле.
Кривые дожития и отношение рисков
Представьте, что у вас есть гипотеза о том, что определенный элемент в опыте индивида в группе или организации является индикатором вероятности продолжения им членства в этой группе или организации с течением времени. Например, вы можете предположить, что люди, которые работают в определенном департаменте получают такой позитивный опыт, что они формируют долгосрочную связь с компанией. Или наоборот, опыт настолько плохой, что люди опять начинают смотреть на рынок труда.Гипотетический опыт может быть рассмотрен как "фактор образа жизни" и вы могли бы анализировать вероятность увольнения со временем так же, как вы бы анализировали дожитие при изучении таких болезней как рак. Один из возможных способов - взять начальную точку во временнЫх замерах групп людей, учесть получали ли они интересующий опыт, и затем фиксировать их в течение следующих месяцев или лет, чтобы понять есть ли причинная взаимосвязь между этим опытом и текучестью.
Кривые дожития Каплана-Мейера весьма интуитивный способ представления этого в графическом виде. Возвращаясь к примеру с курением, график выше показывает кривые дожития для курящих и некурящих в отдельном медицинском исследовании. Ось Х показывает месяцы после определенной стартовой точки измерений, в которой участники были классифицированы по их статусу курения, ось Y показывает долю участников, которые все еще были живы в каждый момент времени. Обратите внимание, что начальная точка не должна быть одинаковой для всех участников. При условии, что нет смещения, свойственного разнице во времени, участники могут присоединятся к исследованию в любое время t и кривая отслеживает их до t + 120.
Похожая полезная процедура, особенно для обобщенных выводов на высшем уровне, - отношение рисков (прим переводчика: wiki), которое подсчитывает среднюю вероятность дожития для конкретной группы в определенный период времени как долю от базовой популяции. Например, вы можете рассчитать вероятность дожития женщин в течение 2-х лет в сравнении со всем населением. Или на рабочем месте вы можете рассчитать вероятность увольнения высоко результативных сотрудников в сравнении c общей массой сотрудников. Точный расчет отношения рисков наделяет вас способностью делать валидные заключения по типу "высоко результативные сотрудники на 20% более вероятно покинут нас в течение двух лет".
Применение в HR-аналитике
Я полагаю, что многие из вас увидели здесь параллели, но вот еще несколько вариантов для применения анализа выживаемости в контексте человеческого капитала:
- Валидация опросов. Анализ выживаемости может быть использован, чтобы показать, что результаты опроса должны восприниматься серьезно. Например, если люди, давшие не-нейтральные оценки по конкретным вопросам, могут быть определены как имеющие большую или меньшую вероятность увольнения, то это может помочь менеджменту собраться и обратить внимание на результаты опроса в будущем.
- Предиктивная аналитика. Анализ выживаемости может установить валидность конкретных измерений в предсказании увольнений или других интересующих результатов, которые могут использоваться как сами по себе, так и как валидная составляющая в более широкой предиктивной модели. Например, исследование в Стэнфорде, используя упомянутую выше (перевернутую) кривую дожития, показало, что язык в электронной переписке был валидным индикатором соответствия сотрудника культуре организации. В МсKinsey мы использовали кривые дожития, чтобы показать, что в любой заданный момент времени, количество значимых связей, которые кто-либо имеет в организации, может быть предиктором вероятности его удержания.
- Продвижение культурного многообразия или разнообразного опыта. Анализ выживаемости применим не только к текучести, но также может быть применен к любым интересующим результатам. Например, если вы хотите проиллюстрировать возрастающую склонность организации использовать определенные "типы" личностей для определенных задач или типов работы, кривые Каплана-Мейера или отношение рисков могут быть отличным способом, чтобы сделать это и определить, выдерживает ли гипотеза об этом эффекте статистическую проверку.
Анализ выживаемости - это очень мощный инструмент в изучении связанных с персоналом результатов, и часто тот, где необходимые данные довольно простые (часто не более чем результаты опросов или записи об участии, и некоторые отправные точки). Все больше организаций должно использовать анализ дожития, если они хотят быть честны с самими собой на счёт того, что реально является драйвером результатов, связанных с персоналом.
Об авторе: Изначально я был просто математиком, потом я стал психометристом и исследователем данных (Data Scientist). Я увлечен применением строгости всех этих дисциплин к сложным вопросам о людях. Еще я прогер-гик и большой фанат японских RPG (пп: вид компьютерных игр, см. wiki). Вы можете найти меня в LinkedIn или в Twitter.
__________________________________________________________