Блог про HR-аналитику: октября 2017

вторник, 31 октября 2017 г.

В какой отрасли самый лучший HR-бренд

В 2013 году я проводил исследование, направленное на выявление факторов HR-бренда, тогда же я нарисовал пост Как отрасль влияет на удовлетворенность работой - про наличие связи между отраслью и удовлетворенностью работой.
Сегодня я покажу схожие результаты, основанные на другом моем опросе - ключевые факторы текучести и эффективности персонала.
Для анализа я использую два вопроса исследования:

Готовы ли Вы рекомендовать эту компанию в качестве работодателя своим знакомым, коллегам?
Отрасль респондента.

Фильтр ставлю на позиции HR, дабы очистить возможное влияние других факторов а ля позиция, функционал и т.п...
Цель у данного опроса может быть как теоретическая, так и вполне практическая: некий джоб сайт в России рейтингует HR бренд в том числе и на основе опроса, который проводит одна очень известная консалтинговая компания в России. Представители этой компании отказываются со мной общаться, поэтому до практического применения этого поста мы дойдем не скоро, но пост не помешает вашей рефлексии, коллеги.

Результаты

Предыдущий текст был многословным, чтобы как-то придать больше объема посту, потому как реально весь пост должен умещаться в три поинта: одной фразой про задачу, потом картинка, потом показатель статистического критерия.

Читается картинка так:
В IT отрасли 78 % респондентов HR указали, что готовы рекомендовать компанию в качестве работодателя, 8 % не знают, 14 % не готовы.
Больше всего не готовы рекомендовать компанию в банковской сфере, что странно, потому что я лично люблю банки. Ну и т.д...
Хи квадрат имеет p-value 0.0011. Что нас в целом устраивает. Тем более, что в опросе нет части отраслей, ка например, государственные органы, которые привнесут больше нулей в p-value критерия, ИМХО. Но я относительно недавно стал задавать вопрос о готовности рекомендовать компанию как показатель HR бренда, поэтому данных пока мало, но я взял себе на заметку этот вопрос и позже еще покажу обновленные данные.
С вас рефлексия результатов и участие в опросе
__________________________________________________________

На этом все, читайте нас в фейсбуке и телеграмме

среда, 25 октября 2017 г.

Вакансия HR-аналитика компании Skyeng

HR аналитик.

Команда HR Skyeng ищет коллегу, который поможет нам быстрее и продуктивнее готовить отчеты и презентации, выстраивать прогнозы в найме, внедрять новые и оптимизировать существующие процессы, а также анализировать HR-бюджет.

Вот лишь неполный список задач, которые вам посчастливится решать:

разработка, подготовка и сопровождение HR отчетности (численность, текучесть, обучение, подбор, адаптация, мотивация и др.;
подготовка аналитических расчетов по прогнозированию потребности в сотрудниках;
анализ и контроль исполнения бюджета;
участие в различных HR проектах с целью анализа их эффективности;
разработка и внедрение процессов, связанных с бюджетированием и не только;
участие в разработке программ мотивации;

Мы уверены, что вы человек неравнодушный, а кроме этого у вас точно есть:

Опыт на аналогичной позиции HR аналитика от года(обязательное условие)
высшее техническое образование;
навыки работы с большими неструктурированными массивами данных;
превосходное владение Excel- вы не просто знаете формулы, но понимаете дух ВПР и т.п ;
опыт работы с R/Rstudio:загрузка данных, описательные статистики, чистка данных, визуализация данных и т.п..;
Знание и применение базовых алгоритмов предиктивной аналитики в R/Rstudio;
Вам знакомы подходы к построению модели прогноза увольнения, например, регрессия Кокса;
системное мышление, аналитический склад ума, умение понятно доносить свои мысли;
желание учиться и развиваться, а также оптимизировать процессы вокруг;

Мы будем особенно рады, если у вас имеется также:

Хорошо развитые устные и письменные навыки общения;
Владеете английским языком не ниже уровня intermediate;(опционально)
Высокая самоотдача, умение работать в сжатых сроках и вести сложные задачи;

Какие задачи необходимо выполнять:

Необходимо делать прогнозирование по найму преподавателей, учитывая прирост новых учеников, потерю старых учеников, и текучесть учителей.

Условия:

Высокий уровень заработной платы;
Оплачиваемый отпуск;
8 часовой рабочий день;
Работа на дому без затрат времени на поездки, а тем более поездки в общественном транспорте;
Дружный и целеустремленный коллектив. Особенно дружный;
Кофе, чай, вода, молоко и всё в неограниченном количестве, ведь Вы работаете дома.

Тестовое задание

Мы школа английского языка. Все уроки наши ученики берут один на один с преподавателем по скайпу.

Для того, чтобы бизнес процесс был эффективным мы должны точно понимать количество учеников и учителей.

В школе есть потребность в русскоязычных преподавателях и носителях языка.

Самое востребованное время занятий вечер с 17,00 до 23,00

Ученики могут заниматься с разной интенсивностью в неделю, 1 - 3 раза в неделю.

Уровень учеников колеблется от начального 0 до High-intermediate.

Ученики могут переносить занятия, отменять, уходить в отпуск, болеть, бросить учебу после нескольких занятий.

Задание:

Необходимо сделать прогноз для найма преподавателей в ноябре месяце.

Сколько нам нужно нанять носителей и сколько русскоязычных учителей?

Какие данные вам потребуются запросить, чтобы сделать прогноз?

Как примерно будет выглядеть формула расчета потребности?

Контакт

oksana.m@skyeng.ru

понедельник, 23 октября 2017 г.

Employee turnover: how to predict individual risks of quitting

ПРИГЛАШАЮ ОТСЛЕЖИВАТЬ НАС В ТЕЛЕГРАМ

There are several approaches to predict Employee turnover (see Analyzing Employee Turnover - Predictive Methods, for russian-speaking readers Анализ текучести персонала – Методы прогнозирования).
Survival Analysis is one of the most importance but it's not the most popular algoritm to predict employee turnover.
Analysts use more familiar algorithms like Logistic Regression but, for example, Pasha Roberts writes: "Don't use logistic methods to predict attrition!". I think that we can only apply for a short-term situation like whether the employee has worked more or less than three months. If our goal is to predict individual quitting risks, then the best method is Survival Analysis.
The problem is that since it is not popular, many do not understand how to apply for Survival Analysis such actions as train-test splitting, cross-validation, tuning of hyperparameters.
I want to show how I do it.
If you want to train with my code you can use your own dataset or mine turnover.csv (link from dropbox). Variables:

"stag" - experience;
"event" - event;
"gender"
"age"
"industry"
"profession"
"traffic" - From what pipelene candidate came to the company;
"coach" - presence of a coach on probation;
"head_gender"
"greywage" - The salary does not seem to the tax authorities;
"way" - how an employee gets to workplace (by feet, by bus etc);
"extraversion", "independ", "selfcontrol", "anxiety", "novator" - Big5 test scales.

The dataset is real. I drop some iterations like scaling because I save space.

The Code
Packages and uploading

I will be glad to any feedback

library(mlr)
library(survival)
library(pec)
library(survAUC)
library(dplyr)
library(reshape2)
library(ggplot2)

data = read.csv("turnover.csv", header = TRUE, sep = ",", na.strings = "")

As you can see I use survival but you can apply this code for every package of Survival Analysis (for example I prefer "randomForestSRC").
Train-test splitting

train = sample(nrow(data), 0.7 * nrow(data))
test = setdiff(seq_len(nrow(data)), train)
train.task = makeSurvTask(data = data[train, ], target = c("stag", "event"))
train.task
test.task = makeSurvTask(data = data[test, ], target = c("stag", "event"))
test.task

set makeleaner

lrn = makeLearner("surv.coxph", id = "cph")

set a grid of hyperparameters

surv_param = makeParamSet(
  makeDiscreteParam("ties",  values = c('efron','breslow','exact')),
  makeIntegerParam("iter.max", lower = 1, upper = 150),
  makeIntegerParam("outer.max", lower = 1, upper = 50)
)

We can know all hyperparameters from

getParamSet("surv.coxph")

Parameters of tunecontrol and cross-validation

rancontrol = makeTuneControlRandom(maxit = 10L)
set_cv = makeResampleDesc("RepCV", folds = 5L, reps = 5L)

And the most delicious - tuning hyperparameters

surv_tune = tuneParams(learner = rfsrc.lrn, resampling = set_cv, task = train.task,
par.set = surv_param, control = rancontrol)

Now we get the most suitable parameters

surv_tune$x
$ties
[1] "efron"
$iter.max
[1] 6
$outer.max
[1] 46

And the Performance measure of quality of the model

surv_tune$y
cindex.test.mean 
        0.600787

cindex = Concordance index (like ROC AUC). And 0.60 is not so good. Then we train on test data

surv.tree = setHyperPars(lrn, par.vals = surv_tune$x)
surva = mlr::train(surv.tree, test.task)
getLearnerModel(surva)
model = predict(surva, test.task)
model
performance(predict(surva, newdata = data[test, ]))
cindex
0.653796

more better. So also we can check the performance measure with

library(risksetROC)

w.ROC = risksetROC(Stime = data[test, ]$stag, 
                   status = data[test, ]$event,
                   marker = model$data$response,
                   predict.time = median(data[test, ]$stag),
                   method = "Cox",
                   main = paste("OOB Survival ROC Curve at t=",
                                median(model$data$truth.time)),
                   lwd = 3,
                   col = "red" )

w.ROC$AUC

But our goal is to predict individual risks of quitting of specific applicants.

mod = coxph(Surv(stag, event) ~ ., data = data[train, ], ties = "efron", iter.max = 6,
            outer.max = 46) #we apply the received parameters

We take "new" applicants and predict risks

newdudes = data[test, ][c(4,5,12), ]
e = predictSurvProb(mod, newdata = newdudes, times = data[test, "stag"])
quantile(e, na.rm=TRUE)

and visualisations

df = as.data.frame(t(e))
df = rename(df,  Johnson='6', Peterson='11',Sidorson='38')
df$time = as.integer(row.names(df))
test_data_long =melt(df, id="time")  # convert to long format
ggplot(data=test_data_long,
       aes(x=time, y=value, colour=variable)) +
  geom_line(size=1.5)+
  theme_grey(base_size = 30)+ theme(legend.position="bottom",legend.title = element_blank())+ ylab("Prob")

Employee turnover: how to predict individual risks of quitting

So Sidorson is the best in terms of staff turnover. He has the lowest risks of quitting.
I will be glad to any feedback

ПРИГЛАШАЮ ОТСЛЕЖИВАТЬ НАС В ТЕЛЕГРАМ

воскресенье, 22 октября 2017 г.

Перевод статьи — Organizational Network Analysis

Перевод статьи Organizational Network Analysis: Going Beyond Email
Анализ организационной сети(ONA -Organizational Network Analysis ) быстро утвердился как инструмент с широким выбором инструментов в people analytics и варьируется от дизайна оргструктуры до оценки операционной эффективности или управления изменениями. Данные о взаимодействии сотрудников в организации могут помочь увидеть как команды и департаменты используют и обмениваются информацией.

Аналитику в этой зоне производят с помощью данных из анализа email сетей с использованием таких инструментов как Microsoft Exchange. Сотрудник отправляет или получает письма от коллег — такие взаимодействия учитываются как связь между одним и более коллегами. Больше отправляет писем — сильнее связь.

Email сети отличный инструмент анализа взаимодействия, но если используется как единственный источник информации вы получите неполную картину.

Email сети отличный инструмент анализа взаимодействия, но если используется как единственный источник информации вы получите неполную картину. С ростом технологий количество инструментов взаимодействия резко увеличилось и email больше не единственный способ взаимодействия. Современные компании используют десятки инструментов включая Slack и Microsoft Teams — которые нацелены на замещение почты. CRM системы, ticket системы , репозитории кода или интранет содержит большое количество информации для анализа.

Диаграммы ниже построили на основе 6 разных инструментов коммуникации в компании. Очевидно, что в компании есть сильные связи взаимодействия среди сотрудников, которые не отражены в сети email.

Диаграммы показывают множество сетей коммуникации которые существуют среди инструментов взаимодействия в одной компании.

Если вы решите проанализировать процесс роста сети коммуникаций при адаптации сотрудника будет неверно смотреть только email сеть. Вы ошибочно решите, что некоторые сотрудники вообще не имеют точек коммуникации. На самом деле они просто используют другие инструменты.

В анализе компании 30% сотрудников не отправляют ни одного email в месяц и процент растет. Наше исследование показывает, что email коммуникацию используют сотрудники более старших должностей, но остальная часть команды успешно использует другие инструменты совместной работы.

Так-же полезно понимать значение взаимодействия которые отражает каждая из сетей. Email широко используемый инструмент, нормально, что их использует большинство сотрудников. Email сети имеют высокую плотность, каждый связан с каждым. Но включенность в сеть, не обязательно говорит о выполнении какой либо работы. С другой стороны, сеть из OneDrive, DropBox или Google Documents показывает кто активно работал с командой над документами. Команда либо редактировала или просматривала документ. Такая сеть отражает значительно более сильное взаимодействие с коллегами.

Преимущества данных из email сетей — легко собрать данные. При прочих равных это не лучший инструмент и останавливаться только на нем не следует. Рекомендуем инвестировать время и проанализировать анализ какой из сетей коммуникаций подойдет для решения текущей задачи. Для некоторых ситуаций следует использовать комбинации источников данных — так вы построите более точную картину.

суббота, 14 октября 2017 г.

Тренды и тенденции материальной мотивации HR 2007-2017

Спасибо Ивану Зайцеву, который фактически со автор поста и своей гипотезой поднял целый пласт проблемы.
Я назвал пост пафосно, хотя речь в нем пойдет лишь об одном небольшом аспекте. В посте Зарплатные ожидания как метрики рынка труда я показал две тенденции.

Диаграмма 1 Динамика белых и серых зарплат HR по годам

Тренды и тенденции материальной мотивации HR 2007-2017

По оси X - годы,
Y - вариант ответа на вопрос "Какая форма оплаты была (есть) в компании";
в ячейках - % от суммы по колонке, т.е. по году.
В этом смысле самые плохие годы для HR были 2015-2016. 40 % говорят о том, что в компании платят "серую" зарплат" (ВАЖНО: год это не год заполнения опросника, а год трудоустройства, 42 % трудоустроившихся в 2015 году указали, что зарплату им положили "серую").
В 2017 году тьфу тьфу ситуация стала выправляться.
А вот кризис 2008 года не спровоцировал рост серых зарплат.

Диаграмма 2 Отличались ли договорённости по зарплате на собеседовании при приеме на работу и при первой выплате

Формулировка вопроса вынесена в название диаграммы. Последовательно растет % HR, которые указывают, что на собеседовании им указывают меньшую зарплату, чем по факту потом платили.

Гипотеза

Дальше »

пятница, 13 октября 2017 г.

40 кейсов People Analytics. Часть 4

Перевод статьи 40 People Analytics Case Studies - Part 4 David Green. Это как бы последняя статья цикла автора, но я подозреваю, что этот цикл станет бесконечным, ибо Давиду Грину надо же как то себя продвигать.
Перевод всего цикла статей выполнил Anthony Korolev (ссылка на профиль в фб). Сайт LEARNOLOGY.RU. И это реально крутой проект, крутая работа. Для меня подобная работа показатель того, что специалист готов вкладываться и выкладываться. Anthony специализируется на трех вещах:

разработка и реализация стратегий роста,
операционная эффективность бизнеса,
развитие талантов и руководителей.

Последний год работает над программой развития преемничества в связи с чем пришел к психометрике и аналитике как средстве повысить организационную эффективность и бизнес-результаты. Первые части:

Итак

40 кейсов People Analytics. Часть 4

В предыдущих трех частях этой статьи я собрал 30 кейсов по HR-аналитике из целого ряда организаций из разных индустриальных секторов. Еще 10 кейсов вы увидите ниже. В сумме, надеюсь, они станут источником некоторого вдохновения и обучения для тех, кто собирается отправиться в собственное путешествие в эту расцветающую область HR.

Больше кейсов, пожалуйста!

Из разговоров с практиками я знаю, что они жаждут историй и возможности учиться у других, поэтому, пожалуйста, рассказывайте мне о других кейсах, которые я смогу осветить в следующих статьях, подобных этой.

ADIDAS

Одна из наиболее вдохновляющих бесед, которая была у меня недавно, проходила со Стефаном Херлом, Старшим Менеджером по HR-аналитике в Adidas. Мы обсуждали будущее управления «опытом сотрудников» (перевод термина “employee experience”) и HR-аналитики и то, насколько это важно для новой HR-стратегии в Adidas. Часть этой дискуссии фигурирует в этом прекрасном интервью со Стефаном на портале Inside HR. Статья описывает три ключевых столпа стратегии Adidas в HR-аналитике: 1) равнение на бизнес для определения, что считать успехом, 2) использование данных и выводов на их основе для улучшения опыта сотрудников, и 3) более широкая поддержка принятия стратегических решений. Я бы также порекомендовал прочесть данную статью со Стефаном в сочетание с подкастом о Работе Будущего с участием Карен Паркин, CHRO в Adidas, и Якобом Морганом. Вместе они демонстрируют прекрасное совпадение целей бизнеса, HR и стратегии HR-аналитики.

Источник: Подкаст «Работа будущего» с Карен Паркин и Якобом Морганом.

MICROSOFT

Дальше »

Соседство с лучшими сотрудниками может увеличить производительность

Перевод статьи Sitting Near a High-Performer Can Make You Better at Your Job в рамках нашего проекта переводы статей по hr-аналитике на английском.
Статья интересная, провокативная, но вызывает возражения и вопросы. Сложно спорить, потому что внутреннюю механику исследований раскрыли скупо, но все-таки поставил в перевод: уверен, что статья вызовет интересе.
Перевод выполнила Багинская Александра (ссылка на профиль в Линкедине), HR Analyst, которая верит в математику и логику во всем и получает удовольствие от результатов хорошего анализа, который подкрепляет первое «кажется» или (еще лучше!) опровергает его. Александра работает в компании Greif с локацией в Голландии, но сама родом из Украины. Это уже второй перевод Александры, см. также Удержать или отпустить? Данные, на которые следует корректно реагировать, когда сотрудник увольняется. Рекомендую Александру, как очень ответственно и надежного спеца.
Итак,

Соседство с лучшими сотрудниками может увеличить производительность

Ваш стол стоит рядом с рабочим местом высокоэффективного коллеги? Это может хорошо сказаться на вашей эффективности… или поставить вашу работу под угрозу.
Основано на исследованиях Michael Housman и Dylan Minor.

Наши соседи по рабочему месту в буквальном смысле влияют на наш рабочий день. Они могут создать прекрасное настроение, равно как и довести нас до каления.
Более того, они могу влиять на то, как мы выполняем свою работу.
Исследователи изучили 8-метровую зону вокруг высокоэффективных сотрудников в большой технологической фирме и обнаружили, что они позитивно повлияли на окружающих их коллег, что отразилось в увеличении их производительности не 15%. Согласно новому исследованию Dylan Minor, доцента Kellogg School of Management, эта «позитивную заразность» добавила к годовому доходу $1 миллион.
Обратная сторона медали, к сожалению, в том, что «тухлые яйца» так же имеют влияние на соседей по офису. «Негативная заразность» от так называемых токсичных сотрудников имеет финансовый эффект, порой, вдвое больше того, что производит позитивная. При этом несмотря на быстрое распространение токсичности в коллективе, она почти мгновенно выветривается, как только «очаг» уволен или физически отдален от компании.
Это означает, что у компаний есть очень дешевый способ потенциально увеличить продуктивность, - перестановка в офисе! Устроить ротацию столов в офисе намного дешевле обучения и рекрутинга, утверждает Minor. В эпоху экспериментов с опен-спейсами и другими нетрадиционными решениями рабочих мест ставки повышаются. Исследования Minorпредоставляет практические заметки для лидеров относительно размещения коллектива. Он указывает, что компании осознают значение управления пространством и начинают задумываться о его применении.

«Заразность»

Дальше »

среда, 11 октября 2017 г.

И снова про компетентностный подход

Мое отношение к компетентностному подходу давно определено: я этот подход похоронил как ненаучный. Претензия к компетентностному подходу очень простая: нет связи между оценкой по компетенциям и результатами работника. Т.е. более высокие показатели по компетенции N не гарантируют более высокие результаты в бизнесе.

Если говорить о западной практике, то она не намного лучшего данных моих исследований Работают ли на самом деле модели компетенций (competency frameworks) в организациях в реальном мире?

Но российский консалтинг не прекратил и не собирается прекращать разрабатывать и продавать модели компетенций на рынок. Понятно, что это очень хороший денежный рынок, который нельзя просто так бросить, руководствуясь только соображениями научной честности. Но должны же быть хоть какие-то декларативные основания? Ну как-то же консалтинг должен объяснять то, что уже начали понимать HR: зачем нужна модель компетенций, если нет связи с результативностью?

Я приглашал в свое время подискутировать Евгения Лурье на эту тему на конференции журнала Штат (и любого другого, кто готов), но Евгений ответил отказом. Но вот сегодня Евгений выдал свое мнение на данную проблему на своей странице Блог об оценке персонала.

2. Кто сказал, что корреляция с результатами - это панацея? Это такой стандартный жупел из серии «мы работаем в интересах бизнеса». Обычно замер KPI существенно хуже по качеству, чем стандартизированный инструмент оценки поведения. Да ещё и содержит солидную долю политики и платы за лояльность. Корреляция с мусором не делает выводы более научными, чем мнение топ-менеджеров и консультантов.

Мне, конечно, обидно, что со мной не хотят дискутировать О революции и новом формате коммуникаций в HR, но ок, не дорос я еще до того, чтобы со мной дискутировали люди такого полета. Мы на своем мелком уровне сами с собой подискутируем.

Итак

Дальше »

Вызов менеджменту со стороны HR-аналитики или о "моделировании" в предиктивной аналитике

Публикация Людмилы Роговой Что влияет на скорость подбора вызвала переполох на рынке. Причины переполоха мне видятся такими: это первое системное решение в HR-аналитике в России. Не просто движуха со стороны энтузиаста hr-аналитика, но здесь взаимоувязаны векторы движений бизнеса, HR-руководства и исполнителей на уровне аналитики. И именно эта системность зацепила рынок.
Теперь я услышал, что в нескольких компаниях стали "создавать модели". Именно в кавычках. А как можно назвать такой формат: HR директор созывает заседание, где задание придумать модель.

Мифология

На что это похоже? Ричард Фейнман в 1974 году перед выпускниками Калтеха (Калифорнийский технологический) привел такой пример:

"В Южных морях существует племя, которое поклоняется самолетам. Во время войны на его острова садились самолеты со всякими полезными грузами, вот этим людям и хочется, чтобы самолеты прилетели снова. Они соорудили посадочные полосы, жгут вдоль них костры, у них имеется деревянная хижина, в которой сидит человек с двумя пристроенными на голову очень похожими на наушники деревяшками, и торчащими на манер антенн прутиками бамбука — это диспетчер, — и все ждут, когда прилетят самолеты. Все же сделано чин по чину. Форма соблюдена в совершенстве. А самолеты не прилетают!"

Во время опиумных войн китайцы стали создавать пароходы. Китайские ученые потрясающе имитировали колеса пароходов, трубы, даже дым, и даже пушки, пушки издавали звуки.... И все!
Создатели этих китайских пароходов выступали на HR-конференциях, срывали кучу аплодисментов, их считали классными спецами. Пока англичане стреляли из пушек. Хотя нет, я ошибся, по нашим компаниям не стреляют из пушек, поэтому потребности в реальной аналитике нет. А есть реальная потребность попиариться на модной теме.
Вот ровно этим сейчас пытаются заниматься некоторые HR-директоры, пытаясь "создавать модели".

Сознание менеджмента

Создание модели является уровнем сознания менеджмента, именно в этом моя главная претензия к 4-х уровневая модель HR-аналитики Берзина: дорога в никуда или история одного поста.
Я вижу три уровня сознания менеджмента:

метрики
корреляции
предиктивная аналитика

Эти уровни слабо связаны между собой, они не подразумевают эволюционного перехода, они просто на разных этажах.
При этом для само по себе созревание менеджмента не подразумевает многолетней истории. Расскажу вам короткую историю. Я сделал срез текучести для одной компании

Предиктивная аналитика

Вызов менеджменту со стороны HR-аналитики или о "моделировании" в предиктивной аналитике

На картинке: по оси X - стаж работы в компании в месяцах, по оси Y - % выбытия из компании.
И вот такой факт виден: в первые полгода работы уходит 20 % персонала, в первый год уходит 30 %.
Этот факт был признан не очень приятным менеджментом компании. Еще раз: менеджмент для себя это обозначил как проблему. Вы можете еще посчитать, сколько денег теряет компании на наборе, обучении, адаптации, зарплате подобных манагерах.
Что решили: мы определили перечень данных, которые можно собрать о сотрудниках, после чего будет построена модель, которая покажет, какие факторы (данные) влияют на отток персонала в первые полгода / год.
Если факторы будут выявлены, на их основе будет выстроена политика отбора персонала. После внедрения такой политики остается только отслеживать отток работников в первые полгода, год. И если ситуация не изменится, хреновая модель у нас выстроена.
Если вам это кажется сложным, вам не стоит читать мой блог, а лучше пойти на семинар какого-нибудь гуры рекрутинга, который вас научит за полчаса читать кандидата.
Безусловно, есть очень сложные задачи в предиктивной аналитике, связанные со сбором данных, софтом, принятием решения, математикой, но в основе лежит голова менеджера, который умеет считывать потребности бизнеса и решать их на основе аналитики.

__________________________________________________________

На этом все, читайте нас в фейсбуке и телеграмме

воскресенье, 8 октября 2017 г.

Что влияет на скорость подбора

Поступила реальная задача - мои коллеги из подбора попросили меня построить модель, предсказывающую время, необходимое для закрытия вакансии. Они перекраивают свои процессы, и одним из изменений должно стать информирование заказчика об ожидаемом сроке подбора еще на этапе подачи заявки на этот самый подбор. Хорошее желание - формирование адекватных ожиданий у руководителей. Помимо прогноза, хотим показывать историю закрытия вакансий в его городе - куда же без описательной статистики... Но возможно, некоторым людям прошлое позволит легче принять будущее) Хотя не факт...
В итоге у нас родился такой прообраз дашборда. Потребитель - линейный руководитель, подавший заявку на подбор. Предполагается, что этот отчет будет формироваться для него индивидуально, сразу после подачи заявки на поиск сотрудника. Ниже первый лист этого отчета.

Мы хотим показать в одном месте прошлое и будущее. Потому что это удобно. А еще мы хотим объяснить, как получилась наша прогнозная цифра (2-й блок дашборда). И там где это возможно, дать руководителю шанс самому "поиграться" факторами, чтобы принять свое решение. И родить кучу новых задач (видимо из блока 3).
Осталось сделать немного - построить модель, предсказывающую нужную метрику; начать собирать оценки по рекрутерам (совсем скоро в нашем кино); ну и запилить дашборд в систему отчетности для быстрого формирования (это отдельная песня).
У меня есть около 15 тыс. записей с реальным сроком закрытия - история с начала 2016 года и по текущий момент. 2015 год не стала брать сознательно - "мутное" время после очередной встряски. Оставила только вакансии массового подбора, убрала проблемные записи. В итоге выборка похудела до ~ 10 тысяч.
Модель решила построить в R: после семинара "HR - аналитика в R" стараюсь закрепить полученные знания.
Первое, что проверила - а есть ли различия в сроке закрытия в разрезе городов. А то может одним универсальным отчетом обойдемся? :-) Да, различия между городами есть - Kruskal-Wallis chi-squared = 1081.2, df = 108, p-value = 2.2e-16 - отличия статистически значимы.

Одних городов для модели мало, что еще взять? Первое, что сразу пришло в голову - это характеристики самих городов - общая численность, уровень безработицы, количество ВУЗов в городе, количество экономически активного населения. Правда тут есть нюансище - корреляции между признаками, что логично. Надо брать или сам город как фактор, или все его характеристики.
Сейчас использовала две модели - обычную линейную регрессию и дерево решений. Первая мне была интересна потому, что там легко интерпретировать результаты - увидеть какие факторы влияют и насколько сильна их взаимосвязь с целевой переменной. От второй модели я ожидала более точный прогноз, но к моему удивлению, линейная регрессия показала лучший результат.

В этом посте я покажу линейную модель, обученную на выборке с перечисленными ниже факторами. В этой модели использовала только характеристики городов.

Численность населения в городе
Уровень безработицы
Количество ВУЗов
Количество экономически активного населения
Количество вакансий в работе у рекрутера
Подбор был удаленный (рекрутер и соискатели находятся в разных городах) или нет
Месяц подачи заявки в подбор (почему бы и не посмотреть?)
"Укрупненный функционал"
Уровень позиции
Доля отказов СЭБ за последний календарный год по каждому городу (Мои коллеги из подбора жаловались на количество отказов после проверки СЭБ, что им приходиться иногда начинать поиск заново - добавила долю отказов СЭБ в разрезе городов. Но наверное для многих компаний этот пункт не имеет критичного значения. )
Причина появления вакансии

Одна печаль при использовании многих факторов из перечисленных - мы, как HR, врядли сможем повлиять на них, чтобы ускорить сроки. А вот эти факторы на нас влияют и хочется оценить масштаб этого влияния.
Использовала lm из caret, разделение на обучающую и тестовую выборку 0.75/0.25. Что получилось. R-squared: 0.336, standard error: 16 дней при среднем сроке 28 дней. Далеко не идеальный результат, но для начала, да еще с учетом качества данных, пойдет. Первые выводы все равно уже можно сделать.
Ниже 20 самых значимых факторов + (Intercept). (Intercept) оказался не значим (p-value 0,707), поэтому в модели использовать его нельзя.

Фактор	Уровень фактора (где есть)	Коэффициент в модели	p-value	Важность фактора
(Intercept)		6,251	0,707
Количество вакансий в работе у рекрутера		0,413	6,052E-310	100.00
Уровень позиции		1,755	5,183E-57	39.97
Причина появления вакансии	Конфиденциальная замена	14,172	1,320E-05	10.81
Уровень безработицы		-0,745	1,785E-04	9.29
Причина появления вакансии	Декретная позиция	2,233	0,003	7.34
Дата подачи заявки в подбор	Фев	2,945	0,004	7.05
Дата подачи заявки в подбор	Ноя	4,002	0,005	6.89
Доля отказов СЭБ в городе		10,803	0,007	6.66
Дата подачи заявки в подбор	Май	2,263	0,017	5.91
Дата подачи заявки в подбор	Апр	2,265	0,020	5.76
Численность населения		-1,67E-06	0,039	5.12
Дата подачи заявки в подбор	Март	1,973	0,041	5.07
Удаленный поиск	Да	1,202	0,048	4.90
Причина появления вакансии	Увольнение сотрудника	1,061	0,050	4.59
Дата подачи заявки в подбор	Дек	2,183	0,129	3.75
Количество ВУЗов		0,029	0,280	2.67
Дата подачи заявки в подбор	Окт	1,421	0,309	2.51
Дата подачи заявки в подбор	Сен	-1,176	0,316	2.47
Дата подачи заявки в подбор	Янв	0,853	0,438	1.91
Укрупненный функционал	Перевод	-12,763	0,441	1.90

На первом месте бесспорный лидер -
количество вакансий в работе у рекрутера. Коэффициент 0,411, p-value практически равен нулю. Это означает, что с увеличением на единицу количества вакансий, которое рекрутер ведет одновременно, срок закрытия всех вакансий у него увеличивается в среднем на 0,4 дня. Учитывая, что обычно в работе может находиться несколько десятков вакансий, то получается весьма ощутимо. Картинка слева.

На втором месте оказался уровень позиции, что в принципе было ожидаемо. Чем выше уровень, тем больше срок закрытия. Уровень был перекодирован как метрическая переменная - 1, 2,3 и т.д. То есть, с переходом на 1 уровень выше, срок закрытия увеличивается на 1,755 дня. С p-value не поспоришь.

Третье место - одна из причин появления вакансии "конфиденциальная замена". Причины появления вакансии далее еще встретятся, но тут скажу, что если причина появления была в подобной замене, то срок закрытия увеличивается в среднем на 14 дней по сравнению с базовым уровнем. Хотя если смотреть на картинку, то срок кажется бОльшим. Но картинкам верить нельзя))) За базу в модели была принята причина "ввод новой ШЕ" (покрашена оранжевым). Все сравнения ведутся именно с ней. Никакого скрытого смысла в таком выборе не было, базовый уровень определялся исходя из названий, программа просто выбрала тот уровень, который по алфавиту был первым.
Следующее место - уровень безработицы. Тут вроде тоже противоречий не возникает. Чем выше безработица, тем легче закрыть вакансию. С увеличением безработицы в городе на 1%, скорость закрытия уменьшается на 0,7 дня.
Пятое место - следующая причина увольнения "декретная позиция". Срок закрытия такой позиции увеличивается на 2,2 дня по сравнению с базовой. Что в очередной раз подтверждает, что люди не так охотно соглашаются идти в компанию на срочные трудовые договора.

На следующих нескольких местах оказалось время подачи заявки в подбор. Картинка где-то слева. За базу принят август (первый по алфавиту, ничего более). По картинке можно сказать, что наиболее быстро закрываются позиции, открытые в период июль-сентябрь. Не знаю, что точно является причиной этого, но моя гипотеза простая - народ отдохнул в отпусках и активнее откликается на вакансии. А декабрьские вакансии закрываются медленнее, так как мало кто хочет лишаться годового бонуса, выплата которого происходит как правило весной. Но что мне странно, что значимыми в модели оказались далеко не все месяца, и тот же декабрь просто "вылетел".

На восьмом месте появилась доля отказов после проверки СБ в разрезе городов. Логично, что чем яростнее СБ, тем срок закрытия больше, вот только не очень понятно как с этим бороться))) Зависимость нелинейная. poly(Доля.отказов.СБ.город, degree=4) привело к увеличению R-squared ~ на 0.01, но тут я это не показываю.
Следующее место - численность населения в городе. Тоже ничего нового. Чем крупнее город, тем быстрее закрывается вакансия.
Был ли подбор удаленным. Если да, то срок будет больше в среднем на 1,2 дня.
И последний значимый фактор - причина появления вакансии "увольнение сотрудника". Но значим он уже с натяжкой - p-value прям на грани.
Все остальное в таблице, что выделено серой заливкой, уже не имеет значения, так как p-value у этих факторов оказался больше 0,05.
Работа над этой моделью только начинается, и по мере появления новых данных буду включать их в модель. И следующее, что я сделаю - добавлю характеристики руководителя и рекрутера (например стаж в должности, тесты и т.д. и т.п.). И очень хочется поймать взаимодействие между двумя этими персонами.

__________________________________________________________

читайте нас в фейсбуке и телеграмме

.

Сделать репост в соц сети!

вторник, 31 октября 2017 г.

Результаты

среда, 25 октября 2017 г.

Вот лишь неполный список задач, которые вам посчастливится решать:

Мы уверены, что вы человек неравнодушный, а кроме этого у вас точно есть:

Мы будем особенно рады, если у вас имеется также:

Какие задачи необходимо выполнять:

Условия:

Тестовое задание

Контакт

понедельник, 23 октября 2017 г.

The CodePackages and uploading

воскресенье, 22 октября 2017 г.

суббота, 14 октября 2017 г.

Диаграмма 1 Динамика белых и серых зарплат HR по годам

Диаграмма 2 Отличались ли договорённости по зарплате на собеседовании при приеме на работу и при первой выплате

Гипотеза

пятница, 13 октября 2017 г.

40 кейсов People Analytics. Часть 4

Больше кейсов, пожалуйста!

ADIDAS

MICROSOFT

Соседство с лучшими сотрудниками может увеличить производительность

«Заразность»

среда, 11 октября 2017 г.

Мифология

Сознание менеджмента

Предиктивная аналитика

воскресенье, 8 октября 2017 г.

вторник, 31 октября 2017 г.

среда, 25 октября 2017 г.

понедельник, 23 октября 2017 г.

The Code
Packages and uploading

воскресенье, 22 октября 2017 г.

суббота, 14 октября 2017 г.

пятница, 13 октября 2017 г.

среда, 11 октября 2017 г.

воскресенье, 8 октября 2017 г.