Хочу поделится анализом рынка вакансий за декабрь.
Огромное спасибо Артем Николаев за скрипты для выкачивания
вакансий с hh.ru в Питоне.
Вот тут нашел скрипт для R. Он очень доходчивый и понятный:
https://habrahabr.ru/post/337684/
Далее выяснилось, что если делать обычный поисковый запрос,
то вакансии приходят без скилов, но если делать запрос по номеру вакансии, то
они приходят со списком скилов, которые отметил рекрутер. Это уже интереснее!
Сформировал датасет по всем актуальным вакансиям где в названии встречается HR.
И тут начались проблемы:
· - Хедхантер выводит не только вакансии HR, но и
все объявления где HR упоминается в описании вакансии. Иногда попадаются
вакансии водителя для HR.
· - Есть совершенно подозрительные вакансии
аналогичные по всем регионам и с мутным описанием не соответствующим
функционалу HR.
· - И, наконец, есть Тинькофф. У этого банка тоже
однотипные вакансии "Специалист по подбору персонала " во всех
регионах вот с таким милым описанием требований "Активность и
целеустремлённость. Харизматичность. Грамотная речь. Быстрая обучаемость.
Высокий уровень самодисциплины. Усидчивость. Желание много общаться и помогать
людям.". Самое интересное, что заработная плата такого специалиста всего
20000 рублей, но работа и обучение все дистанционно (из дома). Интересная кадровая модель для HR.
На рисунке 1 видно, что ключевые навыки HR c точки
зрения рекрутера: Подбор персонала, Оценка персонала, Обучение
и развитие, Адаптация персонала, Управление персоналом и Корпоративная культура.
В принципе, ничего удивительного.
Низкий процент анкет с указанными навыками
вероятнее всего говорит, что этот инструмент HR еще
не освоили (эта функция была запущена несколько месяцев назад) или просто не
хотят напрягаться. По всей видимости, на основании этих навыков Хедхантер
планирует построить рекомендательную модель.
А теперь самое интересное:
- Английский язык требуется только 8
вакансий (0,008%). А это значит, что специалист профессиональная сфера которого
имеет название на английском с точки зрения рекрутеров язык знать не
должен. Возможно, это объясняет низкую
осведомленность HR в современных западных трендах и очень
низкий уровень контактов с западными коллегами.
- Еще хуже обстоит дело с HR-аналиткой, она требуется только в одной
вакансии. И тут мы понимаем, почему эта сфера так плохо внедряется в практику
работы HR. Появляется гаденькая гипотеза, что
рекрутеры набирают себе подобных HR, т.е. по тем навыкам, которые им хорошо
известны и есть у них самих. Но это только гипотеза, пока не подтвержденная.
В среднем указывается от 5 до 7 навыков,
лидер компания из г.Красноярск, которая за 65000 рублей при полной занятости
хочет видеть HR со списком из 30 навыков. Пожелаем им
дружно удачи!
Гипотеза этого исследования: на основании
списка требований к кандидату можно спрогнозировать его заработную плату.
1. Изучим заработную плату HR. На рисунке 3 стандартные ящики усами для зарплаты в Москве и других регионах
России. Видно, что медиана зарплат в Москве - 60000 рублей (в моем исследовании
за март 2017 года медиана была 50000 рублей). В регионах - 32000 рублей. В Москве есть вакансии HR c заработной платой 550 000 рублей, конечно
это руководители отдела крупной фирмы.
У кого хорошее зрение и есть желание изучить заработные платы HR по городам России, могут обратится к данному рисунку.
Заработную плату больше 150 000 рублей будем считать статистическим выбросом, она все равно будет плохо прогнозироваться нашей моделью, т.к. уровень должности в нашем датасете не закодирован (это надо делать вручную).
2. Изучим потенциальные предикторы. Что-то
подсказывает, что основным предиктором будет требуемый опыт работы. На рисунке
3 видно, что в основном ищут HR с опытом работы от 1 до 3 лет. Опыт работы
более 6-ти лет требуется только для 32 вакансий.
Вторым значимым предиктором вероятно будет тип занятости:
полная будет оплачиваться лучше. В нашем датасете только 27 вакансий с
частичной занятостью. Даже Тинькоф за
20000 рублей хочет полную занятость у HR.
Третьим
по значимости предиктором скорее всего будут Москва (Московская область)
и Санкт-Петербург, как регионы с более высокой заработной платой.
3. Всегда имеет смысл начать с линейной
регрессионной модели, т.к. она очень хорошо интерпретируется.
Рассчитываем статистическую мощность.
Multiple regression power calculation
u = 28 (количество предикторов минус 1)
v = 764 (количество
наблюдений минус количество предикторов)
f2 = 0.15 (прогнозируемый R-квадрат)
sig.level = 0.05
(уровень значимости)
power =
1 (статистическая мощность)
Статистическая мощность 1 (это конечно
округление) говорит о том, что для R-квадрат
большего 0,15 нам данных вполне хватает даже с учетом такого большего
количества предикторов.
Рассчитываем полную модель (со всеми
предикторами). Получилось много статистически значимых предикторов, но мы
помним про проблему множественных сравнений. Самый жесткий критерий Бонферони, для
29 предикторов уровень статистической значимости должен быть 0.05/29 =0,002,
нас это вполне устраивает.
Чистим модель от незначимых предикторов.
Вот что получилось:
Residuals:
Min 1Q Median 3Q Max
-79269 -10379 -2879 6830 68533
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 13085 4023 3.253 0.001193 **
Опыт от 1 до 3 лет 13783 1901 7.249 1.02e-12 ***
Опыт от 3 до 6 лет 33246 2182 15.236 < 2e-16 ***
Опыт больше 6 лет 58974 3984 14.803 < 2e-16 ***
Москва 23416 1576 14.861 < 2e-16 ***
Санкт-Петербург 11626 2160 5.383 9.74e-08 ***
Занятость 8510 3858 2.206 0.027700 *
Управление 11595 2534 4.576 5.53e-06 ***
Корп.культура -10036 2729 -3.677 0.000252 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 19050 on 766 degrees of freedom
Multiple R-squared: 0.4898, Adjusted R-squared: 0.4845
F-statistic: 91.91 on 8 and 766 DF, p-value: < 2.2e-16
Эта модель объясняет почти 50% дисперсии,
что с учетом достаточно грязных данных очень неплохо.
Мы видим, что критерий "форма
занятости" для этой модели значим, но не удовлетворяет уровню
статистической значимости 0,002. Можно его тоже исключить, но в связи с тем,
что таких вакансий было очень мало, принимаем решение оставить.
4. Интерпретируем модель:
Характеристика HR
|
Прибавка к заработной плате (рубли)
|
Нет опыта работы, работает в регионе
неполный рабочий день
|
Базовая зарплата 13085
|
Стал работать полный рабочий день
|
+ 8510
|
Отработал больше одного года
|
+ 13783
|
Отработал больше трех лет
|
+ 19463 (прибавка в зарплате
относительно базового уровня +33246)
|
Отработал больше шести лет
|
+ 25728 (прибавка в зарплате относительно
базового уровня +58974)
|
Переехал в Санкт Петербург
|
+ 11626
|
Переехал из Санкт-Петербурга в Москву
|
+ 11790 (прибавка в зарплате
относительно базового уровня +33246)
|
Прокачали в себе навыки управления
|
+ 11595
|
Стали заниматься вопросами корпоративной
культуры
|
Потеряли -10036
|
Еще в прошлом исследовании я обратил
внимание на то, что есть навыки которые уменьшают заработную плату. Это кажется
странным -любой навык должен повышать конкурентоспособность специалиста. Объяснить
это очень просто если вспомнить какие данные мы использовали. В объявлениях о
вакансиях в которых набирают людей с навыками управления корпоративной
культурой предлагают меньшую зарплату.
5. В конце мы попробовали факторизовать
требуемые навыки HR.
На рисунке 5 можно выделить три интересных
группы навыков:
Группа навыков
|
Перечень навыков в группе
|
Бюрократы
|
Кадровый план, кадровая стратегия,
кадровая политика, внутренние коммуникации и HR бренд,
корпоративная культура
|
Реалисты
|
Подбор, оценка, обучение, адаптация
|
Управленцы
|
Мотивация персонала, командная работа и
управление командой, управление персоналом, организаторские способности
|
Бюрократы больше ориентированы на процесс,
реалисты на результат, а управленцы на людей. Очень похоже на управленческую
решетку Блейка-Моутона и Херси-Бланшара.
2. Мы не получили неожиданных результатов, но данные позволили нам спрогнозировать средний уровень заработной платы HR в зависимости от его профессиональных характеристик.
— Как в итоге выкачивали вакансии? Через скрипт с Хабра?
ОтветитьУдалить— Пробовали сделать нового чувака?)
— Что в графике остатков? Судя по Residuals 1Q 3Q ведут себя адекватно. Но смущают максимумы и минимумы. ( можно построить с помощью glm.diag.plots(model) из пакета boot) Сложно критиковать R2 в 0.48, но если график остатков покажет зависимости, можно докручивать.
— Почти сервис, что нужно указать, чтобы претендовать на большую зп:D
Спасибо за пост и ссылку на хабр)
а что Вам даст новый чувак и/или сервис, Артем?
Удалитьага, я присоединюсь в Артему и спрошу, что вы делали с ненормальным рапределением зарплаты
ОтветитьУдалитьВ этом обзоре ничего не делал. Не хватило времени поэкспериментировать.
Удалить