И снова к результатам нашего исследования факторов текучести персонала. В нашем исследовании был вопрос про источник, через который респондент нашел работу. Раньше я смотрел с позиции работодателя, какие плюсы несет тот или иной источник трафика, сейчас я показываю, как можно подойти к решению двух задач:
Обратите внимание, лучше всего прогноз для группы 2, а группа 2 у нас кадровые агенства, т.е. по данным о кандидате проще всего предсказать, найдет он работу через кадровое агентство или нет.
Длина столбика обозначает важность фактора, на первом месте Зарплата, на втором - возраст.
Дальше я покажу различия аудиторий по зарплате и возрасту
Айтишники: как вам идея стартапа - предсказывать источник трафика кандидата? Кандидат вводит свои данные, а ему в ответ рекомендации, как искать работу?
Пишите! И участвуйте в исследовании
- Джоб сайты предлагают обзоры заработных плат для компаний на основе публикуемых вакансий и резюме, и я хочу показать, что аудитория джоб сайтов не описывает всю генеральную совокупность рынка зарплат, а через наше исследование можно показать отклонение;
- Этот пост может стать идеей для сервиса по рекомендациям кандидатам, как им искать работу.
Задача
Я хочу решить следующую задачу: на основе данных о кандидате предсказать, через какой источник трафика он найдет работу. Понимая, какой фактор влияет на выбор того или иного источника трафика, мы поймем аудиторию каждого источника трафика.
Источники трафика
В нашем исследовании много вариантов ответа на вопрос об источниках трафика, я взял только самые характерные:- "Вы откликнулись на вакансию на джоб сайте" и 'Работодатель вышел на Вас через Ваше резюме на джоб сайте" я обозначил как группу "0", или "Jobsite", всего таких респондентов 929;
- "Вы обратились непосредственно в саму компанию по рекомендации вашего знакомого - работника данной компании" как группа '1' или "Реферал" - 212 респондентов;
- "Кадровое агентство вывело вас на работодателя" - группа '2' или "КА" и 130 респондентов;
- "Работодатель вышел на Вас по рекомендации человека, знающего вас" - '3' или "Знакомый" - 357 респондентов.
Факторы
В уравнение я взял следующие факторы:- 'Стартовая зарплата',
- 'Возраст при приеме на работу',
- 'В какой социальной сети вы проявляете максимальную активность',
- 'Ваш пол',
- 'Знание иностранного языка на момент трудоустройства',
- 'Какой основной браузер установлен на вашем личном ноутбуке / компьютере',
- 'Масштаб населенного пункта',
- 'Образование на момент трудоустройства',
- 'Размер компании (число работников)',
- 'Регион',
- 'Сведения о компании. Отрасль',
- 'Сфера Вашей деятельности',
- 'Уровень Вашей позиции'
Результаты
Теперь немного для профи инфо. О точности моделиROC кривая
Precision-recall curve
Скажем прямо: а никто и не обещал идеального попадания.Важность факторов
Дальше будет жесткая картинка.Длина столбика обозначает важность фактора, на первом месте Зарплата, на втором - возраст.
Дальше я покажу различия аудиторий по зарплате и возрасту
Зарплата
Возраст
Обратите внимание, Джоб сайты - самый молодой источник трафика, через него чаще находят работу более молодые кандидаты с медианой в 28 лет, рефералы старше джлб сайтовцев, но (!) они чуть ниже с т.з. зарплаты. А кадровые агенства дают самый большой разброс по зарплате (так что не надо говорить, что кадровые агентства только для богатых), но самая тесная группа по возрасту.Айтишники: как вам идея стартапа - предсказывать источник трафика кандидата? Кандидат вводит свои данные, а ему в ответ рекомендации, как искать работу?
Пишите! И участвуйте в исследовании
Эдуард, доброго дня! Подскажите, пожалуйста, какими инструментами пользовались? Или я уже подзабыла содержание семинара, или вы стремительно осваиваете новые техники! Буду благодарна за ответ!
ОтветитьУдалитьСабина, я работаю в Python - эта программа позволяет делать более продвинутую аналитику, чем excel
ОтветитьУдалить