Поводом к написанию поста стала статья Корпоративная культура Facebook, Amazon и Apple в описании вакансий. Статья вызывала большой интерес - на шестом месте по количеству просмотров за все время существования блога. Я решил проверить, можно ли нечто подобное сделать у нас.
Сразу предупреждаю, что я не замахиваюсь на масштаб исследователей из данной статьи. Моя цель скромнее - просто попробовать получить какой-то осмысленный результат. Понять, что можно что-то извлекать.
Хотел бы также к ребятам их ХХ.ру обратиться: было бы здорово, если вы разместили на гитхабе примеры парсинга вакансий. В нормальных пакетах так и делается: возьмите пакеты xgboost, lime и т.п.. - там даются примеры кодов. Чтобы такие недоучки как я могли пользоваться.
Сами вакансии пришлось качать замысловато: сначала через поиск по компании скачивал ID вакансий, а потом уже по урлу вакансии качал описание. И скорость ответов не в пользу ХХ: никогда прежде мне не отвечали больше суток, а мой вопрос ХХ без ответа висит на гитхабе уже несколько суток....
* Тем не менее, коллеги! если вам нужно будет накачать вакансии с ХХ по разным фильтрам, обращайтесь.
Обращаю ваше внимание, что в текстовом поле были как требования к кандидату, так и обещания компании. Поэтому получилась каша.
Голосование еще открыто, на сейчас соотношение такое:
С размером шрифта все понятно: чем выше буквы, тем понятней текст. А agile - это про Сбербанк, и это про менеджмент топа.
Если убрать AGILE из текстов картинок, то скажите, чем компании будут различаться?
И так далее...... И только AGILE внес разнообразие. И еще показал роль первых лиц компании в формировании корпоративной культуры. Есть agile в компании или нет, это другой вопрос, но корпоративная культура определяется через артикуляцию вот таких слов, и это подтверждается результатами голосования.
В нашем канале ТЕЛЕГРАМ как раз идет голосвание, согласны вы с моими выводами по поводу результатов голосования или нет! голосуйте!
__________________________________________________________
На этом все, читайте нас в фейсбуке, телеграмме и вконтакте
Сразу предупреждаю, что я не замахиваюсь на масштаб исследователей из данной статьи. Моя цель скромнее - просто попробовать получить какой-то осмысленный результат. Понять, что можно что-то извлекать.
Данные
Данные я взял только двух компаний с сайта ХХ. Это открытые вакансии АльфаБанка - почти 500 - и Сбербанка - более 1 500. Итого более 2 000 строк данных. Не очень много, даже совсем немного, но я и не претендую на законченность анализа как уже писал. Данных мало, полученные результаты имеют очень вероятностный характер. Любой другой спец на этих данных получит другие результаты: они будут пересекаться, но будут другими. Это зависит от параметров алгоритма. Поэтому прошу относиться к полученным результатам не как к приговору банкам, а как некой вероятности.Хотел бы также к ребятам их ХХ.ру обратиться: было бы здорово, если вы разместили на гитхабе примеры парсинга вакансий. В нормальных пакетах так и делается: возьмите пакеты xgboost, lime и т.п.. - там даются примеры кодов. Чтобы такие недоучки как я могли пользоваться.
Сами вакансии пришлось качать замысловато: сначала через поиск по компании скачивал ID вакансий, а потом уже по урлу вакансии качал описание. И скорость ответов не в пользу ХХ: никогда прежде мне не отвечали больше суток, а мой вопрос ХХ без ответа висит на гитхабе уже несколько суток....
* Тем не менее, коллеги! если вам нужно будет накачать вакансии с ХХ по разным фильтрам, обращайтесь.
Результат
Проводил анализ тональности текста описаний вакансий. Для непрофессионалов скажу: смысл анализа в том, что машина ищет такие слова и словосочетания, которые чаще применяются в описании вакансий одной компании и реже в описании вакансий другой. Таким образом, выделив такие слова и словосочетания мы встретив в новой, незнакомой нам вакансии эти слова, можем угадать, что это за компания.Обращаю ваше внимание, что в текстовом поле были как требования к кандидату, так и обещания компании. Поэтому получилась каша.
Сбербанк
Альфабанк
Фишка анализа
Кстати говоря, ROC AUC модели на тестовых данных получился 0, 99, т.е. мы идеально можем спрогнозировать, будет ли вакансия Сбербанка или Альфабанка. Хотя я при этом удалил не только слова "Альфа", "Альфабанк", "Сбер", "Сбербанк", "CIB" и т.п., но и слова типа "Технопарк" (это станция метро в Москве, где головной офис Альфабанка.
Интересно, какие признаки выдают компании?
Голосование
Я выложил эти два рисунка в свой канал в телеграме (присоединяемся к каналу! нас уже более 800 участников). Вот такие результаты получились.- Сбербанк 54 лайков: 14 антилайков
- Альфабанк 30 лайков: 25 антилайков
Обсуждение результатов
Выскажу свое мнение, не претендуя на правоту. Мне кажется, что результаты определялись двумя факторами:
- agile
- размер шрифта
С размером шрифта все понятно: чем выше буквы, тем понятней текст. А agile - это про Сбербанк, и это про менеджмент топа.
Если убрать AGILE из текстов картинок, то скажите, чем компании будут различаться?
- В одном случае карьерный рост, в другом - карьерное развитие;
- В случае Сбера возможность обучения за счет компании , в Альфа Банке - корпоративное обучение;
- В АльфаБанке льготное страхование жизни, в Сбере - льготное кредитование;
- В Сбере умение работать в команде , в Альфа Банке сложные интересные задачи.
И так далее...... И только AGILE внес разнообразие. И еще показал роль первых лиц компании в формировании корпоративной культуры. Есть agile в компании или нет, это другой вопрос, но корпоративная культура определяется через артикуляцию вот таких слов, и это подтверждается результатами голосования.
В нашем канале ТЕЛЕГРАМ как раз идет голосвание, согласны вы с моими выводами по поводу результатов голосования или нет! голосуйте!
__________________________________________________________
На этом все, читайте нас в фейсбуке, телеграмме и вконтакте
Есть предположение, что роль играет и выдача в тг канале меню голосования.
ОтветитьУдалитьДо пункта "я не вижу принципиальной разницы между этими двумя компаниями" могли не дочитать, потратив голос раньше.
да, для честной процедуры голосования надо бы другие условия
УдалитьВо-первых, предпосылки исследования спорны, потому как формулировки, которые компании выбирают для описания своих вакансий, могут говорить скорее об уровне адекватности рекрутеров, а также о том, насколько они озадачены HR-брендом, т.е. обложкой. По которой однозначно не стоит судить о реальной культуре в компании. Куда больше о культуре расскажет вахтерша на входе в головной офис :)
ОтветитьУдалитьВо-вторых, нет необходимости выкачивать и анализировать все 1500 вакансий, чтобы сделать выводы, к которым вы пришли. Достаточно просмотреть глазами 5-10 вакансий, чтобы найти в них общее. Особенно если во всех вакансиях есть стандартный блок.
а вы видели статью с западным исследованием?
Удалитьполучились вполне адекватные результаты