Share |

среда, 28 февраля 2018 г.

Wearable computers - готовы ли Вы носить браслеты от работодателя




Wearable computers - это девайс, который носится на одежде и создан для отслеживания перемещений (в основном, иногда другие параметры типа физиологических параметров) носителя.

В нашем телеграм канале (присоединяемся) статья получила два дислайка, и я сделал опрос. 
Хочу прояснить для себя ваше отношение и запускаю опрос: готовы ли Вы носить на работе браслет датчик, который бы по объяснению руководства считывал бы ваши рабочие действия (перемещения по офису, активность нервной системы и т.п.) для того, чтобы оптимизировать рабочий процесс:

  1. да, я не против носить такой браслет;
  2. да, но только из-за угрозы карьере в этой компании;
  3. нет, потому что не доверяю руководству и считаю, что это способ контроля моей работы;
  4. нет, в любом случае это вторжение в мое личное пространство.

Результаты

Самая большая ошибка большинства в HR-аналитике?





Перевод статьи The greatest mistake for many in People Analytics? в рамках нашего проекта переводы статей по hr-аналитике на английском. Автор статьи Andrew Marritt, очень его уважаю и рекомендую, как одного из самого профессионального HR-аналитика. Вот некоторые его статьи в нашем блоге
  1. Фокус на причинах, а не на симптомах вовлеченности сотрудников
  2. Исследования вовлеченности персонала: часть 1, проблемы традиционного подхода
  3. Как использование методов анализа текста изменяет опросы сотрудников
  4. Неосознанная предвзятость? Использование аналитики текста для понимания гендерных различий в оценке эффективности работы - эта статья была использована в курсе на курсере Томского университета.
  5. В опросы следует включать больше открытых вопросов

Перевод этой статьи выполнила Екатерина Соколова, (ссылка на профиль ВКонтакте) - c&b Байкальский банк, ПАО Сбербанк (рекомендую этого специалиста).Это третий перевод Екатерины, см. также:
5 истин об HR-аналитике (IBM Watson Talent)
Итак
Самая большая ошибка большинства в HR-аналитике?

Самая большая ошибка большинства в HR-аналитике?


Douglas Hubbard в своей замечательной книге "Как измерить что-либо" привел 3 экономически важные причины измерений (и аналитики):
  1. чтобы принять верное решение
  2. чтобы влиять на поведение
  3. чтобы продать информацию

понедельник, 26 февраля 2018 г.

Браслеты Amazon могут отследить движения руки сотрудников: “Работодатели всё чаще обращаются с персоналом, как с роботами”

Перевод статьи Amazon wristbands could track workers' hand movements: 'Employers are increasingly treating their employees like robots' нашего  проекта переводы статей по hr-аналитике на английском.
Перевод выполнила Ольга Хайдарова - HR project-manager компании "Этажи", г. Тюмень. Это шестой перевод Ольги, см. также


Также Ольга выполняет самостоятельные проекты по аналитике, см. пост Ольги
Анализ дожития специалистов по продаже недвижимости - работодатели, обращаю ваше внимание, рекомендую специалиста.
Итак,
Браслеты Amazon могут отследить движения руки сотрудников: “Работодатели всё чаще обращаются с персоналом, как с роботами”

Браслеты Amazon могут отследить движения руки сотрудников: “Работодатели всё чаще обращаются с персоналом, как с роботами”

Автор: Элли Маротти (Ally Marotti), Chicago Tribune
Так как Amazon продолжает поиск способов сокращения срока доставки и открывает склады в Иллинойсе, гигант электронной коммерции положил глаз на технологию, которая позволяет отслеживать движения рук работников в то время, когда они выполняют заказы.
Компания недавно запатентовала браслеты, которые могут быть использованы как часть системы инвентаризации, взаимодействующей с оборудованием на складах и сообщающей сотрудникам вибрацией если, например, они кладут товары не в те контейнеры. Но в мире, где правовые рамки, касающиеся сбора и использования данных о людях, в основном не определены, подобные устройства, по мнению некоторых экспертов, могут быстро начать применяться в неблаговидных целях.
Опасения, связанные с таким устройством колеблются от возможной дискриминации до угрозы для безопасности данных для сотрудников компании, численность которой в Чикаго составляет более 8 000 человек.
Amazon почти два года ждали подтверждения патентов, и непонятно, планируют ли они когда-либо развернуть использование этой технологии на своих складах. Компания утверждает, что это не попытка отследить перемещение сотрудников, но от самой идеи такого вмешательства в частную жизнь по позвоночнику бегут мурашки.
“Работодатели все больше относятся к своим сотрудникам, как к роботам,” говорит Лори Эндрюс (Lori Andrews), профессор Юридического колледжа Чикаго-Кент Технологического института Иллинойса (Illinois Institute of Technology's Chicago-Kent College of Law). “Частично проблема в том, что работники редко это осознают,” говорит он.
Некоторые компании раздают фитнес-трекеры, как часть велнесс-программ, но, по сути, это сбор данных о сотрудниках, утверждает Эндрюс. Прошлым летом компания по производству торговых автоматов в штате Висконсин предложила своим работникам имплантировать в руку микрочип, как утверждает компания, чтобы облегчить ежедневные задачи, такие как покупка закусок или использование копировальной техники.

суббота, 24 февраля 2018 г.

Как работает команда: анализ внутригрупповых процессов и ролей участников команды






На Западе сейчас набирает силу тема Organisational Network Analytics или оно же - Social Network Analytics. Я прошел курс на Курсере Applied Social Network Analysis in Python Мичиганского университета. Курс действительно Applied - прикладной в том смысле, что теория только в том объеме, чтобы можно было понять, как применять на практике, но про курс я еще напишу.
По материалам курса я уже сделал пост Исследование email коммуникаций в компании. На сегодня я прошел курс и для повторения я решил сделать что-то на своих данных.

Задача

Я стал собирать данные в закрытой группе на facebook по HR-аналитике. Эта группа закрыта потому, что туда могут попасть только те, кто не просто прошел семинар по аналитике, но и выполнил свой проект. Т.е. там те специалисты, кто умеют работать руками. И обсуждение происходит не обще теоретических вопросов HR и HR-аналитики, а рабочих вопросов. И нас всего 7 человек.
Я решил посмотреть, как работает команда спецов, как происходит взаимодействие, кто у нас проявляет максимальную активность, кто имеет максимальное влияние и т.п..
Мне было бы интересно услышать ваше мнение:

  1. как работает наша команда;
  2. как это можно применять в "боевых" условиях.

Методология

Я сильно не замарачивался и сделал так:

  1. Если участник группы размещает пост - это активное действие. Причем, неважно, делится ли участник каким-то знанием или спрашивает совета: в любом случае он проявляет активность. Во втором случае польза для группы не менее важна, поскольку позволяет также тренировать свои навыки. 
  2. Если другой участник отреагировал на этот пост - это реактивное действие. Реакция может быть в виде коммента или лайка. И для меня неважно: завязалась ли там дискуссия на 500 комментов или ограничилось все одним комментом или лайком. Важно, что пост вызвал реакция участника команды. 

Итого, файл получился таким.
Пост      Реакция   Тип           Дата
Иванов  Петров     коммент   22.02.2018
Петров   Сидоров  лайк         22.02.2018
Таким образом, мы можем посчитать активность Иванова через реакции на его пост дургих участников команды. Если пост Иванова не получил ни коммента, ни лайка, то в таблице он просто не отразится. Чем больше членов команды отреагирует на пост Иванова, тем больше активности он соберет.

Вводные замечания


  1. Данные я собирал, начиная с 12 февраля, поэтому данных мало, и я не погружаюсь в бОльшую глубину, типа: проводить анализ отдельно для реакций типа "лайк" и "коммент" - данных не так уж много. 
  2. Для специалистов сообщу, что эти данные в зависимости от разных показателей я использовал как граф, как мультиграф, директграф или мультидиректграф. 

Результат

Далее я уже применяю Social Network Analytics.

Диаграмма 1

Как работает команда: анализ внутригрупповых процессов и ролей участников команды



Это общая схема взаимодействия команды.

четверг, 22 февраля 2018 г.

Как читать диаграмму boxplot (ящик с усами). На конкретном примере



Очень замечательный опрос проходил у нас вчера в телеграм канале (присоединяемся). Вопрос звучал просто:
 Коллеги, на картинке выше показана диаграмма boxplot - ящик с усами. Прошу честно ответить, умеете ли Вы читать этот тип диаграммы

Диаграмма такого типа

Как читать диаграмму boxplot (ящик с усами). На конкретном примере

Результаты опроса получились такие:

Как читать диаграмму boxplot (ящик с усами). На конкретном примере


Итого у нас на одного знающего двое не знающих. Это канал HR-аналитики. Смею предположить, что в каналах просто HR, без аналитики, % знающих будет еще меньше. 
Мораль: аналитика начинается со знания boxplot.

Попробую объяснить

Представьте, что в вашу компанию пришла проводить тестирование одна консалтинговая компания. Тест по их заявлениям очень крутой, прошел пять валидизаций и был принят в конкурсе "Лучшие лидеры Родины". Но Вы, конечно же, ориентируетесь не на рекламу, а на цифры, поэтому вы смотрите на диаграммы. Предположим вы протестировали своих руководителей по этому тесту и получили

Гистограмма

Как читать диаграмму boxplot (ящик с усами). На конкретном примере
Эта диаграмма позволяет увидеть, как распределены результаты наших работников, например, по шкале "мотивация". Шкалы теста имеют 100 балов - от 0 до 100. 
К нашем удивлению, бОльшая часть наших работников показывают результаты близкие к верхней границе. Из курса статистики факультета психологии мы помним, что результаты хорошего текста должны иметь нормальное распределение что-то типа

среда, 21 февраля 2018 г.

R или Python: какую программу изучать HR аналитикам



Заранее предупреждаю: да, я в курсе, что R и Python это языки программирования, а не программы.
Я провел опрос в нашем телеграм канале (приглашаю):
 "В последнее время часто слышу разговоры, какую программу лучше изучать HR-аналитикам: R или Python. Хочу статистически проверить популярность программ. Прошу проголосовать, какую программу вы изучали, изучаете или хотели бы изучать."
 Последнее время на самом деле многие мои знакомые заявляют о том, что "предпочитают" Python.
R или Python: какую программу изучать HR аналитикам
Я ступил, введя вариант ответа R и Python. Но в телеграме пока не смогу найти опрос с множественным выбором. В случае множественного выбора результат был бы немного иной. 
Из всего многообразия вариантов я могу с определенной осторожностью сказать только про то, что в среде HR R популярней Python. Поэтому смело приглашаю Вас на свой семинар по R Семинар-практикум "HR-Аналитика в R", Москва,23-24 апреля 2018 и приглашаю посмотреть мой вариант того, R или Python надо изучать.

В доказательство своего варианта приведу результаты другого опроса из этого же телеграм канала:
 Коллеги, на картинке выше показана диаграмма boxplot - ящик с усами. Прошу честно ответить, умеете ли Вы читать этот тип диаграммы
R или Python: какую программу изучать HR аналитикам
Поэтому HR-аналитику надо изучать, начиная с boxplot, неважно, в R или Python этот самый boxplot нарисован. 




__________________________________________________________
На этом все, читайте нас в фейсбуке, телеграмме и вконтакте

вторник, 20 февраля 2018 г.

Как я скачиваю вакансии компаний с HH.ru (на примере Газпрома)



Сразу признаюсь: неделю назад я ничего не знал про API HH, парсинг вакансий с ХХ.ру. Поэтому не претендую на лучший способ парсинга вакансий.
Если Вы предложите более удобный способ - буду благодарен.
Мне вакансии потребовалось парсить в рамках задачи Сравнительный анализ корпоративной культуры Альфабанка и Сбербанка на основе текстов вакансий
Работаю в Python.
И предупреждаю: данный алгоритм будет полезен только для парсинга открытых вакансий конкретных компаний. Для парсинга, например вакансий по определенному запросу с определенной даты в определенном регионе уже потребуется другой алгоритм - обращайтесь, если что.

Алгоритм

Необходимые пакеты

import numpy as np
import requests
from tqdm import tqdm_notebook
import pandas as pd
Давайте на примере Газпрома. Самый типа простой способ
Как я скачиваю вакансии компаний с HH.ru


r = requests.get('https://api.hh.ru/vacancies?employer_id=39305').json() 
r
39305 - это номер работодателя на ХХ, в нашем случае Газпром. Как найти ID компании, думаете не проблема: ищите страницу работодателя в ХХ.ру, там в урле берете ID.
Этот способ нас сразу не устраивает, потому что по дефолту эта команда скачивает только 20 вакансий - вакансии размещаются на страницах по 20 вакансий на каждой, и приведенная команда скачает вакансии только с первой страницы. А у нас всего найдено
'found': 774,

В самом низу выдачи r видим

'pages': 39,
'per_page': 20

Т.е. у нас 774 вакансии на 39 страницах. Запускам цикл, чтобы скачать все страницы с 774 вакансиями Газпрома

vac = []
for i in tqdm_notebook(range(0, 39)):
    vac.append(requests.get("https://api.hh.ru/vacancies?employer_id=39305", params={'page': i, 'per_page':20}).json())
И получаем объект типа лист vac. Но и эта выдача меня не устраивает. Если вы посмотрите на отдельные элементы листа типа v[0], то можете обратить внимание, что описание требований к кандидату и предложение компании обрезаны.

'snippet': {'requirement': 'Высшее образование. Опыт работы в банковской сфере 
не менее одного года. Опыт работы в клиентском сервисе не менее двух лет. ',
    'responsibility': 'Привлечение и обслуживание клиентов премиум сегмента. 
Развитие текущих клиентов (установление долгосрочных отношений). 
Выполнение плана продаж. Финансовое консультирование и продажа инвестиционных...'},
Это значит, что надо искать другой путь. Я сначала скачиваю ID всех вакансий Газпрома

pac=[]
for i in range(0, 39):
    for j in range(0, 20):
        pac.append(vac[i]['items'][j]['alternate_url'])
И мы получаем объект типа лист с всеми урлами вакансий Газпрома. Нам надо еще оставить одни номера урлов, а не сами урлы
lili = [re.sub(r'[^0-9]', '', e) for e in pac]
У вас в этом месте выдаст ошибку, потому что я забыл указать библиотеку regex - установите ее. Теперь у нас набор ID вакансий Газпрома. Но вы заметили, что мы сначала скачали все содержимое вакансий, а из него вытащили уже ID. Это нихт гут, если парсить надо много контента, поэтому можно сразу парсить ID вакансий так

vah = []
for i in tqdm_notebook(range(0, 39)):
    for j in tqdm_notebook(range(0, 20)):
        vah.append(requests.get("https://api.hh.ru/vacancies?employer_id=39305", params={'page': i, 'per_page':20}).json()['items'][j]['alternate_url'])
формула страшная для гуманитариев типа меня. И кстати, по времени парсинга я не заметил сильного отличия с парсингом всех вакансий.
Далее мы скачиваем вакансии уже по этим прямым ID. Сначала опять выделяем только числа из урлов, потом скачиваем


lulu = [re.sub(r'[^0-9]', '', e) for e in vah]
vak_url = 'https://api.hh.ru/vacancies/{}'

var = []
for i in lulu:
    var.append(requests.get(vak_url.format(i)).json())
В общем все, дальше мы превращаем скачанные вакансии в объект pandas
df = pd.DataFrame(var)
И последнюю беду, которую мне лично нужно было решить, это избавиться от тегов урлов, потому что описание вакансий идет в таком виде
df['description']
Чтобы избавиться от тегов, выполняем команду
df['description'] = df['description'].apply(lambda x: (re.sub(r'<.*?>', '', str(x))))
Напомню, что я решал локальную задачу парсинга открытых вакансий конкретной компании, для решения других задач потребуется возможно другой алгоритм.




__________________________________________________________
На этом все, читайте нас в фейсбукетелеграмме и вконтакте





понедельник, 19 февраля 2018 г.

Сравнительный анализ корпоративной культуры Альфабанка и Сбербанка на основе текстов вакансий




Поводом к написанию поста стала статья  Корпоративная культура Facebook, Amazon и Apple в описании вакансий. Статья вызывала большой интерес - на шестом месте по количеству просмотров за все время существования блога. Я решил проверить, можно ли нечто подобное сделать у нас.
Сразу предупреждаю, что я не замахиваюсь на масштаб исследователей из данной статьи. Моя цель скромнее - просто попробовать получить какой-то осмысленный результат. Понять, что можно что-то извлекать.

Данные

Данные я взял только двух компаний с сайта ХХ. Это открытые вакансии АльфаБанка - почти 500 - и Сбербанка - более 1 500. Итого более 2 000 строк данных. Не очень много, даже совсем немного, но я и не претендую на законченность анализа как уже писал. Данных мало, полученные результаты имеют очень вероятностный характер. Любой другой спец на этих данных получит другие результаты: они будут пересекаться, но будут другими. Это зависит от параметров алгоритма. Поэтому прошу относиться к полученным результатам не как к приговору банкам, а как некой вероятности.
Хотел бы также к ребятам их ХХ.ру обратиться: было бы здорово, если вы разместили на гитхабе примеры парсинга вакансий. В нормальных пакетах так и делается: возьмите пакеты xgboost, lime и т.п.. - там даются примеры кодов. Чтобы такие недоучки как я могли пользоваться.
Сами вакансии пришлось качать замысловато: сначала через поиск по компании скачивал ID вакансий, а потом уже по урлу вакансии качал описание. И скорость ответов не в пользу ХХ: никогда прежде мне не отвечали больше суток, а мой вопрос ХХ без ответа висит на гитхабе уже несколько суток....
* Тем не менее, коллеги! если вам нужно будет накачать вакансии с ХХ по разным фильтрам, обращайтесь.

Результат

Проводил анализ тональности текста описаний вакансий. Для непрофессионалов скажу: смысл анализа в том, что машина ищет такие слова и словосочетания, которые чаще применяются в описании вакансий одной компании и реже в описании вакансий другой. Таким образом, выделив такие слова и словосочетания мы встретив в новой, незнакомой нам вакансии эти слова, можем угадать, что это за компания.
Обращаю ваше внимание, что в текстовом поле были как требования к кандидату, так и обещания компании. Поэтому получилась каша.

Сбербанк

Сравнительный анализ корпоративной культуры Альфабанка и Сбербанка на основе текстов вакансий

Альфабанк

Вопрос: надо ли в данной ситуации HR-директору беспокоиться о текучести персонала



В одной из групп на фейсбуке я выложил фотографию текучести персонала одного ритейлера
Вопрос: надо ли в данной ситуации HR-директору беспокоиться о текучести персонала
  • По оси X - число месяцев стажа
  • По оси Y - вероятность, что работник доработает до этого момента стажа в компании.
Это по всей компании. 
  • Средний срок жизни 12 месяцев. Текучесть по году будет чуть меньше 50 %
  • В первые три месяца на испытательном сроке уходят более 20 %;
  • В первые полгода треть сотрудников уходит
Моя позиция такова: большой % работников уходит, не оправдав затраты на подбор, адаптацию и обучение. Поэтому текучесть должна быть "горячей" темой. 
Итак, я выложил в группе и спросил, прав ли HR -директор, что не нужно беспокоиться о текучести персонала? 
Александр Вечерин привел контраргумент: 
Вопрос: надо ли в данной ситуации HR-директору беспокоиться о текучести персонала
Не знаю, откуда Александр вытащил картинку, но это бенчмарк текучести. И по ритейлу показатель текучести в среднем по компании 59 %, т.е. показатели текучести персонала в среднем по рынку хуже, чем для нашей компании. 
Итого, я выделяю две позиции:
  1. Ситуация плохая: у нас % уходит, не оправдав затраты на подбор, обучение, и тема текучести должна быть топовой. 
  2. Ситуация хорошая: мы по рынку лучше, в ритейле это нормальная ситуация, поэтому заниматься текучестью надо не больше, чем любой другой HR проблемой. 
Коллеги, в данной ситуации на месте HR директора какую позицию Вы бы заняли? Какую позицию вы бы выбрали: 1 или 2?

Прям сейчас у нас проходит голосование в телеграм канале - присоединяйтесь и добавьте свой голос!!!

__________________________________________________________
На этом все, читайте нас в фейсбукетелеграмме и вконтакте




суббота, 17 февраля 2018 г.

Измерение рентабельности инвестиций в обучение (ROI) - сложно, но не невозможно





Перевод статьи Measuring learning ROI is hard – but not impossible в рамках нашего  проекта переводы статей по hr-аналитике на английском. Автор статьи Harman Brar, она впервые в нашем блоге. И вообще тема оценки эффективности в нашем блоге не самая популярная.
Перевод выполнила Марина Канаева (по ссылке профиль в фейсбуке), менеджер по оценке и развитию персонала в российском агрохолдинге Агропромкомплектация. Это второй перевод Марины в нашем блоге, см. также
Предстоящая эволюция найма и развития талантов
Итак,
Измерение рентабельности инвестиций в обучение (ROI) - сложно, но не невозможно

Измерение рентабельности инвестиций в обучение (ROI) - сложно, но не невозможно

Нельзя отрицать, что попытка привязать обучение к бизнес-результатам - сложная и ресурсоемкая задача.

Многие компании в самых разных отраслях стараются изо всех сил чтобы продемонстрировать эту связь. Большинство на самом деле переживают непростое время, продолжая использовать устаревшие базовые критерии измерения обучения, такие как повышение эффективности работы сотрудника и соблюдение организационных норм.

пятница, 16 февраля 2018 г.

Фокус на причинах, а не на симптомах вовлеченности сотрудников



Перевод статьи Focussing on the causes not the symptoms of employee engagement в рамках нашего проекта переводы статей по hr-аналитике на английском. Автор статьи - Andrew Marritt, но последнее время подзапустил писать, но вообще у него очень классные статьи. К сожалению, он очень глубок, поэтому не так популярен, как некоторые звездоболы от HR-аналитики, но если Вы хотите серьезной аналитики, читайте его статьи. Некоторые из опубликованных:

Перевод данной статьи сделала Екатерина Рыбакова, профиль Екатерины в фейсбук, профиль в Линкедине. У Екатерины это уже четвертый перевод в нашем проекте, см. также:

Итак,
Фокус на причинах, а не на симптомах вовлеченности сотрудников

Фокус на причинах, а не на симптомах вовлеченности сотрудников

В зависимости от того, на какие данные о вовлеченности сотрудников вы смотрите, они, как правило, или остаются на прежнем уровне или уменьшаются в течение последних 15 лет. Очевидно, что-то не так с тем, каким образом фирмы пытались управлять вовлеченностью в рамках своих организаций. Мы считаем, что основная проблема заключается в том, что вовлеченность страдает от ошибочного анализа, приводящего к неэффективным изменениям.

среда, 14 февраля 2018 г.

Интерпретабельность HR-аналитики

Короткий, но важный пост. Копия моего пост с фейсбука и представляет собой тезисы. Написан практически в соавторстве с Александр Вечерин.
В HR-аналитике (да и в любой аналитике) нам важны не просто показатели качества модели, а интерпретируемость результатов. Т.е. если мы создали модель приема на работу, в которой принимаем / отклоняем кандидатов, то мы должны понимать не просто качество модели - с какой вероятностью мы можем неверно взять или неверно отклонить Васю Иванова, но нам еще хотелось бы понимать, почему мы Васю отклонили - какие в нем данные "не те", на основании чего мы его отклоняем. Причем, прошу не путать божий дар в яичницей: это не та ситуация, когда в компании создана модель компетенций, а кандидата отклоняют на основе того, что у него недоразвита компетенция "клиентоориентированность". Это полная лажа, потому что построено это на основе глюков консалтеров, не подкрепленных данными. Я говорю о математической модели, за которой стоит тяжкий труд по сбору данных и анализу. Далее я коснусь математических аспектов интерпретации модели (прошу прощения у неподготовленной публики - переходите сразу в пункту 7 - из песни слова не выкинешь - приходите ко мне на семинар, чтобы быть в теме).

Аспекты интпретации можно описать следующими пунктами.
  1. линейная регрессия замечательна тем, что там есть коэффициенты, которые легко интепретируемы: "с увеличением x на 1 единицу, Y увеличивается на коэффициент ...."
  2. засада возникает в тот момент, когда нам приходится а) логарифмировать, б) стандартизировать переменные или в) регуляризировать - в этот момент пропадает ясность. 
  3. если с логарифмированием и стандартизацией как то еще можно разобраться, у нас вместо абсолютных значений появляются %, а стандартизованные значения мы можем обратно трансормировать, то с регуляризацией все хуже: перестает быть понятен физический смысл коэффициентов
  4. но совсем плохо с непараметрическими моделями, потому что все, что у нас там есть - фиче импортанс - важность факторов. И мы ничего не можем сказать про конкретного Васю Иванова, которого не взяли на работу, потому что его СКОР (от англ score) показал низкие значения. 
  5. вот эта ситуация в аналитике (см. п 5) называется ситуацией "черного ящика", когда мы не понимаем, что внутри. Кстати говоря, тема "черного ящика" обсуждалась на западных HR-аналитических конференциях. 
  6. но совсем недавно появились пакеты типа LIME, которые говорят, да нет, ребята, мы можем сказать, почему Вася был отклонен. 
  7. в посте по ссылке Про деструкторы в отношениях с руководителем. И о том, как правильно их измерять я описываю одну из возможных ситуаций: в качестве модели я беру прогноз психологической совместимости подчиненный руководитель и показываю не просто прогноз того, насколько совместимы они между собой, а какие факторы у конкретно данного Васи Иванова способствуют совместимости или препятствуют

Интерпретабельность HR-аналитики





__________________________________________________________
На этом все, читайте нас в фейсбукетелеграмме и вконтакте




вторник, 13 февраля 2018 г.

Опыт применения чатбота в рекрутинге: год вместе



Перевод статьи A year with our recruiting chatbot в рамках нашего  проекта переводы статей по hr-аналитике на английском. Автор Anna Ott, HR в стартапе Deutsche Telekom AG, публикуется у нас впервые.
Перевод выполнила Ольга Хайдарова - HR project-manager компании "Этажи", г. Тюмень. Ольга, кстати, сама пишет ботов в телеграме, надеюсь, что напишет аналогичную статью про опыт использования бота в HR. Это пятый перевод Ольги, см. также
  1. 86% руководителей не видят пользы в Аналитике – почему так?
  2. Успех в аналитике требует правильного мышления
  3. Улучшаем командную производительность с Анализом организационных сетей (ONA)
  4. Перегруженная организация

Также Ольга выполняет самостоятельные проекты по аналитике, см. пост Ольги
Анализ дожития специалистов по продаже недвижимости - работодатели, обращаю ваше внимание, рекомендую специалиста.
Итак,

Опыт применения бота в рекрутинге: год вместе

Год с нашим рекрутинговым чат-ботом

 Это обзор нашего опыта использования чат-бота (созданного компанией Job Pal) в процессе подбора в hub:raum (инкубатор стартапов компании Deutsche Telekom AG) в течение последних 10 месяцев, и наши честные размышления о наших ожиданиях, уроках, которые мы вынесли и следующих шагах, которые мы, возможно, захотим предпринять с нашим чат-ботом.
Это размышления о вещах, которыми hub:raum фактически занимается с позднего 2016 года, когда было всего пара статей об эффективности технологии чат-ботов в HR, особенно в рекрутинге.  Мы не знали, как чат-бот будет воспринят нашими кандидатами, или сколько он сможет на себя взять от стандартного человеческого взаимодействия - в данном случае, от процесса рекрутинга.

Но с этими новыми технологиями такая штука: пока ты не попробуешь это, ты никогда не узнаешь. 

В теории, есть объективные преимущества внедрения чат-ботов для компаний, особенно в массовом подборе. В процессе рекрутинговых переговоров, множество одинаковых ответов бесконечно даются на множество одинаковых вопросов. Однако чат-бот используют люди, вот поэтому теория становится немного непредсказуемой.
В течение последних нескольких месяцев, у нас было несколько гипотез и несколько интересных наблюдений:

 #1. Соискатели контактируют с хаб-ботом (hubbot) чаще всего вне рабочего времени.

Зная, что талант это дефицитный ресурс, и что наиболее талантливые кандидаты будут пассивно искать свой следующий карьерный шаг, даже если у них уже есть работа, я бы предположила, что значительное удобство общения с чат-ботом после работы или на выходных, отразится на статистике.

понедельник, 12 февраля 2018 г.

Результат через diversity



Перевод статьи Delivering through diversity  в рамках нашего  проекта переводы статей по hr-аналитике на английском. Это исследование McKinsey.
Перевод сделала Александра Багинская (по ссылке профиль с Линкедина). Александра родом с Украины, но живет и работает в Голландии. Рекомендую - вот из таких и надо набирать таланты.  Читайте другие статьи Александры у нас в блоге:

  1. Как блокчейн повлияет на HR?
  2. People Analytics 3.0
  3. Джош Берсин. Переворот рынка HR технологий: 10 топ трендов 2018
  4. Удержать или отпустить? Данные, на которые следует корректно реагировать, когда сотрудник увольняется
  5. Соседство с лучшими сотрудниками может увеличить производительность


Также с Александрой мы работали над статьей Applying Survival Analysis to Reduce Employee Turnover: A Practical Case для западного сайта analyticsinhr.com.
В тему нынешней статьи: тема diversityочень горячая на Западе, но собственно исследований, показывающих связь diversity и результатов очень мало. Поэтому очень рад, что есть возможность показать такую статью. В свое время я заходил на тему diversity - см. Влияние гендера команды на успешность в игре ЧТО ГДЕ КОГДА. К сожалению, в России эта тема вообще валяется в пыли в стороне. Ну и тем не менее.

Результат через diversity 


Vivian Hunt, Lareina Yee, Sara Prince, and Sundiatu Dixon-Fyle
Наше последнее исследование подкрепляет связь между разнообразием и финансовыми показателями компании и предлагает способы разработки лучших стратегий включения для конкурентного преимущества.
Осознание бизнес кейса для включения и разнообразия (inclusion and diversity) сейчас на подъёме. Хотя начальным толчком для этих усилий является социальная справедливость, компании все больше рассматривают включение и разнообразие как источник конкурентного преимущества и особенно как главный двигатель роста. Но прогресс в этих инициативах диверсификации был медленным. И компании все еще не уверены в том, как они могут использовать разнообразие и включение наиболее эффективно для поддержки своих целей роста и создания ценности.
Наше наибольшее исследование разнообразия на рабочем месте Delivering through diversity, подтверждает мировую актуальность связи между разнообразием (в понимании большего соотношения женщин и этнически и культурно более смешанного руководящего состава больших компаний) и финансовыми результатами компании. Новый анализ охватывает наш отчет 2015  года Why diversity matters основываясь на увеличенном наборе данных более 1000 компаний в 12 странах и измеряя не только доходность (в определении заработка до уплаты процентов и налогов – earnings before interest and taxes / EBIT), но и более долгосрочное создание ценности (экономический доход – economic profit), исследуя разнообразие на разных уровнях организации, рассматривая более широкое понимание разнообразия (не только пол и этнос) и предлагая обзор лучших практик.

Разнообразие и финансовые результаты в 2017

В начальном исследовании, в котором использовались данные по разнообразию за 2014 год мы выявили, что компании в верхнем квартиле по гендерному разнообразию среди руководства имели на 15% выше вероятность доходности выше среднего, чем компании в четвертом квартиле. В нашем расширенном наборе данных за 2017 этот показатель вырос до 21% и продолжил быть статистически существенным. Результаты показали вероятность сверхдоходности 35% по EBIT в 2014 по сравнению с 33% в 2017, оба результата статистически существенны для этнического и культурного разнообразия.
Результат через diversity

Несколько других открытий относительно гендерного разнообразия, этнического разнообразия и разнообразия в мире также интересны.

Гендерное разнообразие

Гендерное разнообразие имеет связь и с прибыльностью, и с созданием ценности. В наших данных за 2017 год мы обнаружили позитивную корреляцию между гендерным разнообразием среди руководящего состава и обоими нашими показателями финансовой эффективности; компании верхнего квартиля в мировом гендерном разнообразии среди руководства показали 21% вероятности превзойти их ровесников по индустрии из нижнего квартиля по EBIT, а также у них 27% вероятности превосходства по долгосрочному созданию ценности при измерении экономического дохода (economic-profit, EP) (Рис. 2).

воскресенье, 11 февраля 2018 г.

Анализ рынка вакансий в энергетике РФ




Для меня, как HR-а инхаус в энергетике, анализ рынка вакансий давно представлялся крайне интересной идеей, которую хотелось реализовать. Этот пост стал возможен благодаря Александру Вечерину – как оказанной им помощи с кодом, так и в целом вдохновлён методологией исследования рынка вакансий через джоб-сайты. 










ВВЕДЕНИЕ

В посте приведены результаты анализа рынка вакансий в энергетической отрасли Российской Федерации, для этого в качестве признака парсинга вакансий выбрана отрасль компании: «Энергетика» на джоб-сайте «Hh.ru».
Примечательно то, что, выбирая отрасль компании представляется возможным сравнить вакансии из различных профобластей по уровню заработной платы. Так, к примеру, в энергетике помимо основного технического персонала работают специалисты HR, IT, экономики, области продаж и так далее. Важно отметить, что сравнение данных профобластей осуществлено именно в контексте энергетической отрасли, то есть изолировано от аналогичных вакансий в других отраслях. Такой уровень анализа позволяет выделить наиболее конкурентную профобласть внутри анализируемой отрасли.
Кроме того, дан ответ на извечный вопрос энергетики: в какой сфере заработные платы выше? В генерации энергии, её сбыте или в инфраструктуре?
Датасет содержит следующие переменные:

1. Название компании.
2. Город.
3. Область.
4. Федеральный округ.
5. Наименование вакансии.
6. Уровень заработной платы.
7. Профобласть.
8. Сфера компании.
9. Требуемый опыт.
10. Тип занятости.
11. График работы.
Основной проблемой стало зачастую некорректное указание профобластей специалистами, размещавшими вакансии на «Hh.ru», так специалист по кадрам мог оказаться в категории «Производство», а руководитель электротехнической лаборатории в категории «Добыча сырья». Описанная проблема стала наиболее трудоемкой в устранении и потребовала ручного исправления в датасете. Итоговый вариант содержит следующие категории: HR, IT, Административный персонал, Бухгалтерия, Закупки, Маркетинг/PR, Продажи, Производство, Прочее, Рабочий персонал, Строительство, Транспорт, Экономика, Юриспруденция.
Зависимая переменная – заработная плата, представлена как среднее между «заработной платой от» и «заработной платой до», указанными в описании вакансии.
Федеральные округа были добавлены технически уже после выгрузки вакансий. Парсинг осуществлён в шесть этапов, отдельно для признаков: профобласть, сфера компании, область, требования к опыту, тип занятости и график работы. Полученные промежуточные датасеты были совмещены в один: "energy".
АНАЛИЗ ДАННЫХ

По состоянию на февраль 2018 года на сайте Hh.ru размещено 432 566 вакансий, из них в энергетике 2975 (0,6%), с указанием заработной платы 1713 (57% от всех вакансий исследуемой отрасли), приведенное количество вакансий со сведениями об уровне заработной платы и стало предметом анализа.
Общий взгляд на количество вакансий по областям РФ позволяет сделать приведенный рисунок:


Закономерно наибольшее количество вакансий в Москве и Санкт-Петербурге. Кемеровская область занимает четвертое место по количеству вакансий в энергетике.

На следующем рисунке представлено распределение данных отклика. Как видно переменная не описывается нормальным законом распределения, а также имеет выбросы, что будет учитываться при построении модели прогноза.
Средний уровень заработной платы по энергетическим вакансиям составляет 46 т.р. Далее осуществлён анализ уровня заработной платы в разрезе условий:

1. В зависимости от профобласти
На рисунке видно, что наибольшая медиана соответствует продажам в энергетике, а наименьшая рабочему персоналу, различия по признаку достоверны (Краскел-Уоллис, p-value < 2.2e-16).
Анализ вакансий в энергетике показывает медианную зарплату для HR на уровне 35 т.р., но это данные открытых предложений, интересным представляется сослаться на данные исследования факторов текучести Э. Бабушкина, согласно которому респонденты HR имеют медианную зарплату в энергетике на уровне 40 т.р. (ноябрь 2017) (исследование факторов текучести)

2. В зависимости от сферы компании
Медианы зарплат по сферам компании практически идентичны, при этом различия достоверны (Крускал-Уоллис, p-value < 2.2e-16). Из графика видно, что разлчиия вызваны наличием выбросов для отдельных категорий.
Отвечая на главный вопрос энергетиков, все же следует акцентироваться на том, что не смотря на статистические различия, медианы заработных плат очень близки в зависимости от сферы компании.

3. В зависимости от федерального округа
Критерий Крускала-Уоллиса и в данном случае обнаруживает статистически достоверные отличия (p-value < 2.2e-16). Наибольшая медиана в ДФО, наименьшая в СкФО, но в последнем всего одна вакансия.

Для типа занятости и графика работы также проверена гипотеза о различиях по уровню заработной платы и также подтверждена с помощью критерия Крускала-Уоллиса.

Как и в исследовании 7 факторов зарплаты HR (анализ рынка России, декабрь 2017) А. Вечерина построена регрессионная модель.  На этапе предварительного анализа было выявлено отклоняющаяся от нормального вида распределения в связи с чем уравнение регрессии принимает следующий вид:

lm(log(Зарплата)~Профобласть+Опыт+Занятость+График+Округ

Переменная «Сфера» оказалась незначимой, в связи с чем не была включена в итоговую модель.
В таблице представлены значимые, экспонированные коэффициенты:

Остатки:
    Min      1Q  Median      3Q     Max
-2.7279 -0.2039 -0.0079  0.1876  1.2883

Коэффициенты
                                                                Estimate Pr(>|t|)   
(Intercept)                                               144521     2e-16 ***
Профобласть IT                                     1.353644   6.63e-06 ***
Профобласть Продажи                       1.642862   2.82e-15 ***
Профобласть Производство              1.179334   0.005025 **
Профобласть Рабочий персонал      0.8782623  0.030541 * 
Профобласть Строительство             1.215554   0.003668 **
Опыт нет опыта                                     0.5378153  2e-16 ***
Опыт от 1 до 3 лет                                0.6312836  2e-16 ***
Опыт от 3 до 6 лет                                0.7900018  1.96e-06 ***
Занятость Частичная занятость         0.8373359  0.049096 * 
График Гибкий график                         0.2881771  2e-16 ***
График Полный день                           0.4662562  2e-16 ***
График Сменный график                    0.4008973  2e-16 ***
График Удаленная работа                  0.6956699  0.001296 **
Округ Приволжский ФО                      0.6844429  3.60e-06 ***
Округ Северо-Западный ФО              0.7421455  0.000959 ***
Округ Северо-Кавказский ФО           0.6049376  0.021364 * 
Округ Сибирский ФО                           0.6609282  4.35e-07 ***
Округ Уральский ФО                            0.7352461  0.000306 ***
Округ Центральный ФО                      0.7271445  0.000114 ***
Округ Южный ФО                                0.6966863  2.77e-05 ***
  
 R2 = 0.55 и статистически значим p-value: < 2.2e-16. Для проверки предиктивности модели была введена новая вакансия: Профобласть="HR", Опыт="от 3 до 6 лет", Занятость="Полная занятость", Округ="Сибирский ФО", График="Полный день".
Экспонированное прогнозное значение составило 35 183 р.
Несмотря на высокий R2 модель обнаруживает проблему гетероскедастичности, что не совсем очевидно на Рисунке (указание на выброс), но подтверждается критерием Бройша-Пагана p-value < 2.2e-16. Следовательно данной модели нельзя доверять, вероятнее всего это связано с наличием выбросов, проблема которых не была устранена логорифмированием.

ЗАКЛЮЧЕНИЕ
Проведенный анализ вакансий в энергетике продемонсрировал различе уровня заработной платы в зависимости от профобласти, сферы компании, географии, типа занятости и графика работы. Вместе с тем, полученная регрессионная модель нуждается в совешенствовании качества (утсранение гетероскедастичности).
Для чистоты эксперимента необходимо провести парсинг вакансий с других крупных, российских джоб-сайтов: «Зарплата.ру», «SuperJob.ru». Автор обращается за помощью ко всем коллегам аналитикам, кто поделится кодом в R (можно попробовать Python) для выгрузки вакансий через API этих сайтов.


Популярные сообщения