.

Сделать репост в соц сети!

суббота, 10 февраля 2018 г.

Как с помощью «отбора вслепую» обеспечить личностное разнообразие на рабочем месте (Workplace Diversity)





Перевод статьи How Blind Hiring Increases Workplace Diversity в рамках нашего проекта переводы статей по hr-аналитике на английском. Автор статьи Ji-A Min, этот автору нас впервые в блоге.
Перевод выполнила Светлана Пороскова. Светлана – рекрутер с более чем 20-летним стажем, специализирующаяся на IT и технологических рынках, сертифицированный карьерный коуч и консультант, автор и переводчик материалов по подбору и развитию карьеры. Профили в фейсбуке и линкедине. Это второй перевод Светланы в рамках проекта, читайте также

Война за ИИ-таланты и другие топ-темы рекрутмента в 2018 году

Итак
Как с помощью «отбора вслепую» обеспечить личностное разнообразие на рабочем месте (Workplace Diversity)

«Отбор вслепую» (Blind hiring)  решает множество проблем. Он не только обеспечивает увеличение личностного разнообразия, но и ведет к повышению прибылей. В этом блоге я постараюсь описать, что такое «отбор вслепую» и как он помогает обеспечить ясный и измеримый возврат инвестиций.
Исследования показывают, что каждый 1% увеличения расового разнообразия на рабочем месте дает 9% прирост в выручке от продаж. Анализ McKinsey показывает, что компании с наиболее разнообразным составом правления (в отношении женщин и представителей различных национальностей) получают доходы до вычета процентов и налогов (EBIT) на 14% больше среднего значения. Другие исследования показывают, что увеличение разнообразия на рабочем месте приводит к увеличению производительности труда и более творческому отношению персонала. В этой области «отбор вслепую» может действительно показать хорошие результаты.

«Отбор вслепую»: определение 

«Отбором вслепую» называют любую технику, обезличивающую или скрывающую персональную информацию о кандидате для рекрутера или нанимающего менеджера, если эта информация может оказать осознанное или неосознанное влияние на восприятие данного кандидата. Это влияние обычно вызывает несправедливую или дискриминирующую оценку, ведь большая часть личной информации о кандидате никак не связана с его или ее рабочей эффективностью.

«Отбор вслепую» увеличивает личностное разнообразие на рабочем месте, позволяя рекрутерам и нанимающим менеджерам быть более объективными при оценке навыков, знаний и потенциала кандидата, убирая искажения восприятия, вызванные расовой принадлежностью, полом, возрастом и уровнем образования.
«Отбор вслепую» набирает все большую популярность как часть движения, направленного на исключение ошибочных суждений, обусловленных человеческим фактором и мешающих нанимать действительно лучших кандидатов. Исследование, опубликованное в Harvard Business Review, показало, что кандидаты, нанятые на основе алгоритма отбора, оказывались на 50% более успешными в работе, чем те, кого отбирали на основе человеческих суждений рекрутеров.

«Отбор вслепую» с использованием резюме 

Исследования отбора резюме подтверждают факт искаженного человеческого восприятия. Резюме кандидатов, имена которых звучали как имена белых, получали на 30% больше приглашений на интервью, чем идентичные резюме с афро-американскими именами. Резюме с именами, звучавшими старомодно (old-sounding), оценивались как менее подходящие для вакансии в сравнении с идентичными резюме с более современно звучащими именами.
Неудивительно поэтому, что наиболее распространенный метод «отбора вслепую», который сейчас тестируется, основан на убирании имен и фото кандидатов из их резюме и онлайн-профилей. Другая личная информация, которая убирается из резюме, касается раскрытия возраста кандидатов и их уровня доходов (например, год окончания вуза, его название, адреса и т.д.)
Однако, если вы не пользуетесь специальной технологией, которая делает анонимными профили и резюме, этот процесс может занять много времени или вообще станет невозможным для проведения вручную.

«Отбор вслепую» с использованием предварительного тестирования 

Изначально «отбор вслепую» был «слепым прослушиванием» и применялся оркестрами для отбора музыкантов: они играли за ширмой, чтобы скрыть свою личность. В результате слепых прослушиваний количество женщин-музыкантш в топ-5 симфонических оркестрах США увеличилось с менее чем 5% в 1970-х до 25% в 1990-х.

В наши дни использование предварительного тестирования для оценки необходимых квалификаций и знаний кандидатов - очень распространенная практика в определенных профессиях (например, в разработке ПО). Такой тип тестов может быть очень просто обезличен использованием анонимных идентификаторов кандидатов, так как кандидаты могут проходить тесты удаленно. Другой вариант «слепого» предварительного теста – это личностный опросник. Исследования показали, что компании, использующие личностные опросники в своем процессе подбора получают гораздо большее расовое разнообразие сотрудников.
И снова повторим, что, если вы не пользуетесь программами или сервисами, обезличивающими тесты кандидатов, вам будет очень сложно «не увидеть» личности кандидатов, заполняющих тест или опросник.

среда, 7 февраля 2018 г.

Про нелюбовь россиян к офисам с открытой планировкой (ответ газете Ведомости)



7 февраля газета Ведости опубликовала статью Нелюбовь россиян к офисам с открытой планировкой усиливается. Статья только для подписчиков, но из открытого превью понятно: "Сотрудники российских компаний все меньше любят офисы с открытой планировкой (open space)....."
Давайте я дам свой взгляд на проблему. Я веду собственные исследования факторов текучести и эффективности работников, на основе которых я делаю нижеследующие выводы
Вот здесь Рабочее пространство: Open space VS кабинетная рассадка для интровертов экстравертов я уже показывал, что с точки зрения текучести персонала открытое пространство (open space) и кабинетная рассадка не играют роли.

Рис 1

Про нелюбовь россиян к офисам с открытой планировкой (ответ газете Ведомости)
Картинка показывает, что различия в текучести персонала не значимы. А мы должны с вами были предположить (и у меня именно такая гипотеза и была), что open space способствует более быстрому выгоранию работников и более быстрому уходу из компании. Однако этого нет.
Ну бох с ним. Мы же только про open space.

Рис 2

Про нелюбовь россиян к офисам с открытой планировкой (ответ газете Ведомости)
Снова результаты моего исследования. Это простая сводная таблица. В колонках годы, а в строках ответ на вопрос Готовы ли Вы рекомендовать эту компанию в качестве работодателя своим знакомым, коллегам?. Я взял только тех, кто указал, что работал, работает в open space. Соответственно в ячейках % по году. Если в 2016 году 59 % респондентов были готовы рекомендовать свою компанию в качестве работодателя, то в 2017 году 61 %.
Естественно, я не хочу сказать, что лояльность работающих в офисных пространствах увеличилась - 2 % это случайное отклонение. И значимость Хи квадрата 0, 97.
Т.е. лояльность работников с офисным пространством типа open space не изменилась в 2017 в сравнении с 2016
Эти результаты говорят о том, что на наших данных выводы о том нелюбовь россиян к офисам с открытой планировкой усиливается не подтверждается.
Напишу в Ведомости, ответ по традиции не получу.




__________________________________________________________
На этом все, читайте нас в фейсбукетелеграмме и вконтакте

Исследование email коммуникаций в компании



Прохожу на Курсере курс Applied Social Network Analysis in Python Мичиганского университета. Вообще рекомендую курсы этого университета: много интересного контента. Курсы на Python проходят.
Прошел я пока две недели, хвастать особо нечем, хочу в посте скорее закрепить свои знания. Заранее предупреждаю, что я не ас, могу писать ерунду в каких-то местах, просто тема для меня новая. А новая потому, что я не могу найти понимания того, куда в HR ее применить. Буду вам благодарен за идеи. Вообще же на Западе тема Organisational Network Analytics очень популярна и набирает темп. Поэтому я и решил подробней в ней разобраться. 

Данные е майл коммуникаций

У нас есть данные типа
#Sender Recipient time
1 2 1262454010
1 3 1262454010
1 4 1262454010
1 5 1262454010
1 6 1262454010
1 7 1262454010
1 8 1262454010
1 9 1262454010
1 10 1262454010
1 11 1262454010

Где первая колонка - отправитель, вторая - получатель, и время отправления. При этом перечень полей не ограничен: это такой датасет в задании, а вообще первое, что приходит на ум - можно добавить роль отправителя и получателя.
И первое, чему я самостоятельно научился по этой теме - раскрашивать узлы (nodes) цветом в зависимости от роли. Как вариант - можно брать не роль, а класс письма: заявка, обращение, нецензурная брань и т.п..
Исследование email коммуникаций в компании
Эта картинка из другого задания.
Если вы хотите потренироваться, запишитесь на курс и скачайте данные второй недели. Или лучше работать со своими данными: можете мне прислать, я буду очень рад поработать с ними.
Код

import networkx as nx
import pandas as pd
%matplotlib notebook
import matplotlib.pyplot as plt
Загрузка
G = nx.read_edgelist('email_network.txt', data=[ ('time', float)], 
                         create_using=nx.MultiDiGraph())
Я не уверен, что стоит подробно функции объяснять, все равно придется копаться в пакете, отмечу только, что самое важное здесь - MultiDiGraph - мы указываем, что отношения между узлами (nodes) директивные (Di), т.е. письмо идет в определенном направлении от кого то к кому то, т.е. у нас на диаграмме появляется стрелочка. И отношения Multi - может быть много связей, а точнее писем. И data - мы указываем, что время - это атрибут сети, а не сами связи. После загрузки мы получаем объект edges (ребра? грани?)
G.edges(data=True)
[('158', '64', {'time': 1271766218.0}),
 ('154', '68', {'time': 1271766200.0}),
 ('42', '54', {'time': 1276505582.0}),
 ('42', '1', {'time': 1266579464.0}),
 ('42', '61', {'time': 1273146267.0}),
 ('42', '151', {'time': 1266319958.0}),
 ('42', '151', {'time': 1268999261.0}), ....
Тут все понятно. Количество строк
len(G.edges(data=True))
82927
И вот здесь сразу одна интересная ситуевина. С помощью команды
G.degree()
{'1': 3376,
 '10': 643,
 '100': 126,
 '101': 758,
 '102': 31,
 '103': 461,
 '104': 632,
 '105': 321,
 '106': 860,
 '107': 192,
 '108': 151,
 '109': 166,
 '11': 635,
 '110': 85,
......

Мы получаем список количества писем каждого чувака. И всего у нас
nx.number_of_nodes(G)
167 
чуваков, а писем
sum(G.degree().values())
165854
Что в два раза больше, чем строк в датасете (82927). Т.е. это значит, что пакет учитывает не только тех, кто слева, но и справа. И если ты значишься не только в числе посылателей писем, но и получателей, вам это будет зачтено.

Визуализация


plt.figure(figsize=(10,9))
node_color = [G.degree(v) for v in G]
pos = nx.fruchterman_reingold_layout(G)
nx.draw_networkx(G, pos, 
                 node_color=node_color, alpha=0.7, with_labels=True, 
                 edge_color='.4', cmap=plt.cm.Blues)
plt.axis('off')
plt.tight_layout();
Цвет узла (node) я определил в зависимости от количества получаемых писем


Исследование email коммуникаций в компании
Не очень внятно, верно?) функция pos = nx.fruchterman_reingold_layout(G) отвечает за представление результатов сети, можете поиграться, картинка будет другая. К тому же можно выделить отдельный диапазон картинки.
Исследование email коммуникаций в компании
Матрица.

Почему именно неформальные сети – следующий этап развития HR и HR-аналитики (революционный!)





Перевод статьи Why Informal networks are set to revolutionize HR and People Analytics  в рамках нашего  проекта переводы статей по hr-аналитике на английском. Статья посвящена Organisational Network Analytics, Автор - Greg Newman, Специалист в области HR Data, менеджер продуктов, аналитик «по людям» в TrustSphere, и это уже второй перевод статей автора, см. также
Удержать или отпустить? Данные, на которые следует корректно реагировать, когда сотрудник увольняется
Перевод выполнила Дарья Цирулева, HR-директор группы компаний Корус Консалтинг. (вот такие у нас спецы переводы выполняют!). Ее профиль в фейсбуке.
Кстати говоря, Greg Newman обещал мне пиво поставить при встрече, но констатирую, что пиво то заслужили Дарья и Александра Багинская - автор первого перевода Грега.

Итак
Почему именно неформальные сети – следующий этап развития HR и HR-аналитики (революционный!)

Почему именно неформальные сети – следующий этап развития HR и HR-аналитики (революционный!)

До сих пор сила неформальных связей и неформализованных команд очень мало использовалась в мире, скажем так, большого HR и глобальных HR-систем. Текучесть, изменчивость, неформальность командной работы всегда подразумевала, что «отловить» эту меняющуюся сущность, а уж тем более отслеживать в динамике практически невозможно. Невозможно, да-да!
Сила науки и знаний, стоящая за подходом, получившим название ONA (Organisational Network Analytics или Анализ Организационных Сетей), пионерами в котором были Karen Stephenson и Rob Cross, не подвергается сомнениями – более того, здесь многое попробовано, протестировано. А вот с возможностью масштабно применить подход на практике – с этим были определенные затруднения. Будем честны – до сих пор это не было мейнстримом.
Нет ни малейших сомнений, что традиционные исследования, основанные на ONA, дают серьезные результаты. Но высокая их стоимость и «мгновенность», привязка только к «здесь и сейчас»… Да, команды и неформальные сети можно увидеть и даже померить – но вот можно ли эту информацию иметь всегда, и всегда актуальную?

Неформальные сети теперь по-настоящему видимы


Почему именно неформальные сети – следующий этап развития HR и HR-аналитики (революционный!)


Рисунок 1: выявляем связи/отношения за формальной иерархией
Последние технологические прорывы таких компаний, как моя (да, минутка саморекламы), позволили сделать из ONA каким он был еще вчера – сложного бумажного процесса – живой беспрерывный поток данных в режиме реального времени. А значит, уже меняется и сама способность организаций работать с собственными неформальными сетями и понимать, как работа делается на самом деле.

понедельник, 5 февраля 2018 г.

Wegmans: оценка ценности корпоративных льгот для сотрудников



Перевод статьи 5 Truths about Workforce Analytics в рамках нашего проекта переводы статей по hr-аналитике на английском. Статья с сайта re:Work Laszlo Bock. Статья посвящена c&b, таких кейсов немного, поэтому этот кейс будет особо ценен для спецов по мотивации. Ласло Бока наверное кое кто уже не знает, потому что он ушел в поста вице президента Google по управлению талантами, но вообще он знаковая фигура для HR, см. например
В Head-Hunting Big Data может быть не такой уж сложной задачей
А после ухода из компании он занялся своими проектами, в том числе сайтом re:Work
Перевод выполнила Екатерина Соколова (ссылка на профиль ВКонтакте) - c&b Байкальский банк, ПАО Сбербанк.Это второй перевод Екатерины, см. также:
5 истин об HR-аналитике (IBM Watson Talent)
Итак

Wegmans: оценка ценности корпоративных льгот для сотрудников

Вызов: Затраты на медицинское страхование выросли, но Wegmans не понимал, какую ценность для сотрудников имеет эта льгота
Действие: совместный анализ помог Wegmans понять, какой ценностью сотрудники наделяют медицинское страхование
Результат: Wegmans смог контролировать расходы на медицинское страхование без потери удовлетворенности сотрудников этой льготой

Вызов

Wegmans Food Markets, ведущая сеть супермаркетов в Новой Англии и Средне-Атлантических штатах США, решила пересмотреть медицинское страхование, предоставляемое сотрудникам. В 2007 компания быстро расширила долю рынка, открыла новые магазины и наняла сотни новых сотрудников. Вместе с этим затраты на медицинское страхование взлетели. Wegmans захотел понять, как сотрудники оценивают разные виды социальной поддержки, включая медицинское страхование, чтобы научиться управлять затратами, повышая удовлетворённость сотрудников.

Действие:

Wegmans заказал совместный анализ из двух частей у CEB, компании, владеющей лучшими практиками и технологиями, для прояснения, почему сотрудники приходят в компанию и остаются в ней, а так же как оценивают разные опции медицинского страхования.
Традиционно используемый маркетологами совместный анализ выходит за рамки обычного опроса удовлетворенности сотрудников, дает представление о предпочтениях сотрудников, учитывая множество вариантов и преимуществ. При проведении совместного анализа респонденту показываются последовательные пары продуктов и услуг, респондент должен выбрать между ними. В ходе опроса респонденты рассматривают несколько элементов и сравнивают множество комбинаций из характеристик услуги, на основании этого компания сможет выделить оптимальное сочетание характеристик. Эти результаты используются для более эффективного принятия решений при управлении предложением.
Wegmans проводил исследование более 2 недель в 17 крупных, эффективных магазинах и просмотрел 76% ответов из случайно выборки, которая состояла из 1 310 сотрудников, что было репрезентативно в данной популяции. В тот момент Wegmans владел 71 магазином и 34 000 сотрудников. Wegmans объединилась с неконкурентной продуктовой сетью, которая так же желала изучить предпочтения своих сотрудников. Сети разделили между собой затраты на исследование и сравнили результаты, что позволило понять индивидуальные и схожие предпочтения сотрудников.
Wegmans разработал коммуникационную стратегию для пояснения сотрудникам целей анализа:

  1. Сначала Wegmans проинформировал менеджеров и сотрудников магазинов о ходе и процессе опроса, а затем направил этим менеджерам распечатанные приглашения для раздачи сотрудникам из выбранной категории. Поскольку у большинства сотрудников не было корпоративного емейла, это было наипростейшим способом коммуникации с магазинами.
  2. CEB провела обучающую телеконференцию с менеджерами магазинов и поработала с репрезентативной выборкой сотрудников, чтобы снять наиболее популярные вопросы сотрудников об опросе. 
  3. В заключении выбранные сотрудники связались с сотрудниками-участниками опроса, чтобы пройтись вместе по инструкции и ответить на возникающие вопросы. После этого сотрудники прошли онлайн-опрос через выделенные компьютеры.

Совместный анализ содержал два типа вопросов о медицинском страховании:

  1. Вопросы об удовлетворенности определяли системные различия в удовлетворенности и вовлеченности между сотрудниками, работающими в давно открытых магазинах, и теми, кто работает в новых. В некоторых вопросах сотрудникам нужно было оценить, насколько удовлетворяет их медицинское страхование компании, путем отметки по шкале между "совершенно неудовлетворен" и "абсолютно удовлетворен".
  2. Вопросы о компромиссах определяли, как сотрудники воспринимают ценность системы вознаграждений в целом. В данных вопросах респондентам предлагалось сделать выбор между двумя или более гипотетическими «пакетами», состоящими из различных атрибутов медицинского страхования и льгот. К примеру, выбрать между 5-процентным повышением базовой зарплаты в сочетании со сниженной стоимостью медицинской страховки против простого 10-процентного увеличения базовой заработной платы. Сотрудникам было необходимо проранжировать эти параметры по порядку в зависимости от предпочтения.

Результаты

Wegmans: оценка ценности корпоративных льгот для сотрудников

Оба блока вопросов показали, что сотрудники воспринимают медицинское страхование как решающий фактор при выборе работодателя и продолжении трудовой деятельности в компании. В частности, совместный анализ показал, что предложение даже базового медицинского обслуживания для сотрудников, которые в настоящее время не имеют права на получение услуги, будет приводить к значительному увеличению ценности медицинского страхования для сотрудников. Анализ показал, что инвестиции в размере 107 $ на одного сотрудника, не имеющего право на получение услуги, будут стоить 1,5 млн. $ для компании, но по ощущениям сотрудников это будет стоить 32,5 млн. $. Неожиданно Wegmans открыл, что зарплата была отнесена в конец обоих списков с точки зрения ценности для сотрудников. Еще один интересный вывод заключался в том, что в вопросе выбора между низким вычетом и низкой страховой премией, сотрудники готовы платить больше, чтобы иметь меньше ответственности.





__________________________________________________________
На этом все, читайте нас в фейсбукетелеграмме и вконтакте



Про деструкторы в отношениях с руководителем. И о том, как правильно их измерять



Одна известная консалтинговая компания решила запустить тест про карьерные деструкторы и как обычно делает это через жопу.
И поэтому я решил, как правильно определять подобные деструкторы: не на основе мнений "экспертов", а на основе машинного обучения модели.

Задача

Я уже показывал в своем блоге пост Прогноз психологической совместимости руководителя и подчиненного.
В нашем исследовании факторов эффективности и текучести персонала (поучаствуйте в опросе) есть вопрос  Благодарил ли Вас Ваш руководитель за достижения? с вариантами ответа:

  • Никогда;
  • Изредка;
  • Часто ; 
  • Все. 

С некоторыми оговорками этот результат можно интерпретировать как констатация подчиненным психологической совместимости его и руководителя.
Мы можем прогнозировать данный результат на основе данных о подчиненном и руководителе. В предыдущем посте я подробно описываю качество модели, сообщю только, что качество это значительно выше плинтуса, а основные драйверы в модели - данные тестов Большая пятерка и КТО (Лаборатория Гуманитарные Технологии нам когда-то давала тесты для нашего исследования, за что ей большое спасибо, но потом усомнилось в ценности моей работы и перестало давать - и жаль).
Жаль, потому что мы может прогнозировать не только вероятность того, насколько часто руководитель будет выражать признание, но и показывать конкретные индивидуальные драйверы этой самой психологической совместимости.
Причем, если в нашем исследовании мы берем результаты тестов только респондента - подчиненного, то в корпоративных исследованиях мы можем взять результаты самого руководителя и повысить точность прогноза.

Примеры

Хорошие отношения 

Я беру совершенно реальные примеры нашего исследования - конкретных респондентов. Для специалистов понятно, что это пакет LIME


Про деструкторы в отношениях с руководителем. И о том, как правильно это измерять
На рисунке у нас данные респондента, который выбрал вариант "часто", и машина говорит, что она выбрала для него этот же вариант, поскольку вероятность этого выбора для респондента она определила в 0, 73 (см. левую табличку).
Справа - результаты данного респондента по тестам КТО и Большая пятерка (я показал не все шкалы - их 10 - а только первые 6 самых важных..
Картинку посредине дублирую

пятница, 2 февраля 2018 г.

Свои функции в R, оптимизация препроцессинга подготовки данных в R



Я не работаю с макросами в excel - мозгов не хватает, но мне кажется, что то, что я покажу, есть эти самые макросы в R.
В R в подготовке модели очень много места занимают коды препроцессинга, подготовки данных. Меня лично убивают многокилометровые портянки. Понятно, что их не надо писать каждый раз заново, можно из предыдущих кодов вставлять, но сам факт копирования, вставки, потом этот код при каждом повторе кода заново запускать - не комильфо.
Хочу поделиться тем, как можно все это сократить. И сделаю это на примере кейса по текучести персонала используя первый специализированный пакет в R по HR аналитике.

И заодно рекламирую свой семинар по HR-аналитике в R - Семинар-практикум "HR-Аналитика в R", Москва, 23-24 апреля

Задача.

При решении задачи по текучести персонала мы всегда имеем колонки Дата приема и Дата увольнения, а нам надо получить из них переменные "Stag" и "Event". Это достаточно однообразная операция, она занимает на так много места, но тем не менее я у себя оптимизирую эту операцию.

Решение

Загружаем пакет 'HRanalytics'. Как установить пакет см. пост Пакет R HR analytics для HR аналитиков.

library(HRanalytics)
data("survey")
str(survey)
Эти данные - данные нашего исследования факторов текучести персонала (поучаствуйте, ау).
В этом исследовании респонденты описывают одно из своих мест работы от даты приема до даты увольнения. Мы можем построить модель прогноза текучести на основе регрессии Кокса, но сначала нам надо преобразовать дату приема и дату увольнения в стаж и события.
Создаем два скрипта в Rstudio: один основной, на котором мы будем решать задачу, а на второй вынесем формулы препроцессинга, подготовки данных. Этот второй скрипт можно будет впоследствии использовать много раз для решения подобных задач. У меня этот файл называется незамысловато: podgotovka.
В этом аподготовительном скрипте в R я прописываю формулу

stag = function(end, date_report, begin) {
  library(lubridate)
  x = ifelse(is.na(end), 0, 1)
  end = parse_date_time(end, c("dmy", "dmy_HMS")) 
  end[is.na(end)] =  as.Date(date_report, "%d.%m.%Y")  
  
  begin = parse_date_time(begin, c("dmy", "dmy_HMS"))
  y = as.numeric((end-begin)/(30.4375*24*60*60)) 
  
  return(data.frame('event' = x, 'stag'=y))
}
Эта функция позволяет нам создавать переменные стажа и события. Прокомментирую:

  1. на всякий случай я подгружаю пакет lubridate, если забываю подгрузить в основном скрипте
  2. x = ifelse(is.na(end), 0, 1)- это формула создания переменной event
  3. Далее - и вот здесь вам надо быть внимательными- идет формат работы с датами, который зависит от того, в каком формате данные подгружаются. Я здесь предусмотрел два формата (я надеюсь, вы понимаете по формуле).
  4. И в стаже у нас удивительный знаменатель - это от того, что формат даты у нас в секундах, и чтобы получить месяца, я делю на секунды.
  5. И функция возвращает датафрейм из двух переменных

Далее вы можете получить на данных исследования:

st = stag(survey$Дата.увольнения, survey$Отметка.времени, survey$Дата.трудоустройства) 
summary(st)
event             stag         
 Min.   :0.0000   Min.   :-130.037  
 1st Qu.:0.0000   1st Qu.:   5.979  
 Median :1.0000   Median :  19.959  
 Mean   :0.6061   Mean   :  35.370  
 3rd Qu.:1.0000   3rd Qu.:  47.359  
 Max.   :1.0000   Max.   : 591.146  
                  NA's   :80
И сразу получаем первый втык: какого хрена у нас стаж отрицательный? и почему в стаже таки 80 пустых значений? Ну это уже другая задачка.
Вы можете получить переменные так:

survey$stag = stag(survey$Дата.увольнения, survey$Отметка.времени, survey$Дата.трудоустройства)$stag
Переменную 'event' получите сами.
Когда вы будете работать со своими данными, то у вас дата выгрузки будет фиксированной, а не отдельной колонкой, поэтому вы пишите так

stag(q$Дата.увольнения, "20.12.2017", q$Дата.приема)
ВАЖНО: дату используете свою, эта произвольная
Ну т.е. если вам по барабану мой пакет, но у вас есть свои задачи, что вы просто берете эту формулу и работаете с ней.
Я хотел вставить эту формулу в пакет HRanalytics, но откровенно боюсь того, что пойдут баги типа: а если в Дате увольнения пустые значения не Nan, а "" или " "? Наверное, все эти ситуации можно предусмотреть, но я не готов так глубоко залезать.


Проще

Если у вас названия колонок уже давно определены (выгрузка из системы), данные вы выгружаете в одном формате, то можно сделать совсем просто


stag = function(q) {
  
q$event = 1
q$event[is.na(q$Дата.увольнения)] = 0
q$end = q$Дата.увольнения
q$end = dmy(q$end) # dmy это day-month-year
q$end[is.na(q$end)] =  "2017-12-20 UTC" # заполяем датой выгрузки отчета 
q$begin = dmy(q$Дата.приема)
q$stag = as.numeric((q$end-q$begin)/30.4375) 
return(q)}

Здесь вы видите, что уже заточено на конкретные данные. Но просто в том, что вы потом в основном скрипте просто пишите:
df = stag(df)
И у вас добавляются колонки стажа и евента.
ПыСы. Честно говоря, не уверен, что все гладко сделал, поэтому, если заметите ошибки, пишите.


__________________________________________________________
На этом все, читайте нас в телеграмме и вконтакте



четверг, 1 февраля 2018 г.

Время начала работы как стрессогенный фактор (результаты исследования)

Я уже делал ровно такой же пост в июне 2016 года Время начала работы как стрессогенный фактор (результаты исследования). Но теперь у нас значительно прибавилось данных, поэтому я не просто повторяю пост, а смотрю на то, как со временем меняются тенденции, коэффициенты уравнения.
У нас есть вопрос в исследовании про время начало работы, в прошлом посте за 2016 год распределение времени начала работы было таким:
  1. 08.00 - 347 респондентов указали 8 утра как время начала работы;
  2. 09.00 - 1279;
  3. 10.00 - 323;

На сегодняшний день распределение таково:
  1. 08.00 - 659 респондентов указали 8 утра как время начала работы;
  2. 09.00 - 2351;
  3. 10.00 - 700;

Грубо говоря, данных в два раза больше. В свое время появились статьи со ссылками на якобы исследования, что ранее начало работы является стрессом для работников. Если это так, то я предполагаю, что работники, начинающие свою работу в 8 утра, должны быстрее покидать компанию из-за стресса, вызванного ранним началом работы.

вторник, 30 января 2018 г.

Тренды цифрового обучения (Digital Learning): десять вещей, которые необходимо знать



Перевод статьи The Disruption of Digital Learning: Ten Things We Have Learned в рамках нашего проекта переводы статей по hr-аналитике на английском. Автор статьи всем известный Josh Bersin. Обязательно прочтите другие его забойные статьи

  1. Джош Берсин. Переворот рынка HR технологий: 10 топ трендов 2018 (самая свежая статья о трендах)
  2. 9 горячих трендов в HR-технологиях … и почти все они - бомба на рынке;
  3. Топ 10 прорывов в HR технологиях (Одно время - самая популярная статья блога);
  4. HR-тренды 2016 от Берзина
Перевод сделали: Геннадий Волянский, Светлана Писарук, Владислава Маковецкая. Команда HR-специалистов нефтегазодобывающего предприятия. Ключевой профиль - развитие персонала, работа с молодежью, планирование карьеры.

Итак,

Тренды цифрового обучения (Digital Learning): десять вещей, которые необходимо знать

За последние несколько месяцев у меня была серия встреч с CLO (Chief Learning Officer – Руководитель в сфере обучения), лидерами по управлению талантами и Поставщиками инструментов обучения нового поколения. Моя цель была проста: попытаться понять новый корпоративный формат обучения, если можно так выразиться, теперь мы можем его называть «цифровое обучение». В этой статье я хотел бы поделиться десятью вещами, о которых нужно подумать, с целью помочь профессионалам L&D (Специалист по обучению и развитию персонала (Learning & Development Professional)), лидерам HR и бизнес-лидерам понять, как изменился мир корпоративного обучения.
Во-первых, в качестве предварительного просмотра, позвольте мне объяснить, почему эта тема так важна. Корпоративная индустрия L&D составляет более 140 миллиардов долларов США, в то время как рынок для колледжей, профессионального развития и среднего образования во всем мире составляет около 300 миллиардов долларов США. Благодаря появлению цифрового контента и инструментов, все эти программы переосмысливаются для цифрового доступа, позволяя бизнесу и сотрудникам учиться, как никогда раньше.
Во-вторых, эта тема сейчас #2 тема на умы генеральный директор и руководители отделов кадров. Исследование компании "Делойта" в области тенденций развития человеческого капитала в 2017 году показало, что 83% компаний считают этот вопрос важным, а 54% – срочным, что на 11% по сравнению с прошлым годом. В этом мире автоматизации, трансформации бизнеса и постоянного устаревания навыков компании понимают, что предоставление убедительного, цифрового опыта обучения имеет решающее значение для успеха бизнеса.
Для начала, позвольте мне предложить некоторый контекст.
Цифровое обучение не означает, что обучение происходит на вашем мобильном телефоне, это означает  «обеспечение возможностей для обучения в том месте, где находится сотрудник». 
Это «способ обучения», а не «Тип обучения».
Люди пытаются применить технологии к корпоративному обучению уже более 30 лет. От видео-диска к компакт-диску и до электронного обучения на YouTube, мы прошли через быстрое изменение технологий обучения и развития. Сегодняшнее "цифровое обучение" не просто означает производство видео, которые легко просматривать на вашем телефоне, это означает "обеспечение возможностей для обучения в том месте, где находится сотрудник”.
Другими словами, эта новая эра – это не только сдвиг в инструментах, это сдвиг в сторону ориентированного на сотрудников дизайна. Так же, как мы используем приложения, такие как Uber, чтобы совершить поездку или как Doordash, чтобы заказать еду, нам нужно обучение и информационная поддержка, максимально простые и интуитивно понятные в использовании. Переход от ”учебного дизайна“ к ”дизайну опыта" и использование дизайнерского мышления являются здесь ключевыми. И мы должны учитывать командирующихся работников, т.о. мы можем разработать обучение, которое было бы простым и доступным для изучения в пути.

Задумайтесь, как быстро развивалось Корпоративное обучение.  Только за одно поколение мы перешли от традиционных корпоративных университетов к электронному обучению, смешанному обучению, обучению на основе талантов, а затем –  непрерывному обучению. Инструменты, такие как Google, YouTube, Facebook на рабочем месте, Slack и другие полностью изменили систему обучения, так что теперь наша задача – “обеспечение возможностей для обучения в том месте, где находится сотрудник”.
Тренды цифрового обучения (Digital Learning): десять вещей, которые необходимо знать
Рис. 1: Эволюция корпоративного обучения
Я не говорю, что это будет легко, это требует много новых технологий и подходов – но это очевидно, все к этому движется. Потому что, если мы не приложим усилий, люди могут не использовать L&D отдел, и большая часть сделанных нами инвестиций, скорее всего, будет не использована или не востребована.

1) традиционные LMS – это уже не центр корпоративного обучения, и они начинают отходить.

понедельник, 29 января 2018 г.

Как прохождение электронного курса влияет на выживаемость персонала



Как прохождение электронного курса влияет на выживаемость персонала


Зачем это все?


Приветствую, коллеги. В данном посте я хочу рассказать вам о том, как я решал (и еще решаю) задачу анализа выживаемости персонала в зависимости от того, пройден или нет электронный курс. Главный гость нашего набора данных - электронный вводный курс, который назначается 80% сотрудников компании.

Может возникнуть вопрос: "Зачем?". На деле в компании достаточно много дистанционных программ обучения и хочется понимать насколько они влияют на сотрудников и может ли данный вид обучения влиять на продолжительность работы сотрудников.

И так, гипотеза следующая: сотрудники, которые успешно проходят электронный курс, дольше работают в компании.

Про набор данных


Я использовал язык Python и библиотеки lifelines и patsy. На деле существует еще одна библиотека для анализа выживаемости scikit-survival, но с ней я еще не работал, хотя говорят, что она достаточно хороша.

Я пропущу описание процесса предварительной обработки данных. После всех манипуляций набор выглядел так:

<class 'pandas.core.frame.DataFrame'>
Int64Index: 10902 entries, 2 to 11162
Data columns (total 13 columns):
person_fullname      10902 non-null object
person_department    10902 non-null object
position_name        10902 non-null object
hire_date            10902 non-null datetime64[ns]
dismiss_date         10902 non-null datetime64[ns]
course_start_date    10902 non-null datetime64[ns]
course_end_date      10902 non-null datetime64[ns]
score                10902 non-null float64
status               10902 non-null object
sex                  10902 non-null category
is_dismiss           10902 non-null bool
job_exp              10902 non-null int64
time_course          10902 non-null int64
В наборе 10902 наблюдения.
Попробуем оценить функцию выживаемости с помощью lifelines


duration= data_bts.job_exp
event = data_bts.is_dismiss

from lifelines import KaplanMeierFitter
kmf = KaplanMeierFitter()
kmf.fit(duration, event)

kmf.survival_function_.plot(xticks=np.arange(0, 5500, 200), yticks=np.arange(0,1.1, 0.1),
                            figsize=(15, 10), color='blue');
plt.show()

Вот что получилось:


На графике видно, что рубеж в 175 дней преодолевает практически 80%, и 35% сотрудников преодолевает рубеж в 1,5 года. Медиана равна 466 дней.

Проверим, верно ли мы интерпретировали график:

print(kmf.median_) - 469
print(kmf.survival_function_.KM_estimate[175]) - 0.803675249511
print(kmf.survival_function_.KM_estimate[547]) - 0.350953224329

Построим функцию угрозы используя процедуру Нельсон-Аалена:

from lifelines import NelsonAalenFitter naf = NelsonAalenFitter() naf.fit(duration, event) naf.plot(xticks=np.arange(0, 5500, 200), figsize=(15, 10), c='blue') plt.show()


На графике видно, что после 400 дней риск увольнения резко возрастает.

А теперь сравним, тех кто прошел электронный курс и тех кто не прошел:

status = data_bts.status
mask = (data_bts.status == 'Пройден')

kmf.fit(duration[mask], event[mask], label='Пройден')
ax = kmf.plot(xticks=np.arange(0, 5500, 200), yticks=np.arange(0,1.1, 0.1), 
                            figsize=(15, 10), c='g');

kmf.fit(duration[~mask], event[~mask], label='Не пройден')
kmf.plot(ax=ax, c='r')
plt.show()

Что же мы видим? Продолжительность жизни в компании у тех кто не прошел электронный курс выше, чем у тех кто прошел.

Не будем верить тому, что видим и проверим это с помощью лог ранк теста:

from lifelines.statistics import logrank_test
mask = (data_bts.status == 'Пройден')

results = logrank_test(duration[mask], duration[~mask], event[mask], event[~mask], alpha=.95 )
results.print_summary()

Results
   t 0: -1
   test: logrank
   alpha: 0.95
   null distribution: chi squared
   df: 1

   __ p-value ___|__ test statistic __|____ test result ____|__ is significant __
         0.00000 |            124.084 |      Reject Null    |        True    

Судя по уровню значимости, который очень мал (для любопытных: 3.726650854557449e-29) мы можем отвергнуть нашу нулевую гипотезу. Получается, что те кто прошел электронный курс имеют больший шанс покинуть компанию, чем те кто не прошел.

Аддитивная модель Аалена


Все что было сделано выше является взглядом сверху. Однако, зачастую у нас есть и другие факторы, которые влияют на продолжительность жизни.

Построим нашу модель:

from lifelines import AalenAdditiveFitter
aaf = AalenAdditiveFitter(coef_penalizer=1.0, fit_intercept=True)

Импортируем библиотеку patsy для создания дизайн-матрицы факторов. К слову в scikit-learn аналогом этого являются dummie переменные.

import patsy
bts_factor_matrix = patsy.dmatrix('person_department + position_name + score + time_course -1', data_bts, return_type='dataframe')

Создадим новые признаки в нашей матрице

bts_factor_matrix['duration'] =  data_bts.job_exp
bts_factor_matrix['event'] = data_bts.is_dismiss

Настроим нашу модель

aaf.fit(bts_factor_matrix, 'duration', 'event')

Чтобы оценка модели была более строгой, воспользуемся встроенной в lifelines процедурой кросс-валидации:

from lifelines.utils import k_fold_cross_validation
score = k_fold_cross_validation(aaf, bts_factor_matrix, 'duration', 'event', k=10)
print(np.mean(score))
print(np.std(score))

Точность нашей модели равна 0,66 со стандартным отклонением 0,04. 

Вывод:


Можно сказать, что качество нашего алгоритма получилось не очень хорошим. Средняя точность по всем итерациям равна 0,66. Скорее всего необходимо сделать более качественный feature engineering и добавить в модель больше признаков. Очевидно, что в модель необходимо включать разные курсы и делить их по категориям.





воскресенье, 28 января 2018 г.

5 истин об HR-аналитике (IBM Watson Talent)





Перевод статьи 5 Truths about Workforce Analytics в рамках нашего проекта переводы статей по hr-аналитике на английском. Автор статьи Nigel Guenole - впервые в нашем блоге, но надо скорее говорить не про автора, а о компании, которая это опубликовала: IBM и направление компании про hr-аналитику IBM Watson Talent.
Блог компании интересен не только статьями, но и кейсами с датасетами.
Перевод выполнила Екатерина Соколова (ссылка на профиль ВКонтакте) - c&b Байкальский банк, ПАО Сбербанк.Это первый перевод Екатерины, уже знаю, что не последний.
Итак
5 истин об HR-аналитике (IBM Watson Talent)

5 истин об HR-аналитике


24 октября на конференции HR Tech World в Амстердаме David Green поделился нашими новейшими сведениями о подготовке аналитиков в компаниях Европы и во всем мире.
Вы можете оценить вашу компания с точки зрения подготовки HR-аналитиков с помощью статьи: HR analytics readiness: How does Europe compare to the rest of the world?
Это исследование заставило нас шире взглянуть на роли аналитики и персонала. Наша трудовая жизнь — это смешанная реальность, которая представляет собой замечательные возможности наряду с беспрецедентными вызовами. Возможности нам дают цифровые технологии. Вы можете начать смотреть трансляцию встречи руководителя с коллективом на Макбуке, уйти с работы и продолжить просмотр с места, на котором остановились, с вашего мобильного устройства, как это делают сотрудники Netflix и Amazon Prime. Комментарии к презентации быстро преобразовываются в отчете, поэтому генеральный директор может отслеживать реакцию аудитории. Подобных возможностей изобилие у тех, кто быстро интегрирует технологии в рабочие процессы и понимает, что нет предела цифровой трансформации.
Усложняющиеся рабочие условия бросают вызовы. Бизнес-среда, которая когда-то была простой, стабильной и щедрой, теперь сложна, динамична и опасна. Средняя продолжительность жизни компании по данным S&P 500 в 20-е годы составляла 67 лет, сегодня - всего лишь 15 лет. Большая часть потрясений вызвана политической неопределенностью из-за событий типа Brexit. Но также влияние имеют цифровые технологии: криптовалюты, блокчейн и платформенные рынки, такие как Amazon, Uber и Airbnb, которые разрушают отрасли.
Чтобы быть конкурентоспособными, компаниям нужно развивать активы с четырьмя характеристиками: активы должны быть полезны, уникальны, трудно повторимы и трудно подделываемы. Лучшие активы когда-то были физическими: земля, здания и сооружения. Сегодня люди также считаются одними из лучших активов, но людьми сложнее управлять. Долговечность зданий и сооружений ограничена сроком амортизации. Но люди поступают непредсказуемо и покидают организацию тогда, когда перестают быть счастливыми в ней. Они не являются активами по общепринятым принципам бухгалтерского учета.
HR нужно найти место, в котором сотрудники более предсказуемы, и аналитика персонала поможет в этом. В книге «The Power of People: Learn how successful organizations use workforce analytics to improve business performance» мы обсуждали, с чего начать. Наша новая статья с HR Tech World рассматривает готовность HR делать аналитические проекты. Несмотря на наличие отличных советов, нет надежного пути к успеху в аналитике помимо общих мантр, таких как «сосредоточиться на бизнесе, не на HR», что больше зависит от контекста. Это заставило нас рассказать, какие моменты аналитики мы рассматриваем как обобщаемые и «истинные». Мы придумали и перечислили пять истин понимая, что они могут быть слегка провокационными.

Истина №1: HR-аналитика нужна не всегда.

Истина работает, когда вы имеете дело со стандартными проблемами. На каких качествах кандидата я должен сосредоточиться при подборе? Каковы определяющие факторы текучести? Вряд ли ваши частные исследования перевернут десятилетия исследований журналов вроде Personnel Psychology. Иногда мнение может быть даже предпочтительнее анализа: если они противоречат друг другу, возьмите во внимание, чье мнение и чью аналитику вы сравниваете. Интуиция одних может быть лучше, чем исследования других.

Истина №2: Компромиссы в дизайне исследования - самые дорогие компромиссы.

Решения о проекте аналитики персонала принимаются с учетом политики организации, целесообразности и точности. Часто приходится идти на компромиссы в области разработки дизайна, но их последствия трудно восполнить. Если дизайн исследования слабый, никакая статистическая изощренность не спасет вас. Существует иерархия эффективности, когда дело доходит до дизайна проектов, допускающих причинные выводы. Мы резюмировали иерархии в статье  Decoding Workforce Analytics.

пятница, 26 января 2018 г.

GLASSDOOR показал список лучших профессий США 2018: hr менеджеры будут приятно удивлены

Напоминаю: Вы можете совершенно бесплатно воспользоваться услугой Сколько я стою на рынке - заполнив анкету, вы сможете узнать, насколько ваша зарплата выше / ниже рынка

GLASSDOOR показал список лучших профессий США 2018: hr менеджеры будут приятно удивлены



Крупнейший американский ресурс по размещению вакансий GLASSDOOR показал топ 50 лучших профессий США 2018.
Этот рейтинг формируется на основе трех показателей:
  • медиана заработной платы профессии;
  • рейтинг удовлетворенности работой;
  • количество вакансий

(ждем, что ХХ и прочие джобсайты будут тырить эту методику?) 
Самое приятное для HR менеджеров, что они вошли в топ 5 лучших профессий США

Уроки управления талантами от Apple: кейсы от самой дорогой компании Мира



Это мой стародревний перевод статьи John Sullivan (2011 год). Поэтому это не просто про Apple, а Apple Steve Jobs. Решил перенести в свой блог.
См. также другие переводы статей John Sullivan:

Итак

Уроки управления талантами от Apple: кейсы от самой дорогой компании Мира

В этом августе Apple стала самой дорогой компанией Мира на основе рыночной капитализации, превосходя любую другую компанию как в индустрии технологий, так и в любой другой индустрии. Как компания, ориентированная на потребителя, она имеет длительную динамику роста, что удивительно, поскольку рост
происходит через кризисы, когда потребители неохотно тратят свои небольшие накопления. Учитывая, что Apple была на грани банкротства в 1997 году, это тем более удивительно и примечательно.

Невероятная стоимость компании – не результат более чем 30-ти летней звездной деятельности. Apple часто имела промахи. Ее успех не результат специального оборудования, ресурсов производства или удачного месторасположения. Но результат потрясающего лидерства, таланта и необычных подходов в управлении талантами

Почти все в бизнесе признают, что потрясающие успехи Apple связаны со Стивом Джобсом. Некоторые авторы описали подходы Apple в HR, но лишь немногие смогли копнуть глубже и проанализировать, почему эти подходы работают. Визиты в штаб-квартиру и интервью с руководством HR убедили меня, что есть уроки, которые необходимо взять у этой компании. После двух десятилетий исследований и анализа подходов Apple в управлении талантами я скомпилировал список ключевых отличий.

Если вы работаете менеджером и хотите воспроизвести результаты, эти кейсы укажут Вам направление.