.

Сделать репост в соц сети!

суббота, 31 марта 2018 г.

Индивидуальные факторы успешности: применение пакета LIME для задач регрессии в R



Напомню, что пакет LIME появился в ответ на проблему "черного ящика" машинного обучения: предиктивная модель показывает прогноз (сколько кандидат будет продавать, будет он успешным или нет, насколько у него серьезные риски увольнения или нет), но модель не отвечает на вопрос о том, какое именно качество кандидата "западает". Речь идет о непараметрических моделях, в параметрических есть коэффициенты, поэтому если мы стандартизуем признаки, то можем понимать вес переменных, см. подробнее Интерпретабельность HR-аналитики, пост не про это.
См. также с тему Про деструкторы в отношениях с руководителем. И о том, как правильно их измерять
Итого, LIME позволяет ответить на вопрос про конкретного кандидата, какие качестве его "вытаскивают", какие "западают".
Цель поста - показать, как LIME работает на задачах классификации, а нам бы хотелось использовать LIME для задач регрессии, дожития, кластеризации.....

Ну и так. 

Я показываю решение на основе датасета case1 первого пакета по HR аналитике в R. Как установить, см. Пакет R HR analytics для HR аналитиков. Используем датасет "case1". Понятно, что кейс игрушечный, но достаточный для того, чтобы вы умели применять его на своих данных.

Описание данных

У нас есть информация о 81 сотруднике компании: информация при приеме - уровень IQ, измеряемый с помощью теста, наличие аналогичного опыта на предыдущем месте работы, образование. И спустя время после начала работы мы измеряем уровень продаж.
Задача - на основе данных о кандидате на входе в компанию спрогнозировать продажи.
Поскольку у нас цель поста показать пакет LIME для задачи регрессии, я не буду вникать в особенности задачи прогноза, просто скажу, что у нас есть две значимые переменные для прогноза - IQ и E (наличие релевантного опыта работы).

Решение

Необходимые пакеты

library(lime)
library(HRanalytics)
data("case1")

и отбираем необходимые переменные
df = case1[, c('Продажи', 'IQ', 'E')]
Далее я переменную E - опыт - делаю факторной только для того, чтобы показать, что факторные переменные также работают в модели.
df$E = as.factor(df$E)
И модель. Напоминаю, что я делаю совсем простую модель, поскольку цель в другом.
model = lm(Продажи ~ IQ + E, df)
Переходим к пакету LIME. Первое, что нам нужно, определить тип модели, выясняем его так.
class(model)
[1] "lm"
И создаем тип модели
model_type.lm = function(x, ...) {
    return("regression")
}

Т.е. мы говорим LIME, что мы в типе модели 'lm' будем использовать регрессию.
Следующая формула нужна, чтобы показать, какой тип переменной прогноза желаем используем (числовая в отличие от вероятности для классификации).
predict_model.lm = function(x, newdata, type, ...) {
   pred = predict(x, newdata, type ='response')
    return(as.data.frame(pred))
  }
Собственно ради двух вышеуказанных форму и нужен был пост:). Но поскольку я в интернете не встретил полного описания, то сделал сам.
Далее мы тренируем эхплейнер - то, что в LIME отвечает за индивидуальные прогнозы
explainer = lime(df[, c( 'IQ', 'E')], model)
Обратите внимание, я указываю эксплейнеру конкретные переменные датасета. Задаем новые данные - я показываю двух новых кандидатов.
newd = data.frame(IQ=c(99, 37),  E=c('1', '0'))
Как видите, у одного высокий интеллект и наличие опыта работы, у другого низкий интеллект и отсутствие опыта работы. И запускаем эхплейнер на новых данных.
explanation = explain(newd, explainer, n_features = 2 )
Думаю, что с помощью ?explain вы сможете прочитать, что здесь что обозначает. Получаем вот такой вывод
head(explanation)
model_type case model_r2 model_intercept model_prediction feature feature_value feature_weight   feature_desc
1 regression    1 0.276435        79.85067         93.79742      IQ            99       5.499671 97 < IQ <= 102
2 regression    1 0.276435        79.85067         93.79742       E             2       8.447084          E = 1
3 regression    2 0.726847        92.15528         70.59510      IQ            37     -13.919076       IQ <= 91
4 regression    2 0.726847        92.15528         70.59510       E             1      -7.641104          E = 0
   data prediction
1 99, 2   93.56856
2 99, 2   93.56856
3 37, 1   30.02060
4 37, 1   30.02060
И самое вкусное, что надо показывать Заказчику
plot_features(explanation, ncol = 1)

Картинка

Здесь интуитивно понятная картинка:

  • каждая диаграмма для каждого кандидата;
  • переменные по каждому кандидату (попутно замечу, что высота столбика говорит о весе фактора);
  • зеленый цвет означает, что качество кандидата позволяет ему показывать более высокие результаты, красное - это наоборот - "западение".




__________________________________________________________
На этом все, читайте нас в фейсбуке, телеграмме и вконтакте

пятница, 30 марта 2018 г.

Эволюция HR-аналитки



Не получилось у меня прорывов в этом посте, покажу вам саму идею.
Под прорывом я ожидал более физически осмысленных результатов.
Пост я назвал Эволюцией потому, что хотел показать, как математика помогает в рефлексии - позволяет систематизировать прошлые знания, понять траектории развития. И рефлексия тоже поддается математике....

Логика поста

Я скачал все свои посты в блоге - см. Как скачивать / парсить тексты постов блога blogspot, потом я проделываю кластеризацию, т.е. выделяю ключевые типы тем блога. а потом я показываю это в динамике - то, как эти темы меняются по времени.
Как мне кажется, эту технику можно использовать в корпоративной системе управления знаниями (если мы скачаем всю базу корпоративных знаний), корпоративном обучении и т.п...
Проблема в том, что кластеры не те, что нам хотелось бы получить:)

Решение

вот такие кластеры я получил в своем блоге
Эволюция HR-аналитки

Ну в общем общие термины: текучесть, тест, зарплата, эффективность, вовлеченность и т.п...
А динамика а динамика кластеров вот такая (на нижней диаграмме номер кластера соответствует кластеру на диаграмме сверху).

  • Т.е. в 2013 году (а это в моей практике по сути начало HR аналитики) преобладала тема "обучение оценка команда талант инструмент модель google кандидат процесс people", потом тема идет на спад и достигает минимума в 2015 году, а потом опять выстреливает и возвращает свои позиции в 2017 году (я полагаю, что это связано в первую очередь с нашим проектом "переводы статей по HR аналитике на английском") .
  • А вот исследования текучести ("текучесть стаж подчинённый исследование фактор респондент опрос зарплата мужчина диаграмма") достигают пика в 2014 -2015 году, а потом идут на спад. 
  • четвертый кластер стоит особняком вообще, увеличение доли в 2016 году связано с использованием тестов Лаборатории гуманитарные технологии в нашем исследовании (как раз в 2016 году начали получать серьезные результаты), а в 2017 году Лаборатория отказала в тестах, поэтому результаты пошли на спад. 

Ну вот как бы все, что можно выжать. Можно применить тематический анализ Дирихле, но там также встанет проблема интерпретации результатов:)


__________________________________________________________
На этом все, читайте нас в фейсбуке, телеграмме и вконтакте

четверг, 29 марта 2018 г.

Как скачивать / парсить тексты постов блога blogspot



Пост для пользователей Python и тех, кто занимается парсингом контента из интернета.
Недавно я показывал, как скачиваю / парсю вакансии с сайта ХХ.ру Как я скачиваю вакансии компаний с HH.ru (на примере Газпрома), сейчас я хочу показать, как можно скачивать тексты постов блогов платформы blogspot, т.е. как я могу скачать свой блог и покажу это на своем блоге.
Текст блога может быть использован в исследовании широкого класса задач, связанных с анализом текста.
Как скачивать / парсить тексты постов блога blogspot

Итак

Необходимые пакеты


import pandas as pd 
import feedparser
from urllib.request import urlopen
from bs4 import BeautifulSoup
import re
Вам надо будет установить библиотеки, которых нет по дефолту.

Сам парсинг

Первый шаг - нам необходимо получить урлы всех постов в блоге, а уже по ним скачивать содержание. И урлы мы скачиваем так.
urla = []
url = feedparser.parse('https://www.blogger.com/feeds/1020819187099399113/posts/default?redirect=false&start-index=1&max-results=50')
for x in url.entries:
    urla.append(str(x.link))
Здесь
  1. 1020819187099399113 - ID блога, который вы хотите скачать 
  2. max-results=50 - я сделал 50, но максимальное значение 500. И это плохо для блогов, где более 500 постов, но для это есть гиперпараметр 
  3. start-index=1 - если указано 1, значит вы с последнего поста начинаете отматывать парсинг, поэтому, когда вы скачали 500 постов, ставите 500 (или 501?) и продолжаете парсинг

urla = pd.Series(urla)
зачем то я полученный лист оборачиваю в формат series. И далее создаю переменную дата

Дата

date = []
# создаю переменную дата
for i, idbank in enumerate(urla):
    html = urlopen(idbank)
    bsObj = BeautifulSoup(html, "html.parser")
    nameList = bsObj.findAll("h2", { 'class':"date-header"  })
    date.append(nameList)
Нам надо очистить дату от тегов и прочего мусора, я это делаю так.
df = pd.DataFrame({'date':date})
df['date'] = df['date'].apply(lambda x: (re.sub(r'<.*?>', '', str(x))))
df['date'] =  df['date'].str.strip('[]')
df['date'] 
И мы получаем вот такой вид даты
0           вторник, 27 марта 2018 г.
1       воскресенье, 25 марта 2018 г.
2       понедельник, 19 марта 2018 г.
3       воскресенье, 18 марта 2018 г.
4           четверг, 15 марта 2018 г.
5           вторник, 13 марта 2018 г.
6       воскресенье, 11 марта 2018 г.
Это необязательная переменная, я ее добавил просто в качестве примера.


Текст постов

скачиваем так
art = []
for i, idbank in enumerate(urla):
    html = urlopen(idbank)
    bsObj = BeautifulSoup(html, "html.parser")
    nameList = bsObj.findAll("div", {"dir":"ltr", "style":"text-align: left;", "trbidi":"on"})
    art.append(nameList)
bsObj.findAll("div", {"dir":"ltr", "style":"text-align: left;", "trbidi":"on"}) - вот эта запись может быть не единственным вариантом скачивания / парсинга теста поста, я не придумал ничего более умного. И текст тоже надо причесать
df['text'] = art
df['text'] = df['text'].apply(lambda x: (re.sub(r'<.*?>', '', str(x))))
df['text'] = df['text'].str.strip('[]')
rem = {'\(adsbygoogle = window.adsbygoogle \|\| \[]\)\.push\({}\);': ''}
df['text'].replace(rem, regex=True, inplace=True)
df['text'] = df['text'].replace('\n', '', regex = True)
df['text']
Вот над этим шедевром я поработал основательно)) rem = {'\(adsbygoogle = window.adsbygoogle \|\| \[]\)\.push\({}\);': ''} в итоге получаем
0     Перевод статьи 3 Behaviors That Drive Successf...
1     Вдохновившись переводамистатей на тему Organiz...
2     Для тех, кто хочет погрузитьсяв статистическое...
3     Перевод статьи Case Study: Using ONA to Identi...
4          Провокативный пост на самом деле.Я провож...
5     Перевод статьи Consumer-goods giant Unilever h...
6     Перевод статьи The 4 Trends Changing How You H...
7          Провел опрос в телеграм канале HR-аналити...
Обращаю ваше внимание, что я ставил задачу парсить скачивать только текст постов, если вы хотите качать целые посты, то надо отказаться от очистки от тегов. Ну и т.п.
Ну или вместе это выглядит так
df
df
      date                                       text
0 вторник, 27 марта 2018 г.     Перевод статьи 3 Behaviors That Drive Successf...
1 воскресенье, 25 марта 2018 г. Вдохновившись переводамистатей на тему Organiz...
2 понедельник, 19 марта 2018 г. Для тех, кто хочет погрузитьсяв статистическое...
3 воскресенье, 18 марта 2018 г. Перевод статьи Case Study: Using ONA to Identi...
4 четверг, 15 марта 2018 г.     Провокативный пост на самом деле.Я провож...
Пользуйтесь на здоровье. Формат выгрузки можно менять, т.е. вместо переменной Дата можно поставить автора, а дату в другом формате, но это уже детали, их можно менять.



__________________________________________________________
На этом все, читайте нас в фейсбукетелеграмме и вконтакте

вторник, 27 марта 2018 г.

3 типа поведения, которые определяют успешных продавцов



Перевод статьи 3 Behaviors That Drive Successful Salespeople в рамках нашего  проекта переводы статей по hr-аналитике на английском. Автор статьи Ryan Fuller (автор Harvard Business Review и владелец компании people analytics), это уже вторая статья автора на туже тему
Что делает продавцов лучшими
Перевод сделала незаменимая Александра Багинская (по ссылке профиль с Линкедина). Саша родом с Украины, но живет и работает в Голландии. Читайте другие статьи Александры у нас в блоге:
  1. Что делает продавцов лучшими
  2. Результат через diversity - одна из самых дискутируемых тем, по ссылке результаты исследования McKinsey.
  3. Как блокчейн повлияет на HR?
  4. People Analytics 3.0
  5. Джош Берсин. Переворот рынка HR технологий: 10 топ трендов 2018 - одна из самых популярных статей блога за все время
  6. Удержать или отпустить? Данные, на которые следует корректно реагировать, когда сотрудник увольняется
  7. Соседство с лучшими сотрудниками может увеличить производительность

Также с Александрой мы работали над статьей Applying Survival Analysis to Reduce Employee Turnover: A Practical Case для западного сайта analyticsinhr.com.
Итак

3 типа поведения, которые определяют успешных продавцов

Автор Ryan Fuller, опубликовано 20 августа 2014
Большинство людей считают продажу искусством, а не наукой: некоторым людям дано, другим – нет. Но это оставляет много неопределенности в отделе, который часто приносит большую часть прибыли  компании, и существенно усложняет управление высокоэффективной торговой силой. Превалирует мнение, что количество времени, затраченное продавцами на клиентов, является самым важным фактором, определяющим объёмы их продаж. Но недавнее исследование выявило еще более мощный индикатор – размер и качество сети продавца внутри собственной компании.
HR аналитика может помочь организациям узнать больше о том, какое поведение отличает их самых успешных продавцов. В VoloMetrix мы недавно изучили коммерческую силу крупной B2B компании, использующей шесть четвертей данных квоты для нескольких тысяч сотрудников. Затем мы сопоставили это с 18-месячными КПЭ персонала VoloMetrix. Эти КПЭ измеряют такие аспекты, как время, проведенное с клиентом или менеджером, размер и кросс-функциональность внутренней сети, важность данного сотрудника во внутренней сети, время с высшим руководством и многие другие, анонимно рассчитанные по каждому сотруднику.
Мы ожидали, что у нас будет две фазы исследования. Первая просто запустит модель относительно всей торговой организации, не озадачиваясь сегментированием. Это означало, что продавцы мелкого и среднего сектора попадали в один пласт с теми, кто продает через каналы и крупным предприятиям, и что Азиатско-Тихоокеанский регион не был разграничен с Европой, Ближним Востоком и Африкой и т.п.
Наши исследователи предположили, что на этом уровне не будут выявлены значимые корреляции. Казалось очевидным, что наиболее эффективные продавцы простых недорогих товаров для малых и средних предприятий в Азии выглядят совершенно иначе, чем североамериканские продавцы, с семизначным оборотом в корпоративном секторе. Вот почему вторая фаза исследования должна была разбить продавцов на группы более схожих и повторить анализ.
Второй этап нам не понадобился.
Оказалось, что независимо от того, что и кому вы продаете и где вы находитесь, успех в продаже сильно коррелирует с тремя аспектами:
  1. достаточно времени с существующими и потенциальными клиентами
  2. большая и здоровая сеть связей в вашей собственной организации
  3. время и внимание вашего менеджера и другого высшего руководства в вашей собственной организации
Первый фактор является модным, и увеличение времени с клиентами в приоритете у большинства лидеров продаж и консультантов. К сожалению, просто увеличение количества времени, которое ваши неуспешные продавцы тратят на клиентов, вряд ли особо поможет и, на самом деле, может и навредить. Представьте себе плохого продавца, который пытается вам что-то продать, а теперь представьте, что вы проводите с ними в два раза больше времени.
Второй и третий аспекты менее очевидны, но невероятно важны.
Корпоративные покупатели становятся все более изощренными и входят в процесс продаж достаточно хорошо осведомленный о своих вариантах. Они ищут того, кто заслуживает доверия, может понять их потребности и быстро и грамотно решить их вопросы и проблемы. Для этого необходимо, чтобы продавец был в состоянии найти подходящих людей в нужном месте в нужное время. От них также ожидается знать, как получить одобрение сделки внутри их компании, иметь доступ к руководству, когда это необходимо, и иметь целостное представление о том, что может предложить вся их компания покупателю за пределами текущей транзакции.
Возьмем, например B2B компанию, о которой упоминалось ранее. Лучшие продавцы начали квартал, встречаясь с потенциальными клиентами. Но со временем их время, проведенное с клиентами, сократилось, а сеть их внутренних контактов выросла.
3 типа поведения, которые определяют успешных продавцов

Менее успешные продавцы проявляли сходные тенденции, но их показатели были ниже: они тратили на 25% меньше времени на клиентов, на 20% меньше на внутренние контакты и на 20% меньше высшее руководство.

воскресенье, 25 марта 2018 г.

Анализ коммуникаций коллектива в рабочем чате Telegram




Вдохновившись переводами статей на тему Organizational Network Analysis и постом Эдуарда Бабушкина про работукоманды, я решила попробовать провести организационный  сетевой анализ в R на реальных данных о коммуникации коллектива.

Поскольку мессенджеры нынче наше всё, источником информации стала переписка в рабочем чате Telegram одного профессионального коллектива. Мессенджер является официальным корпоративным средством связи компании, чат используется как для решения рабочих вопросов (около 70% сообщений), так и внерабочих (например, совместно заказать пиццу). В выборку не включались информационные сообщения «для всех» (учитывались только ответные сообщения на них).

Про извлечение этих данных писать особо нечего – в этом деле либо мозги и знание методов парсинга данных из мессенджеров, либо железная… точка опоры :) Я пошла по второму пути – вручную выписала информацию о переписке за 2 месяца. Зато теперь есть понимание возможных сложностей: было бы интересно посмотреть, как  при парсинге решается проблема с определением направления сообщения (кому писалось), или проблема с участниками, которые любят единый по смыслу месседж разбивать на несколько сообщений…

Итак, первое, что мы можем сделать, это построить общую картину коммуникаций в коллективе

Красиво?... Даже визуально заметно, что лидерами по частоте коммуникаций являются сотрудники 11, 15, 5, 10. Первое, что можно предположить, что это - руководители, и  на их сообщения остальные обязаны (либо просто считают необходимым) отреагировать.  Я отметила руководителей красным цветом, и стало понятно, что это предположение не вполне соответствует действительности. Я также отметила квадратом рядового сотрудника, на которого возложены функции «организатора».

Таким образом, есть еще как минимум два специалиста, которые не являются ни руководителями, ни организаторами, но демонстрируют не меньшую частоту коммуникаций.

Для наглядности, мы можем представить активность коммуникаций, вот так:


Активность: суммарное количество сообщений сотрудника и откликов на его сообщения.

Мы видим явно выбивающихся в лидеры не-руководящих 11 и  5. Может, они просто злостные спамеры и генерят поток ненужных картинок с котиками? Можем разбить показатель активности на исходящий (Out) и входящий поток (In) (в % соотношении):

Сотрудник 11 в равной степени одинаково генерит контент и получает отклики, у номера 5 преобладают исходящие, откликов явно меньше.

Вопрос для размышления: можно ли сделать вывод, что сотрудник 11, конкурирующий по активности (в том числе реакциям коллег),  с руководством – является неформальным лидером?

Также обращают на себя внимание сотрудники с крайне низким уровнем общей активности: 22, 24.

Опять вопрос: можно ли предположить, что эти сотрудники испытывают сложности с коммуникацией и обладают невысоким социальным статусом? (Хотя я бы проверила влияние стажа работы, возможно, это просто новички).

Еще один интересный разрез  - разделение по группам внутри коллектива. Данный конкретный коллектив функционально разделен на несколько отделов. Можно посмотреть, как строятся коммуникации внутри и между отделами:
  


Цветом выделены 4 функциональных отдела: «желтый» – сотрудники 1(руководитель), 2, 9, 23, «розовый» – сотрудники  7(руководитель), 13, 21,   «зеленый» - одинокий сотрудник 8, «бирюзовый» - все остальные.

Можно заметить, что большую часть коммуникаций создают сотрудники «бирюзового» отдела. Остальные слабо вовлечены в общие коммуникации, в основном через  одного участника: «розовый» через  сотрудника  13, «желтый» - через 23. Руководители обоих отделов, видимо, вообще предпочитают другие формы общения (возможно, через личные сообщения или устно). При этом, между собой внутри желтый и розовый отделы также общаются слабо, что убеждает меня в наличии альтернативного канала коммуникаций (отдельный чат).

И вновь вопрос для размышления: может ли эта картина отражать сплоченность всего коллектива, качественно характеризовать межгрупповые отношения? Например, что отделы не очень дружат между собой?

Вот еще несколько описательных характеристик сети, которые могут понять ситуацию в коллективе (вообще, параметров еще множество, я честно беру наиболее понятные для меня, как для новичка в анализе сетей).

Транзитивность (коэффициент кластеризации) - характеристика повышенной вероятности связи между двумя участниками коммуникации, если есть одинаковые связи с другими участниками (друг моего друга – мой друг). Когда коэффициент кластеризации высокий – это означает, что коммуникации чрезвычайно плотно сгруппированы вокруг нескольких участников; когда он низкий – это значит, что связи в графе относительно равномерно распространены среди всех узлов.
[1] 0.473301
На мой взгляд, коэффициент подтверждает картинку, полученную выше – коммуникации сгруппированы вокруг части сотрудников одного отдела, за его пределами плотность заметно падает.

Диаметр - максимальный кратчайший путь между любыми двумя вершинами (между которыми такой путь возможно проложить). Параметр, который показывает величину сети. 4  - много это или мало, и какие выводы из этого можно сделать – я пока не могу предположить, не хватает опыта,  сравнить не с чем (если у вас есть идеи – велком!)
[1] 4

Плотность - вычисляется как нормированное число ребер (отношение наличных связей в сети к возможному максимальному количеству связей в сети с данным количеством вершин). 
[1] 0.548913

Взаимность – думаю, понятно из названия. В нашем случае большинство связей оказываются взаимными. Предполагаю, что это хорошо для коллектива.
[1] 0.660066

Средняя длина пути – аналогично, определение очевидно. Среднее количество точек между двумя вершинами.
[1] 1.853755

На мой неопытный взгляд большинство параметров середина на половинку. Не плохо, но и не идеально.

Итак, главные вопросы к экспертному сообществу (и не к экспертному тоже – даже если вы никогда этим не занимались, давайте в режиме мозгового штурма):
1.         Можно ли использовать такую информацию, как коммуникации в чате Telegram для социометрического анализа, в частности, определения звезд и аутсайдеров, оценки социально-психологического климата или других прикладных hr-целей?
2.         Какие выводы сделали бы вы, глядя на полученную информацию?


понедельник, 19 марта 2018 г.

Специализация «Анализ данных» (обзор серии курсов)


Для тех, кто хочет погрузиться в статистическое обучение (не путать с машинным обучением) представляю обзор специализации от Новосибирского государственного университета совместно с компанией 2GIS на платформе Coursera.org"Анализ данных".
Специализация отлично подходит для начинающих работу с данными. Экспертам, занимающимся построением моделей машинного обучения будет не интересно, так как это всё же азы. Тем не менее, стройная логика и поэтапное прохождение позволит очень хорошо освежить (изучить) университетский курс мат. статистики.
Специализация состоит из четырех курсов на русском языке, выстроенных в логике постепенного усложнения:

1.      Введение в данные – основы теории вероятности, мат. статистики и графического анализа данных.
2.    Исследование статистических взаимосвязей – погружение в мат. статистику, корреляции, построение линейной регрессии.
3.    Сравнение и создание групп – способы сравнения зависимых и независимых выборок, кластерный анализ (отметил очень хорошее пояснение по кластерному анализу и способам проверки его качества).
4.       Тренды и классификации – работа с временными рядами, факторный анализ, классификация.

Каждый курс состоит из пяти недель, из них четыре учебные с видеолекциями и промежуточными тестами, на пятой неделе заполняется итоговый тест и подготавливается проектная работа. Проектная работа – взаимооцениваемое задание, это означает, что работу будут проверять такие же слушатели, как вы, а вашей задачей будет проверить ряд работ однокурсников.
В зависимости от уровня подготовки слушатель может выбрать конкретные курсы специализации, либо пройти все.
Преимущества специализации в том, что практическая часть параллельно преподаётся на SPSS и R, слушатель может выбрать тот вариант, который ближе ему, либо изучить оба. Для подготовки проектов выдаются реальные датасеты с данными  компании 2GIS.
Главный недостаток специализации в том, что она, к сожалению, платная. Бесплатный доступ предоставляется сроком на 7 дней, затем слушатель должен осуществлять ежемесячную оплату. Поскольку оплата взимается не за отдельный курс, а за специализацию и при этом материалы всего курса становятся доступными сразу, то в целях экономии можно попробовать проходить курсы параллельно и максимально быстро. Поскольку обучение платное, по окончанию каждого курса выдаётся сертификат.



воскресенье, 18 марта 2018 г.

Кейс: применение Анализа Организационных Сетей (ONA) для выявления скрытых “звёзд”, которые помогут повысить доход





Перевод статьи Case Study: Using ONA to Identify Hidden Stars Who Can Help Boost Revenue нашего  проекта переводы статей по hr-аналитике на английском. Автор Роб Кросс , профессор глобального бизнеса в Бэбсон Колледж, отмеченный наградой им. Эдварда А. Мэддена. Смотрите другую его статью в нашем блоге
Как Corning использует исследования организационной сети для оптимизации совместной работы и результатов

Перевод выполнила Ольга Хайдарова - HR project-manager компании "Этажи", г. Тюмень. Это седьмой перевод Ольги, см. также
  1. Браслеты Amazon могут отследить движения руки сотрудников: “Работодатели всё чаще обращаются с персоналом, как с роботами”
  2. Опыт применения чатбота в рекрутинге: год вместе;
  3. 86% руководителей не видят пользы в Аналитике – почему так?;
  4. Успех в аналитике требует правильного мышления;
  5. Улучшаем командную производительность с Анализом организационных сетей (ONA);
  6. Перегруженная организация.

Также Ольга выполняет самостоятельные проекты по аналитике, см. пост Ольги
Анализ дожития специалистов по продаже недвижимости - работодатели, обращаю ваше внимание, рекомендую специалиста.
Итак,

Кейс: применение Анализа Организационных Сетей (ONA) для выявления скрытых “звёзд”, которые помогут повысить доход

Кейс: применение Анализа Организационных Сетей (ONA) для выявления скрытых “звёзд”, которые помогут повысить доход
Рисунок 1. Анализ организационных сетей выявил несколько потенциально перспективных. но неиспользуемых сотрудников, которые могут повысить рост доходов.  
Дивизиональный  директор недавно занял руководящую должность. Продажи падали, и он был крайне заинтересован в выявлении мер, которые нужно предпринять для успешного заключения сделок, и драйверов успеха, поскольку это влияло на развитие и расширение существующего бизнеса. Он также хотел убедиться, что люди сотрудничают  внутри экспертных областей и соответствующим образом мотивированы поддерживать продажи, что влияло на уровень проникновения продаж. Он поручил провести Анализ организационных сетей (ONA), чтобы отобразить информационные потоки, так как они имели прямое отношение к росту доходов.

Проблема:

Результаты анализа показали, что:

  • Только 5% людей объясняли 25% всех приносящих доход коммуникаций. При оценке времени, затраченного на взаимодействие с другими, оказалось, есть партнеры, которые могли бы содействовать продвижению продажи клиенту. На Рисунке 1 (выше), партнеры, показанные с левой стороны диаграммы, имеют гораздо меньше людей, зависящих от них при достижении рабочих целей, и они меньше вовлечены в генерацию дохода (это показано размером “пузырька”). Их рассматривали в качестве хороших кандидатов для помощи в продажах клиентам.
  • Люди, которые помогали с процессом продаж, были не замечены или не вознаграждены так же, как сотрудники, которые закрывали сделки. Например, один старший лидер имел много выстроенных связей с руководителями других компаний. Годами он отвечал за обеспечение посредничества, чтобы начать процесс продаж, которые часто приводили к успешной сделке.
  • 78% доходных итераций были сконцентрированы внутри клиентских аккаунтов, обмен лучшими практиками между аккаунтами  был очень мал. Это было обусловлено недостаточностью коммуникаций между клиентскими менеджерами в компании. Эта изолированность мешала осведомленности людей о новых продуктовых предложениях и новом опыте, и, как следствие, кросс-продажам. Их опыт и отношения с клиентами не были интегрированы в клиентские продажи и реализацию проектов. Усложнял это тот факт, что эти клиентские менеджеры были единственной точкой выхода на клиента, поэтому, в случае, если они покинут фирму, это была бы значительной финансовой потерей.
  • Диапазон коммуникаций в клиентской команде широко варьировался, что влияло на возможность удовлетворить потребности клиента. Рисунок 2 (внизу) показывает две клиентские команды. Команда B достаточно хорошо связана в среднем семью связями на одну персону. Команда имеет высокие рейтинги удовлетворенности клиентов, и неудивительно, что она может принести большую пользу клиенту, способствуя возможности расширения своего первоначального участия. В клиентской команде А есть два абсолютно незадействованных человека и только три связи на сотрудника в среднем. Команда приносит удовлетворительные результаты, но дополнительной работы не ожидается. Просто построив взаимоотношения четырех центральных сотрудников и сотрудников на периферии, можно увеличить число связей на 40%.

Рисунок 2. Организационный анализ сетей выявил широкую вариативность связей в клиентских командах, которая влияет на возможность удовлетворения потребностей клиента.

четверг, 15 марта 2018 г.

Мифы харассмента (экспертное мнение vs данные)



Провокативный пост на самом деле.
Я провожу опрос на тему харассмента Харассмент на рабочем месте (исследование) (голосуем, на сегодня уже более 300 человек поделились информацией. Даже если у Вас не было случаев в вашей карьере, даже если Вы мужчина - голосуем!).

Так вот

Мне одна из дам высказала гипотезу, что в результате харассмента чаще увольняются более молодые, потому что они не могут противостоять домогателю, у них опыта подобного общения, а те, кто в более зрелом возрасте, могут поговорить и объяснить домогателю, чтобы отстал.
Опрос
Я решил проверить эту гипотезу, но сначала я задал этот вопрос в нашем телеграм канале

Мне подкинули гипотезу, что в результате харассмента чаще увольняются более молодые, потому что они не могут противостоять домогателю, у них опыта подобного общения, а те, кто в более зрелом возрасте, могут поговорить и объяснить домогателю, чтобы отстал
как вы считаете, действительно ли в результате действий домогателя чаще увольняются более молодые женщины, а более зрелые могут поговорить и поставить домогателя на место?
да, я согласен с тем, что увольняются от действий домогателя чаще более молодые женщины
нет, возраст не влияет на то, что женщина увольняется от действий домогателя
И получил вот такой результат
Мифы харассмента

Т.е. практически 3/4 согласны с этой гипотезой.

На самом деле

В нашем опросе вот такие вариант исхода действий домогателя:
  1. дала в рыло, отстал 
  2. Домогатель уволился 
  3. Меня уволили после отказа
  4. Ничем, домогательства продолжаются
  5. обратился (обратилась) за помощью к кому-то в компании, домогателя поставили на место 
  6. Поговорил (-а) прямо, домогатель понял и перестал
  7. со временем сам прекратил
  8. ушел на повышение в московский офис
  9. Я уволился (уволилась)

Я из этих вариантов оставил только два

  1. Поговорил (-а) прямо, домогатель понял и перестал (26 дам выбрали этот вариант на сегодня)
  2. Я уволился (уволилась) (38)

вторник, 13 марта 2018 г.

Unilever нанимает сотрудников, используя интеллектуальные игры и искусственный интеллект, - и это стало огромным успехом





Перевод статьи Consumer-goods giant Unilever has been hiring employees using brain games and artificial intelligence — and it's a huge success and Beyond в рамках нашего  проекта переводы статей по hr-аналитике на английском. Статья с сайта businessinsider - сайт публикует интересные технологичные статьи.
Перевод выполнила Светлана Дзюбенко (профиль в фейсбуке), HR из Одессы, работает более 15 лет директором по персоналу в коммерческих компаниях, в сферах оптовой торговли В2В,В2С, производства, транспортных услуг.
Итак




Гигант потребительских товаров Unilever нанимал сотрудников, используя интеллектуальные игры (brain games) и искусственный интеллект (artificial intelligence - AI), - и это стало огромным успехом

Unilever - одна из крупнейших и успешных компаний в мире по производству товаров ежедневного спроса.

Unilever хочет стать мировым лидером, в использовании искусственного интеллекта (artificial intelligence – AI) для найма сотрудников. 
  • Unilever использовал искусственный интеллект(AI) для отбора всех сотрудников на должности начального уровня( за прошедший год.
  • Кандидаты играют в игры, основанные на нейробиологии, для оценки присущих им черт, затем записывают интервью, которые анализируются при помощи искусственного интеллекта (AI).
  • Компания считает этот эксперимент большим успехом и собирается продолжить его в дальнейшем.
В течение прошлого года Unilever использовал искусственный интеллект (AI) для найма сотрудников начального уровня, и компания заявляет, что она значительно увеличила разнообразие нанятых сотрудников и экономическую эффективность найма.
«Мы попадали в университетский городок(campus) так же, как и я когда-то более 20 лет назад», - сказал Майк Клементи (Climenti Mike), вице-президент по человеческим ресурсам Северной Америки для Business Insider. «Явно, что-то должно было измениться».

воскресенье, 11 марта 2018 г.

Четыре тренда, меняющих ваш подход к подбору персонала в 2018 году и в последующий период





Перевод статьи The 4 Trends Changing How You Hire in 2018 and Beyond в рамках нашего  проекта переводы статей по hr-аналитике на английском. Автор статьи Maria Ignatova, автору нас впервые, имя и фамилия у нее славянские, но в рабочем бекграунде и образовании все только американское, поэтому ничего не могу сказать, откуда она.
Перевод выполнила Галина Подовжняя, работает в компании Coca Cola Hellenic, на позиции Group Supply Chain HR BP for Procurement, Planning & QSE, профили в фейсбуке и линкедине. Это уже третий перевод Галины, см. также:


И оцените, какой серьезный труд сделала сейчас Галина.
Итак,
Четыре тренда, меняющих ваш подход к подбору персонала в 2018 году и в последующий период

Четыре тренда, меняющих ваш подход к подбору персонала в 2018 году и в последующий период

Найм талантов стал чрезвычайно транзакционным процессом. Утомительный поиск кандидатов, бесконечное планирование и монотонный скрининг могут быть неэффективными и отупляющими. Настало время новой эры рекрутмента, которая фокусируется на том, что приносит гораздо больше удовольствия, - на человеческом и стратегическом аспектах.
Сегодня мы представляем вам «Отчёт о глобальных трендах в рекрутменте 2018», описывающий четыре основных тренда в   найме. Эти тренды убивают транзакционность, делают найм более стратегичным и  позволяют рекрутерам  и нанимающим менеджерам фокусироваться на высоко-потенциальных талантах.
Мы выявили эти тренды на основе многочисленных интервью с экспертами, а также с помощью исследования, в котором приняли участие девять тысяч талантливых лидеров и нанимающих менеджеров по всему миру. Вот они:

  • Кадровое разнообразие (diversity)
  • Новые инструменты интервьюирования (new interviewing tools)
  • Данные (data)
  • Искусственный интеллект (artificial intelligence)

Вот как эти тренды ранжированы в порядке важности, по мнению талантливых лидеров и нанимающих менеджеров, а также насколько успешно они применяются:
Четыре тренда, меняющих ваш подход к подбору персонала в 2018 году и в последующий период

Далее вы найдёте краткий обзор каждого тренда. Для полного понимания того, как компании сегодня внедряют эти идеи, загрузите наш «Отчёт о глобальных трендах в рекрутменте 2018».

1. Разнообразие - это новый глобальный образ мышления

78% талантливых профессионалов и нанимающих менеджеров говорят, что кадровое  разнообразие является главным трендом, влияющим на то, как они нанимают

суббота, 10 марта 2018 г.

Что дарят женщинам на 8 марта



Провел опрос в телеграм канале HR-аналитики о том, что дарят женщинам на 8 марта и решил сохранить результаты.
Всего поучаствовало 196 человек, результаты и опции такие
  • Цветы выбрало 105 респондентов;
  • Сувениры - 5;
  • Конфеты - 34;
  • Парфюмерия, косметика, бижутерия - 29;
  • Игрушки - 2;
  • Ювелирные украшения - 19;
  • Деньги - 24;
  • Другое - 57;
  • Ничего - 33.
И только один мужчина подарил игрушку:)
диаграмма в %
Что дарят женщинам на 8 марта


Обращаю Ваше внимание, что диаграмма не круговая, поскольку в опросе был множественный выбор, респонденты могли выбирать до трех вариантов ответов, поэтому сумму % выше 100.
Приглашаю поучаствовать в других наших опросах:






__________________________________________________________

На этом все, читайте нас в фейсбуке, телеграмме и вконтакте




Что делает продавцов лучшими



Перевод статьи What Makes Great Salespeople в рамках нашего  проекта переводы статей по hr-аналитике на английском. Автор статьи Ryan Fuller (автор Harvard Business Review и владелец компании people analytics), он у нас впервые.
Перевод сделала незаменимая Александра Багинская (по ссылке профиль с Линкедина). Александра родом с Украины, но живет и работает в Голландии. Рекомендую - вот из таких и надо набирать таланты.  Читайте другие статьи Александры у нас в блоге:



Также с Александрой мы работали над статьей Applying Survival Analysis to Reduce Employee Turnover: A Practical Case для западного сайта analyticsinhr.com.
Статья ниже - про вечную тему - что делает продавцов лучшими. Но в отличие от той воды, что обычно льют в данной теме, эта статья подсказывает, какие данные можно брать и прогнозировать лучших продавцов. Кстати говоря, еще один повод начать изучать Organisational Network Analytics, см. например Как работает команда: анализ внутригрупповых процессов и ролей участников команды

Чем определяются лучшие продавцы

Автор Ryan Fuller
Опубликовано в Business Harward review 8 июля 2015
Каким поведением отличаются успешные продавцы? В прошлом году в исследовании моей помпании по people analytics в VoloMetrix было определено три особенности лучших менеджеров по продажам: больше времени с клиентами, шире сеть внутренних знакомств, больше времени с руководством. Эти три особенности поведения наблюдались вне зависимости от региона, территории, роли в продажах, подводя к выводу, что это фундаментальные ингредиенты успеха.
Мы пришли к этим заключениям после изучения коммерческой силы большой В2В компании-разработчика ПО, использовав шесть четверней квоты данных о достижениях тысяч сотрудников. В следствии мы сопоставили результаты с 18 месяцами аналитики КПЭ человеческих ресурсов, созданных VoloMetrix. С тех пор у нас появилась возможность работать с несколькими другими компаниями для проведения подобного и более глубокого анализа.
Основываясь на более ранних выводах, мы разработали более широкую структуру для каждого поведения, которое мы идентифицировали (два из которых мы объединили), плюс дополнительный:
  1. Взаимодействие с клиентами. Это включает в себя не только общее время, проведенное с клиентами, но и такие факторы, как количество аккаунтов, время, проведенное с каждым, частота взаимодействий, широта и глубина отношений.
  2. Внутренние сети. Мы обнаружили, что полезно разбить характеристики внутренние сетей на три подкатегории:
    • Общая включает в себя общее количество отношений внутри компании, время, проведенное с другими коллегами и влияние внутри сети.
    • Ресурсы поддержки – набор показателей, ориентированных на отношения, созданные с помощью сотрудников службы поддержки продаж, включая специалистов предпродаж, представителей внутренних продаж и других.
    • Руководство – набор показателей, сконцентрированных на отношениях между представителями отдела продаж и их непосредственными руководителями, а также более широкое взаимодействие с менеджментом компании.
  3. Энергия – этот новый угол, который очень сильно связан с предыдущими двумя, включает в себя набор показателей, которые измеряют общее время и усилия, затраченные продавцами.

пятница, 9 марта 2018 г.

Харассмент на рабочем месте (исследование)






Тема сексуального харассмента (домогательства) стала популярной. Просим Вас ответить, были ли в Вашей профессиональной карьере подобные случаи (если не были, то Ваш голос не менее важен. И даже если Вы мужчина - поучаствуйте!).
Сексуальное домогательство — запугивание, издевательство или принуждение сексуального характера, также нежелательное или ненадлежащее обещание вознаграждения в обмен на сексуальные услуги, иные устные или физические (объятия, прикосновения, нападение с целью изнасилования) преследования сексуального характера.

Все ответы абсолютно анонимны
Результаты будут публиковаться регулярно в телеграм канале и фейсбук странице блога HR-аналитики 




Так влияет ли гендерное разнообразие на эффективность команды



Не очень люблю методологические посты писать. Но в данной ситуации ситуация перезрела, поэтому хотел бы обозначить свою позицию на этом счет. Для нашего рынка важно, поскольку мы можем получить очередную лажу типа компетентностного подхода: связи с бизнес результатами нет, но рынок измерения компетенций в России десятки миллионов долларов. Деньги на ветер. Вот я бы и хотел предостеречь от подобной практики в отношении гендерного разнообразия.
В посте коснусь только гендерного разнообразия и в двух пластах:

  • определение термина diversity или контекста использования diversity;
  • о причинности / корреляции и проблеме измерения влияния diversity в моделях эффективности.

О термине diversity

Когда представители академического Мира возражают мне, что нельзя diversity измерять просто по соотношению мужчин и женщин, что необходимо проконтролировать и уравнять другие факторы, такие как, например, стаж игры в ЧтоГдеКогда (см. например Влияние гендера команды на успешность в игре ЧТО ГДЕ КОГДА или вот замечательная статья Александра Вечерина
Нужно ли нам гендерное разнообразие? (на примере Что?Где?Когда?)), то я с ними абсолютно согласен!
С точки зрения академических исследований это важно. Вопрос в том, что гендерное разнообразие чаще всего понимается не в академическом ключе, а вполне в бизнесовом, например, в политике рекрутинга.
Гендерное разнообразие в рекрутинге понимается как сочетание мужчин и женщин. Все! Без контроля других факторов. Давайте посмотрим на примеры:
Результат через diversity - это исследование компании McKinsey. Посмотрите и найдите, где компания контролирует какие то факторы кроме гендера? Опыт работы, компетенции, профессионализм? Нет, вот картинка корреляции между гендерным разнообразием и эффективностью компании.
Вот еще более откровенная статья McKinsey - Why diversity matters. Я просто процитирую несколько фраз из статьи:
  • We know intuitively that diversity matters.
  • While correlation does not equal causation (greater gender and ethnic diversity in corporate leadership doesn’t automatically translate into more profit), the correlation does indicate that when companies commit themselves to diverse leadership, they are more successful.
  • More diverse companies, we believe, are better able to win top talent and improve their customer orientation, employee satisfaction, and decision making, and all that leads to a virtuous cycle of increasing returns. 
  • Racial and ethnic diversity has a stronger impact on financial performance in the United States than gender diversity

Вот так: "know intuitively", "we believe", а потом уже откровенно пишут про "stronger impact" (!!!) 
Поэтому я, кстати, ответил McKinsey своим постом Влияние гендера команды на успешность в игре ЧТО ГДЕ КОГДА . Но думаю, что в обоих случаях влияния нет. Если в случае ЧГК стоит, скорее всего, неравномерность стажа игры, то в случае McKinsey сыграла, скорее всего, мода на разнообразие: просто более "инновативные" компании типа Google позволяют себе следовать за модой и набирать больше женщин, и поэтому влияние в случае таких компаний, на мой взгляд, обратное: не компания более эффективная вследствие того, что туда набирают больше женщин, а больше женщин, потому что компания более эффективная и позволяет себе заниматься чудачествами типа подбора женщин, ассессмент центров, вовлеченности персонала и прочей ..... А нижний квартиль компаний по эффективности занят выживанием, ему некогда разбираться с diversity. Но это только моя гипотеза. 

Проблема для бизнеса