.

Сделать репост в соц сети!

вторник, 31 мая 2016 г.

Оценки эффективности подхода Больших данных в оценке персонала

Задали вопрос на семинаре, не было времени ответить, отвечаю постом.
В принципе ответ на уровне логики, не ROI, не Больших данных. Но если у кого то еще есть вопрос, то может пригодиться.
Вопрос такой.
Посмотрите на картинки

Показана ситуация на рынке бейсбола (читаем Moneyball).
Слева ситуация - до 2012 года, Справа - после.
по оси X - количество американских рублей, затрачиваемых на зарплату игроков, по оси Y - количество игр, выигранных до попадания в серию плей офф.
Для меня очевидно, что картинка справа - показатель того, что рынок становится эффективней, что команды тратят деньги с умом.
Мне сегодня сказали следующее: команды неэффективней, потому как тратят больше денег - смотрим на шкалу X: если самая богатая команда тратила 90 миллионов долларов до 2012 года, то после 2012 - 190 таже команда.
Ответ простой: чтобы исключить влияние факторов типа инфляция, ситуация на рынке и т.п., предлагаю принимать во внимание не абсолютные цифры, а стоимость одной выигранной игры для команды.
Например, слева Бостон Ред Сокс (синяя точка) тратила 90 мил / 100 = 900 000 баксов за одну выигранную игру. А команда Билли Бина Окланд атлетикс тратила  30 мил / 90 = 330 000 баксов за выигранную игру. Есть разница?
Справа, Бостон тратила 190 мил / 100 = почти 2 мил за игру.
Окланд 60 мил / 90 = 660 000.
Есть разница?
А эффективность измеряется разбросом трат - стоимость выигранной игры у команд стала ближе после 2012 года.
Так вот эффективность здесь в том, что слева крайняя правая точка на примерно 75 выигранных игр тратила примерно 75 миллиона. Т.е. игра у этой команды стоила один миллион долларов. Больше, чем у Ред Сокс.
Ну вот как то так.
Забавно, что сегодня после семинара я наткнулся на статью про вовлечение в бейсболе. Moneyball for Business: Employee Engagement Meta-Analysis  - суть статьи простая: к сожалению, прогнозы выигранных игр команд на основе индивидуальных действий игроков не всегда бывают точными, иногда ошибка прогноза составляет 15 игр за сезон (представляете, при 100 играх, ошибка - 15 - это не маленько). Чтобы объяснить ошибку, аналитики ввели понятие "clubhouse culture". Ну и далее переходят к исследованию Gallup про вовлеченность. В месте про Gallup  я бы поспорил, но сам эффект ошибки в оценке игр в Moneyball - важный прецедент для аналитиков

воскресенье, 29 мая 2016 г.

Браузер скажет о кандидате то, что не скажет уровень учебной успеваемости



Перевод статьи What Your Browser Says About You That Your GPA Doesn’t.
Обратите внимание, а нашем опросе есть вопрос о пользовательском браузере (примите участие)

Инновации не могут быть сымитированы.

Если вы хотите нанять творческих, независимых и инновационных людей, вы будете смотреть в аттестат кандидата или узнаете, каким браузером он пользуется?
В интервью New York Times (по ссылке перевод этого интервью), Ласло Бок, старший вице-президент people operations в Google, сказал: "Одна вещь, которую мы поняли: ни оценки по успеваемости, ни результаты учебных тестов (аналог российского ЕГЭ – прим, Э.Б.) не говорят ничего с т.з. прогноза эффективности кандидата".
Главный по HR в Google мог принизить проблему. Но Matthew Mayhew, доцент высшего образования в Нью-йоркском университете, изучает взаимосвязь между формальным образованием и инновациями, и результаты не дают повода для оптимизма для студентов класса A.
«Важный результат: растет балл успеваемости – падает инновативность», - пишет Mayhew. Поэтому балл по успеваемости не совсем бесполезная информация – хорошая успеваемость может быть основанием для отказа.
Исследования Mayhew, однако, сфокусированы на предпринимателях, людях, которые по определению вне поля рекрутеров. Но может быть мы получим корреляцию между академической успеваемостью в более традиционных областях?
Спецы клиентского сервиса и телефонные продажники, к примеру, имеют конкретные цели, четкий скрипт поведения, вся их работа далеко от того, чтобы считаться креативной или инновативной. Текучесть в этой сфере достигает 45 %, компании вынуждены тратиться на рекрутинг и обучение новых людей.
Cornerstone OnDemand помогает нанимать и удерживать работников. Компания проанализировала порядка 50 000 продажников, кто прошел он лайн ассессмент как часть процедур компании, аналитики Cornerstone не смогли найти корреляций там, где искали, в том числе между текучестью и количеством мест работы за последние пять лет, между текучестью и стажем на последнем месте работы.
Браузер скажет о кандидате то, что не скажет уровень учебной успеваемости
Michael Housman, аналитик Cornerstone OnDemand, упоминает, что среди набора данных есть данные о браузере, которым пользуются кандидаты в поиске работы. Housman делает вывод, что кандидаты, которые пользуют браузером, который был установлен на компьютер / ноутбук не по умолчанию, такие как Firefox или Chrome, работают в среднем на 15 % дольше, чем те, кто пользуются браузером, который стоял при покупке по умолчанию. У этих кандидатов на 19 % меньше вероятность прогулов, они лучше продают, время звонков короче, удовлетворенность их клиентов выше согласно исследованиям Cornerstone.
Как так получается, что годы упорного труда над оценками не имеют для нас никакой ценности, а информация о браузере во время короткого теста значима?
«Академическая среда – специфическая среда», - рассказывает Ласло Бок New York Times.
Люди с высокой успеваемостью заточены под конкретную среду. Одно из моих главных разочарований во время обучения был факт, что профессора спрашивают очевидные вещи.Мы же ищем людей, у которых нет очевидных ответов
Но колл центры тоже специфичная среда, как большинство работ, если не учебная успеваемость, то может быть способность кандидата к обучению релевантные навыки для работы?

четверг, 26 мая 2016 г.

Прогноз эффективных руководителей с учетом их "созревания"

В подборе/ прогнозе эффективных руководителей компании есть одна важная проблема, которую раньше как-то обходили стороной.
Представьте, что вы взяли всех руководителей компании, поделили на эффективных и остальных, взяли результаты их тестов и установили, что руководители с высокими показателями по вербальному интеллекту имеют больше шансов быть эффективными.
Хороший результат, ура!
На самом деле, не совсем ура. Потому что мы не будем теперь вычленять всех работников компании с высокими показателями по интеллекту и смотреть их на позицию руководителя.
Как минимум есть одно ограничение: если человек имеет высокий интеллект, но работает три недели в компании (или даже три месяца), то его даже в лучшей фантазии не назначат руководителем.
Следовательно нашему анализу не хватает простой вещи: мы должны назначать не просто на основе интеллекта, а с учетом дозревания до позиции руководителя.
И пример такого анализа я хочу показать

Итак

У нас есть 100 руководителей, 40 из которых признаны эффективными, а 60  среднего уровня (беру с потолка цифры просто для примера).
Прогноз эффективных руководителей с учетом их "созревания"

На картинке: по оси X показан стаж работы кандидата в руководители: от момента трудоустройства в компании до момента назначения на должность.
Красным обозначена вероятность попадания в эффективные руководители, черным - в остальные.
Обратите внимание, что в крайней правой точке черная кривая достигает значения 60, а красная - 40. Это и есть наше распределение на эффективных и неэффективных, т.е. у нас некий средний кандидат в итоге имеет вероятность 40 % стать успешным.
ИЛИ, по другому: стать эффективным руководителем шансы в 1,5 раза меньше, чем другим (60/40 = 1,5). Это ключевой момент для понимания.
Теперь давайте смоделируем ситуацию для кандидата с высоким и низким интеллектом.


Я думаю, что здесь совершенно очевидно понятно, на какой диаграмме кандидат с высоким, на какой - с низким интеллектом. Заметно, что кандидаты с низким интеллектом почти не имеют шансов, а вот у кандидатов с высоким интеллектом картина интересная: они эффективней, если их брать в руководители раньше, а с момента, когда стаж превышает 100 с небольшим отрезков времени, интеллект как конкурентное преимущество исчерпывает себя. Видимо, начинают сказываться связи в компании, опыт и т.п...
Или вот еще более интересная зависимость

Слева - вероятность стать эффективным / неэффективным при низких показателях по качеству N личностного опросника.
И все логично, а справа картина вероятностей в ситуации, когда у кандидата высокие показатели. получается, что кандидат вырывает себе ничью (потому что в итоге у него шансы 50/50 только на стаже в 150 временных отрезков.
И обратите внимание: у нас итоговая вероятность в лучшем случае составляет 50 / 50. Что это значит? Это значит, что мы улучшаем прогноз только за 10 %. Т.е. у нас базовое распределение лучших и остальных 40 на 60, а мы в случае, например, кандидата с высокими показателями по интеллекту и личностному качеству получаем вот такую картинку
Прогноз эффективных руководителей с учетом их "созревания"

Т.е. при любом стаже вероятность попадания в эффективные и неэффективные руководители у нас 50/50. Кому то это может показаться плохой точностью так и есть, но помните, что мы в любом случае улучшаем модель, поскольку у нас при нашей существующей политике отбора руководителей точность равна 40 / 60, и мы увеличиваем точность на 10 %.

Понравился пост?

если Вы захотите выразить мне благодарность за интересный пост, вы можете перевести небольшую сумму мне на Яндекс кошелек (кликните по кнопке Перевести) 
или сделать перевод на карту Сбербанка,
Номер карты 676 280 38 921 538 46 57 - укажите "пост в блоге". 
Или просто покликайте на директ рекламу ниже на странице - у вас это отнимет несколько секунд, а мне принесет немного денег. 
спасибо!

вторник, 24 мая 2016 г.

Карьерный рост / карьерное планирование в компании на основе машинного обучения



Очень много работы, поэтому штрихами обозначу пост.
Но эту задачу я еще ни разу не показывал, думаю, будет интересно на нее посмотреть.

Итак, 

Клиент - крупный ритейлер, массовый подбор.
задача:
  • сделать прогноз, кто из вновь принятых скорее станет менеджером (руководителем + 1 и + 2 уровня).
  • Понять, кого стоит готовить в кадровый резерв / кого не стоит.
Для этого проводим ретроспективный анализ по имеющимся данным.

Зависимость результативности и стажа работы в компании

Накопал интересную зависимость: взяли уже назначенных руководителей, посмотрели их эффективность (поделили на звезд и не звезд) и в качестве предиктора взяли стаж работы в компании. Выяснилось, что "звезды" идут к позиции руководителя дольше, чем остальные.
Средний срок от приема на работу до назначения на позицию руководителя для звезда 27 месяцев, для остальных - 18.

И визуализация
Карьерный рост / карьерное планирование в компании на основе машинного обучения
Как читать такой тип диаграммы - Анализ и визуализация дожития: чем HR похож на медиков.

  • По оси X - число месяцев стажа
  • По оси Y - вероятность, что работник Не станет руководителем.

Пунктиром обозначен 95 % доверительный интервал. Т.е. через 36 месяцев вероятность, что работник станет руководителем 70 % примерно.
И кроме того, мы выяснили, что на основе входных тестов можно предсказывать скорость карьерного продвижения.
На картинке ниже:
По шкале X – показатели шкалы, каждый график обозначает состояние с назначением через определенный промежуток стажа (18 месяцев, 27 и 36), по оси Y – вероятность, что назначать начальником (точнее, вероятность, что не будешь назначен, т.е. точка напротив вероятности 0,25 на графике 36 обозначает, что вероятность назначения руководителем составляет к третьему году работы 75 % - мы говорим не про вообще всех работников, а аудиторию руководителей)
Заметно, что кандидаты с более высокими показатели по шкале быстрее становятся руководителями?


Карьерный рост / карьерное планирование в компании на основе машинного обучения
Связь заметна. Точность модели при этом (см. ниже) - 58 % (AUC), но
Карьерный рост / карьерное планирование в компании на основе машинного обучения
Мы, тем не менее, можем сделать вывод:
личные качества кандидата влияют на его карьерный рост, и мы это можем использовать при формировании кадрового резерва и карьерном планировании.

Чего нет

Я показал связь между личностными качествами и карьерным ростом, но не показал, с какой вероятностью кандидат с этими качествами попадает в звезды и наоборот. Заметили, что у нас а) есть качества, которые обеспечивают более быстрый карьерный рост и б) более быстрый карьерный рост скорее связан не со звездностью.
Ту би континьед.....


пятница, 20 мая 2016 г.

Какие книги по военной стратегии наиболее популярны

Провел опрос в социальных сетях, какие книги по военной стратегии наиболее популярны.
Список взял из своего же поста Книги по военной стратегии.
Результаты в таблице (во второй колонке указано количество человек, которые выбрали тот или иной вариант.

Сунь-Цзы Искусство войны 
25
Макиавелли О военном искусстве, Государь 
18
Суворов Наука побеждать 
8
Карл Клаузевиц О войне 
7
Уинстон Черчилль История Второй мировая войны
6
Манштейн Утерянные победы 
4
Книги Эдварда Люттвака (Стратегия византийской империи, Стратегия. Логика войны и мира)
3
Лиделл Гарт Стратегия непрямых действий 
2
Стратегикон Маврикия (византийский полководец) 
1
Эрих Людендорф Тотальная война
0

Книги по военной стратегии Сунь Цзы и Маккиавели в большом отрыве. Это, положа руку на сердце, было понятно до голосования, но я лично надеялся, что современные авторы - Эдвард Люттвак и Лиделл Гарт - более известны. Тем более, что они вполне в русле философии Сунь Цзы - стратегия непрямых действий и Гарта и Стратегия Византийской империи у Люттвака
Посмотрим, что будет через год. 
И добавляйте свой список книг по военной стратегии - появится возможность включить ваши книги в список голосования

среда, 18 мая 2016 г.

Анализ данных и сексизм

Недавно в фейсбуке, Эдуард Бабушкин предложил решить кейс, выдал данные по опросу и поставил задачу:
«Жду от вас:
1) любое решение в области регрессии (например, что влияет на уровень ЗП)
2) любую задачу по классификации
3) любое решение в анализе дожития с помощью регрессии Кокса
Обратите внимание 1) в конце уже сделал за вас много работы: посчитал стаж и выставил event
2) ЗП дается в национальной валюте
Работаем по боевому
Лайкните, если задача понятна»
 (с)
Я лайкнул и вот я здесь, а всё потому, что одним из условий была публикация результатов решения в блоге.
Пост получился сумбурным, поэтому всем, кому не особо интересен анализ данных в R, могут бегло посмотреть картинки и выводы, которые могут быть оспорены в комментариях.

воскресенье, 15 мая 2016 г.

Каких кандидатов чаще обманывает работодатель с зарплатой

Снова результаты нашего исследования Ключевые факторы текучести персонала (ссылка дана для того, чтобы вы прошли и поучаствовали в опросе). Напомню, что у помимо опроса, участники проходили тесты Лаборатории Гуманитарные Технологии. Тест КТО
  1. Общий балл;
  2. Вербальный интеллект;
  3. Числовой интеллект;
  4. Эрудиция;
  5. Обработка информации.
И Большая пятерка
  1. Интроверсия - экстраверсия;                                                                   
  2. Независимость - согласие;                                                                     
  3. Импульсивность - самоконтроль;                                                                
  4. Тревожность- стабильность;                                                                    
  5. Консерватизм- новаторство.
Я использовал тесты, чтобы спрогнозировать ответ респондента на вопрос "Отличались ли договорённости по зарплате на собеседовании при приеме на работу и при первой выплате":
  • нет, не отличались               441
  • да, зарплата оказалась меньше     57
Число напротив варианта - количество респондентов, выбравших тот или иной вариант.
Не любителям математики можно сразу в самый конец поста - к содержательным результатам. Любителям математики - про качество модели.

Кривая ROC

Каких кандидатов чаще обманывает работодатель с зарплатой

Точность прогноза

Один из вариантов выбора

False
True
All
0
122
10
132
1
7
11
18
All
129
21
150

Не самая лучшая кривая, но не забывайте, что базовая точность у нас 12 %, а мы повышаем ее до 50 %.
И про переменные
Каких кандидатов чаще обманывает работодатель с зарплатой

На картинке самые значимые переменные: 
  • Общий балл по интеллекту;
  • Независимость согласие
Зависимость забавная: более независимых чаще обманывают с зарплатой, точнее, и мне кажется, здесь собака порыта, более независимые чаще обманываются, а еще точнее, чаще выбирают вариант "да, зарплата оказалась меньше"
С интеллектом еще забавней: чаще вариант "да, зарплата оказалась меньше" выбирают респонденты с крайними значениями по интеллекту: либо очень низкими показателями по шкале Общий балл, либо очень высокими. Поэтому зависимость здесь нелинейная.
Хочу услышать ваши интерпретации. 

Понравился пост?

если Вы захотите выразить мне благодарность за интересный пост, вы можете перевести небольшую сумму мне на Яндекс кошелек (кликните по кнопке Перевести) 
или сделать перевод на карту Сбербанка,
Номер карты 676 280 38 921 538 46 57 - укажите "Каких кандидатов чаще обманывает работодатель с зарплатой  ". 
Или просто покликайте на директ рекламу ниже на странице - у вас это отнимет несколько секунд, а мне принесет немного денег. 
спасибо!


среда, 11 мая 2016 г.

Универсальный драйвер текучести персонала

Очередной результат нашего исследования драйверов текучести персонала (пройдем по ссылке и поучаствуем в опросе, если вы еще не). Напомню, что прошедшие опрос могут пройти бонусом батарею тестов Лаборатории Гуманитарные Технологии.
Напомню, что мы использовали для тестирования тесты КТО
  • Общий балл;
  • Вербальный интеллект;
  • Числовой интеллект;
  • Эрудиция;
  • Обработка информации.
И Большая пятерка
  • Интроверсия - экстраверсия;                                                                   
  • Независимость - согласие;                                                                     
  • Импульсивность - самоконтроль;                                                                
  • Тревожность- стабильность;                                                                    
  • Консерватизм- новаторство.
Я "сметчил" результаты тестов и результаты опроса и построил несколько предиктивных моделей на основе тестов.
Данный пост в продолжение поста Прогнозируем психологическую совместимость руководитель подчиненный. Мы выяснили, что можем прогнозировать неприятие инициатив подчиненного руководителем на основе психологических качеств подчиненного.
Сейчас я беру в качестве зависимой переменной стаж совместной работы руководитель - подчиненный. Обратите внимание: не общий стаж работы в компании, а стаж работы со своим последним руководителем (очевидно, что руководители могут меняться на работе).
Итого я попытался предсказать стаж совместной работы руководитель - подчиненный на основе тестов. Всего смог набрать 314 респондентов, кто прошел тестирование, а также сам ушел от руководителя или еще работает с ним (я беру только добровольную текучесть, когда респондент указал, что сам ушел из компании, думаю, понятно, почему).
Модель получилась слабая, я нашел только один драйвер текучести в отношениях
Универсальный драйвер текучести персонала

Три диаграммы, каждая обозначает ситуации спустя определенный срок совместной работы - 6, 12, 24 месяца

  • по оси X - шкала интроверсии - экстраверсии 
  • по оси Y - вероятность выживаемости: вероятность, что на этом сроке подчиненный все еще будет работать с руководителем.

То, что красные треугольники опускаются вниз, говорит, что вероятность выживания снижается со сроком совместной работы.
Так в первые полгода риск расставания с руководителем не превышает 25 % (риск = 1 - вероятность выживания). Через 24 месяца у нас все меньше шансов (чаще - менее 50 %) работать вместе.
Заметно, что экстраверты имеют больше рисков расставаться с руководителем (для лбителей классической статистики p value 0, 013.
Интересно, что интроверсия - экстраверсия именно отношенческий драйвер: его значимость как фактора становится меньше, если мы в качестве зависимой переменной возьмем общий стаж работы в компании. Т.е. экстраверсия драйвит риски расставания с человеком, а не, например, условиями работы в компании.
Я посмотрел связь с гендерным сочетанием пары руководитель - подчиненный - связи нет. Хотелось бы посмотреть в разрезе позиций / отраслей, но пока у нас мало данных для этого.
и напоследок вопрос / размышление: является ли это драйвером расставания в профессиональных отношениях или, вообще, любых отношениях людей? Тогда мы могли бы использовать наши результаты в прогнозе семейных отношений (намекаю на eHarmony).
И к данным по подчиненным стоило бы добавить результаты по руководителям: что нам даст сочетание, когда руководитель и подчиненный - оба выраженные экстраверты?
И можно ли сказать, что от экстравертов руководителей подчиненные уходят быстрее?

вторник, 10 мая 2016 г.

Соотношение штабного и линейного в менеджменте

Брусилов (надеюсь, не стоит напоминать, кто это) в своих Воспоминаниях рассказывает про спор в поезде саперного капитана, который в состоянии подпития материл штабных офицеров. Аргументы сапера были ясные и простые: Скобелев (признанный не только русскими, но иностранными военными аналитиками, например фон Меллентин наряду с Суворовым упоминает Скобелева) закончил Академию генштаба только потому, что надо бы. С другой стороны, Куропаткин был до мозга костей штабистом (и одно время жаже был начальником штаба у Скобелева), был образованным генералом, но просрал русско-японскую войну.
Алексей Алексеевич защищает штабных, упоминая, что штабные офицеры получали блестящее образование, однако делает оговорку, что главная проблема штабных офицеров - слишком быстрая смена должностей. У меня эта оговорка не вызывает сочувствия, согласны?
Обратите внимание, я не пишу про советскую историю. Хотя если посмотреть после 17-го года, то многих ли начальников штабов вы помните?
Мы помним полководцев, да. Многие помнят Василевского, но имхо потому, что он отличился как полководец - провел блестящую операцию против Японии, был представителем Ставки на фронтах (хотя я ценю Василевского именно за штабную работу). Кто-то еще помнит Шапошникова Бориса Михайловича - чаще в связи с работами Виктора Суворова.
Выходит, штабная работа не так уж важна, носит обслуживающий характер, а штабной опыт дает мало полководцу?
С таким подходом согласен ... Лев Николаевич Толстой. Помните его рассуждения в Войне и Мире про планирование сражений немцами? Для Толстого все это планирование кажется неважным, гораздо важнее поведение солдата на поле боя, когда он - солдат - оторван от полководца, когда его поведением нельзя управлять, когда солдат предоставлен сам себе, и важен дух этого самого солдата. А все эти планы немецкие - бумагомарательство и т.п... Я впервые прочел Войну и Мир в семнадцать лет, и мне взгляд Толстого импонировал.
Потом я повзрослел и узнал, что "бумагомаратель" Клаузевиц один из самых почитаемых военных стратегов в Мире . Он, кстати, служил в русской армии в 1812 года и имел о русской армии невысокое мнение.
И самый лучший полководец первой мировой войны Людендорф (то, что лучший, не я придумал, а сказал Лиддел Гарт) был штабистом. Т.е. битву под Танненбергом он выиграл в должности начальника штаба. А Гиндендург был при нем полководцем. Именно был! Потому что сначала немцы искали начальника штаба, а потом уже под него согласовывали полководца. И таких примеров, когда штабные офицеры немецкого генерального штаба становились полководцами - море.
Тогда может быть проблема не в музыке как таковой, а что-то не так в консерватории?
И если у кого-то не получается сделать штаб школой развития, то может стоит что-то в штабе поменять? Ведь смогли же немцы сделать это Генеральный штаб как учебный центр (или еще раз о культуре обучения)

пятница, 6 мая 2016 г.

Прогнозируем психологическую совместимость руководитель подчиненный

На выходные набрал новых результатов нашего опроса ключевых факторов текучести персонала (ссылка дана того, чтобы вы прошли и поучаствовали в опросе). Данные опроса я "сметчил" (термин, знакомый всем, кто работает с данными) с результатами тестов Лаборатории Гуманитарные Технологии.

Собственно к задаче.

У нас в исследовании есть такой вопрос "Выходили (выходите) ли Вы со своими инициативами на руководителя" и четыре варианта ответов, среди которых:

  1. Да, и как минимум некоторые были приняты               
  2. Да, но все было отвергнуто

Я этот вопрос воспринимаю, как вопрос психологической совместимости руководитель - подчиненный. Любители попинать могут это сделать, я не буду сейчас погружаться в обоснование, почему так, моя задача состоит в том, чтобы спрогнозировать по результатам тестов ответ респондента - будут ли его инициативы приняты руководителем или нет. И эта аналитика имеет практический аспект: какой смысл нам принимать на работу любого крутого чувака, если его крутость будет отвергнута руководителем. У нас, к сожалению, нет данных по руководителям, это значительно улучшило бы аналитику, но что есть, то есть.

Итак

У нас в исследовании 161 респондент указали, что их инициативы принимались руководителем, 42 респондента указали, что все их инициативы отвергались руководителем. В этом месте сразу хочу показать кривую обучения алгоритма, которая показывает точность модели в зависимости от размера трейн и тест сети дает нам понимание, что для нашей выборки увеличение размера выборки не даст увеличения точности.
Прогнозируем психологическую совместимость руководитель подчиненный
Модель
Напомню, что мы использовали для тестирования тесты КТО

  • Общий балл;
  • Вербальный интеллект;
  • Числовой интеллект;
  • Эрудиция;
  • Обработка информации.

И Большая пятерка

  • Интроверсия - экстраверсия;                                                                   
  • Независимость - согласие;                                                                     
  • Импульсивность - самоконтроль;                                                                
  • Тревожность- стабильность;                                                                    
  • Консерватизм- новаторство.

Качество модели

Я работал с градиентным бустингом.
Precision recall curve для тестовых данных
Прогнозируем психологическую совместимость руководитель подчиненный
Confusion matrix для тестовых данных


col_0
False
True
All
0
48
1
49
1
3
9
12
All
51
10
61
Под "1" здесь понимается не принятие руководителем инициатив подчиненного, "0" - принятие.
Согласитесь, неплохая точность. 
ROC curve
Прогнозируем психологическую совместимость руководитель подчиненный
И для тех, кому интересна в первую очередь содержательная интерпретация, сообщу, что высокую прогностическую ценность имеют шкалы Интроверсия - Экстраверсия и Независимость - Согласие
Картинка, поясняющая связь между шкалами теста и ответом опроса
Прогнозируем психологическую совместимость руководитель подчиненный



  • По оси X - шкала Независимости Согласия;
  • Ось Y - шкала Интроверсии - Экстраверсии

Эти шкалы - не единственные, участвующие в прогнозе, но эти - одни из самых сильных.
Красиво?

Понравился пост?

если Вы захотите выразить мне благодарность за интересный пост, вы можете перевести небольшую сумму мне на Яндекс кошелек (кликните по кнопке Перевести) 
или сделать перевод на карту Сбербанка,
Номер карты 676 280 38 921 538 46 57 - укажите "Технологические решения в области people analytics ". 
Или просто покликайте на директ рекламу ниже на странице - у вас это отнимет несколько секунд, а мне принесет немного денег. 
спасибо!

вторник, 3 мая 2016 г.

Технологические решения в области people analytics - 2016



25-26 апреля в Лондоне прошла конференция по hr-аналитике. Про результаты конференции можно почитать отчет одного из организаторов - Давида Грина.
Я хотел бы дать обзор технологических решений в области people analytics:
Saberr – программа, которая помогает строить команды, подбирать людей в команды;
Вот пример решения. Задача: в проектную команду нужно подобрать менеджера, есть два кандидата. Результаты анализа кандидатов на скрине
Технологические решения в области people analytics - 2016
One Model – облачная платформа для сбора, хранения и визуализации данных. Это не про предиктивную аналитику, а про отчетность и дашборды, но позволяет работать с данными
Launchpad Recruits – Платформа видеоинтервью следующего поколения, позволяющая принимать решения на основе данных.
Workometry – программа победитель премии Emerging Game-Changer Award, анализирует обратную связь работников - анализ текстов работников. Программа очень перспективная. Фраза с сайта: Understand your Employees like you Understand your Customers

И на закуску

Мне показалась очень полезной картинка - схема people analytics в компании: от запроса бизнеса до изменений. Обратите внимание, что гипотезы - обязательный этап.
И еще есть сторителлинг. Это совсем про другое, что у нас в России представляют как сторителлинг
Технологические решения в области people analytics


воскресенье, 1 мая 2016 г.

Почему HR должны отказаться от профиля успешности



Пост методологический.
Я ранее уже предсказывал смерть компетентностному подходу. Теперь предсказываю смерть профилю успешности, вместе с моделью компетенций. Это сюда же. Но если я модели компетенций предсказывал смерть по той простой причине, что ассессмент центры при свой дороговизне дают ничего с т.з. прогнозов эффективности, то профиль успешности в самой своей методологии некорректен.
И я вам попробую показать это. Попробую, потому что для понимания нужно немного знать статистику.

Про профиль успешности

вот два примера профиля успешности. Скачал их тупо по запросу в Гугле. Первый профиль успешности на основе модели компетенций
Почему HR должны отказаться от профиля успешности
Второй профиль успешности - на основе тестов
Почему HR должны отказаться от профиля успешности
Знакомы вам эти картинки? Пытались создавать что-то подобное?
Логика простая: набрать успешных руководителей и посчитать средние значения (или медиану) по каждой шкале, а потом всех входящих мерить на соответствие. А если чего из качеств профиля успешности не достает, то это зона развития,с этим надо работать. Или просто отклонять человека.

Как на самом деле


Это базовая картинка про анти - профиль успешности.
На диаграмме схема принятия решения.

  • Оси X, Y - некие качества. 
  • Точки - работники
  • Синие точки - успешные работники
  • Красные - не очень.
  • Голубая зона на диаграмме - % успешных выше, чем красных при данных уровнях развития качеств
  • Красная зона - не очень успешные превышают в % успешных 
  • Наша задача - отобрать синих на основе качеств. По сути - отобрать тех, кто попадает в голубую зону. 
  • Мы могли бы брать всех, у кого качество X выше примерно 0,5 и ниже 1,1 (опытные аналитики уже поняли, что цифры - это Z баллы), но тогда будем отсекать всех, у кого низкие показатели по шкале Y

__________________________________________________________
На этом все, читайте нас в фейсбукетелеграмме и вконтакте

И бонусом мои возражения против против на YouTube