Блог про HR-аналитику: Руководство для начинающих по машинному обучению для HR-практиков

четверг, 16 июля 2020 г.

Руководство для начинающих по машинному обучению для HR-практиков

Перевод статьи A Beginner’s Guide to Machine Learning for HR Practitioners нашего проекта переводы статей по hr-аналитике на английском. Автор Adam McKinnon в легкой и доступной форме рассказывает, что такое машинное обучение.
Рекомендую в качестве дополнения видео Что такое машинное обучение machine learning в HR на примере создания модели отбора кандидатов

Перевод выполнила Ирина Самойленко -- Сhief HR производстенной компании г. Днепр, Украина (профиль на LinkedIn)

Итак,

Руководство для начинающих по машинному обучению для HR-практиков

Когда вы слышите Искусственный интеллект (ИИ), первое, что приходит на ум - это роботы; в частности, фильм Стивена Спилберга, под названием "Искусственный интеллект", в котором создан ребенок-робот, который может любить и вести себя, как настоящий человек. Эта идея кажется ближе к мечте, чем к реальности. Но правда в том, что ИИ более вездесущ, чем мы могли бы подумать. Он варьируется от самостоятельного вождения автомобилей, рекомендаций фильмов на Netflix, обнаружения спама в электронной почте до голосовых помощников, таких как Сири от Apple. Дело в том, что ИИ уже представлен во многих компаниях и различных отраслях, как показано на рисунке ниже.

Где в компаниях используются проекты с ИИ. Использование ИИ на предприятиях, Magoulas R. и Swoyer S. (2020). Обратите внимание на низкий уровень применения в HR.

Тем не менее, факты свидетельствуют о том, что HR по-прежнему не может воспользоваться множеством возможностей, связанных с ИИ. Отчасти, что может потребоваться для ускорения внедрения ИИ, так это образовательный контент, предназначенный для HR-профессионалов, а не для специалистов по данным. Таким образом, мы предлагаем это краткое руководство по машинному обучению (МО), важному подмножеству ИИ, с намерением демистифицировать МО и сделать его осязаемым.

Что такое ИИ?

Давайте начнем с определения. Искусственный Интеллект - это широкая область компьютерных наук, сфокусированная на создании машин, которые могут вести себя разумно - сродни людям. Кроме того, мы можем различить 1. Обобщенный ИИ и 2. Определённый ИИ. Концепция Обобщенного ИИ заключается в разработке машин, которые могут выполнять несколько задач, как робот-ребенок у Спилберга. Эта область еще в зачаточном состоянии.

Более подходящим для HR является Определенный ИИ, который относится к интеллектуальным машинам, использующимся для выполнения только одной конкретной задачи, но той, которую он делает лучше, чем мог бы человек (например, быстрее, точнее или объективнее). Например, приложение, которое прочитывает сотни резюме за секунды и определяет оптимальных кандидатов на собеседование, тем самым предоставляя HR-специалистам больше времени для выполнения задач, которые люди выполняют лучше машин (например, налаживание взаимопонимания, эмпатии, творчества, критического мышления и т.д.)

Что такое машинное обучение?

Но как можно запрограммировать машину для обработки информации (то есть данных) интеллектуальным способом? Ответом на это является машинное обучение (МО). МО - это подмножество Определенного ИИ, которое происходит из сочетания статистики и информатики. Оно относится к процессу обучения компьютеров выполнению задачи вместо того, чтобы следовать пошаговым инструкциям. Как правило, это выполняется итеративно дэйта-сайнтистами (специалистами по данным), которые инструктируют компьютер о правильности или неправильности его решений. В зависимости от результата, компьютер приспосабливается к тому, как принимать решения в будущем, другими словами, «он учится».

Руководство для начинающих по машинному обучению для HR-практиков

Отношения между ИИ, МО и тремя основными типами МО.

Когда дело доходит до MО, есть три основных типа:

Обучение с подкреплением - Reinforcement Learning
Неконтролируемое обучение
Контролируемое обучение - Supervised Learning

Что такое обучение с подкреплением (Reinforcement Learning)?

Обучение с подкреплением, вероятно, лучше всего узнаваемо по компьютеру IBM Deep Blue, «роботу», который научился играть в шахматы и побеждать чемпиона мира.

Обучение с подкреплением - это метод, который позволяет алгоритму учиться методом проб и ошибок, используя обратную связь от своих собственных действий и опыта. Подобно Павлову и его собаке, обучение с подкреплением включает вознаграждаемые решения, которые ведут к успеху, и наказуемые решения, которые ведут к чему-то другому, кроме успеха, что в конечном итоге в процессе делает алгоритм все более интеллектуальным.

Примеры обучения с подкреплением, применяемого в HR, немного скудны, хотя наиболее распространены в таких областях, как образование (т.е. применение контента на основе успеваемости учащегося), финансы и инвестиции (т.е. расширенное прогнозирование), операции с цепочками поставок (т.е. роботы, выполняющие заказы на складе), оптимизация транспортных потоков и здравоохранение (т.е. точная классификация изображений биопсии).

Что такое контролируемое обучение (обучение с учителем Supervised Learning )?

Наиболее распространенными формами МО в разных отраслях, в частности в сфере HR, являются контролируемое обучение, за которым следует неконтролируемое обучение.

В контролируемом обучении мы пытаемся предсказать результат, например, уйдет ли сотрудник из компании, какой риск получения травмы или какова идеальная начальная зарплата для нового сотрудника.

Чтобы делать предсказания, нам нужны разные входные переменные (т.е. переменные, называемые «чертами» дэйта-сайтистами). Наши входные функции ограничены только нашим воображением (то есть тем, что, по нашему мнению, будет важным) и тем, какиe данные мы можем получить практически или какие данные мы можем создать (например, зная, где кто-то работает и где он живет, мы можем создать переменную, ориентированную на то, как сотрудники добираются на работу)

Пример: контролируемое обучение, информирующее о текучести персонала

Давайте рассмотрим более подробный пример контролируемого обучения - предсказания, кто покинет организацию. Представьте, что каждый пятый новичок покидает организацию в течение первых 12 месяцев пребывания в должности. Чтобы предотвратить такую текучесть, мы могли бы создать контролируемую модель обучения, которая прогнозирует вероятность ухода новых сотрудников, чтобы наши HR и менеджеры могли вовремя вмешаться.

В этом примере прогнозируемым исходом для модели является риск текучести, а черты, используемые для прогнозирования текучести, могут включать в себя демографические и трудовые характеристики сотрудников (например, возраст, уровень образования, уровень должности, оплата труда по отношению к рынку, месяц трудоустройства, наличие планов развития и тд.).

Предполагая, что такая модель была бы очень точной, она позволила бы нам понять текучесть среди наших новичков с трех сторон.

Во-первых, какие факторы наиболее влияют на прогнозирование текучки среди наших сотрудников. Пример такой модели представлен на рисунке ниже, который иллюстрирует, предотвращает ли черта текучку (зеленые линии) или способствует текучести (красные линии), а также относительную важность каждой черты в прогнозировании текучести (т.е. более длинные линии обозначают большую важность).
Во-вторых, модель также оценивает вероятность того, что каждый новый сотрудник покинет компанию, что позволяет целенаправленное вмешательство (т.е. риск того, что, например, Адам уйдет в первые 12 месяцев).
В-третьих, модель определяет черты, предотвращающие или способствующие риску текучести для каждого сотрудника. Этот индивидуальный результат может позволить HR-ам предпринимать реформирующие и индивидуальные действия, независимо от того, знают ли они лично каждого сотрудника.

Пример модели, которая предсказывает риск текучести кадров. Диаграмма описывает относительную важность и прямое влияние черт модели. Красные линии представляют черты, которые способствуют риску текучести, тогда как зеленые линии представляют элементы, предотвращающие риск текучести.

Модель контролируемого обучения, используемая для прогнозирования текучести кадров среди новичков, потенциально может снизить значительные затраты, в том числе финансовые (например, на увольнение, размещение вакансии, подбор, обучение и замещение), репутационные (например, подрыв EVP и / или снижение привлекательности компании для кандидатов) и связанные с производительностью (например, в среднем организации тратят от четырех недель до трех месяцев на обучение новых сотрудников). Некоторые из этих затрат можно легко посчитать, таким образом мы можем определить сбережения компании на основе предотвращенной текучести (например, предотвращение 2 из 10 увольнений экономит ххх$).

Что такое неконтролируемое обучение (Unsupervised Learning)?

В отличие от контролируемого обучения, где мы пытаемся предсказать результат, неконтролируемое обучение одновременно анализирует множество переменных, чтобы выявить сходства, закономерности или зависимости в данных. Неконтролируемое обучение - это больше понимание того, что содержится в данных. Два наиболее распространенных вида использования неконтролируемого обучения основаны на:

Кластеризации: автоматическом разбиении набора данных на группы на основе сходства анализируемых признаков. Классически, применяется к потребителям, но в равной степени относится и к организациям, благодаря чему мы понимаем сегменты наших сотрудников (то есть кластеры) и определяем, работают ли наши HR-политики на эти сегменты.
Анализе ассоциаций: идентифицирование наборов переменных, которые часто встречаются вместе в вашей базе данных. Например, выявление моделей травматизма среди работников конкретных подразделений.

Пример: неконтролируемое обучение, информирующее о текучести сотрудников

Кластерный анализ, самая известная форма неконтролируемого обучения, также может помочь нам лучше понять выгорание сотрудников. Этот подход может помочь сгруппировать сотрудников на основе сходных черт (например, местоположение, срок работы, национальность, уровень образования, возраст, уровень производительности и т.д.)

На приведенном ниже рисунке показаны результаты анализа такой черты, как демография работников. Множественные демографические характеристики сначала сводятся к двум измерениям с использованием метода, называемого многообразного обучения (еще один неконтролируемый метод), и эти два новых измерения затем группируются с использованием метода, называемого T-SNE. На рисунке ниже показано, как сотрудники могут быть сгруппированы, в данном случае, в двенадцать кластеров, исходя из их демографических характеристик.

Пример результатов кластерного анализа применительно к сотрудникам

После группировки в кластеры следующим шагом является определение риска текучки для каждой группы. Кроме того, интересно определить, есть ли какие-то общие факторы риска, практически свидетельствующие о том, что сотрудники в кластере ведут себя на работе схожим образом.

Это последнее понимание имеет большое практическое значение, поскольку оно может помочь нам адаптировать действия, нацеленные на конкретные кластеры сотрудников, обеспечивая тем самым максимальное влияние (т.е. удерживая сотрудников и снижая затраты на текучесть) и окупая наши инвестиции (т.е. на каждый потраченный нами доллар мы обеспечиваем ххх долларов экономии от снижения текучести).

Вывод

Мы начали открывать черный ящик, который называется "Искусственный интеллект", предоставляя простой обзор машинного обучения. Мы рассмотрели три основных типа МО - обучение с подкреплением, контролируемое и неконтролируемое - и рассмотрели некоторые простые применения каждого из них, где это возможно, связанные с HR. Мы искренне верим, что благодаря большему знанию того, что возможно с МО, HRBP и лица, принимающие решения, будут как ожидать большего, так и готовы делать больше в этой технологической области. В следующей части мы расскажем о пошаговом процессе выполнения контролируемого MО - о том, как сделать переговоры с командами People Analytics более осязаемыми и менее абстрактными.

Блог про HR-аналитику

.

Сделать репост в соц сети!

четверг, 16 июля 2020 г.

Руководство для начинающих по машинному обучению для HR-практиков