.

Сделать репост в соц сети!

понедельник, 7 октября 2019 г.

Прогноз уровня добровольной текучести в компании

Эта статья в развитие темы Хватит предсказывать увольнение работника. Если в той статье я говорю о том, что не имеет смысла прогнозировать увольнение конкретного работника, в этой я хочу показать пример того, чем, на мой взгляд, имеет смысл заниматься.
Также этот пост можно воспринимать как коммерческое предложение.
На диаграмме ниже - количество уволившихся по собственному желанию в разрезе по месяцам.

Мы можем прогнозировать это число. И показать на вашем дашборде.
Это может быть полезно для планирования нагрузки рекрутеров. А также для понимания факторов, которые влияют на нашу текучесть. Если мы фиксируем текущую текучесть, то можем показать прогнозную текучесть.
Не удивляйтесь тому, что на диаграмме 2013-2017 годы - других данных у меня нет.

Как мы прогнозируем

Если посмотреть разброс текучести по месяцам, то он за эти годы дает такую картину.
Прогноз уровня добровольной текучести в компании




Заметно различие числа увольняющихся в разрезе по месяцам. Чемпионы оттока - сентябрь и июль. Но нам это приятно, потому что на основе этой информации мы можем прогнозировать будущую текучесть.

Найм

Поскольку мы прогнозируем не просто % текучести, а число уволившихся, то очевидно, что размер найма также должен влиять на будущий отток. Т.е.
Для любителей покопаться в основаниях сообщаю инфо: самое сильное влияние на будущий отток оказывает найм с лагом 2 месяца. Т.е. на отток в сентябре влияет размер найма в июле. Понятно, что это не общий закон, это данные конкретно взятой компании, у вас могут быть свои законы, тем не менее, было бы интересно понять, какой механизм в основе этого влияния. Но явно не потому, что через два месяца новички побежали.

Другие факторы

у меня в наличии были только эти факторы, но ничто нам не мешает включить любые другие переменные, включая внешнеэкономические типа % безработицы в России и так далее.

Качество модели



Если вы будете делать у себя прогноз уровня добровольной текучести, то вы должны отдавать отчет в том, что прогноз не может быть идеальным, и вы должны уметь оценивать качество прогноза - не аналитики, а вы сами. Чтобы аналитики вас не смогли обмануть.
Проверка такая: вы создаете модель, отрезав несколько последних месяцев, в моем случае я отрезал четыре последних месяца. Потом делал прогноз на них. На диаграмме красная линия - это прогноз. Обратите внимание, что хуже всего прогноз у нас по августу 2017 года. Это нихт гут, но в оправдание модели предлагаю посмотреть прошлые периоды - после роста текучести в июле следует падение текучести в августе, поэтому можно сказать, что в августе оказал влияние какой-то неучтенный фактор. Я выше писал о том, что такие модели позволяют понимать внутренние процессы в компании. Это как раз такой случай, когда что-то идет в другой логике, а для нас это повод для понимания и рефлексии, что происходит.
На диаграмме заметно, что на фоне разброса текучести за весь период красная линия вроде бы не так сильно отстает от реальных данных, но нам нужно не вроде бы, а четкий ответ: можем ли мы сказать, что наш прогноз выше плинтуса.
Методика такова.

  1. Мы должны посчитать сумму или среднее значение абсолютных значений отклонений прогнозных значений от реальных (400 и 390, 445 и 363, 385 и 386, 386 и 365). Пусть это будет некое число X;
  2. Далее мы считаем сумму или среднее разницы абсолютных значений между значением текучести текущего месяца с текучестью предыдущего (400 и 351, 445 и 400 и так далее). Это и есть наш "плинтус". Т.е. самый простой элементарный прогноз это когда мы предполагаем, что в следующем месяце у нас уйдет столько же, сколько в этом. Пусть это будет число Y;
  3. Это такой наивный подход, но он позволяет оценить качество модели. Если у нас первое число - X - будет больше, чем Y - т.е. если разброс между реальными и прогнозными значениями будет больше, чем разница между текущим и предыдущим значением, то какой прок в этой модели? 
  4. В нашем случае число X или среднее значение отклонения прогноза от факта составляет 28, 25 (т.е. мы в среднем ошибаемся на такое число увольняющихся),  а число Y - средняя разница между числом увольнением текущего и прошлого месяца - 38, 75 - мы делаем вывод, что наша модель выше плинтуса и применима на практике. 

Предостережение

Если вы закажете у меня создание такой модели и визуализации ее на дашборде, то сразу давайте договоримся:

  1. горизонт прогноза не должен превышать 3 месяца, дальше вероятная ошибка / разброс значений будет уже неприличным;
  2. данных должно быть не менее чем за 5 лет;
  3. каждый месяц надо будет пересчитывать прогноз - этому можно научить.

Пишите edvb@yandex.ru
Посмотрите также вот на такую модель - ее тоже можно реализовать Power BI: дашборд "Скорость / время / сроки закрытия вакансий"



Комментариев нет:

Отправить комментарий