.

Сделать репост в соц сети!

среда, 25 марта 2020 г.

Лайфхаки для HR. Как разделить работников по полу если есть только их список

Задача:

Есть список работников (ФИО полностью). Нужно указать пол каждого из работников.

Исходные данные представлены в файле Excel (ФИО сформированы онлайн сервисом - генератор имен. Любое совпадение с реальными людьми случайно):




Ссылка на исходный файл указана ниже.

Возможные ситуации возникновения задачи:


  • проверка правильности указания в системе учета пола работников;
  • гендерный анализ работников;
  • др.

Методика решения:

Обычно отчества в РФ заканчиваются на "вич" для мужчин и "вна" для женщин. Реже на "глы" (оглы) для мужчин и "ызы" (кызы) для женщин.
Отсюда следует, что нам нужно взять три последние буквы строк с ФИО и сравнить их соответственно с "вич" и "вна" (в указанном примере указаны только такие отчества).

Решение:


Задачу можно решить как в Excel, так и в R.

Решение в Excel.

Выделяем ячейку справа от столбца ФИО и вводим =ЕСЛИ(ПРАВСИМВ(A2;3)="вна";"ж";"м"). Далее протягиваем эту формулу до конца списка и получаем пол работников.


Ссылка на исходный файл и решение указана ниже.

Решение в R.

Решение сводится к следующему коду:


ds = mutate(
data_base,
`Пол` = case_when(
str_sub(data_base$ФИО, -3, -1) == "вич" ~ "м",
str_sub(data_base$ФИО, -3, -1) == "вна" ~ "ж",
TRUE ~ "!"
)
)

Ссылка на полный код указана ниже.

Результат тот же:


Примечание:

В данном случае, когда вариантов окончаний отчеств два, использование Excel более оправдано, чем R. Но, в случае увеличения вариаций, вложенность конструкции ЕСЛИ усложнится, тогда как в R любой вариант окончания отчества - это добавление одной строки.

Ссылка на файлы:


Комментариев нет:

Отправить комментарий