.

Сделать репост в соц сети!

Показаны сообщения с ярлыком препроцессинг данных. Показать все сообщения
Показаны сообщения с ярлыком препроцессинг данных. Показать все сообщения

воскресенье, 12 августа 2018 г.

Препроцессинг данных: если часть переменной категориальная, часть числовая (с кодом в R)



90 % работы аналитика это извлечение и препроцессинг данных. Хочу поделиться, как я решил одну проблему, которую сам себе же и создал.
Самый пост технически не сложный, но, надеюсь, фишки кода препроцессинга будут оценены теми, кто работает в R. Ну и саму логику решения задачи:)

Препроцессинг данных: если часть переменной категориальная, часть числовая (с кодом в R)

Проблема

  • В моем опросе Портрет HR-директора (кстати, поучаствуйте) есть такие вопросы "Количество подчиненных HR-директора (размер HR-службы) - укажите число работников службы HR - можно приблизительно"
  • "Размер компании (количество работающих) - укажите число работников компании, хотя бы приблизительно". 
Изначально эти вопрос представлял собой тип вопроса "one choice" - респондент выбирал один вариант из нескольких предложенных (далее буду показывать на примере вопрос о размере HR службы):
  • 'ни одного'
  • 'от 1 до 3' 
  • 'от 4 до 10' 
  • 'от 11 до 30' 
  • 'более 30'