.

Сделать репост в соц сети!

вторник, 11 ноября 2014 г.

Взаимосвязь текучести персонала и времени зачатия ребенка в Швеции

В рамках подготовки к семинару по управлению текучестью персоналом на основе данных изучаю книгу шведского ученого Göran Broström-Event History Analysis with R-CRC Press (2012).
В книге помимо прочего приводится статистика фертильности (плодовитости) женщин. Статистика первой половины 19 века (!). Помимо прочего идут такие показатели: дата замужества, дата рождения первого ребенка, дата рождения второго ребенка и т.д...
Я человек окончательно испорченный, вижу сразу самое непотребное: я обратил внимание, что во многих случаях разница между датой выхода замуж и рождением первого ребенка менее 9 месяцев. Захотелось ответить на вопрос: а каков % тех женщин, что зачали ребенка до замужества.

Взаимосвязь текучести персонала и рождаемость в Швеции
деление здесь 0, 25 соответствует 3-м месяцам, 0,5 - полгода, 0, 75 - 9 месяцев, 1 - год. Заметно, что мода приходится на 0, 75 лет или 9 месяцев и соответствует интуитивной гипотезе, что бОльшая часть женщин зачинают ребенка в брачную ночь.
Медиана - 9, 72. И 42, 3 % имеет разницу между датой замужества и рождением первого ребенка менее 9 месяцев. Нужно учитывать срок беременности, но я думаю, что распределение срока беременности носит нормальное распределение, поэтому мы достаточно уверено можем сказать, что у примерно 40 % шведских женщин в 19 веке момент зачатия предшествовал свадьбе.
Для сравнения: всего было 1857 обследуемых женщин, частота указана по оси Y. Следовательно в первые три месяца после замужества ребенка родили примерно 15 % = (50 + 100 + 125)/ 1857. Можно посчитать точнее, но мне уже лень
.....
Для тех, кто следит за моими постами по текучести персонала, поняли ли вы, почему я привожу кейсы, далекие от HR?
Управление текучестью персонала на основе данных - базовый показатель текучести персонала
Я бы еще вывод сделал: аналитика - это серьезный труд, который приносит результаты через годы, нельзя сегодня поставить задачу, а завтра получить результат. Более того, аналитика не есть проект, а процесс: не думаю, что церковнослужители думали о том, что в 21 веке кто-то будет рыться в их книгах... Это еще и культура данных...

ПыСы

Для пользователей R, Rstudio
library(eha)
data(fert)
Сам же научился делать scale функции hist
hist(g$next.ivl, axes=F)
axis(2)
axis(1, at=seq(0,10, by=0.25), labels=seq(0,10, by=0.25))

5 комментариев:

  1. А там случайно нет данных о социальном статусе этих женщин? Вот что пишут в Инете о свадебных традициях Швеции 19 века: "Очень часто крестьянские девушки не выходили замуж до тех пор, пока не рожали или не беременели, так как это считалось доказательством того, что в предстоящем браке она будет иметь детей. И в наши дни в скандинавских странах внебрачные связи широко распространенное явление."

    ОтветитьУдалить
    Ответы
    1. супер)
      в данных есть такая переменная - социально экономический статус, он имел четыре уровня
      farmer 0.85
      unknown 0.82
      upper 0.90
      lower 0.75
      крестьяне явно farmer, цифра напротив - медианное значение для каждой группы. Я посмотрел значимость различий - их нет((( в том смысле, что крестьяне не отличались от прочих социальных групп

      Удалить
  2. Презабавнейшие данные, особенно заголовок порадовал.
    Отдельное спасибо за доп.инфу по R studio

    ОтветитьУдалить
  3. Надо еще учитывать, что есть дети, зачатые после оформления отношений, но родившиеся недоношенными - в 19 веке было много причин для преждевременных родов))) С др.ст., мертворожденные и умершие через несколько часов после родов, вероятнее всего, не попадали в статистику как дети, а учитывались как "неудачная" беременность..
    Юлия

    ОтветитьУдалить