Опять беру данные от Высшей школы экономики. По требованию сайта полностью цитирую источник
«Российский мониторинг экономического положения и здоровья населения НИУ-ВШЭ (RLMS-HSE)», проводимый Национальным исследовательским университетом "Высшая школа экономики" и ЗАО «Демоскоп» при участии Центра народонаселения Университета Северной Каролины в Чапел Хилле и Института социологии РАН. (Сайты обследования RLMS-HSE: http://www.cpc.unc.edu/projects/rlms и http://www.hse.ru/rlms)».
Взял выборку по индивидам репрезентативной выборки населения России за 2013 год. Т.е. исследователи строили выборку таким образом, чтобы она про всю Россию говорила.
Посмотрел сегодня связь двух вопросов
Обратите внимание, по оси Y - количество респондентов. Т.е. например, более 4 000 респондентов выбрали вариант "Скорее удовлетворены" и "Нет" в отношении курения.
Или в boxplot
«Российский мониторинг экономического положения и здоровья населения НИУ-ВШЭ (RLMS-HSE)», проводимый Национальным исследовательским университетом "Высшая школа экономики" и ЗАО «Демоскоп» при участии Центра народонаселения Университета Северной Каролины в Чапел Хилле и Института социологии РАН. (Сайты обследования RLMS-HSE: http://www.cpc.unc.edu/projects/rlms и http://www.hse.ru/rlms)».
Взял выборку по индивидам репрезентативной выборки населения России за 2013 год. Т.е. исследователи строили выборку таким образом, чтобы она про всю Россию говорила.
Посмотрел сегодня связь двух вопросов
- rm71 Вы курите в настоящее время?
- Да
- Нет
- rj1.1.1 Насколько Вы удовлетворены или не удовлетворены Вашей работой в целом?
- Полностью удовлетворены - 1
- Скорее удовлетворены - 2
- И да, и нет - 3
- Не очень удовлетворены - 4
- Совсем не удовлетворены - 5
- rj65 Насколько Вы удовлетворены своей жизнью в целом в настоящее время?
- Полностью удовлетворены - 1
- Скорее удовлетворены - 2
- И да, и нет - 3
- Не очень удовлетворены - 4
- Совсем не удовлетворены - 5
Получились такие результаты
Давайте посмотрим взаимосвязь курения и удовлетворенностью жизнью
Обратите внимание, по оси Y - количество респондентов. Т.е. например, более 4 000 респондентов выбрали вариант "Скорее удовлетворены" и "Нет" в отношении курения.
Или в boxplot
Хи квадрат, если рассматривать удовлетворенность как номинативную переменную, и Манн Уитни, если рассматривать удовлетворенность как порядковую переменную, показывает значимость различий
Wilcoxon rank sum test with continuity correction
data: satisfaction by smoking
W = 19933519, p-value = 1.899e-12
alternative hypothesis: true location shift is not equal to 0
Взаимосвязь удовлетворенностью работой и курением
Тест
Манн Уитни
Wilcoxon rank sum test with continuity correction
data: satisfactionjob by smoking
W = 6385937, p-value = 2.146e-06
alternative hypothesis: true location shift is not equal to 0
Для тех, кто не умеет читать данные записи - посещайте семинар Аналитика для HR
Вопрос на засыпку
Как вы считаете, является ли курение причиной различий в удовлетворенности или же курение опосредует какую то другую причину и показывает не причинную связь, а корреляцию?
Если версии будут разумными, мы сможем проверить это на основе имеющихся данных