Share |

пятница, 10 января 2014 г.

Эмпирические правила статистики, или Что нужно помнить о размерах выборки

С согласия авторов публикую перевод с сайта bss-around.ru одного очень важного материала по тому, каким должен быть оптимальный размер выборки.

Carmen Wilson VanVoorhis and Betsy Levonian Morgan (University of Wisconsin-La Crosse), перевод Екатерины Орел

В этой статье мы обозначим практическое правило подбора величины выборки для установления различий, связей, критерия Хи-квадрат и факторного анализа.

Cohen (1990), выдающийся психометрист, написал на основе своего опыта статью под названием «То, что я уже знаю». Однако, если Вы студент, осваивающий премудрости научного исследования, возможно, Вам понадобится статья, озаглавленная «То, что Вам нужно знать». Если Вы курируете студенческие проекты, Вы можете захотеть присоединиться к нам в описании утилитарных принципов организации исследования, которые «мы не хотели бы забыть». Мы обеспокоены обилием статистических программ, которые привлекают пользователей довольно ограниченным набором методов, зарекомендовавши себя на практике, и хотели бы освежить в памяти читателя некоторые базовые эвристики, касающиеся размера выборки, которые направляют наше исследование. В самом деле, при организации исследования и обработке данных возникают спорные моменты относительно мощности и величины эффекта и того, как они влияют на выбор размера выборки. Поэтому мы предлагаем вашему вниманию этот краткий обзор практических правил, касающихся размера выборки.


Практические правила для подбора размера выборки в исследовании.

Количество испытуемых: Размеры групп для определения значимости различий.

Т-критерий для независимых выборок, Т-критерий для связанных выборок, дисперсионный анализ (одно- и многофакторный) (ANOVA) и многомерный дисперсионный анализ (MANOVA) все эти показатели разработаны для того, чтобы установить, есть ли различия между сравниваемыми группами. Сколько участников исследования нужно, чтобы адекватно использовать эти статистические методы? Для величины эффекта от средней до высокой, 30 испытуемых в каждой группе обеспечат около 80% мощности (минимальная рекомендуемая мощность для обычного исследования, Cohen, 1988). Если нужно минимизировать количество участников исследования, то 7 испытуемых в группе (минимальное число групп 3) дадут примерно 50% мощности при величине эффекта равно 0,5. 14 испытуемых в группах, при тех же условиях, обеспечат примерно 80% мощности.

Число испытуемых напрямую связано с мощностью (способностью выявить «реальные» различия между группами). Размер эффекта относится к силе связи между переменными и/или силе (величине) найденных различий. Cohen (1988, 1992) определил некоторые размеры эффектов, выведенные из результатов психологических исследований (маленький 0,2, средний 0,5, высокий 0,8), большинство хороших учебников по статистике (например, Aron & Aron, 1999) дают простые формулы для вычисления наличного и предполагаемого размера эффекта.

Все тесты на выявление различий основаны на анализе распределения. Поэтому число испытуемых в любой выборке напрямую связано со стандартным отклонением. Чем больше испытуемых, тем уже распределение и тем выше вероятность того, что различия будут найдены (и, следовательно, тем выше мощность). Однако мощность связана не только с размером выборки. Она также соотносится и с размером эффекта. Чем больше размер эффекта, тем выше мощность. Например, разница в весе между новорожденным и 1-месячным ребенком довольно мала, и поэтому мал и размер эффекта. А вот разница в весе между новорожденным и годовалым ребенком гораздо больше, и, следовательно, больше и размер эффекта, и вероятность выявить различия (мощность тоже больше).

Предупреждения:

  1. сравнение меньшего количества групп требует большего количества испытуемых, чтобы обеспечить адекватную мощность.
  2. Более низкий ожидаемый размер эффекта требует большего количества испытуемых, чтобы обеспечить адекватную мощность.
  3. При использовании многомерного дисперсионного анализа важно, чтобы число случаев было больше, чем количество зависимых переменных в каждой группе.

Количество испытуемых: статистики, используемые для проверки отношений.

Хотя существует более общая формула, основное практическое правило при проверке отношений гласит: необходимо не менее 50 испытуемых для корреляции или регрессии, и это число тем больше, чем больше количество независимых переменных в исследовании (with the number increasing with larger numbers of independent variables). Green (1991) дает всесторонний обзор процедур, определения размера выборки, необходимого для проведения регрессионного анализа. Он предлагает формулу N=50+8m (где m это число независимых переменных) для проверки множественной корреляции (multiple correlation), и N>104+m для измерения индивидуальных предикторов (individual predictors). Если используются оба теста, нужно использовать ту формулу, по которой количество испытуемых получается больше.

Несмотря на то, что формулы Green достаточно полны, есть еще два практических правила, используемых в этом случае. С количеством предикторов меньшим или равном 5 (это число включает в себя корреляции) исследователь может использовать формулу Harris для определения минимального количества испытуемых. Harris пишет, что число испытуемых подсчитывается, как 50+m (где m число предикторов), формула, очень похожая на формулу Green, приведенную выше. Для регрессионных уравнений, использующих 6 или более предикторов, допустим абсолютный минимум испытуемых из расчета 10 человек на один предиктор. Однако, если позволяют обстоятельства, исследователь получит более достоверный результат, если наберет30 испытуемых на каждый предиктор. Например, Cohen & Cohen (1975) показали, что для единственного предиктора, коррелирующего на выборке с зависимой переменной на уровне 0,30, необходимо 124 испытуемых, чтобы достичь 80% мощности. С пятью предикторами и корреляцией 0,30 80% мощность достигается при количестве испытуемых равном 187.

Предупреждение: большие выборки нужны, когда зависимая переменная перекошена, когда ожидается маленький размер эффекта, когда проявляется значительная ошибка измерения, или используется ступенчатая регрессия.

Количество испытуемых: Хи-квадрат.

Консервативное правило гласит, что ни одно значение ожидаемой частоты в группе должно быть меньше 5, и общая выборка должна составлять, как минимум, 20 человек. При использовании критерия Хи-квадрат, в отличие от многих других статистических методов, увеличение количества наблюдений не влияет на критическое значение, при котором отвергается нулевая гипотеза. Однако, количество наблюдений все еще определяет мощность. Маленькая ожидаемая частота в одной или более группах значительно ограничивает мощность. Маленькие ожидаемые частоты могут также немного увеличивать ошибку первого рода; однако, для общего размера выборки не менее 20, альфа редко превышает значение 0,06 (Howel, 1997). Статистика хи-квадрат используется для проверки независимости категориальных переменных, следовательно все наблюдения должны быть независимыми. Другими словами, на одного индивида должно приходиться только одно наблюдение. Степени свободы основаны на количестве переменных и их возможных уровней, а не на количестве наблюдений. Следовательно, степени свободы имеют ограниченную непрямую связь с мощностью. С увеличением числа групп (а следовательно, и с увеличением числа степеней свободы), ожидаемая частота в группах может постепенно уменьшаться, не уменьшая при этом мощность (см. Cohen, 1988 для вычисления необходимого размера выборки, чтобы обеспечить заданный уровень мощности при заданной степени свободы).

Предупреждение. Если ожидаемый размер эффекта велик, допустима более низкая мощность, и общий размер выборки может быть равен 8, и при этом не оказывать влиять на ошибку первого рода.

Количество испытуемых: факторный анализ.

Хорошее общее правило для факторного анализа применять его не менее, чем для 300 случаев, или, более мягкое правило, - не менее, чем 50 испытуемых для каждого фактора. Comprey & Lee (1992) приводят такие указания касательно размера выборки в факторном анализе: 50 очень плохо, 100 плохо, 200 сойдет, 300 хорошо, 500 очень хорошо, 1000 отлично.

Предупреждение: Guadagnoli and Velicer (1988) показали, что решения, где есть несколько высоких факторных нагрузок (>0,80) не требуют такого большого количества случаев.
Источник

Комментариев нет:

Отправить комментарий

рек