Статистика

Минимум, чтобы понимать утверждения вроде «r = 0.3, p < 0.05» в научных текстах. Главные концепты: корреляция и антикорреляция, коэффициент Пирсона, статистическая значимость и p-value, эффект-сайз, размер выборки. Без формул — только смысл, чтобы отличать сильное утверждение от слабого.

Среднее, медиана, разброс

Когда есть набор чисел, его обычно сжимают до двух характеристик: «типичное значение» и «насколько разные значения отличаются друг от друга».

  • Среднее (average, mean) — сумма всех чисел делённая на количество. Хорошо работает для симметричных распределений, плохо — если есть редкие очень большие значения, они вытягивают среднее (зарплата Маска перекашивает среднее по стране)
  • Медиана — значение, которое разделяет упорядоченный набор пополам: половина значений меньше, половина больше. Устойчива к выбросам
  • Стандартное отклонение — мера того, насколько типичные значения разбросаны вокруг среднего. Маленькое = все близко к среднему, большое = сильный разброс

Корреляция

Корреляция — мера того, насколько связаны два набора данных. Например: рост и вес людей, время в школе и доход во взрослой жизни, активность гена и поведение.

Самый известный показатель — коэффициент корреляции Пирсона, обозначается r. Принимает значения от -1 до +1:

rСмысл
+1Идеальная положительная связь: один параметр растёт — другой растёт строго пропорционально
0Нет линейной связи: знание одного параметра ничего не говорит о другом
-1Идеальная отрицательная связь (антикорреляция): один растёт — другой строго пропорционально падает

Промежуточные значения интерпретируются по силе:

  • r около 0.1–0.2 — слабая связь
  • 0.3–0.5 — умеренная
  • 0.5–0.7 — сильная
  • 0.7 и выше — очень сильная

«Отрицательная корреляция» — это не «нет связи», а связь в обратную сторону: чем больше одного, тем меньше другого. Например, тренировка и количество ошибок при выполнении задачи скорее всего антикоррелированы.

Важно: коэффициент Пирсона измеряет линейную связь. Если связь нелинейна (например, U-образна — оптимум где-то в середине), Пирсон её не увидит, даже если связь реально есть. Для таких случаев используются другие меры (ранговая корреляция Спирмена, взаимная информация и пр.).

Эффект-сайз

«Связь есть» и «связь сильная» — разные утверждения. Эффект-сайз — мера того, насколько сильно одно влияет на другое.

Коэффициент корреляции r — один из видов эффект-сайза. Другие меры (d Коэна, eta-squared и пр.) применяются в задачах, где сравнивают группы или измеряют долю объяснённой дисперсии.

Главный практический навык — отличать большой эффект от маленького. Например, в исследовании написано: «гены объясняют 5% вариативности черты». Это значит: связь есть, но 95% разброса определяется чем-то другим. На уровне отдельного человека такая связь почти ничего не предсказывает.

Это особенно важно для генетики поведения и социальной психологии: там типичные эффект-сайзы малы (r = 0.1–0.2), и громкие заголовки «учёные нашли связь X и Y» часто означают слабую статистическую связь, не предсказательную модель.

Статистическая значимость и p-value

p-value — вероятность получить такой же или ещё более сильный результат случайно, если бы реальной связи не было.

Условное правило: если p < 0.05 (вероятность случайности меньше 5%), результат считается статистически значимым.

Это часто путают: статистическая значимость говорит только о том, что эффект не нулевой — что-то есть. Она ничего не говорит о том, насколько эффект сильный.

При большой выборке статистически значимым становится даже крошечный эффект, который практически ничего не значит. Поэтому «p < 0.05» без указания эффект-сайза — слабое утверждение. Серьёзный анализ всегда даёт обе цифры: значимость (p) и силу эффекта (r или другое).

Кризис воспроизводимости в психологии и медицине 2010-х был во многом про это: исследования с p < 0.05 на маленьких выборках, потом не воспроизводящиеся при повторении.

Размер выборки

Чем больше данных, тем надёжнее любая статистика. Маленькая выборка может давать любые случайные результаты — большой эффект, маленький, отсутствие эффекта — без связи с реальностью.

Грубые ориентиры:

  • 20–50 человек — почти всегда мало для серьёзных выводов о связях, особенно слабых
  • 100–500 — может хватить для умеренных эффектов
  • 1000+ — нужно, чтобы надёжно обнаружить слабые эффекты, типичные для генетики поведения
  • Десятки и сотни тысяч — стандарт для современных GWAS (поиск связей генов с признаками)

Когда читается «исследование показало X», полезно посмотреть, на скольких людях. Сильные клинические рекомендации обычно опираются на тысячи и десятки тысяч участников, а не на отдельные эксперименты с 30 студентами.

Как читать r и p в одной фразе

Типичная формулировка в научном тексте: «корреляция между X и Y составила r = 0.32, p < 0.001, n = 480».

Расшифровка:

  • r = 0.32 — связь умеренная: ~10% дисперсии Y объясняется X (квадрат r), 90% — чем-то ещё
  • p < 0.001 — вероятность случайно получить такой результат меньше одной тысячной
  • n = 480 — данные собраны на 480 наблюдениях

В целом: связь надёжная (низкий p, большая выборка), но не сильная (r около 0.3). Реальный эффект существует, но его не хватит, чтобы по X предсказать Y у конкретного человека.

Это типичный паттерн в социальных и поведенческих науках: связи реальные, но слабые. Сильные предсказания получаются только при сочетании множества таких слабых сигналов.