Статистика
Минимум, чтобы понимать утверждения вроде «r = 0.3, p < 0.05» в научных текстах. Главные концепты: корреляция и антикорреляция, коэффициент Пирсона, статистическая значимость и p-value, эффект-сайз, размер выборки. Без формул — только смысл, чтобы отличать сильное утверждение от слабого.
Среднее, медиана, разброс
Когда есть набор чисел, его обычно сжимают до двух характеристик: «типичное значение» и «насколько разные значения отличаются друг от друга».
- Среднее (average, mean) — сумма всех чисел делённая на количество. Хорошо работает для симметричных распределений, плохо — если есть редкие очень большие значения, они вытягивают среднее (зарплата Маска перекашивает среднее по стране)
- Медиана — значение, которое разделяет упорядоченный набор пополам: половина значений меньше, половина больше. Устойчива к выбросам
- Стандартное отклонение — мера того, насколько типичные значения разбросаны вокруг среднего. Маленькое = все близко к среднему, большое = сильный разброс
Корреляция
Корреляция — мера того, насколько связаны два набора данных. Например: рост и вес людей, время в школе и доход во взрослой жизни, активность гена и поведение.
Самый известный показатель — коэффициент корреляции Пирсона, обозначается r. Принимает значения от -1 до +1:
| r | Смысл |
|---|---|
| +1 | Идеальная положительная связь: один параметр растёт — другой растёт строго пропорционально |
| 0 | Нет линейной связи: знание одного параметра ничего не говорит о другом |
| -1 | Идеальная отрицательная связь (антикорреляция): один растёт — другой строго пропорционально падает |
Промежуточные значения интерпретируются по силе:
- r около 0.1–0.2 — слабая связь
- 0.3–0.5 — умеренная
- 0.5–0.7 — сильная
- 0.7 и выше — очень сильная
«Отрицательная корреляция» — это не «нет связи», а связь в обратную сторону: чем больше одного, тем меньше другого. Например, тренировка и количество ошибок при выполнении задачи скорее всего антикоррелированы.
Важно: коэффициент Пирсона измеряет линейную связь. Если связь нелинейна (например, U-образна — оптимум где-то в середине), Пирсон её не увидит, даже если связь реально есть. Для таких случаев используются другие меры (ранговая корреляция Спирмена, взаимная информация и пр.).
Эффект-сайз
«Связь есть» и «связь сильная» — разные утверждения. Эффект-сайз — мера того, насколько сильно одно влияет на другое.
Коэффициент корреляции r — один из видов эффект-сайза. Другие меры (d Коэна, eta-squared и пр.) применяются в задачах, где сравнивают группы или измеряют долю объяснённой дисперсии.
Главный практический навык — отличать большой эффект от маленького. Например, в исследовании написано: «гены объясняют 5% вариативности черты». Это значит: связь есть, но 95% разброса определяется чем-то другим. На уровне отдельного человека такая связь почти ничего не предсказывает.
Это особенно важно для генетики поведения и социальной психологии: там типичные эффект-сайзы малы (r = 0.1–0.2), и громкие заголовки «учёные нашли связь X и Y» часто означают слабую статистическую связь, не предсказательную модель.
Статистическая значимость и p-value
p-value — вероятность получить такой же или ещё более сильный результат случайно, если бы реальной связи не было.
Условное правило: если p < 0.05 (вероятность случайности меньше 5%), результат считается статистически значимым.
Это часто путают: статистическая значимость говорит только о том, что эффект не нулевой — что-то есть. Она ничего не говорит о том, насколько эффект сильный.
При большой выборке статистически значимым становится даже крошечный эффект, который практически ничего не значит. Поэтому «p < 0.05» без указания эффект-сайза — слабое утверждение. Серьёзный анализ всегда даёт обе цифры: значимость (p) и силу эффекта (r или другое).
Кризис воспроизводимости в психологии и медицине 2010-х был во многом про это: исследования с p < 0.05 на маленьких выборках, потом не воспроизводящиеся при повторении.
Размер выборки
Чем больше данных, тем надёжнее любая статистика. Маленькая выборка может давать любые случайные результаты — большой эффект, маленький, отсутствие эффекта — без связи с реальностью.
Грубые ориентиры:
- 20–50 человек — почти всегда мало для серьёзных выводов о связях, особенно слабых
- 100–500 — может хватить для умеренных эффектов
- 1000+ — нужно, чтобы надёжно обнаружить слабые эффекты, типичные для генетики поведения
- Десятки и сотни тысяч — стандарт для современных GWAS (поиск связей генов с признаками)
Когда читается «исследование показало X», полезно посмотреть, на скольких людях. Сильные клинические рекомендации обычно опираются на тысячи и десятки тысяч участников, а не на отдельные эксперименты с 30 студентами.
Как читать r и p в одной фразе
Типичная формулировка в научном тексте: «корреляция между X и Y составила r = 0.32, p < 0.001, n = 480».
Расшифровка:
- r = 0.32 — связь умеренная: ~10% дисперсии Y объясняется X (квадрат r), 90% — чем-то ещё
- p < 0.001 — вероятность случайно получить такой результат меньше одной тысячной
- n = 480 — данные собраны на 480 наблюдениях
В целом: связь надёжная (низкий p, большая выборка), но не сильная (r около 0.3). Реальный эффект существует, но его не хватит, чтобы по X предсказать Y у конкретного человека.
Это типичный паттерн в социальных и поведенческих науках: связи реальные, но слабые. Сильные предсказания получаются только при сочетании множества таких слабых сигналов.