От корреляции к причине: как наука ищет истину и почему доказательства бывают обманчивы

В этой статье, продолжающей серию по книге Алекса Эдманса, мы углубляемся в сложный вопрос: как отличить простую случайность от реальной причинно-следственной связи? Наука предлагает инструменты, но в конечном счёте мир слишком сложен, и последним аргументом часто остаётся наш здравый смысл, который должен быть всегда наготове.

От цинги к золотому стандарту: рождение РКИ

Как мы уже видели, путь от наблюдения корреляции («когда А, то Б») к установлению причинно-следственной связи («А вызывает Б») тернист и сложен. Главная трудность — исключить влияние скрытых общих факторов. Яркой иллюстрацией этого стал поиск лекарства от цинги, унёсшей жизни миллионов моряков. Лекари пробовали всё — от мочи до купороса, — но успех приходил случайно, так как выбор лечения не был системным. Прорыв совершил в 1747 году британский врач Джеймс Линд. Он провёл, по сути, первое рандомизированное контролируемое испытание (РКИ), назначив двенадцати больным матросам шесть разных методов лечения случайным образом. Результат был однозначен: те, кто получал цитрусовые, быстро пошли на поправку. Этот подход, где выбор вмешательства определяется случаем, стал краеугольным камнем современной науки.

Джеймс Линд – победитель цинги

Рандомизация позволяет превратить данные в убедительные свидетельства, а РКИ с тех пор стали «золотым стандартом» доказательной медицины. Однако и у этого метода есть уязвимость: психологический эффект. Пациент Линда мог выздороветь, просто веря в силу лимонов. Для устранения этой погрешности было изобретено плацебо — «пустышка», неотличимая от настоящего лекарства. В идеальном испытании ни пациент, ни врач не знают, кто что получает (двойной слепой метод).

Когда эксперимент невозможен: инструментальные переменные

Несмотря на мощь РКИ, проводить эксперименты над людьми не всегда этично или возможно. В таких случаях на помощь приходят так называемые инструментальные переменные — внешние факторы, которые случайным образом влияют на объект изучения, но сами по себе не связаны с результатом.

Классический пример: влияет ли свобода выбора школы на успеваемость ребёнка? Прямое сравнение затруднено, ведь родители, активно выбирающие школу, обычно больше вовлечены в образование детей в целом. Исследователи нашли остроумный инструмент — количество рек в городе. Границы школьных округов часто проходят по рекам, поэтому в городах с развитой речной сетью (как Бостон) у родителей объективно больше школ на выбор, чем в городах с малым количеством рек (как Майами). Сравнение показало, что в Бостоне дети в среднем учатся лучше. Таким образом, река, влияя на выбор (вход), косвенно повлияла и на оценки (выход), что позволило сделать вывод о причинно-следственной связи.

Главный критерий хорошей инструментальной переменной — она должна звучать почти абсурдно при прямом объяснении результата. Её сила — в случайности воздействия.

Природные эксперименты: уроки минимальной зарплаты

Иногда сама жизнь ставит эксперимент за нас. Такие ситуации называют природными экспериментами. Их сила в том, что распределение на группы происходит не по воле исследователя или участника, а из-за внешних обстоятельств.

Яркий пример — новаторское исследование Дэвида Карда и Алана Крюгера о влиянии повышения минимальной зарплаты на занятость. В 1992 году Нью-Джерси повысил МРОТ, а соседняя Пенсильвания — нет. Учёные сравнили ситуацию в ресторанах двух штатов и обнаружили парадокс: в Нью-Джерси занятость не упала, а даже немного выросла, тогда как в Пенсильвании снизилась. Для чистоты анализа они также сравнили рестораны, которых повышение коснулось, с теми, кто и так платил выше нового минимума (своего рода «контрольная группа с плацебо»). Результат подтвердился. Это исследование, за которое Кард позже получил Нобелевскую премию, показало, что интуитивно очевидные экономические законы могут не работать в реальности, и подчеркнуло важность тщательного дизайна исследований.

Влияние увеличения минимальной зарплаты

Ключевой вопрос природного эксперимента: можешь ли ты сам повлиять на то, в какую группу попадёшь? Если нет — значит, распределение можно считать случайным, что приближает нас к истинной причинности.

Обратите внимание: Может причиной сноса завода, кроме привлекательности его площадки, являлось и то, что завод просто остановился в своем развитии.

Последний аргумент: здравый смысл и проверка гипотез

Когда нет ни возможности для РКИ, ни подходящей инструментальной переменной, в арсенале исследователя остаётся здравый смысл и логическая проверка альтернативных объяснений. Алекс Эдманс, изучая, как поражение местной футбольной команды влияет на фондовый индекс, не только показал падение акций, но и провёл две дополнительные проверки. Во-первых, акции крупных компаний (которыми владеют и иностранцы) падали меньше, чем акции мелких локальных фирм, что подтверждало «местный» характер эффекта. Во-вторых, если бы реакция была рациональной, то сильнее всего падали бы акции после неожиданных поражений. Но падение происходило независимо от ожиданий, что указывало на иррациональную, эмоциональную природу явления. Такие косвенные улики помогают укрепить гипотезу, даже не доказывая её на 100%.

Свидетельство — не доказательство: проблема универсальности

Даже установив причинно-следственную связь в одном контексте, мы не можем автоматически переносить её на другие ситуации. Знание редко бывает универсальным. Поучительной ошибкой стала попытка применить принципы научного менеджмента Фредерика Тейлора (эффективные на фабрике) к системе образования в США через закон «No Child Left Behind» (NCLB). Идея была проста: привязать финансирование школ и зарплаты учителей к результатам стандартизированных тестов учеников. Вместо прорыва в образовании это привело к «натаскиванию» на тесты, сокращению учебной программы и массовому выгоранию учителей. Закон был отменён.

Почему фабричные методы провалились в школе? Образование плохо поддаётся стандартизации, школьная оценка — неполный показатель работы учителя, а путь к успеху у каждого ребёнка свой. Это наглядный урок: прежде чем применять «доказанное» решение, всегда спрашивайте: Есть ли причины, по которым этот результат может не работать в новом контексте? Мир сложен и «гранулирован», разные его части реагируют по-разному.

Осторожно с масштабом: когда больше — не значит лучше

Ещё одна ловушка — неоправданная экстраполяция по масштабу. Известно, что для успеха нужен не только высокий IQ, но и упорство (грити). Однако это не значит, что бесконечное увеличение упорства или интеллекта даст пропорциональный рост успеха. Эти факторы работают в связке и имеют точку насыщения. Рецепт автора прост: сохраняйте ясность ума относительно предмета изучения. Если кто-то заявляет, что «А улучшает Б», всегда смотрите на шкалу. Два литра воды могут помочь пробежать марафон лучше, чем один, но десять литров уже убьют бегуна. Прежде чем делать вывод, нужно подумать.

Абсурдность игнорирования контекста и масштаба прекрасно иллюстрирует шуточное, но методически безупречное «РКИ по парашютам», проведённое гарвардскими кардиологами. Они не обнаружили разницы в травматизме при прыжках с парашютом и без него. Всё было правильно, кроме одной детали: прыгали они с припаркованного самолёта с высоты полуметра. Этот эксперимент — аллегория того, как слепое следование методологии без здравого смысла приводит к бессмысленным выводам.

Использование парашюта для предотвращения смерти и увечий при прыжках с самолётов: РКИ

Пределы познания: вечное неведение

Наконец, даже самое убедительное свидетельство не становится абсолютным доказательством из-за фундаментального предела нашего знания. Мы можем идеально устранить все известные нам систематические ошибки и найти железную связь между А и Б. Но это не гарантирует, что не существует некой неизвестной нам третьей силы Z, которая на самом деле управляет и А, и Б. Наше знание о мире по определению неполно и постоянно уточняется. Окончательных истин не бывает — есть лишь всё более точные приближения к ним. Поэтому критическое мышление, скепсис и готовность пересматривать убеждения в свете новых данных — важнейшие инструменты не только учёного, но и любого думающего человека.

Больше интересных статей здесь: Производство.

Источник статьи: Может содержать ложь (4).