Judgment

Оригинальное название: 
Judgment

Предисловие

Ожидаемая полезность исхода — произведение вероятности исхода на полезность исхода. Ожидаемая полезность действия — сумма ожидаемых полезностей всех вариантов исхода.

Определение наилучшего действия включает в себя вычисления вариантов исхода. Разумеется, это не сознательные вычисления, а доверительные оценки, исходя из наших убеждений. Если наши оценки неточны, то и решения не приведут к желаемому результату.

Когда мы выбираем, что делать, нам нужна уверенность, что наши оценки близки к реальности. В этом смысле рациональность убеждений — эпистемическая рациональность — одна из основа рациональности действия.

Рациональность убеждений можно развивать, нарабатывая привычки в областях:

  • оценки вероятности тех или иных причин происходящего;
  • оценки надёжности свидетельств;
  • проверки предположений.

Для уточнения убеждений не нужно быть гением математики и считать в уме вероятности. Как и в случае с аксиомами выбора, есть несколько принципов, помогающих приближать убеждения к реальности. Аналогично существуют и нарушения этих принципов.

В 2002 году Д.Канеман получил Нобелевскую премию за анализ законов работы человеческого рассудка, выполненный им совместно с А.Тверски. В частности, он обнаружил, что мы используем сокращённые оценки вероятности (не вычисления, а эвристики), которые во многих случаях систематически уводят нас от точных оценок. Это вызвало шквал исследований в области когнитивной психологии, принятия решений и методов оценки вероятностей в реальном мире.

В этой части обсуждаются принципы рациональности убеждений, а также то, как люди отступают от них, используя приближенные эвристики.

Bayes' Theorem

Предупреждение. Данная часть требует некоторого знакомства с теорией вероятности. Кое-какие базовые понятия здесь Станевичем упоминаются, но явно не полностью.

Для достижения эпистемической рациональности необходимо, чтобы убеждения основывались на оценках вероятностей, приближенных к реальности. Вычисление вероятностей — одна из моделей таких оценок.

Чисто математически понятие “вероятность” подчиняется определенным объективным правилам. Самые важные:

  • вероятность всегда не меньше нуля и не больше единицы. Формально:
    0 ≤ P(A) ≤ 1, где P — значение вероятности события A;
  • если нечто случается достоверно, всегда, то его вероятность равна единице;
  • если нечто не случается вообще никогда, то его вероятность равна нулю;
  • если события A и B не могут случиться одновременно, они называются взаимоисключающими. Вероятность наступления любого из взаимоисключающих событий — это сумма вероятностей каждого события в отдельности: P(A или B) = P(A) + P(B);

Часто событие A может случиться, когда событие B уже произошло (“если человек дожил до 80, он может дожить и до 90”). Вероятность события A в этом случае “условная вероятность” и записывается как P(A/B).

Для взаимоисключающих событий A и B вероятность P(A/B) = 0, как и P(B/A) = 0.

Для любых событий A и B вероятность P(A/B) = P(A и B)/P(B). Физический смысл — предположим, что:

  • до 80 доживают половина. Вероятность 0,5 (это событие B);
  • до 90 доживает треть. Вероятность 0,3 (это событие “A и B”);

Тогда вероятность “дожил до 80 и доживёт до 90”: 0,3 / 0,5 = 0,6, то есть если уж человек дожил до 80, то шансов дожить до 90 у него выше среднего.

Таким образом, мы можем описывать вероятности комбинаций событий. Путём простых преобразований мы получим одну из самых известных формул в теории принятия решений — теорему Байеса или правило Байеса.

Эта формула была получена английским математиком Реверендом Томасом Байесом ещё в 18 веке и решает не просто абстрактную задачу преобразования P(B/A) в P(A/B).

Данной формулой описывается формальное правило обновления наших убеждений на основе полученных в результате наблюдения данных.

Это правило отвечает на вопрос “насколько можно доверять гипотезе B, предсказывающей наблюдение A”, если известны:

  • степень доверия к гипотезе B до наблюдения A (насколько мы уверены в теории?);
  • уверенность теории B в предсказании A (насколько сильно теория разрешает существание A?);
  • степень доверия к альтернативной гипотезе (насколько мы уверены в других гипотезах?);
  • уверенность альтернативной гипотезы в предсказании A (насколько сильно другие гипотезы разрешают существание A?);
  • событие A уже произошло.

Прежде чем перейти к ней, немного об обозначениях. Хотя в дальнейшем используется сравнительно много математических символов, суть теоремы Байеса может быть понята вообще без математики. Формальные вычисления полезны, если нужна точная уверенность, но проще научиться нескольким правилам размышления, по аналогии с аксиомами выбора.

  • P(H) — вероятность того, что гипотеза H верна, до эксперимента;
  • P(~H) — вероятность того, что гипотеза H неверна, до эксперимента;
  • P(H/D) — вероятность того, что гипотеза H подтверждается наблюдением D, после эксперимента;
  • P(D/H) — вероятность того, что наблюдение D предсказывается гипотезой H (насколько сильно гипотеза H требует существования наблюдения D);
  • P(D/~H) — вероятность того, что наблюдение D предсказывается гипотезой, альтернативной H (насколько сильно гипотеза, альтернативная H. требует существования наблюдения D).

Обратите внимание, что P(D/H) ни в коем случае не противоположность P(D/~H) — наблюдение D может предсказываться разными гипотезами с произвольной степенью уверенности, то есть с разными вероятностями, и сумма этих вероятностей не равна единице!

Пример. На месте преступления обнаружен нож. Известно, что корсиканцев среди преступников 20%, что корсиканцы оставляют нож на месте преступления в семи случаях из десяти, а остальные в четырёх случаях из десяти. С какой вероятностью нож оставил корсиканец? Более формально:

  • H — гипотеза “преступление совершил корсиканец”;
  • D — событие “на месте преступления найден нож”;
  • P(H) — вероятность того, что преступление совершил корсиканец, равна 0,2;
  • P(D/H) — гипотеза “нож оставил корсиканец” предсказывает наличие ножа с вероятностью 0,7;
  • P(D/~H) — остальные гипотезы предсказывают наличие ножа с вероятностью 0,4;

Подсчитываем: (0,2 * 0,7) / (0,2 * 0,7 + 0,8 * 0,4) = 0,14 / (0,14 + 0,32) = 0,14 / 0,46 = 0,304„,

Таким образом, оценка вероятности того, что преступление совершил корсиканец, увеличилась после того, как на месте преступления был найден нож. (Увеличилась на сравнительно небольшую величину, так как корсиканцев немного!)

У людей очень часто сложности с пониманием того, как обновлять свои убеждения согласно формуле Байеса. Необходимо подчеркнуть, что смысл не в том, чтобы научиться точно высчитывать, а в том, чтобы быстро получать оценку в верном направлении. Суть байесианского размышления состоит именно в этом.

Затруднения с вероятностями: игнорирование базовой ставки

Сложности, испытываемые людьми при работе с вероятностями, можно проиллюстрировать двумя примерами.

Проблема такси

Ночью произошло ДТП с участием такси. В городе работают две компании такси — “Синие” и “Зелёные”. “Зелёным” принадлежит 85% такси, “Синим” 15%. Свидетель аварии утверждает, что такси принадлежало “Синим”. Следственный эксперимент показал, что ночью свидетель верно определяет цвет такси в 80%. Какова вероятность того, что такси действительно принадлежало “Синим”?

Проблема вируса

Вирус XYZ вызывает серьёзное заболевание у одного человека из тысячи. Существует тест, показывающий, заражён человек XYZ или нет. Однако этот тест в 5% даёт ложное срабатывание — показывает факт заражения, когда на самом деле человек здоров.

Предположим, что тестирование взятого наугад человека показало, что он XYZ-инфицирован. Какова вероятность того, что он на самом деле болен?

Попытайтесь найти решение самостоятельно, прежде чем читать дальше. Не обязательно точно подсчитывать, сформулируйте хотя бы догадки.

Разбор проблемы такси

Теорема Байеса диктует нам, как лучше всего использовать вот эти сведения:

  • 15% такси в городе — синие;
  • свидетель определяет синий цвет правильно в 80%.

Интуитивные догадки большинства людей, тем не менее, далеки от истины. Удивительно, но, несмотря на показания свидетеля, вероятность того, что такси зелёное — 59%. Причина в том, что зелёных такси в городе много (85‰) и этот факт “перевешивает” 80%-ю уверенность свидетеля.

Разберём это подробнее, не используя формул. Возьмём 100 аналогичных ДТП:

  • 15 такси в этих ДТП синие;
  • свидетель верно определил цвет 80% из них, то есть у 12 такси;
  • 85 такси в этих ДТП зелёные;
  • свидетель неверно определил цвет 20% из них, то есть у 1⒎ такси;

Таким образом в 100 ДТП свидетель определил 29 такси как синие. На самом деле синих такси всего 12. Вероятность того, что такси действительно синее, 12 / 29 = 0,41.

Формальное решение с помощью теоремы Байеса:

  • H — гипотеза “в ДТП участвовало синее такси”;
  • D — событие “свидетель видел синее такси”;
  • P(H) — вероятность того, что такси вообще синее (0,15);
  • P(~H) — вероятность того, что такси вообще зелёное (“не синее”) (0,85);
  • P(D/H) — вероятность того, что свидетель видел именно синее такси (0,80);
  • P(D/~H) — вероятность того, что свидетель ошибся (0,2).

P(H/D) = P(H) * P(D/H) / ( P(H) * P(D / H) + P(~H) * P(D/~H) )

P(H/D) = 0,15 * 0,80 / ( 0,15 * 0,80 + 0,85 * 0,20 ) = .41

Из тех, кому предлагали решить эту задачу, значения между 20% и 70% назвали меньше половины. Большинство ответов было в районе 80%.

Люди переоценивали значимость конкретного и ясного показания свидетеля и недооценивали “базовую ставку” — тот факт, что синих такси в городе намного меньше зелёных.

Разбор проблемы вируса

Похожим образом недооценивается влияние “базовой ставки” — объективной вероятности события — и в задаче про вирус XYZ. Большинство ответов примерно в районе 95%, в то время как правильный ответ около 2%!

Причина та же: люди переоценивают значимость срабатывания теста и недооценивают статистические данные. Попробуем придти к правильному ответу логически, не применяя формулу Байеса. Мы знаем, что из тысячи человек инфицирован только один. Остальные 999 здоровы. Так как тест на вирус ошибается в 5%, то примерно 50 здоровых людей будут считаться больными. В итоге больными будут сочтен 51 человек, из которых действительно болен только один, то есть 1 / 50 = 2%.

Проще говоря, здоровых людей слишком много, чтобы можно было положиться на один тест со сравнительно большой погрешностью.

Формальное решение с помощью теоремы Байеса:

  • H — гипотеза “человек XYZ-инфицирован”;
  • D — событие “тест дал положительный результат”;
  • P(H) — вероятность того, что человек действительно болен (0,001);
  • P(~H) — вероятность того, что человек действительно здоров (0,999);
  • P(D/H) — вероятность того, что тест сработал правильно (0,95);
  • P(D/~H) — вероятность того, что тест сработал неправильно (0,05).

P(H/D) = P(H) * P(D/H) / ( P(H) * P(D / H) + P(~H) * P(D/~H) )

P(H/D) = 0,001 * 0,95 / ( 0,001 * 0,95 + 0,999 * 0,05 ) = 0,0187

Обсуждение

В обоих примерах налицо тенденция преувеличивать значение свидетельств (человека, прибора, анализа…) и недооценивать статистику. Свидетельства для большинства зримы, конкретны и весомы, а статистика… ну да, статистична. Это приводит к разного рода искажениям, потому что само по себе свидетельство — та же статистика, оно верно лишь с некоторой вероятностью.

Проблемы, подобные двум описанным выше, часто называют беспричинными базовыми ставками, поскольку они включают в себя статистику, не имеющую очевидной причинно-следственной связи с поведением. Например, проблема такси, сформулированная более “причинно”, звучала бы, например, так: “Хотя обе компании такси приблизительно равны по силе, такси Зелёных замечены в 85% автопроисшествий, а такси Синих в 15%”. В такой формулировке кажется понятнее, почему Зеленых надо учитывать намного сильнее. Люди намного чувствительнее к причинам, чем к статистике.

В подобных задачах всегда присутствуют две вероятности:

  • вероятность свидетельства — степень неуверенности, неточности измерения, анализа, оценки;
  • вероятность события самого по себе.

Чтобы придти к верному решению, надо использовать обе вероятности надлежащим образом. Так как свидетельство кажется конкретнее, люди часто уделяют второй вероятности меньше внимания, чем следует.

Для правильного использования обеих вероятностей оптимальнее исходить даже не из формулы Байеса, а из байесианской интуиции:

Байесианская интуиция
свидетельство о событии необходимо взвешивать на весах “базовой ставки” вероятности самого события. (Это условный рефлекс, его можно выработать практикой.)

Нет смысла тренироваться в вычислении формулы Байеса в уме. Речь скорее о том, чтобы “думать байесиански”, выработать своеобразный инстинкт. Тогда в задаче про XYZ-вирус будет достаточно осознать, что при такой низкой плотности больных большинство ложных срабатываний теста придётся на здоровых людей.

В сущности, на практике такого понимания вполне достаточно, чтобы начать быстро строить догадки в верном направлении (хотя, разумеется, углубленное понимание даёт дополнительные преимущества). Движение брошенного мяча можно описать математически, но мы не занимаемся решением дифференциальных уравнений в уме, бросая мяч куда нам надо.

Игнорирование P(D/~H)

В предыдущей части рассмотрено, как ошибка оценки базовой (априорной) вероятности приводит к ошибкам. Часто же проблема кроется не в оценке вероятностей, а в учёте свидетельств, которые могли бы изменить наши убеждения.

Для иллюстрации этого типа ошибок перепишем формулу Байеса немного иначе. Исходная формула выводит вероятность основной гипотезы H с учётом свидетельства D:

Разумеется, можно посчитать и вероятность противоположной гипотезы ~H с учётом новых данных D. Это лишь вопрос переобозначения:

Поделив левые и правые части обеих равенств, приходим к одной из форм теоремы Байеса (ещё её называют “odds form”, “соотношением шансов”):

  • P(H/D) / P(~H/D) — отношение вероятностей истинности основной и противоположной гипотез с учётом новых данных;
  • P(D/H) / P(D/~H) — отношение оценок правдоподобия новых данных с точки зрения основной и противоположной гипотезы. Ещё можно это назвать отношением уверенностей, с которыми новые данные предсказываются основной и противоположной гипотезами;
  • P(H) / P(~H) — отношение вероятностей истинности основной и противоположной гипотез вообще, ещё до новых данных.

Словами это можно выразить примерно так: чем увереннее противоположная гипотеза предсказывает событие И чем меньше ей доверяли до эксперимента, тем больше вероятность истинности противоположной гипотезы, если событие всё же случилось.

Часто при оценке значимости, весомости свидетельства (P(D/H) / P(D/~H)) люди недооценивают необходимость учёта знаменателя на тот случай, если основная гипотеза неверна.

Все больше исследований показывают, что недооценка того, что данные могут свидетельствовать в пользу противоположной гипотезы, воистину вездесуща. Показателен следующий эксперимент. Испытуемых просили представить, что они обследуют пациента с красной сыпью на теле. Им предложили четыре вида сведений и предложили выбрать те, что важны для постановки правильного диагноза вымышленной болезни Digirosa:

  • процент людей, больных Digirosa;
  • процент людей, не больных Digirosa;
  • процент людей, больных Digirosa и имеющих на теле красную сыпь;
  • процент людей, не больных Digirosa и имеющих на теле красную сыпь.

Легко видеть, что эти сведения соответствуют четырём элементам формулы Байеса: P(H), P(~H), P(D/H) и P(D/~H). Хотя P(D/~H) (процент людей, не больных Digirosa и имеющих на теле красную сыпь) очевидно необходим при постановке диагноза, 48.8% испытуемых не учли этой информации — те, кто не болен Digirosa и имеет на теле красную сыпь, казались не относящимися к делу.

Важность P(D/~H) часто кажется контринтуитивной. Необходимо научиться учитывать её или вы так и будете её игнорировать. Вот ещё один пример, в котором необходимость учёта P(D/~H) кажется странной даже после предупреждения.

Представьте, что вы готовитесь к встрече с Давидом Максвеллом. Вам необходимо оценить, с какой вероятностью он является профессором университета. Вы получаете ту или иную информацию для размышлений.

Шаг 1. Вам сообщили, что Давид Максвелл был на приёме, на котором из 100 присутствовавших 25 были профессорами университетов, а 75 бизнесменами. Вопрос: какова вероятность того, что Давид Максвелл профессор университета?

Шаг 2. Вы узнали, что Давид Максвелл состоит в престижном клубе. 70% профессоров, бывших на приёме, являются членами этого клуба. 90% бизнесменов с того же приёма также являются членами клуба. Вопрос: какова вероятность того, что Давид Максвелл профессор университета?

На первом шаге всё просто — вероятность 0,25. Во втором шаге имеется небольшая тонкость. Кажется, что раз больше половины профессоров состоят в клубе, то вероятность того, что Давид Максвелл профессор, следует увеличить. Это и есть игнорирование свидетельства P(D/~H). На деле же принадлежность к клубу более характерна для бизнесменов. Тем самым вероятность того, что Давид Максвелл профессор, надо не увеличить, а уменьшить. Разберём второй шаг подробнее:

  • шансы, что Давид Максвелл профессор, до второго шага:
    0,25 / 0,75 = 0,333;
  • отношение правдоподобия с учётом новых данных:
    0,70 / 0,90 = 0,777
  • шансы, что Давид Максвелл профессор, на втором шаге:
    0,777 * 0,333 = 0,259

Формальные вычисления согласно теореме Байеса также указывают на уменьшение вероятности того, что Давид Максвелл профессор, с 0,25 на первом шаге до 0,206 на втором шаге: (0,70 * 0,25) / (0,70 * 0,25 + 0,90 * 0,75) = 0,206.

В эксперименте автора лишь 42% испытуемых уменьшили свою оценку вероятности на втором шаге. Остальные не учли, что более высокое значение P(D/~H) “перевешивает” значимость P(D/H).

Ещё один пример того же самого, но иначе поданного. Вообразите, что вы встречаетесь с Марком Смитом. Вам необходимо оценить, с какой вероятностью он является профессором университета. Вы снова получаете ту или иную информацию для размышлений.

Шаг 1. Вам сообщили, что Марк Смит был на приёме, на котором из 100 присутствовавших 80 были профессорами университетов, а 20 бизнесменами. Вопрос: какова вероятность того, что Марк Смит профессор университета?

Шаг 2. Вы узнали, что Марк Смит состоит в престижном клубе. 40% профессоров, бывших на приёме, являются членами этого клуба. 5% бизнесменов с того же приёма также являются членами клуба. Вопрос: какова вероятность того, что Марк Смит профессор университета?

В этой задаче на первом шаге всё просто — вероятность 0,80.

На втором шаге отношение правдоподобия намного больше единицы (0,40/0.05) и P(D/H) мало (0,40). Кажется разумным пренебречь P(D/~H) как очевидно малым, даже несмотря на то, что оно должно уменьшать вероятность того, что Марк профессор университета. На деле байесианское вычисление показывает, что эта вероятность с 0,8 на первом шаге возрастает до 0,97 на втором: (0,40,8)/(0,40,8+0,05*0,2)=0,97. Тем не менее, лишь 30% испытуемых попытались на втором шаге _увеличить_ оценку вероятности.

Таким образом, любая переоценка от шага 1 к шагу 2 должна учитывать P(D/~H). Совсем необязательно точно всё подсчитывать, достаточно указать в верном направлении — вот суть байесианского мышления.

Игнорирование противоположной гипотезы — знаменателя в отношении правдоподобия — не просто ошибка. Во врачебной практике бывает жизненно необходимо помнить про противоположные версии диагнозов. Вся наука держится на том, чтобы принимать в расчёт одинаково как “за”, так и “против”.

Вот ещё пример: предположим, у вашей сестры есть машина, купленная пару лет назад, марки то ли X, то ли Y, вы не помните точно. Вы помните, что она проезжает 25 миль на одном галлоне бензина и ещё ни разу не ремонтировалась. Вы знаете, что:

  • 65% машин марки X проезжают 25 миль на одном галлоне.

Доступны также следующие сведения:

  • % машин марки Y, что проезжают 25 миль на одном галлоне;
  • % машин марки X, не требовавших ремонта в первые два года эксплуатации;
  • % машин марки Y, не требовавших ремонта в первые два года эксплуатации;

Вопрос: если вы можете получить только одно из этих трёх сведений, что вы выберете, чтобы уточнить, какой марки машина вашей сестры?

Разберём задачу подробно:

  • гипотеза H1 — машина марки X;
  • гипотеза H2 — машина марки Y;
  • D1 — диагностический признак “машина проезжает 25 миль на одном галлоне”;
  • D2 — диагностический признак “машина не требует ремонта в первые два года эксплуатации”.

У нас есть один кусочек сведений, P(D1/H1), какой процент машин марки X проезжает 25 миль на одном галлоне.

Возможны два отношения правдоподобия: P(DI/Hl)/P(Dl/H2) и P(D2/HI)/P(D2/H2). Так как мы не можем получить оба, то разумно суметь вычислить полностью хотя бы одно и запросить P(Dl/H2), узнав, какой процент машин марки Y проезжает 25 миль на одном галлоне. Если этот процент будет отличаться от известных нам 65%, у нас появится пища для содержательного размышления.

Выбор выглядит ясным, но для неподготовленного человека он совершенно не очевиден. Эксперименты показали, что большинство (60,4%) желает уточнить P(D2/H1) процент машин марки X, не требовавших ремонта в первые два года эксплуатации. Это совершенно бесполезная информация, так как мы не можем узнать P(D2/H2). Без знания того, какой процент машин марки Y не требует ремонта в первые два года, полученную информацию невозможно использовать.

Сильное беспокойство вызывает то, что схожие результаты дал аналогичный эксперимент со студентами старших курсов медицинских вузов. Они пытались диагностировать тропическую болезнь типа A или B. Им сообщили вероятность P(симптом1/болезнь-A) P(симптом1/болезнь-A) и предложили на выбор одно из трёх сведений: P(симптом1/болезнь-B), P(симптом2/болезнь-A) или P(симптом2/болезнь-B). Ясно, что лишь первое из них давало возможность сравнить шансы, но 69.3% медиков-старшекурсников не смогли это увидеть.

Тенденция игнорировать иные возможные объяснения особенно ярко проявляется в широко известном “эффекте Барнума” (Барнум, знаменитый циркач, известен фразой “Дураки рождаются ежеминутно”). Часто на подготовительных курсах психологии преподаватель собирает образцы почерков всех учащихся и через неделю раздаёт “личные персональные уникальные анализы” почерка, составленные из общих фраз. Обычно учащиеся высоко оценивают точность подобных “анализов” — от 7 до 9 баллов по 10 баллов. Когда их просят сравнить описания, они бывают ужасно ошеломлены, увидев у соседей то же описание, что у себя. Именно эффект Барнума лежит в основе мифов о точности астрологии и тому подобных псевдонаук.

Если приглядеться к причинам этого, то мы увидим нашего старого знакомого — игнорирование P(D/~H). Люди неявно оценивают вероятность того, что описание “обычно вы открыты и дружелюбны, но иногда замкнуты и неразговорчивы…” относится к ним и оценивают её как высокую. Более формально, высокой оценивается вероятность

P("вы открыты и т.д."/"это описание сделано для меня лично")

Это, разумеется, не отношение правдоподобия. Это всего лишь P(D/H). Чтобы оценить шансы правдоподобия гипотез, необходимо знать P(D/~H), то есть

P("вы открыты и т.д."/"это описание сделано для всех людей вообще")

Конечно, мы немедленно увидим, что эта вероятность точно так же высока. Описание “вы открыты и т.д.” настолько размыто, что применимо практически к каждому, кто готов узнать в нём себя. Таким образом, отношение правдоподобия

P("вы открыты и т.д."/"это описание сделано для меня лично") / P("вы открыты и т.д."/"это описание сделано для всех людей вообще")

всегда равно примерно единице. Согласно формуле

 (шансы истинности гипотезы после наблюдения) = (отношение правдоподобия) * (шансы истинности гипотезы до наблюдения)

сколько бы данных ни было собрано, при отношении правдоподобия, примерно равном единице, шансы истинности гипотезы не изменятся — свидетельства не влияют на них! Иными словами, данное свидетельство не несёт ничего нового — это очевидно, если обратить внимание на P(D/~H).

Сверхуверенность при калибровке знаний

Эту часть мы начнём с небольшого тестирования вашей способности калибровать свои знания. В каждом из утверждений заполните пропущенные места вашими лучшими оценками:

  1. Я на 90% уверен, что возраст Мартина Лютера Кинга в момент смерти был где-то между ____ и ___ годами.
  2. Я на 90% уверен, что число книг в Ветхом завете где-то между ____ и ___ книгами.
  3. Я на 90% уверен, что год рождения Вольфганга Амадея Моцарта между ____ и ___ .
  4. Я на 90% уверен, что между период беременности азиатских слонов между ____ и ___ днями.
  5. Я на 90% уверен, что глубочайшее место в океане между ____ и ___ футами.
  6. Я на 90% уверен, что длина Нила между ____ и ___ милями.
  7. Я на 90% уверен, что число стран-экспортёров нефти между ____ и ___ .
  8. Я на 90% уверен, что диаметр Луны между ____ и ___ милями.
  9. Я на 90% уверен, что вес боинга-747 между ____ и ___ фунтов.
  10. Я на 90% уверен, что расстояние авиаперелета Лондон-Токио между ____ и ___ милями.

Эти вопросы связаны с ещё одним видом затруднений, испытываемых людьми при работе с вероятностями — так называемой парадигме калибровке знаний.

Вероятность одного утверждения оценить невозможно — в самом деле, как мне понять, насколько вы правы, говоря, что ваш племянник с вероятностью 95% женится в этом году? Однако множество подобных утверждений оценить уже можно, так как появляется возможность применить методы статистики.

Например, когда метеоролог говорит, что завтра с вероятностью 90% будет солнечно и тепло, то всё нормально — очевидно, он собрал всю доступную ему информацию, корректно её обработал и обозначил вывод с такой-то степенью уверенности. Одна ошибка — дождливый день — ни о чем не говорит. Однако, если вы увидите, что метеоролог ошибается в девяти прогнозах из десяти, у вас возникнут серьёзные сомнения в достоверности его прогнозов. Иными словами, при уверенности метеоролога в 90% вы готовы простить не больше 10% ошибочных прогнозов.

Достоверность оценок человека подчиняется ровно тем же самым правилам, что достоверность прогнозов метеоролога. Эпистемическая рациональность требует, чтобы при уверенности 70% были верны семь утверждений из десяти, при уверенности 80% — восемь утверждений из десяти и так далее. Другими словами, человек должен правильно оценивать как то, что он знает, так и то, чего он не знает.

Многочисленные исследования показывают так называемую сверхуверенность. Субъективная уверенность, как правило, заметно выше, чем объективное измерение соотношения правильных/неправильных утверждений. Например:

  • при уверенности в 100% люди бывают правы в 88%;
  • при уверенности в 90% люди бывают правы в 75%;
  • при уверенности от 70% до 90% на деле люди бывают приблизительно лишь в 50%;

Эффект сверхуверенности при калибровке своих знаний обязан (в большинстве случаев) тенденции “фиксироваться” на первом пришедшем в голове. Мы словно “присваиваем” себе этот ответ и “защищаем” его в последующих размышлениях: “это же мой ответ, как он может быть неверен?!”.

Причина неоправданно высокой уверенности в своей оценке чаще всего кроется в том, что над её возможной неверностью даже не задумываются. Человек зачастую не осознаёт, что даже свидетельства он может подбирать пристрастно — те, что подтверждают его первую оценку.

Вы можете проверить себя на сверхуверенность: в конце приведены ответы на вопросы, заданные в начале главы. Так как вы отвечали с 90%-й уверенностью, только один из десяти ответов имеет полное право оказаться неверным. Однако есть хорошие шансы, что вы ошибётесь больше чем один раз — даже несмотря на то, что вас предупреждали!

Сверхуверенность — вовсе не лабораторный феномен. Она проявляется в спортивных прогнозах, предсказаниях экономистов, наконец, при предвидении своих собственных действий. Одним из обличий сверхуверенности является ошибка планирования — недооценка времени, требуемого на какое-либо дело (например, написание диплома, заполнение налоговой декларации или завершение строительства).

У сверхуверенности при калибровке своих знаний много последствий. Люди, переоценивающие свои знания, меньше стремятся учиться и исправлять свои ошибки и заблуждения. Критикуя других за неповоротливость и нерасторопность, легко не заметить того же самого у себя.

Весьма показательны опросы автомобилистов. 75% водителей признаются, что во время вождения говорят по телефону, едят, бреются или занимаются чем-то ещё. Однако 75% тех же самых людей огорчаются или раздражаются, когда видят, что другие водители говорят за рулём по телефону или едят! Другими словами, тысячи людей сверхуверены в том, что их болтовня по телефону не влияет на их вождение. Такое нарушение эпистемической рациональности (когда убеждения не соответствуют действительности) влечёт за собой расплату в виде увеличения ДТП из-за невнимательности.

Эпистемическая иррациональность и плохая оценка достоверности своих суждений или прогнозов — весьма распространённое явление, чреватая многими неприятностями. Например, сверхуверенность среди врачей — чрезвычайно насущная и опасная проблема.

Дополнительные сложности при работе с вероятностями. Часть 1

Ошибка конъюнкции

Рассмотрим знаменитую “проблему Линды”:

Линде 31 год, она не замужем, за словом в карман не лезет и очень сообразительная. Она училась на факультете философии. Студенткой много размышляла о дискриминации и социальной несправедливости, участвовала в демонстрациях против распространения ядерного оружия.

Оцените эти утверждения по шкале от 1 (самое вероятное) до 8 (наименее вероятное):

  • a. Линда учитель в начальной школе ___;
  • b. Линда продавец в книжном магазине и посещает занятия по йоге ___;
  • c. Линда активно участвует в движении феминисток ___;
  • d. Линда социальный работник ___;
  • e. Линда состоит в лиге Защиты Прав Женщин ___;
  • f. Линда банковский служащий ___;
  • g. Линда менеджер по продажам ___;
  • h. Линда банковский служащий и активно участвует в движении феминисток ___;

Большинство людей при прохождении этого теста демонстрирует так называемую “ошибку конъюнкции”. Вариант “h” (Линда банковский служащий и активно участвует в движении феминисток) является соединением вариантов “c” и “f”, поэтому вероятность варианта “h” не может быть выше вероятностей “с” или “f”. Тем не менее, свыше 80% опрошенных присваивает варианту “h” более высокую вероятность, чем вариантам “c” или “f”

Такое часто случается благодаря эффекту “подстановки атрибута”. Он возникает, когда необходимо оценивать один атрибут предмета, а на деле оценивается другой атрибут, связанный с первым — по принципу “меньшего труда”. Например, в данном примере “участник движения феминисток” кажется ближе к Линде и “тащит” за собой “банковский служащий”, а сам по себе атрибут “банковский служащий” с описанием Линды никак не связан и его труднее принять во внимание. Логика, конечно же, диктует нам, что множество “феминистки И банковские служащие” является лишь частью множества “банковские служащие” и потому меньше его.

Инвертирование условных вероятностей

Инвертирование условных вероятностей — одна из тех ошибок в оценке вероятностей, которая часто отражается на реальной жизни, Речь о предположении, что вероятность события A при условии наступления события B – это то же самое, что вероятность события B при условии наступления события A. Это два совершенно разных случая часто принимаются за один. Конечно, иногда различие очевидно: например, вероятность беременности при условии сексуального контакта совсем не то же самое, что вероятность сексуального контакта при условии беременности. Но бывают и более сложные случаи.

Напомним определение условных вероятностей:

     P(A/B) = P(A и B)/P(B)
     P(B/A) = P(A и B)/P(A)

Когда вероятность события A намного больше условного события B, тогда P(A/B) будет намного выше, чем P(B/A).

В 1988 году в одной из калифорнийских газет была опубликована статья с результатами опроса студентов. Опрос, как казалось, подтверждал, что вероятность употребления тяжёлых наркотиков растёт, если человек курил марихуану. На самом деле опрос показал, что вероятность того, что человек курил марихуану, выше среди тех, кто употреблял тяжёлые наркотики. Это два совершенно разных случая. Вероятность того, что студент употребляет тяжёлый наркотик, попробовав перед тем марихуану, намного, намного меньше, чем вероятность того, что употребляющие тяжелый наркотик раньше курили марихуану.

Большинство курящих марихуану не пробовали тяжелых наркотиков, но большинство употребляющих тяжёлые наркотики раньше курили марихуану.

Для наглядности:

 употребляет тяжёлые наркотикине употребляет тяжёлые наркотики
курил марихуану50950
не курил марихуану102000

Очень немногие (60 из 3010, меньше 2%) употребляют тяжёлые наркотики, зато примерно треть курили марихуану. Вероятность того, что употребляющие тяжёлые наркотики курили марихуану, весьма велика:

P(курили марихуану / употребляют тяжёлые наркотики) = 50/60 = 0,83

Тем не менее, вероятность того, что курящий марихуану перейдёт на тяжёлые наркотики, весьма мала:

P(употребляют тяжёлые наркотики / курили марихуану) = 50/1000 = 0,05

Важная область, в которой инвертирование условных вероятностей происходит особенно часто — диагнозы в медицине. Обнаружено, что как пациенты, так и врачи путаются, ошибочно считая, что вероятность болезни, сопровождаемой данным симптомом — это то же, что вероятность данного симптома при этой болезни.

Например, если я вам скажу, что некоторый тест обнаружил у вас рак, вы будете, мягко говоря, обеспокоены. Если я добавлю, что точность данного конкретного теста 90%, вы взбудоражитесь ещё больше. Однако если я вам скажу, что вероятность рака на самом деле меньше 20%, всё станет выглядеть намного лучше, правда?

Подробнее: предположим, этот тест проверили на 1000 человек. Рак нашли у ста из них. Для наглядности:

 рак действительно естьрака нет
положительный тест90500
отрицательный тест10400

Из таблицы видно, что точность теста в самом деле 90% — реальный рак он нашёл в 90 случаях из ста. Это вероятность P(положительный тест / рак действительно есть). Это очевидно не то, что нужно вам. Вам требуется вероятность P(рак действительно есть / положительный тест), а она равна лишь 90/590=15,3%.

К несчастью, это далеко не придуманный пример. Известен случай, когда врач порекомендовал превентивную терапию, спутав вероятность рака по показаниям теста, с вероятностью срабатывания теста при раке. Так как превентивная терапия заключалась в удалении молочных желез, вы теперь можете понять, насколько серьёзными могут быть последствия ошибок обсуждаемого вида.

Дополнительные сложности при работе с вероятностями. Часть 2

Эффект определённости (The Certainty Effect)

В известной работе Канемана и Тверски 1979 года приведено много примеров эффекта определённости, когда люди переоценивают гарантированные исходы по сравнению с вероятными.

Вот один из примеров. Выберите один из двух вариантов:

  • A. 2500 долларов с вероятностью 0,33; 2400 долларов с вероятностью 0,66 и ничего с вероятностью 0,01;
  • B. 2400 долларов наверняка.

Теперь снова выберите один из двух вариантов:

  • C. 2500 долларов с вероятностью 0,33; ничего с вероятностью 0,67;
  • D. 2400 долларов с вероятностью 0,34; ничего с вероятностью 0,66.

Канеман и Тверски обнаружили, что 82% опрошенных в первом случае выбрали вариант B. Это нормальный выбор, в нём нет ничего плохого. Проблема в том, что во втором случае 83% тех же опрошенных выбрали вариант C. Этот выбор противоречит выбору B в первом случае. Подробнее:

Предпочтение варианта B в первом случае означает, что полезность 2400 долларов больше, чем полезность 2500 долларов с вероятностью 0,33 плюс полезность 2400 долларов с вероятностью 0,66. Формально можно записать так:

   u($2400) > 0,33u($2500) + 0,66u($2400)

Вычитая 0,66u($2400) из обеих частей неравенства, получим:

   0,34u($2400) > 0,33u($2500)

Однако это именно то, что предлагается во втором случае. Тем не менее люди во втором случае выбирают вариант C, словно 0,33u($2500) > 0,34u($2400). (Функция полезности u(сумма) словно бы даёт разный результат в зависимости от вероятности.)

Канеман и Тверски описывают это поведение в рамках модели «теории перспектив» (prospect theory), исходя из того, что «вес» функции полезности действительно нелинейно меняется в зависимости от вероятности, как показано на рисунке ниже. Это хорошо описывает «перевешивание» варианта C во втором случае, когда увеличения вероятности варианта D недостаточно для придания ему веса.

Трудности «распаковки» составляющих в оценке вероятностей

Ранее мы видели трудности, испытываемые людьми при конъюнкции. В «проблеме Линды», конечно, конъюнкция в прямом виде вообще не применяется — из-за «подстановки атрибутов» задача не рассматривается как вероятностная. Вместо оценки вероятностей задача замещается гораздо более простой задачей «похожести» (»банковская служащая-феминистка» больше похоже на Линду, чем просто «банковская служащая»).

Однако проблемы возникают и при оценке отдельных составляющих — особенно, когда эти составляющие не перечислены явно.

В 1994 году Тверски и Кёхлер опубликовали отчёт об исследовании, в котором две группы оценивали процент смертей в США по разным причинам. Первая группа оценила, что «по естественным причинам» происходит 58% смертей. Вторая группа сочла, что от рака случается 18% смертей, от сердечного приступа 22% и по прочим естественным причинам 33% смертей. Легко видеть, что общий процент смертей от естественных причин (73%) намного выше оценки первой группы, которая не дробила по причинам (58%).

Ситуация с неточным подсчётом процента «смертей от естественных причин» — типичный пример оценки неявного перечисления. При оценке общей суммы люди систематически недооценивают — результат оценки «категории как целого» часто меньше суммы оценок каждой составляющей. Минимизируя мыслительные усилия, люди при оценке категории в целом не «распаковывают» её, не перечисляют её составляющие.

Ошибка игрока

Пожалуйста, ответьте на два вопроса:

Вопрос A. Вы кидаете честную монету, у которой шансы «орёл»/«решка» равны 50/50. «Орёл» выпал пять раз подряд. На шестом броске:

  • более вероятно, что выпадет «решка»?
  • более вероятно, что выпадет «орёл»?
  • равновероятно, что выпадет «орёл» или «решка»?

Вопрос B. У «однорукого бандита» люди выигрывают в среднем один раз из десяти. Юлия только что выиграла три раза подряд. Каковы её шансы выиграть в четвёртый раз?

На этих вопросах хорошо видна так называемая «ошибка игрока», когда люди видят связь между прошлыми и будущими событиями в то время как они совершенно независимы. Свойством независимости прошлых и будущих событий обладают многие азартные игры, в том числе рулетка. Не будем учитывать тонкости вроде «зелёного зеро» или «двойного зеро» и предположим, что половина секторов рулетки красная, половина чёрная. Шансы красного или чёрного сектора, таким образом, 0,5. Даже после пяти или шести красных подряд шанс, что следующим выпадет красный сектор, всё равно 0,50 (при исправной рулетке, конечно).

Ошибка игра проявляется не только у новичков. Профессиональные игроки, которые посвящают игре 20 и более часов в неделю, подвержены ей даже больше, чем обычные люди.

Важно понимать, что ошибка игрока возникает не только в азартных играх. Например, пол будущего ребенка тоже определяется с вероятностью приблизительно 0,50, но очень часто пары, имеющие двух девочек, хотят третьего ребёнка, потому что «уж на этот-то раз обязан родиться мальчик!»

Ошибка игрока связана со множеством ошибок при оценке вероятности разных случайных событий. Одна из характерных ошибок — убеждённость в том, что действительно случайная последовательность не может содержать никаких «неслучайных» последовательностей типа «HHHHHH» или «HHTTHHTTHHTTHHTTHHTT». По этой причине люди не могут придумать «истинно случайные» последовательности — когда они пытаются сделать это, у них получается слишком мало непрерывных повторов или шаблонов. В попытках добиться случайности люди слишком часто меняют соседние значения в последовательности, чтобы избежать повторов.

На этом основана демонстрация паранормальных способностей, время от времени устраиваемая для студентов-психологов. Одного из студентов просят записать на листе бумаги двести цифр из множества (1,2,3) в случайном порядке. Этот список видит только студент, но не преподаватель. Студента просят сосредоточиться на первой цифре последовательности, а преподаватель пытается её угадать. Когда преподаватель называет цифру, студент сообщает аудитории верную цифру и отмечает «угадал / не угадал», после чего мысленно сосредотачивается на следующей цифре.

Важно отметить, что перед началом демонстрации преподаватель сообщает, что продемонстрирует свою «психическую мощь» и просит аудиторию заранее определить, какого процента угаданных им цифр будет достаточно для доказательства наличия у него паранормальных способностей. Понятно, что при случайном угадывании будет около 33% попаданий, поэтому класс обычно соглашается с тем, что для доказательства паранормальных способностей преподавателя требуется не меньше 40% угаданных цифр. Затем проводится демонстрация и результат попаданий существенно больше 40% изумляет многих.

Знакомые с тем, как люди придумывают случайные последовательности, легко догадаются, в чём дело. Преподаватель знает, что люди при этом стараются избегать длинных повторов и прочие одинаковых последовательностей. Какова вероятность появления двойки после двух двоек подряд? По-прежнему 1/3. Но люди пытаются придумать случайную последовательность и не пишут третью двойку подряд! Таким образом, преподавателю достаточно назвать любую из двух цифр, кроме последней названной студентом, чтобы «угадывать» чаще чем в 33% — без всякой телепатии.

Дополнительные сложности при работе с вероятностями. Часть 3

Дополнительные сложности при работе с вероятностями. Часть 3

Оценка вероятностей: клинические предсказания против страховых

Понимание и избегание ошибки игрока — не-математическое знание большой силы. Оно даёт глубокое понимание того, что большинство событий составляет сложную смесь результатов случайных и не-случайных, систематических, факторов.

Нежелание признать роль случайности способно уменьшить нашу способность предсказывать результаты. Осознание роли случайности требует признания того, что наши предсказания никогда не бывают стопроцентно точны и всегда содержат ошибки.

Интересно, однако, что признание неточности наших прогнозов способно помочь нам точнее предсказывать. Это видно на очень простом эксперименте. Человек сидит перед красной и синей лампочками и должен угадывать, какая из них мигнёт. Это повторяется много раз и испытателю платят за успешные предсказания. Лампочки мигают случайным образом — 70% красная, 30% синяя. Испытатели быстро понимают, что красная мигает чаще. Однако они думают, что мигания подчинены некоему закону, и редко допускают мысль о случайном порядке миганий. В результате они пытаются угадать каждое мигание отдельно и в среднем угадывают 70% красных вспышек и 30% синих. Это явно не лучшая стратегия.

Рассмотрим подробнее. Человек угадывает 70% красных вспышек и 30% синих при том, что соотношение “красные к синим” равно 70:30. Для серии из ста попыток из 70-ти красных было угадано 49 (70% от 70) и из 30 синих угадано 9 (30% от 30). Общий процент попаданий — 58%. Это намного меньше, чем если бы просто заметить, что красная лампочка мигает гораздо чаще и каждый раз предсказывать красную вспышку — количество верных попаданий в этом случае составило бы 70%.

Оптимальная стратегия в данном случае подразумевает, что необходимо смириться с тем, что синие вспышки не будут угадываться никогда. Так как за иногда угаданные синие вспышки тоже платят, кажется неочевидным, что есть смысл вообще не угадывать синие. Однако правильное вероятностное мышление именно это и требует — сосредоточиться на угадывании более частых красных вспышек, сознательно допуская ошибки при угадывании менее частых синих.

Допущение ошибок в менее частых случаях ради уменьшения общего числа ошибок — трудно.

В статистике известен термин “актуарное предсказание” — предсказание какого-то исхода для всех людей с определёнными признаками. Например, предсказание продолжительности жизни 77,5 лет для некурящих и предсказание продолжительности жизни 64,3 года для курящих — актуарные предсказания. Если отбирать более чем по одному признаку, такие предсказания можно сделать точнее. Пример: продолжительность жизни 58,2 лет для курящих, с излишним весом и не занимающихся спортом. Обычно подобные предсказания со многими признаками точнее предсказаний с одним признаком. Они применяются в экономике, криминалистике, медицине, психологии и много где ещё.

Некоторые группы практикующих психологов, тем не менее, заявляет о своей способности точно предсказывать не для групп, но для конкретных людей. Такие предсказания называются клиническими.

Клинические предсказания могли бы служить хорошим дополнением к актуарным, если бы не одно “но” — они не работают.

Чтобы клинические предсказания можно было применять, должен существовать способ легкой фиксации обозримого количества информации, необходимой врачу для предсказания. К сожалению, пока все попытки организовать подобное терпели неудачу.

Многочисленные исследования, проводимые на протяжении более сорока лет, неизменно показывают, что актуарные предсказания в целом точнее клинических, даже если врач гораздо больше знает о пациенте, чем статистик.

Если врачу сообщали актуарное предсказание и просили учесть его в клиническом предсказании, то даже в этом случае клинические предсказания оказывались менее точными. Это возвращает нас к обсуждавшемуся выше приему “сознательно согласиться с неизбежностью ошибок, чтобы уменьшить их количество”. Актуарные статистики следуют этому правилу, а клинические врачи — нет. Они стараются “угадать” каждый случай и в результате ошибаются чаще, чем статистики.

Заядлые игроки всячески избегают стратегии “допускать ошибки, чтобы уменьшить их общее количество”. Например, игроки в блекджек избегают так называемой базовой стратегии, снижающей норму прибыли казино с 6-8% .до 1%, потому что уверены в том, что возможна стратегия, эффективная не на последовательности игр, а в каждой игре в отдельности. Вместо актуарной стратегии, статистически сберегающей тысячи долларов, они предпочитают клиническую, исходящую из каждой конкретной ситуации.

Дополнительные сложности при работе с вероятностями. Окончание

Дополнительные сложности при работе с вероятностями. Часть 4

Другие аспекты эпистемической рациональности: проверка гипотез и их фальсифицируемость

Подобно тому, как люди затрудняются посмотреть на данные с точки зрения альтернативной гипотезы, им также требуется много времени, чтобы придумать, как их предположения могут быть опровергнуты. Как правило, люди (и учёные в том числе) ищут подтверждения своим гипотезам, нежели опровержения.

Вот пример этого:

Четыре символа ниже — это четыре карты, лежащие на столе. На одной стороне карты буква, на другой цифра. Имеется правило: если на буквенной стороне карты гласная буква, то на обороте карты чётное число. Какие карты необходимо перевернуть, чтобы проверить правило?

         K      A      8      5

Эта задача интенсивно исследовалась не одним десятком учёных по двум причинам. Во-первых, большинство людей даёт на неё неправильные ответы. Во-вторых, дьявольски трудно понять, почему это так.

Ответ выглядит очевидным: если карта с гласной буквой должна на обороте иметь чётное число, то надо перевернуть карты «A» (чтобы проверить, чётное ли число на обороте) и «8» (чтобы проверить гласная ли буква на обороте). Загвоздка в том, что этот ответ (а его даёт примерно половина респондентов) неверен!

Второй по распространенности (20%) ответ - перевернуть только карту «A» и проверить, чётное ли число на обороте — тоже неверен!

Ещё 20%, предлагаюших проверить карты «K» и «8», тоже неправы.

Если вы попытались сами ответить на этот вопрос, то почти наверняка ошиблись. Разберём подробнее:

− люди правильно делали, не учитывая карту «K» — правило ничего не говорит о картах с согласными буквами; - люди правильно учитывали карту «A» — это гласная буква и необходимо проверить, есть ли на обороте чётное число.

Основная трудность с картами «5» и «8». Многие ошибочно полагают, что проверить надо карту «8», чтобы убедиться, что на обороте гласная буква. Однако, если на обороте карты «8» согласная буква, то это не свидетельствует о верности или неверности правила — правило ничего не говорит о согласных! А вот если на обороте карты «5» окажется гласная буква, то это свидетельствует об ошибочности правила, так что карту «5» необходимо проверить.

Обобщая: правило вида «если P, то Q» может быть опровергнуто только демонстрацией P и не-Q комбинации. Таким образом, для проверки правила только «P и не-Q» карты — в нашем примере «A» и «5» карты.

Почему этот ответ так тяжело найти, если задача после объяснения кажется очень простой? На этот счёт имеется много теорий. Одна из старейших теорий утверждает, что людям горадо легче искать подтверждения своим предположениям и потому они склонны переворачивать карты «A» и «8», чтобы найти свидетельства в поддержку правила и не проверять карту «5», на обороте которой может оказаться гласная буква, опровергающая правило.

Несмотря на то, что принцип «ищи опровержение предположению» явно полезен, множество исследований говорит о том, что подобное поведение «неестественно», оно не приходит в голову.

Это видно также на примере знаменитой «задачи 2-4-6»: участникам сообщают, что экспериментатор задумал некоторое правило и тройка чисел (триплет) 2-4-6 ему удовлетворяет. Каждый участник может назвать сколько угодно триплетов, а экспериментатор сообщает, удовлетворяет данный триплет правилу или нет. Когда участник сочтёт, что окончательно понял задуманное правило, он записывает его и отдаёт экспериментатору.

Задуманное правило: «любые три числа в порядке возрастания». Как правило, если его и находят, то с огромным трудом, так как участники склонны придумывать подтверждения своим мыслям, а не искать им опровержения. Например, при проверке правила «три соседних чётных числа по возрастанию» придумывают соответствующие триплеты, слышат подтверждение от экспериментатора и чем дальше, тем больше укрепляются в своём предположении.

В большинстве случаев люди даже не пытались придумать пример, противоречащий их гипотезе, например 8-40-12.

В другой версии этого же эксперимента участникам сообщалось, что экспериментатор задумал два правила: DAX и MED, причём триплет 2-4-6 удовлетворяет правилу DAX. Участники называли триплеты, а экспериментатор сообщал, какому из двух правил он удовлетворяет. Правило DAX, как в оригинальном эксперименте, это «любые три числа в порядке возрастания», правило MED: «какие угодно числа». В этой версии участникам было намного легче придумывать в том числе и опровергающие триплеты — просто потому, что одна из двух гипотез так или иначе подтверждалась. В сущности, данная версия эксперимента показывает, как обойти наше нежелание придумывать опровергающие примеры — достаточно добавить второе предположение.

Таким образом, плохая новость — людям очень трудно думать «против» тех гипотез и предположений, которые им надо проверить. Хорошая новость заключается в том, что это тренируемый навык. В частности, все учёные путём долгого обучения вырабатывают навык автоматического сомнения: «Чем ещё я могу объяснить данные факты?»

Заключение и выводы

Максимально полезные действия можно выбрать лишь при верной оценке вероятности разных вариантов будущего. Инструментальная рациональность базируется на эпистемической рациональности.

Эпистемическая рациональность поддерживает согласованность наших убеждений с наблюдениями. Мы формируем наши убеждения исходя из наших субъективных оценок вероятности. В этой части книги мы видели, как часто эти оценки далеки от оптимальных.

Люди сплошь и рядом не учитывают информацию, необходимую для точной оценки:

  • базовая ставка (априорная вероятность) недооценивается, потому что воспринимается как оторванная от жизни абстракция;
  • вероятность событий, предсказываемых альтернативными гипотезами, недооценивается или вовсе игнорируется;
  • гипотеза, которая считается основной, крайне редко проверяется по-настоящему путем поиска опровергающих её примеров.

В результате исследований появился удручающе длинный список искажений, присущих людям как в области эпистемической, так и в области инструментальной рациональности. Неужели у нас всё настолько плохо? Ряд исследователей предполагает, что полученные результаты можно интерпретировать иначе. В следующей части мы подробно исследуем этот вопрос.

Add new comment

Plain text

  • No HTML tags allowed.
  • Web page addresses and e-mail addresses turn into links automatically.
  • Lines and paragraphs break automatically.
CAPTCHA
This question is for testing whether or not you are a human visitor and to prevent automated spam submissions.