Judgment

Оригинальное название: 
Judgment

Предисловие

Ожидаемая полезность исхода — произведение вероятности исхода на полезность исхода. Ожидаемая полезность действия — сумма ожидаемых полезностей всех вариантов исхода.

Определение наилучшего действия включает в себя вычисления вариантов исхода. Разумеется, это не сознательные вычисления, а доверительные оценки, исходя из наших убеждений. Если наши оценки неточны, то и решения не приведут к желаемому результату.

Когда мы выбираем, что делать, нам нужна уверенность, что наши оценки близки к реальности. В этом смысле рациональность убеждений — эпистемическая рациональность — одна из основа рациональности действия.

Рациональность убеждений можно развивать, нарабатывая привычки в областях:

  • оценки вероятности тех или иных причин происходящего;
  • оценки надёжности свидетельств;
  • проверки предположений.

Для уточнения убеждений не нужно быть гением математики и считать в уме вероятности. Как и в случае с аксиомами выбора, есть несколько принципов, помогающих приближать убеждения к реальности. Аналогично существуют и нарушения этих принципов.

В 2002 году Д.Канеман получил Нобелевскую премию за анализ законов работы человеческого рассудка, выполненный им совместно с А.Тверски. В частности, он обнаружил, что мы используем сокращённые оценки вероятности (не вычисления, а эвристики), которые во многих случаях систематически уводят нас от точных оценок. Это вызвало шквал исследований в области когнитивной психологии, принятия решений и методов оценки вероятностей в реальном мире.

В этой части обсуждаются принципы рациональности убеждений, а также то, как люди отступают от них, используя приближенные эвристики.

Bayes' Theorem

Предупреждение. Данная часть требует некоторого знакомства с теорией вероятности. Кое-какие базовые понятия здесь Станевичем упоминаются, но явно не полностью.

Для достижения эпистемической рациональности необходимо, чтобы убеждения основывались на оценках вероятностей, приближенных к реальности. Вычисление вероятностей — одна из моделей таких оценок.

Чисто математически понятие «вероятность» подчиняется определенным объективным правилам. Самые важные:

  • вероятность всегда не меньше нуля и не больше единицы. Формально:
    0 ≤ P(A) ≤ 1, где P — значение вероятности события A;
  • если нечто случается достоверно, всегда, то его вероятность равна единице;
  • если нечто не случается вообще никогда, то его вероятность равна нулю;
  • если события A и B не могут случиться одновременно, они называются взаимоисключающими. Вероятность наступления любого из взаимоисключающих событий — это сумма вероятностей каждого события в отдельности: P(A или B) = P(A) + P(B);

Часто событие A может случиться, когда событие B уже произошло («если человек дожил до 80, он может дожить и до 90»). Вероятность события A в этом случае «условная вероятность» и записывается как P(A/B).

Для взаимоисключающих событий A и B вероятность P(A/B) = 0, как и P(B/A) = 0.

Для любых событий A и B вероятность P(A/B) = P(A и B)/P(B). Физический смысл — предположим, что:

  • до 80 доживают половина. Вероятность 0,5 (это событие B);
  • до 90 доживает треть. Вероятность 0,3 (это событие «A и B»);

Тогда вероятность «дожил до 80 и доживёт до 90»: 0,3 / 0,5 = 0,6, то есть если уж человек дожил до 80, то шансов дожить до 90 у него выше среднего.

Таким образом, мы можем описывать вероятности комбинаций событий. Путём простых преобразований мы получим одну из самых известных формул в теории принятия решений — теорему Байеса или правило Байеса.

Эта формула была получена английским математиком Реверендом Томасом Байесом ещё в 18 веке и решает не просто абстрактную задачу преобразования P(B/A) в P(A/B).

Данной формулой описывается формальное правило обновления наших убеждений на основе полученных в результате наблюдения данных.

Это правило отвечает на вопрос «насколько можно доверять гипотезе B, предсказывающей наблюдение A», если известны:

  • степень доверия к гипотезе B до наблюдения A (насколько мы уверены в теории?);
  • уверенность теории B в предсказании A (насколько сильно теория разрешает существание A?);
  • степень доверия к альтернативной гипотезе (насколько мы уверены в других гипотезах?);
  • уверенность альтернативной гипотезы в предсказании A (насколько сильно другие гипотезы разрешают существание A?);
  • событие A уже произошло.

Прежде чем перейти к ней, немного об обозначениях. Хотя в дальнейшем используется сравнительно много математических символов, суть теоремы Байеса может быть понята вообще без математики. Формальные вычисления полезны, если нужна точная уверенность, но проще научиться нескольким правилам размышления, по аналогии с аксиомами выбора.

  • P(H) — вероятность того, что гипотеза H верна, до эксперимента;
  • P(~H) — вероятность того, что гипотеза H неверна, до эксперимента;
  • P(H/D) — вероятность того, что гипотеза H подтверждается наблюдением D, после эксперимента;
  • P(D/H) — вероятность того, что наблюдение D предсказывается гипотезой H (насколько сильно гипотеза H требует существования наблюдения D);
  • P(D/~H) — вероятность того, что наблюдение D предсказывается гипотезой, альтернативной H (насколько сильно гипотеза, альтернативная H. требует существования наблюдения D).

Обратите внимание, что P(D/H) ни в коем случае не противоположность P(D/~H) — наблюдение D может предсказываться разными гипотезами с произвольной степенью уверенности, то есть с разными вероятностями, и сумма этих вероятностей не равна единице!

Пример. На месте преступления обнаружен нож. Известно, что корсиканцев среди преступников 20%, что корсиканцы оставляют нож на месте преступления в семи случаях из десяти, а остальные в четырёх случаях из десяти. С какой вероятностью нож оставил корсиканец? Более формально:

  • H — гипотеза «преступление совершил корсиканец»;
  • D — событие «на месте преступления найден нож»;
  • P(H) — вероятность того, что преступление совершил корсиканец, равна 0,2;
  • P(D/H) — гипотеза «нож оставил корсиканец» предсказывает наличие ножа с вероятностью 0,7;
  • P(D/~H) — остальные гипотезы предсказывают наличие ножа с вероятностью 0,4;

Подсчитываем: (0,2 * 0,7) / (0,2 * 0,7 + 0,8 * 0,4) = 0,14 / (0,14 + 0,32) = 0,14 / 0,46 = 0,304„,

Таким образом, оценка вероятности того, что преступление совершил корсиканец, увеличилась после того, как на месте преступления был найден нож. (Увеличилась на сравнительно небольшую величину, так как корсиканцев немного!)

У людей очень часто сложности с пониманием того, как обновлять свои убеждения согласно формуле Байеса. Необходимо подчеркнуть, что смысл не в том, чтобы научиться точно высчитывать, а в том, чтобы быстро получать оценку в верном направлении. Суть байесианского размышления состоит именно в этом.

Затруднения с вероятностями: игнорирование базовой ставки

Сложности, испытываемые людьми при работе с вероятностями, можно проиллюстрировать двумя примерами.

Проблема такси

Ночью произошло ДТП с участием такси. В городе работают две компании такси — «Синие» и «Зелёные». «Зелёным» принадлежит 85% такси, «Синим» 15%. Свидетель аварии утверждает, что такси принадлежало «Синим». Следственный эксперимент показал, что ночью свидетель верно определяет цвет такси в 80%. Какова вероятность того, что такси действительно принадлежало «Синим»?

Проблема вируса

Вирус XYZ вызывает серьёзное заболевание у одного человека из тысячи. Существует тест, показывающий, заражён человек XYZ или нет. Однако этот тест в 5% даёт ложное срабатывание — показывает факт заражения, когда на самом деле человек здоров.

Предположим, что тестирование взятого наугад человека показало, что он XYZ-инфицирован. Какова вероятность того, что он на самом деле болен?

Попытайтесь найти решение самостоятельно, прежде чем читать дальше. Не обязательно точно подсчитывать, сформулируйте хотя бы догадки.

Разбор проблемы такси

Теорема Байеса диктует нам, как лучше всего использовать вот эти сведения:

  • 15% такси в городе — синие;
  • свидетель определяет синий цвет правильно в 80%.

Интуитивные догадки большинства людей, тем не менее, далеки от истины. Удивительно, но, несмотря на показания свидетеля, вероятность того, что такси зелёное — 59%. Причина в том, что зелёных такси в городе много (85‰) и этот факт «перевешивает» 80%-ю уверенность свидетеля.

Разберём это подробнее, не используя формул. Возьмём 100 аналогичных ДТП:

  • 15 такси в этих ДТП синие;
  • свидетель верно определил цвет 80% из них, то есть у 12 такси;
  • 85 такси в этих ДТП зелёные;
  • свидетель неверно определил цвет 20% из них, то есть у 1⒎ такси;

Таким образом в 100 ДТП свидетель определил 29 такси как синие. На самом деле синих такси всего 12. Вероятность того, что такси действительно синее, 12 / 29 = 0,41.

Формальное решение с помощью теоремы Байеса:

  • H — гипотеза «в ДТП участвовало синее такси»;
  • D — событие «свидетель видел синее такси»;
  • P(H) — вероятность того, что такси вообще синее (0,15);
  • P(~H) — вероятность того, что такси вообще зелёное («не синее») (0,85);
  • P(D/H) — вероятность того, что свидетель видел именно синее такси (0,80);
  • P(D/~H) — вероятность того, что свидетель ошибся (0,2).

P(H/D) = P(H) * P(D/H) / ( P(H) * P(D / H) + P(~H) * P(D/~H) )

P(H/D) = 0,15 * 0,80 / ( 0,15 * 0,80 + 0,85 * 0,20 ) = .41

Из тех, кому предлагали решить эту задачу, значения между 20% и 70% назвали меньше половины. Большинство ответов было в районе 80%.

Люди переоценивали значимость конкретного и ясного показания свидетеля и недооценивали «базовую ставку» — тот факт, что синих такси в городе намного меньше зелёных.

Разбор проблемы вируса

Похожим образом недооценивается влияние «базовой ставки» — объективной вероятности события — и в задаче про вирус XYZ. Большинство ответов примерно в районе 95%, в то время как правильный ответ около 2%!

Причина та же: люди переоценивают значимость срабатывания теста и недооценивают статистические данные. Попробуем придти к правильному ответу логически, не применяя формулу Байеса. Мы знаем, что из тысячи человек инфицирован только один. Остальные 999 здоровы. Так как тест на вирус ошибается в 5%, то примерно 50 здоровых людей будут считаться больными. В итоге больными будут сочтен 51 человек, из которых действительно болен только один, то есть 1 / 50 = 2%.

Проще говоря, здоровых людей слишком много, чтобы можно было положиться на один тест со сравнительно большой погрешностью.

Формальное решение с помощью теоремы Байеса:

  • H — гипотеза «человек XYZ-инфицирован»;
  • D — событие «тест дал положительный результат»;
  • P(H) — вероятность того, что человек действительно болен (0,001);
  • P(~H) — вероятность того, что человек действительно здоров (0,999);
  • P(D/H) — вероятность того, что тест сработал правильно (0,95);
  • P(D/~H) — вероятность того, что тест сработал неправильно (0,05).

P(H/D) = P(H) * P(D/H) / ( P(H) * P(D / H) + P(~H) * P(D/~H) )

P(H/D) = 0,001 * 0,95 / ( 0,001 * 0,95 + 0,999 * 0,05 ) = 0,0187

Обсуждение

В обоих примерах налицо тенденция преувеличивать значение свидетельств (человека, прибора, анализа…) и недооценивать статистику. Свидетельства для большинства зримы, конкретны и весомы, а статистика… ну да, статистична. Это приводит к разного рода искажениям, потому что само по себе свидетельство — та же статистика, оно верно лишь с некоторой вероятностью.

Проблемы, подобные двум описанным выше, часто называют беспричинными базовыми ставками, поскольку они включают в себя статистику, не имеющую очевидной причинно-следственной связи с поведением. Например, проблема такси, сформулированная более «причинно», звучала бы, например, так: «Хотя обе компании такси приблизительно равны по силе, такси Зелёных замечены в 85% автопроисшествий, а такси Синих в 15%». В такой формулировке кажется понятнее, почему Зеленых надо учитывать намного сильнее. Люди намного чувствительнее к причинам, чем к статистике.

В подобных задачах всегда присутствуют две вероятности:

  • вероятность свидетельства — степень неуверенности, неточности измерения, анализа, оценки;
  • вероятность события самого по себе.

Чтобы придти к верному решению, надо использовать обе вероятности надлежащим образом. Так как свидетельство кажется конкретнее, люди часто уделяют второй вероятности меньше внимания, чем следует.

Для правильного использования обеих вероятностей оптимальнее исходить даже не из формулы Байеса, а из байесианской интуиции:

Байесианская интуиция
свидетельство о событии необходимо взвешивать на весах «базовой ставки» вероятности самого события. (Это условный рефлекс, его можно выработать практикой.)

Нет смысла тренироваться в вычислении формулы Байеса в уме. Речь скорее о том, чтобы «думать байесиански», выработать своеобразный инстинкт. Тогда в задаче про XYZ-вирус будет достаточно осознать, что при такой низкой плотности больных большинство ложных срабатываний теста придётся на здоровых людей.

В сущности, на практике такого понимания вполне достаточно, чтобы начать быстро строить догадки в верном направлении (хотя, разумеется, углубленное понимание даёт дополнительные преимущества). Движение брошенного мяча можно описать математически, но мы не занимаемся решением дифференциальных уравнений в уме, бросая мяч куда нам надо.

Игнорирование P(D/~H)

В предыдущей части рассмотрено, как ошибка оценки базовой (априорной) вероятности приводит к ошибкам. Часто же проблема кроется не в оценке вероятностей, а в учёте свидетельств, которые могли бы изменить наши убеждения.

Для иллюстрации этого типа ошибок перепишем формулу Байеса немного иначе. Исходная формула выводит вероятность основной гипотезы H с учётом свидетельства D:

Разумеется, можно посчитать и вероятность противоположной гипотезы ~H с учётом новых данных D. Это лишь вопрос переобозначения:

Поделив левые и правые части обеих равенств, приходим к одной из форм теоремы Байеса (ещё её называют «odds form», «соотношением шансов»):

  • P(H/D) / P(~H/D) — отношение вероятностей истинности основной и противоположной гипотез с учётом новых данных;
  • P(D/H) / P(D/~H) — отношение оценок правдоподобия новых данных с точки зрения основной и противоположной гипотезы. Ещё можно это назвать отношением уверенностей, с которыми новые данные предсказываются основной и противоположной гипотезами;
  • P(H) / P(~H) — отношение вероятностей истинности основной и противоположной гипотез вообще, ещё до новых данных.

Словами это можно выразить примерно так: чем увереннее противоположная гипотеза предсказывает событие И чем меньше ей доверяли до эксперимента, тем больше вероятность истинности противоположной гипотезы, если событие всё же случилось.

Часто при оценке значимости, весомости свидетельства (P(D/H) / P(D/~H)) люди недооценивают необходимость учёта знаменателя на тот случай, если основная гипотеза неверна.

Все больше исследований показывают, что недооценка того, что данные могут свидетельствовать в пользу противоположной гипотезы, воистину вездесуща. Показателен следующий эксперимент. Испытуемых просили представить, что они обследуют пациента с красной сыпью на теле. Им предложили четыре вида сведений и предложили выбрать те, что важны для постановки правильного диагноза вымышленной болезни Digirosa:

  • процент людей, больных Digirosa;
  • процент людей, не больных Digirosa;
  • процент людей, больных Digirosa и имеющих на теле красную сыпь;
  • процент людей, не больных Digirosa и имеющих на теле красную сыпь.

Легко видеть, что эти сведения соответствуют четырём элементам формулы Байеса: P(H), P(~H), P(D/H) и P(D/~H). Хотя P(D/~H) (процент людей, не больных Digirosa и имеющих на теле красную сыпь) очевидно необходим при постановке диагноза, 48.8% испытуемых не учли этой информации — те, кто не болен Digirosa и имеет на теле красную сыпь, казались не относящимися к делу.

Важность P(D/~H) часто кажется контринтуитивной. Необходимо научиться учитывать её или вы так и будете её игнорировать. Вот ещё один пример, в котором необходимость учёта P(D/~H) кажется странной даже после предупреждения.

Представьте, что вы готовитесь к встрече с Давидом Максвеллом. Вам необходимо оценить, с какой вероятностью он является профессором университета. Вы получаете ту или иную информацию для размышлений.

Шаг 1. Вам сообщили, что Давид Максвелл был на приёме, на котором из 100 присутствовавших 25 были профессорами университетов, а 75 бизнесменами. Вопрос: какова вероятность того, что Давид Максвелл профессор университета?

Шаг 2. Вы узнали, что Давид Максвелл состоит в престижном клубе. 70% профессоров, бывших на приёме, являются членами этого клуба. 90% бизнесменов с того же приёма также являются членами клуба. Вопрос: какова вероятность того, что Давид Максвелл профессор университета?

На первом шаге всё просто — вероятность 0,25. Во втором шаге имеется небольшая тонкость. Кажется, что раз больше половины профессоров состоят в клубе, то вероятность того, что Давид Максвелл профессор, следует увеличить. Это и есть игнорирование свидетельства P(D/~H). На деле же принадлежность к клубу более характерна для бизнесменов. Тем самым вероятность того, что Давид Максвелл профессор, надо не увеличить, а уменьшить. Разберём второй шаг подробнее:

  • шансы, что Давид Максвелл профессор, до второго шага:
    0,25 / 0,75 = 0,333;
  • отношение правдоподобия с учётом новых данных:
    0,70 / 0,90 = 0,777
  • шансы, что Давид Максвелл профессор, на втором шаге:
    0,777 * 0,333 = 0,259

Формальные вычисления согласно теореме Байеса также указывают на уменьшение вероятности того, что Давид Максвелл профессор, с 0,25 на первом шаге до 0,206 на втором шаге: (0,70 * 0,25) / (0,70 * 0,25 + 0,90 * 0,75) = 0,206.

В эксперименте автора лишь 42% испытуемых уменьшили свою оценку вероятности на втором шаге. Остальные не учли, что более высокое значение P(D/~H) «перевешивает» значимость P(D/H).

Ещё один пример того же самого, но иначе поданного. Вообразите, что вы встречаетесь с Марком Смитом. Вам необходимо оценить, с какой вероятностью он является профессором университета. Вы снова получаете ту или иную информацию для размышлений.

Шаг 1. Вам сообщили, что Марк Смит был на приёме, на котором из 100 присутствовавших 80 были профессорами университетов, а 20 бизнесменами. Вопрос: какова вероятность того, что Марк Смит профессор университета?

Шаг 2. Вы узнали, что Марк Смит состоит в престижном клубе. 40% профессоров, бывших на приёме, являются членами этого клуба. 5% бизнесменов с того же приёма также являются членами клуба. Вопрос: какова вероятность того, что Марк Смит профессор университета?

В этой задаче на первом шаге всё просто — вероятность 0,80.

На втором шаге отношение правдоподобия намного больше единицы (0,40/0.05) и P(D/H) мало (0,40). Кажется разумным пренебречь P(D/~H) как очевидно малым, даже несмотря на то, что оно должно уменьшать вероятность того, что Марк профессор университета. На деле байесианское вычисление показывает, что эта вероятность с 0,8 на первом шаге возрастает до 0,97 на втором: (0,40,8)/(0,40,8+0,05*0,2)=0,97. Тем не менее, лишь 30% испытуемых попытались на втором шаге _увеличить_ оценку вероятности.

Таким образом, любая переоценка от шага 1 к шагу 2 должна учитывать P(D/~H). Совсем необязательно точно всё подсчитывать, достаточно указать в верном направлении — вот суть байесианского мышления.

Игнорирование противоположной гипотезы — знаменателя в отношении правдоподобия — не просто ошибка. Во врачебной практике бывает жизненно необходимо помнить про противоположные версии диагнозов. Вся наука держится на том, чтобы принимать в расчёт одинаково как «за», так и «против».

Вот ещё пример: предположим, у вашей сестры есть машина, купленная пару лет назад, марки то ли X, то ли Y, вы не помните точно. Вы помните, что она проезжает 25 миль на одном галлоне бензина и ещё ни разу не ремонтировалась. Вы знаете, что:

  • 65% машин марки X проезжают 25 миль на одном галлоне.

Доступны также следующие сведения:

  • % машин марки Y, что проезжают 25 миль на одном галлоне;
  • % машин марки X, не требовавших ремонта в первые два года эксплуатации;
  • % машин марки Y, не требовавших ремонта в первые два года эксплуатации;

Вопрос: если вы можете получить только одно из этих трёх сведений, что вы выберете, чтобы уточнить, какой марки машина вашей сестры?

Разберём задачу подробно:

  • гипотеза H1 — машина марки X;
  • гипотеза H2 — машина марки Y;
  • D1 — диагностический признак «машина проезжает 25 миль на одном галлоне»;
  • D2 — диагностический признак «машина не требует ремонта в первые два года эксплуатации».

У нас есть один кусочек сведений, P(D1/H1), какой процент машин марки X проезжает 25 миль на одном галлоне.

Возможны два отношения правдоподобия: P(DI/Hl)/P(Dl/H2) и P(D2/HI)/P(D2/H2). Так как мы не можем получить оба, то разумно суметь вычислить полностью хотя бы одно и запросить P(Dl/H2), узнав, какой процент машин марки Y проезжает 25 миль на одном галлоне. Если этот процент будет отличаться от известных нам 65%, у нас появится пища для содержательного размышления.

Выбор выглядит ясным, но для неподготовленного человека он совершенно не очевиден. Эксперименты показали, что большинство (60,4%) желает уточнить P(D2/H1) процент машин марки X, не требовавших ремонта в первые два года эксплуатации. Это совершенно бесполезная информация, так как мы не можем узнать P(D2/H2). Без знания того, какой процент машин марки Y не требует ремонта в первые два года, полученную информацию невозможно использовать.

Сильное беспокойство вызывает то, что схожие результаты дал аналогичный эксперимент со студентами старших курсов медицинских вузов. Они пытались диагностировать тропическую болезнь типа A или B. Им сообщили вероятность P(симптом1/болезнь-A) P(симптом1/болезнь-A) и предложили на выбор одно из трёх сведений: P(симптом1/болезнь-B), P(симптом2/болезнь-A) или P(симптом2/болезнь-B). Ясно, что лишь первое из них давало возможность сравнить шансы, но 69.3% медиков-старшекурсников не смогли это увидеть.

Тенденция игнорировать иные возможные объяснения особенно ярко проявляется в широко известном «эффекте Барнума» (Барнум, знаменитый циркач, известен фразой «Дураки рождаются ежеминутно»). Часто на подготовительных курсах психологии преподаватель собирает образцы почерков всех учащихся и через неделю раздаёт «личные персональные уникальные анализы» почерка, составленные из общих фраз. Обычно учащиеся высоко оценивают точность подобных «анализов» — от 7 до 9 баллов по 10 баллов. Когда их просят сравнить описания, они бывают ужасно ошеломлены, увидев у соседей то же описание, что у себя. Именно эффект Барнума лежит в основе мифов о точности астрологии и тому подобных псевдонаук.

Если приглядеться к причинам этого, то мы увидим нашего старого знакомого — игнорирование P(D/~H). Люди неявно оценивают вероятность того, что описание «обычно вы открыты и дружелюбны, но иногда замкнуты и неразговорчивы…» относится к ним и оценивают её как высокую. Более формально, высокой оценивается вероятность

P("вы открыты и т.д."/"это описание сделано для меня лично")

Это, разумеется, не отношение правдоподобия. Это всего лишь P(D/H). Чтобы оценить шансы правдоподобия гипотез, необходимо знать P(D/~H), то есть

P("вы открыты и т.д."/"это описание сделано для всех людей вообще")

Конечно, мы немедленно увидим, что эта вероятность точно так же высока. Описание «вы открыты и т.д.» настолько размыто, что применимо практически к каждому, кто готов узнать в нём себя. Таким образом, отношение правдоподобия

P("вы открыты и т.д."/"это описание сделано для меня лично") / P("вы открыты и т.д."/"это описание сделано для всех людей вообще")

всегда равно примерно единице. Согласно формуле

 (шансы истинности гипотезы после наблюдения) = (отношение правдоподобия) * (шансы истинности гипотезы до наблюдения)

сколько бы данных ни было собрано, при отношении правдоподобия, примерно равном единице, шансы истинности гипотезы не изменятся — свидетельства не влияют на них! Иными словами, данное свидетельство не несёт ничего нового — это очевидно, если обратить внимание на P(D/~H).

Сверхуверенность при калибровке знаний

Эту часть мы начнём с небольшого тестирования вашей способности калибровать свои знания. В каждом из утверждений заполните пропущенные места вашими лучшими оценками:

  1. Я на 90% уверен, что возраст Мартина Лютера Кинга в момент смерти был где-то между ____ и ___ годами.
  2. Я на 90% уверен, что число книг в Ветхом завете где-то между ____ и ___ книгами.
  3. Я на 90% уверен, что год рождения Вольфганга Амадея Моцарта между ____ и ___ .
  4. Я на 90% уверен, что между период беременности азиатских слонов между ____ и ___ днями.
  5. Я на 90% уверен, что глубочайшее место в океане между ____ и ___ футами.
  6. Я на 90% уверен, что длина Нила между ____ и ___ милями.
  7. Я на 90% уверен, что число стран-экспортёров нефти между ____ и ___ .
  8. Я на 90% уверен, что диаметр Луны между ____ и ___ милями.
  9. Я на 90% уверен, что вес боинга-747 между ____ и ___ фунтов.
  10. Я на 90% уверен, что расстояние авиаперелета Лондон-Токио между ____ и ___ милями.

Эти вопросы связаны с ещё одним видом затруднений, испытываемых людьми при работе с вероятностями — так называемой парадигме калибровке знаний.

Вероятность одного утверждения оценить невозможно — в самом деле, как мне понять, насколько вы правы, говоря, что ваш племянник с вероятностью 95% женится в этом году? Однако множество подобных утверждений оценить уже можно, так как появляется возможность применить методы статистики.

Например, когда метеоролог говорит, что завтра с вероятностью 90% будет солнечно и тепло, то всё нормально — очевидно, он собрал всю доступную ему информацию, корректно её обработал и обозначил вывод с такой-то степенью уверенности. Одна ошибка — дождливый день — ни о чем не говорит. Однако, если вы увидите, что метеоролог ошибается в девяти прогнозах из десяти, у вас возникнут серьёзные сомнения в достоверности его прогнозов. Иными словами, при уверенности метеоролога в 90% вы готовы простить не больше 10% ошибочных прогнозов.

Достоверность оценок человека подчиняется ровно тем же самым правилам, что достоверность прогнозов метеоролога. Эпистемическая рациональность требует, чтобы при уверенности 70% были верны семь утверждений из десяти, при уверенности 80% — восемь утверждений из десяти и так далее. Другими словами, человек должен правильно оценивать как то, что он знает, так и то, чего он не знает.

Многочисленные исследования показывают так называемую сверхуверенность. Субъективная уверенность, как правило, заметно выше, чем объективное измерение соотношения правильных/неправильных утверждений. Например:

  • при уверенности в 100% люди бывают правы в 88%;
  • при уверенности в 90% люди бывают правы в 75%;
  • при уверенности от 70% до 90% на деле люди бывают приблизительно лишь в 50%;

Эффект сверхуверенности при калибровке своих знаний обязан (в большинстве случаев) тенденции «фиксироваться» на первом пришедшем в голове. Мы словно «присваиваем» себе этот ответ и «защищаем» его в последующих размышлениях: «это же мой ответ, как он может быть неверен?!».

Причина неоправданно высокой уверенности в своей оценке чаще всего кроется в том, что над её возможной неверностью даже не задумываются. Человек зачастую не осознаёт, что даже свидетельства он может подбирать пристрастно — те, что подтверждают его первую оценку.

Вы можете проверить себя на сверхуверенность: в конце приведены ответы на вопросы, заданные в начале главы. Так как вы отвечали с 90%-й уверенностью, только один из десяти ответов имеет полное право оказаться неверным. Однако есть хорошие шансы, что вы ошибётесь больше чем один раз — даже несмотря на то, что вас предупреждали!

Сверхуверенность — вовсе не лабораторный феномен. Она проявляется в спортивных прогнозах, предсказаниях экономистов, наконец, при предвидении своих собственных действий. Одним из обличий сверхуверенности является ошибка планирования — недооценка времени, требуемого на какое-либо дело (например, написание диплома, заполнение налоговой декларации или завершение строительства).

У сверхуверенности при калибровке своих знаний много последствий. Люди, переоценивающие свои знания, меньше стремятся учиться и исправлять свои ошибки и заблуждения. Критикуя других за неповоротливость и нерасторопность, легко не заметить того же самого у себя.

Весьма показательны опросы автомобилистов. 75% водителей признаются, что во время вождения говорят по телефону, едят, бреются или занимаются чем-то ещё. Однако 75% тех же самых людей огорчаются или раздражаются, когда видят, что другие водители говорят за рулём по телефону или едят! Другими словами, тысячи людей сверхуверены в том, что их болтовня по телефону не влияет на их вождение. Такое нарушение эпистемической рациональности (когда убеждения не соответствуют действительности) влечёт за собой расплату в виде увеличения ДТП из-за невнимательности.

Эпистемическая иррациональность и плохая оценка достоверности своих суждений или прогнозов — весьма распространённое явление, чреватая многими неприятностями. Например, сверхуверенность среди врачей — чрезвычайно насущная и опасная проблема.

Дополнительные сложности при работе с вероятностями. Часть 1

Ошибка конъюнкции

Рассмотрим знаменитую «проблему Линды»:

Линде 31 год, она не замужем, за словом в карман не лезет и очень сообразительная. Она училась на факультете философии. Студенткой много размышляла о дискриминации и социальной несправедливости, участвовала в демонстрациях против распространения ядерного оружия.

Оцените эти утверждения по шкале от 1 (самое вероятное) до 8 (наименее вероятное):

  • a. Линда учитель в начальной школе ___;
  • b. Линда продавец в книжном магазине и посещает занятия по йоге ___;
  • c. Линда активно участвует в движении феминисток ___;
  • d. Линда социальный работник ___;
  • e. Линда состоит в лиге Защиты Прав Женщин ___;
  • f. Линда банковский служащий ___;
  • g. Линда менеджер по продажам ___;
  • h. Линда банковский служащий и активно участвует в движении феминисток ___;

Большинство людей при прохождении этого теста демонстрирует так называемую «ошибку конъюнкции». Вариант «h» (Линда банковский служащий и активно участвует в движении феминисток) является соединением вариантов «c» и «f», поэтому вероятность варианта «h» не может быть выше вероятностей «с» или «f». Тем не менее, свыше 80% опрошенных присваивает варианту «h» более высокую вероятность, чем вариантам «c» или «f»

Такое часто случается благодаря эффекту «подстановки атрибута». Он возникает, когда необходимо оценивать один атрибут предмета, а на деле оценивается другой атрибут, связанный с первым — по принципу «меньшего труда». Например, в данном примере «участник движения феминисток» кажется ближе к Линде и «тащит» за собой «банковский служащий», а сам по себе атрибут «банковский служащий» с описанием Линды никак не связан и его труднее принять во внимание. Логика, конечно же, диктует нам, что множество «феминистки И банковские служащие» является лишь частью множества «банковские служащие» и потому меньше его.

Инвертирование условных вероятностей

Инвертирование условных вероятностей — одна из тех ошибок в оценке вероятностей, которая часто отражается на реальной жизни, Речь о предположении, что вероятность события A при условии наступления события B – это то же самое, что вероятность события B при условии наступления события A. Это два совершенно разных случая часто принимаются за один. Конечно, иногда различие очевидно: например, вероятность беременности при условии сексуального контакта совсем не то же самое, что вероятность сексуального контакта при условии беременности. Но бывают и более сложные случаи.

Напомним определение условных вероятностей:

     P(A/B) = P(A и B)/P(B)
     P(B/A) = P(A и B)/P(A)

Когда вероятность события A намного больше условного события B, тогда P(A/B) будет намного выше, чем P(B/A).

В 1988 году в одной из калифорнийских газет была опубликована статья с результатами опроса студентов. Опрос, как казалось, подтверждал, что вероятность употребления тяжёлых наркотиков растёт, если человек курил марихуану. На самом деле опрос показал, что вероятность того, что человек курил марихуану, выше среди тех, кто употреблял тяжёлые наркотики. Это два совершенно разных случая. Вероятность того, что студент употребляет тяжёлый наркотик, попробовав перед тем марихуану, намного, намного меньше, чем вероятность того, что употребляющие тяжелый наркотик раньше курили марихуану.

Большинство курящих марихуану не пробовали тяжелых наркотиков, но большинство употребляющих тяжёлые наркотики раньше курили марихуану.

Для наглядности:

 употребляет тяжёлые наркотикине употребляет тяжёлые наркотики
курил марихуану50950
не курил марихуану102000

Очень немногие (60 из 3010, меньше 2%) употребляют тяжёлые наркотики, зато примерно треть курили марихуану. Вероятность того, что употребляющие тяжёлые наркотики курили марихуану, весьма велика:

P(курили марихуану / употребляют тяжёлые наркотики) = 50/60 = 0,83

Тем не менее, вероятность того, что курящий марихуану перейдёт на тяжёлые наркотики, весьма мала:

P(употребляют тяжёлые наркотики / курили марихуану) = 50/1000 = 0,05

Важная область, в которой инвертирование условных вероятностей происходит особенно часто — диагнозы в медицине. Обнаружено, что как пациенты, так и врачи путаются, ошибочно считая, что вероятность болезни, сопровождаемой данным симптомом — это то же, что вероятность данного симптома при этой болезни.

Например, если я вам скажу, что некоторый тест обнаружил у вас рак, вы будете, мягко говоря, обеспокоены. Если я добавлю, что точность данного конкретного теста 90%, вы взбудоражитесь ещё больше. Однако если я вам скажу, что вероятность рака на самом деле меньше 20%, всё станет выглядеть намного лучше, правда?

Подробнее: предположим, этот тест проверили на 1000 человек. Рак нашли у ста из них. Для наглядности:

 рак действительно естьрака нет
положительный тест90500
отрицательный тест10400

Из таблицы видно, что точность теста в самом деле 90% — реальный рак он нашёл в 90 случаях из ста. Это вероятность P(положительный тест / рак действительно есть). Это очевидно не то, что нужно вам. Вам требуется вероятность P(рак действительно есть / положительный тест), а она равна лишь 90/590=15,3%.

К несчастью, это далеко не придуманный пример. Известен случай, когда врач порекомендовал превентивную терапию, спутав вероятность рака по показаниям теста, с вероятностью срабатывания теста при раке. Так как превентивная терапия заключалась в удалении молочных желез, вы теперь можете понять, насколько серьёзными могут быть последствия ошибок обсуждаемого вида.

Добавить комментарий

Plain text

  • HTML-теги не обрабатываются и показываются как обычный текст
  • Адреса страниц и электронной почты автоматически преобразуются в ссылки.
  • Строки и абзацы переносятся автоматически.
CAPTCHA
This question is for testing whether or not you are a human visitor and to prevent automated spam submissions.