Затруднения с вероятностями: игнорирование базовой ставки

Родитель: 
Оригинальное название: 
Problems with Probabilities: Base Rate Neglect

Сложности, испытываемые людьми при работе с вероятностями, можно проиллюстрировать двумя примерами.

Проблема такси

Ночью произошло ДТП с участием такси. В городе работают две компании такси — “Синие” и “Зелёные”. “Зелёным” принадлежит 85% такси, “Синим” 15%. Свидетель аварии утверждает, что такси принадлежало “Синим”. Следственный эксперимент показал, что ночью свидетель верно определяет цвет такси в 80%. Какова вероятность того, что такси действительно принадлежало “Синим”?

Проблема вируса

Вирус XYZ вызывает серьёзное заболевание у одного человека из тысячи. Существует тест, показывающий, заражён человек XYZ или нет. Однако этот тест в 5% даёт ложное срабатывание — показывает факт заражения, когда на самом деле человек здоров.

Предположим, что тестирование взятого наугад человека показало, что он XYZ-инфицирован. Какова вероятность того, что он на самом деле болен?

Попытайтесь найти решение самостоятельно, прежде чем читать дальше. Не обязательно точно подсчитывать, сформулируйте хотя бы догадки.

Разбор проблемы такси

Теорема Байеса диктует нам, как лучше всего использовать вот эти сведения:

  • 15% такси в городе — синие;
  • свидетель определяет синий цвет правильно в 80%.

Интуитивные догадки большинства людей, тем не менее, далеки от истины. Удивительно, но, несмотря на показания свидетеля, вероятность того, что такси зелёное — 59%. Причина в том, что зелёных такси в городе много (85‰) и этот факт “перевешивает” 80%-ю уверенность свидетеля.

Разберём это подробнее, не используя формул. Возьмём 100 аналогичных ДТП:

  • 15 такси в этих ДТП синие;
  • свидетель верно определил цвет 80% из них, то есть у 12 такси;
  • 85 такси в этих ДТП зелёные;
  • свидетель неверно определил цвет 20% из них, то есть у 1⒎ такси;

Таким образом в 100 ДТП свидетель определил 29 такси как синие. На самом деле синих такси всего 12. Вероятность того, что такси действительно синее, 12 / 29 = 0,41.

Формальное решение с помощью теоремы Байеса:

  • H — гипотеза “в ДТП участвовало синее такси”;
  • D — событие “свидетель видел синее такси”;
  • P(H) — вероятность того, что такси вообще синее (0,15);
  • P(~H) — вероятность того, что такси вообще зелёное (“не синее”) (0,85);
  • P(D/H) — вероятность того, что свидетель видел именно синее такси (0,80);
  • P(D/~H) — вероятность того, что свидетель ошибся (0,2).

P(H/D) = P(H) * P(D/H) / ( P(H) * P(D / H) + P(~H) * P(D/~H) )

P(H/D) = 0,15 * 0,80 / ( 0,15 * 0,80 + 0,85 * 0,20 ) = .41

Из тех, кому предлагали решить эту задачу, значения между 20% и 70% назвали меньше половины. Большинство ответов было в районе 80%.

Люди переоценивали значимость конкретного и ясного показания свидетеля и недооценивали “базовую ставку” — тот факт, что синих такси в городе намного меньше зелёных.

Разбор проблемы вируса

Похожим образом недооценивается влияние “базовой ставки” — объективной вероятности события — и в задаче про вирус XYZ. Большинство ответов примерно в районе 95%, в то время как правильный ответ около 2%!

Причина та же: люди переоценивают значимость срабатывания теста и недооценивают статистические данные. Попробуем придти к правильному ответу логически, не применяя формулу Байеса. Мы знаем, что из тысячи человек инфицирован только один. Остальные 999 здоровы. Так как тест на вирус ошибается в 5%, то примерно 50 здоровых людей будут считаться больными. В итоге больными будут сочтен 51 человек, из которых действительно болен только один, то есть 1 / 50 = 2%.

Проще говоря, здоровых людей слишком много, чтобы можно было положиться на один тест со сравнительно большой погрешностью.

Формальное решение с помощью теоремы Байеса:

  • H — гипотеза “человек XYZ-инфицирован”;
  • D — событие “тест дал положительный результат”;
  • P(H) — вероятность того, что человек действительно болен (0,001);
  • P(~H) — вероятность того, что человек действительно здоров (0,999);
  • P(D/H) — вероятность того, что тест сработал правильно (0,95);
  • P(D/~H) — вероятность того, что тест сработал неправильно (0,05).

P(H/D) = P(H) * P(D/H) / ( P(H) * P(D / H) + P(~H) * P(D/~H) )

P(H/D) = 0,001 * 0,95 / ( 0,001 * 0,95 + 0,999 * 0,05 ) = 0,0187

Обсуждение

В обоих примерах налицо тенденция преувеличивать значение свидетельств (человека, прибора, анализа…) и недооценивать статистику. Свидетельства для большинства зримы, конкретны и весомы, а статистика… ну да, статистична. Это приводит к разного рода искажениям, потому что само по себе свидетельство — та же статистика, оно верно лишь с некоторой вероятностью.

Проблемы, подобные двум описанным выше, часто называют беспричинными базовыми ставками, поскольку они включают в себя статистику, не имеющую очевидной причинно-следственной связи с поведением. Например, проблема такси, сформулированная более “причинно”, звучала бы, например, так: “Хотя обе компании такси приблизительно равны по силе, такси Зелёных замечены в 85% автопроисшествий, а такси Синих в 15%”. В такой формулировке кажется понятнее, почему Зеленых надо учитывать намного сильнее. Люди намного чувствительнее к причинам, чем к статистике.

В подобных задачах всегда присутствуют две вероятности:

  • вероятность свидетельства — степень неуверенности, неточности измерения, анализа, оценки;
  • вероятность события самого по себе.

Чтобы придти к верному решению, надо использовать обе вероятности надлежащим образом. Так как свидетельство кажется конкретнее, люди часто уделяют второй вероятности меньше внимания, чем следует.

Для правильного использования обеих вероятностей оптимальнее исходить даже не из формулы Байеса, а из байесианской интуиции:

Байесианская интуиция
свидетельство о событии необходимо взвешивать на весах “базовой ставки” вероятности самого события. (Это условный рефлекс, его можно выработать практикой.)

Нет смысла тренироваться в вычислении формулы Байеса в уме. Речь скорее о том, чтобы “думать байесиански”, выработать своеобразный инстинкт. Тогда в задаче про XYZ-вирус будет достаточно осознать, что при такой низкой плотности больных большинство ложных срабатываний теста придётся на здоровых людей.

В сущности, на практике такого понимания вполне достаточно, чтобы начать быстро строить догадки в верном направлении (хотя, разумеется, углубленное понимание даёт дополнительные преимущества). Движение брошенного мяча можно описать математически, но мы не занимаемся решением дифференциальных уравнений в уме, бросая мяч куда нам надо.

Add new comment

Plain text

  • No HTML tags allowed.
  • Web page addresses and e-mail addresses turn into links automatically.
  • Lines and paragraphs break automatically.
CAPTCHA
This question is for testing whether or not you are a human visitor and to prevent automated spam submissions.