Дополнительные сложности при работе с вероятностями. Часть 1

Родитель: 
Оригинальное название: 
Additional Problems of Probabilistic Reasoning

Ошибка конъюнкции

Рассмотрим знаменитую «проблему Линды»:

Линде 31 год, она не замужем, за словом в карман не лезет и очень сообразительная. Она училась на факультете философии. Студенткой много размышляла о дискриминации и социальной несправедливости, участвовала в демонстрациях против распространения ядерного оружия.

Оцените эти утверждения по шкале от 1 (самое вероятное) до 8 (наименее вероятное):

  • a. Линда учитель в начальной школе ___;
  • b. Линда продавец в книжном магазине и посещает занятия по йоге ___;
  • c. Линда активно участвует в движении феминисток ___;
  • d. Линда социальный работник ___;
  • e. Линда состоит в лиге Защиты Прав Женщин ___;
  • f. Линда банковский служащий ___;
  • g. Линда менеджер по продажам ___;
  • h. Линда банковский служащий и активно участвует в движении феминисток ___;

Большинство людей при прохождении этого теста демонстрирует так называемую «ошибку конъюнкции». Вариант «h» (Линда банковский служащий и активно участвует в движении феминисток) является соединением вариантов «c» и «f», поэтому вероятность варианта «h» не может быть выше вероятностей «с» или «f». Тем не менее, свыше 80% опрошенных присваивает варианту «h» более высокую вероятность, чем вариантам «c» или «f»

Такое часто случается благодаря эффекту «подстановки атрибута». Он возникает, когда необходимо оценивать один атрибут предмета, а на деле оценивается другой атрибут, связанный с первым — по принципу «меньшего труда». Например, в данном примере «участник движения феминисток» кажется ближе к Линде и «тащит» за собой «банковский служащий», а сам по себе атрибут «банковский служащий» с описанием Линды никак не связан и его труднее принять во внимание. Логика, конечно же, диктует нам, что множество «феминистки И банковские служащие» является лишь частью множества «банковские служащие» и потому меньше его.

Инвертирование условных вероятностей

Инвертирование условных вероятностей — одна из тех ошибок в оценке вероятностей, которая часто отражается на реальной жизни, Речь о предположении, что вероятность события A при условии наступления события B – это то же самое, что вероятность события B при условии наступления события A. Это два совершенно разных случая часто принимаются за один. Конечно, иногда различие очевидно: например, вероятность беременности при условии сексуального контакта совсем не то же самое, что вероятность сексуального контакта при условии беременности. Но бывают и более сложные случаи.

Напомним определение условных вероятностей:

     P(A/B) = P(A и B)/P(B)
     P(B/A) = P(A и B)/P(A)

Когда вероятность события A намного больше условного события B, тогда P(A/B) будет намного выше, чем P(B/A).

В 1988 году в одной из калифорнийских газет была опубликована статья с результатами опроса студентов. Опрос, как казалось, подтверждал, что вероятность употребления тяжёлых наркотиков растёт, если человек курил марихуану. На самом деле опрос показал, что вероятность того, что человек курил марихуану, выше среди тех, кто употреблял тяжёлые наркотики. Это два совершенно разных случая. Вероятность того, что студент употребляет тяжёлый наркотик, попробовав перед тем марихуану, намного, намного меньше, чем вероятность того, что употребляющие тяжелый наркотик раньше курили марихуану.

Большинство курящих марихуану не пробовали тяжелых наркотиков, но большинство употребляющих тяжёлые наркотики раньше курили марихуану.

Для наглядности:

 употребляет тяжёлые наркотикине употребляет тяжёлые наркотики
курил марихуану50950
не курил марихуану102000

Очень немногие (60 из 3010, меньше 2%) употребляют тяжёлые наркотики, зато примерно треть курили марихуану. Вероятность того, что употребляющие тяжёлые наркотики курили марихуану, весьма велика:

P(курили марихуану / употребляют тяжёлые наркотики) = 50/60 = 0,83

Тем не менее, вероятность того, что курящий марихуану перейдёт на тяжёлые наркотики, весьма мала:

P(употребляют тяжёлые наркотики / курили марихуану) = 50/1000 = 0,05

Важная область, в которой инвертирование условных вероятностей происходит особенно часто — диагнозы в медицине. Обнаружено, что как пациенты, так и врачи путаются, ошибочно считая, что вероятность болезни, сопровождаемой данным симптомом — это то же, что вероятность данного симптома при этой болезни.

Например, если я вам скажу, что некоторый тест обнаружил у вас рак, вы будете, мягко говоря, обеспокоены. Если я добавлю, что точность данного конкретного теста 90%, вы взбудоражитесь ещё больше. Однако если я вам скажу, что вероятность рака на самом деле меньше 20%, всё станет выглядеть намного лучше, правда?

Подробнее: предположим, этот тест проверили на 1000 человек. Рак нашли у ста из них. Для наглядности:

 рак действительно естьрака нет
положительный тест90500
отрицательный тест10400

Из таблицы видно, что точность теста в самом деле 90% — реальный рак он нашёл в 90 случаях из ста. Это вероятность P(положительный тест / рак действительно есть). Это очевидно не то, что нужно вам. Вам требуется вероятность P(рак действительно есть / положительный тест), а она равна лишь 90/590=15,3%.

К несчастью, это далеко не придуманный пример. Известен случай, когда врач порекомендовал превентивную терапию, спутав вероятность рака по показаниям теста, с вероятностью срабатывания теста при раке. Так как превентивная терапия заключалась в удалении молочных желез, вы теперь можете понять, насколько серьёзными могут быть последствия ошибок обсуждаемого вида.

Добавить комментарий

Plain text

  • HTML-теги не обрабатываются и показываются как обычный текст
  • Адреса страниц и электронной почты автоматически преобразуются в ссылки.
  • Строки и абзацы переносятся автоматически.
CAPTCHA
This question is for testing whether or not you are a human visitor and to prevent automated spam submissions.