Bayes' Theorem

Kergma - Mon, 12/18/2017 - 19:38

Родитель:

Оригинальное название:

Bayes' Theorem

Keith E. Stanovich

Предупреждение. Данная часть требует некоторого знакомства с теорией вероятности. Кое-какие базовые понятия здесь Станевичем упоминаются, но явно не полностью.

Для достижения эпистемической рациональности необходимо, чтобы убеждения основывались на оценках вероятностей, приближенных к реальности. Вычисление вероятностей — одна из моделей таких оценок.

Чисто математически понятие “вероятность” подчиняется определенным объективным правилам. Самые важные:

вероятность всегда не меньше нуля и не больше единицы. Формально:
0 ≤ P(A) ≤ 1, где P — значение вероятности события A;
если нечто случается достоверно, всегда, то его вероятность равна единице;
если нечто не случается вообще никогда, то его вероятность равна нулю;
если события A и B не могут случиться одновременно, они называются взаимоисключающими. Вероятность наступления любого из взаимоисключающих событий — это сумма вероятностей каждого события в отдельности: P(A или B) = P(A) + P(B);

Часто событие A может случиться, когда событие B уже произошло (“если человек дожил до 80, он может дожить и до 90”). Вероятность события A в этом случае “условная вероятность” и записывается как P(A/B).

Для взаимоисключающих событий A и B вероятность P(A/B) = 0, как и P(B/A) = 0.

Для любых событий A и B вероятность P(A/B) = P(A и B)/P(B). Физический смысл — предположим, что:

до 80 доживают половина. Вероятность 0,5 (это событие B);
до 90 доживает треть. Вероятность 0,3 (это событие “A и B”);

Тогда вероятность “дожил до 80 и доживёт до 90”: 0,3 / 0,5 = 0,6, то есть если уж человек дожил до 80, то шансов дожить до 90 у него выше среднего.

Таким образом, мы можем описывать вероятности комбинаций событий. Путём простых преобразований мы получим одну из самых известных формул в теории принятия решений — теорему Байеса или правило Байеса.

Эта формула была получена английским математиком Реверендом Томасом Байесом ещё в 18 веке и решает не просто абстрактную задачу преобразования P(B/A) в P(A/B).

Данной формулой описывается формальное правило обновления наших убеждений на основе полученных в результате наблюдения данных.

Это правило отвечает на вопрос “насколько можно доверять гипотезе B, предсказывающей наблюдение A”, если известны:

степень доверия к гипотезе B до наблюдения A (насколько мы уверены в теории?);
уверенность теории B в предсказании A (насколько сильно теория разрешает существание A?);
степень доверия к альтернативной гипотезе (насколько мы уверены в других гипотезах?);
уверенность альтернативной гипотезы в предсказании A (насколько сильно другие гипотезы разрешают существание A?);
событие A уже произошло.

Прежде чем перейти к ней, немного об обозначениях. Хотя в дальнейшем используется сравнительно много математических символов, суть теоремы Байеса может быть понята вообще без математики. Формальные вычисления полезны, если нужна точная уверенность, но проще научиться нескольким правилам размышления, по аналогии с аксиомами выбора.

P(H) — вероятность того, что гипотеза H верна, до эксперимента;
P(~H) — вероятность того, что гипотеза H неверна, до эксперимента;
P(H/D) — вероятность того, что гипотеза H подтверждается наблюдением D, после эксперимента;
P(D/H) — вероятность того, что наблюдение D предсказывается гипотезой H (насколько сильно гипотеза H требует существования наблюдения D);
P(D/~H) — вероятность того, что наблюдение D предсказывается гипотезой, альтернативной H (насколько сильно гипотеза, альтернативная H. требует существования наблюдения D).

Обратите внимание, что P(D/H) ни в коем случае не противоположность P(D/~H) — наблюдение D может предсказываться разными гипотезами с произвольной степенью уверенности, то есть с разными вероятностями, и сумма этих вероятностей не равна единице!

Пример. На месте преступления обнаружен нож. Известно, что корсиканцев среди преступников 20%, что корсиканцы оставляют нож на месте преступления в семи случаях из десяти, а остальные в четырёх случаях из десяти. С какой вероятностью нож оставил корсиканец? Более формально:

H — гипотеза “преступление совершил корсиканец”;
D — событие “на месте преступления найден нож”;
P(H) — вероятность того, что преступление совершил корсиканец, равна 0,2;
P(D/H) — гипотеза “нож оставил корсиканец” предсказывает наличие ножа с вероятностью 0,7;
P(D/~H) — остальные гипотезы предсказывают наличие ножа с вероятностью 0,4;

Подсчитываем: (0,2 * 0,7) / (0,2 * 0,7 + 0,8 * 0,4) = 0,14 / (0,14 + 0,32) = 0,14 / 0,46 = 0,304„,

Таким образом, оценка вероятности того, что преступление совершил корсиканец, увеличилась после того, как на месте преступления был найден нож. (Увеличилась на сравнительно небольшую величину, так как корсиканцев немного!)

У людей очень часто сложности с пониманием того, как обновлять свои убеждения согласно формуле Байеса. Необходимо подчеркнуть, что смысл не в том, чтобы научиться точно высчитывать, а в том, чтобы быстро получать оценку в верном направлении. Суть байесианского размышления состоит именно в этом.

Bayes' Theorem

Add new comment

Plain text

You are here

Bayes' Theorem

Add new comment

Plain text