Decision Making

Kergma - Fri, 12/15/2017 - 15:05

Родитель:

Decision Making and Rationality in the Modern World

Keith E. Stanovich

Инструментальная рациональность – это:

точно знать, что вам надо;
точно знать, что делать, исходя из имеющихся физических, личностных и социальных ресурсов;
принимать наилучшие решения, достигая максимума целей.

Это приводит к понятию “ожидаемой полезности” как формальной оценки степени достижения целей.

Полезность – это не “польза” и не “удовольствие”. Это чисто техническое понятие для измерения степени приближения к желательному результату.

Описательная модель принятия решений: набор знаний о том, как люди действуют и какие психологические механизмы служат для формирования их убеждений.
Нормативная модель принятия решений: набор правил для действий и убеждений, служащих для повышения их точности и правильности.
Ожидаемая выгода, субъективная ожидаемая полезность: нормативные модели ожиданий желаемого, говорящие нам, как поступить самым полезным образом.

Описательной модели посвящена масса книг, в которых описывается, как поведение людей отклоняется от нормативных моделей. В четвертой части рассматриваются альтернативные интерпретации таких отклонений.

Сначала рассмотрим “ожидаемую выгоду” – простейшую нормативную модель принятия решений – и увидим её ограничения. Затем рассмотрим “субъективную ожидаемую полезность” как более точную нормативную модель.

Ожидаемая выгода и субъективная ожидаемая полезность

Процесс принятия решений можно разделить на три этапа:

перечисление возможных действий;
перечисление возможных состояний мира;
оценка последствий каждого возможного действия в каждом возможном состоянии мира.

Поскольку возможных состояний мира обычно больше одного, то любое действие можно рассматривать как азартную игру – ведь его последствия точно не известны, потому что будущее состояние мира нельзя знать наверняка.

Для вычисления ожидаемой выгоды используется формула:

V = Σp_iv_i

где

p_i – вероятность состояния мира;
v_i – ожидаемая выгода от состояния мира;
Σ – обозначает “сумма всего за этим знаком”.

Для примера рассмотрим игры А и B:

Действие	Возможное состояние мира	Возможное состояние мира
Выбрать игру A	Выигрыш $10 с вероятностью 0.5	Проигрыш $6 с вероятностью 0.5
Выбрать игру B	Выигрыш $20 с вероятностью 0.25	Проигрыш $2 с вероятностью 0.75

Ожидаемые выгоды:

для “выбрать игру A” – .5($10) + .5(-$6) = $5 + (-$3) = +$2
для “выбрать игру B” – .25($20) + .75(-$2) = $5 + (-$1.5) = +$3.50

Игра B выгоднее, если играть достаточно долго.

Выгода, однако, не равна полезности. Предположим, вы накопили $10000 на покупку дома. Незадолго до покупки кто-то предлагает вложить эти $10000 в некий проект, чтобы через месяц с вероятностью 80% получить $100000 или с вероятностью 20% не получить ничего. Это игра не выглядит привлекательной, хотя ожидаемая выгода и большая.

Более формально “непривлекательность” этой игры можно выразить с помощью полезности: наличие $10000 полезнее, чем возможность наличия $100000. Оценка полезности адекватнее оценки выгоды.

Возможны более сложные ситуации. Предположим, вас схватили бандиты и угрожают отрезать ноги, если через два часа они не получат $10000. У вас при себе только $8000. В этот момент кто-то предлагает сыграть на эти $8000, кинув монету. При выпадении “орла” вы теряете все деньги, при “решке” получаете $10000. В такой ситуации полезнее сыграть, потому что полезность возможности наличия $10000 гораздо выше полезности наличия $8000.

В некоторых ситуация полезность связана с выгодой. Обычно же по мере роста денежных сумм относительная полезность падает. Сто долларов очень “полезны”, когда у вас всего тысяча долларов, и практически неощутимы, когда у вас миллион.

Таким образом, ожидаемая полезность более общее понятие, чем ожидаемая выгода. Для человека, страшащегося воды, победа в соревнованиях по плаванию может обладать отрицательной полезностью, несмотря ни на какую возможную выгоду.

Ожидаемая полезность позволяет рассматривать более общие выборы. Например:

Действие	Возможное состояние мира: солнечно	Возможное состояние мира: дождь
Пойти с семьёй на пляж	Очень хочется	Совершенно не хочется
Пойти с семьёй в музей	Гораздо лучше, чем в дождь на пляж	Немного хуже, чем в музей в солнечный день (открытый сад в дождь недоступен)

Очевидно, для полного подсчёта полезности каждого варианта в таблице не хватает вероятностей. В отличие от карточных игр, где вероятность можно подсчитать, в реальной жизни вероятности того или иного варианта часто оцениваются субъективно, самим игроком.

Предположим, что вероятность дождя мы оценили в 1/5 и перепишем таблицу с более формальными оценками полезности:

Действие	Cолнечно с вероятностью 0.8	Дождь с вероятностью 0.2
Пойти с семьёй на пляж	100	10
Пойти с семьёй в музей	60	50

Ожидаемые полезности (по тем же формулам, что для ожидаемой выгоды):

от похода на пляж: .80(100) + .20(10) = 80 + 2 = 82
от похода в музей: .80(60) + .20(50) = 48 + 10 = 58

Поход на пляж при данных субъективных вероятностях полезнее.

На практике же применение подобных вычислений зачастую трудоёмок и оценка субъективных вероятностей ненадёжна, не говоря уже о том, что времени на решение обычно мало.

Аксиоматичный подход к ожидаемой полезности

К счастью, имеется и другой способ принятия рациональных решений. Он основан на так называемых “аксиомах выбора”.

Аксиомы выбора – набор правил принятия решений, приводящий к согласованным и устойчивым решениям.

Аксиома транзитивности: если вы предпочитаете исход A исходу B и исход B исходу С, то вы должны предпочесть исход A исходу C.

Нарушение этой аксиомы приводит к серьёзным последствиям. Предположим, вы:

больше любите шоколад, чем яблоки;
больше любите яблоки, чем лимоны;
больше любите лимоны, чем шоколад (что нарушает аксиому транзитивности!).

Рассмотрим цепочку событий:

я даю вам даром шоколадку;
затем предлагаю вам лимон за шоколадку и немного денег. Вы соглашаетесь, поскольку любите лимоны больше шоколада;
я предлагаю вам яблоко за лимон и немного денег. Вы снова соглашаетесь, поскольку любите яблоки больше лимонов;
я предлагаю вам шоколадку (которую вы мне отдали раньше) за яблоко и немного денег. Вы снова соглашаетесь, поскольку любите шоколад больше яблок;
я снова предлагаю вам лимон за шоколадку и немного денег…

Разумеется, вы воскликнете “меня дурят!” и откажетесь продолжать этот выдуманный эксперимент. Проблема в том, что вас никто не обманывал – вам всё время предлагали выбор согласно вашим же предпочтениям!

В данном мысленном эксперименте последствия нарушения аксиомы транзитивности заметить легко. В жизни же такие следствия заметить труднее, хотя приводят они к схожим последствиям.

Поэтому так важно поддерживать свои предпочтения ясными, точными и непротиворечивыми (в терминах аксиом выбора).

Неуместный контекст и аксиомы выбора

Во всех аксиомах выбора предполагается, что на решения не влияет неуместный контекст – те обстоятельства или причины, которые сам человек, принимающий решения, считает не относящимися к делу.

Это можно проиллюстрировать на примере выше. Если дополнить ваши предпочтения вот так:

больше любите шоколад, чем яблоки;
больше любите яблоки, чем лимоны;
больше любите лимоны, чем шоколад, если они предложены после шоколада с яблоками.

тогда выбор лимона произойдёт в уместном для вас контексте и аксиома транзитивности не будет нарушена – вы действительно любите объект “лимоны, предложенные после шоколада с яблоками” больше, чем объект “шоколад”.

Аксиома независимости от неуместного контекста: неуместные, по мнению самого человека, обстоятельства не должны влиять на выбор решения.

Пример нарушения. Диалог в ресторане между официантом (О) и посетителем (П):

О: – У нас есть бифштекс и отбивная.

П: – Я хотел бы бифштекс.

О: – Да, я забыл, у нас ещё есть седло барашка.

П: – В таком случае принесите мне отбивную.

Пример соблюдения. Гость (Г) и хозяин (Х), на блюде лежит одно яблоко:

Х: – Возьмите яблоко.

Г: – Нет, спасибо.

(хозяин кладёт рядом с яблоком грушу)

Г: – Пожалуй, я съем яблоко, спасибо.

Пока на блюде было только одно яблоко, гостю могло быть неловко опустошить блюдо. Добавление груши создало уместный контекст, чтобы взять яблоко.

Многочисленные исследования убедительно показывают, что люди очень часто принимают решения под воздействием контекста, который они сами считают не относящимся к делу.

Аксиомы выбора помогают упорядочивать предпочтения и точнее учитывать контекст, приводя тем самым к более точным решениям даже в ситуациях рискованного выбора.

Принцип “только одно”

Одна из простейших, но вызывающих глубокое непонимание аксиом выбора – аксиома доминирования:

Аксиома доминирования: если вы предпочитаете исход A исходу B при наступлении события X и вы предпочитаете исход A исходу B при не-наступлении события X, то вы должны предпочесть исход A независимо от того, наступит событие X или нет.

Многочисленные эксперименты показали, что люди часто нарушают эту аксиому выбора примерно таким образом:

человек выбирает A перед B, если событие X случается;
человек выбирает A перед B, если событие X не случается;
человек не выбирает A перед B, если не знает, случится событие X или нет;

Устранение эффектов контекста: аксиома независимости

Одной из аксиом выбора, помогающая устранить влияние неуместного контекста, является аксиома независимости выбора.

Аксиома независимости выбора: если вероятность какого-то исхода так или иначе присутствует больше чем в одном варианте, этот исход необходимо исключить из рассмотрения.

Пример нарушения (парадокс Аллэ).

Проблема 1. Выберите между:

$1000000 гарантированно.

.89 возможность выиграть $1000000.

.10 возможность выиграть $5000000.

.01 не получить ничего.

Проблема 2. Выберите между:

.11 возможность выиграть $1000000.

.89 не получить ничего.

.10 возможность выиграть $5000000.

.90 не получить ничего.

Большинство в первом случае выбирает вариант A, во втором случае вариант D.

Выбор варианта D во втором случае нарушает аксиому независимости выбора, потому что:

вероятность .89 не получить ничего содержится и в C, и в D (в скрытом виде).
после исключения этого исхода выбирать надо между “.11 возможность выиграть $1000000” и “.10 возможность выиграть $5000000”.
в этом случае предпочтительнее вариант C, как более надёжный.

Фрейминг-эффекты: нарушение инвариантности описания

Ислледования, проведённые за последние три десятилетия, выявили наличие устойчивых фрейминг-эффектов – влияние способа описания задачи на её решение.

Классический пример. Страна готовится к эпидемии, от которой умрут 600 человек. Два варианта описания выбора между программами лечения:

Вариант 1.

программа A гарантирует спасение 200 жизней;
программа B с вероятностью 1/3 спасает всех и с вероятностью 2/3 погибнут все.

Вариант 2.

при принятии программы С точно умрут 400 человек;
при принятии программы D с вероятностью 1/3 никто не умрёт и с вероятностью 2/3 погибнут все.

Участники экспериментов чаще всего выбирали программы A или D. Но если прочесть внимательно, то ясно, что программы A и C – одна и та же программа (как и B с D).

Этот опыт (и бесчисленное множество аналогичных) показывает нарушение аксиомы инвариантности описания.

Аксиома инвариантности описания: если смысл описания исхода A тот же самый, что смысл описания исхода B, то исходы A и B – это один и тот же исход.

Тверски и Канеман разработали теорию перспектив, объясняющую, почему различные формулировки одних и тех же исходов способны сильно влиять на выбор. Согласно ей, в ситуации неопределённого выбора потеря ощущается острее, чем приобретение того же самого объёма, причём рост потерь приводит к большему увеличению негативной оценки, чем рост приобретения к увеличению ощущения полезности.

Функция полезности обладает большей чувствительностью к размеру потерь, чем к размеру приобретений. Эту особенность механизма оценки исходов, по всей видимости, невозможно выключить. Зато её можно скомпенсировать, подходя к выбору более внимательно и переформулируя описания исходов таким образом, чтобы их было легче сравнивать.

В начале развития рынка кредитных карт активно лоббировалось положение, что следует больше продвигать скидки при оплате наличными, чем наценку при использовании кредитных карт. Скидка воспринимается как приобретение, а наценка как потеря.

Ещё один фрейминг-эффект возникает, когда один из исходов подаётся как “ничего не менять”. В многочисленных экспериментах было показано, что люди склонны ничего не менять, если им предоставляется такая возможность. Что примечательно – ничего не менять больше склонны менее самостоятельные и зависимые люди.

Странная притягательность статус-кво: эффект обладания (the endowment effect)

Фрейминг-эффекты в ситуации выбора, когда один из исходов подаётся как “то, что есть сейчас”, приводит к когнитивному искажению, известному как “эффект обладания”.

“Эффект обладания” заключается в том, что ценность уже имеющегося оценивается намного выше того, за сколько оно было приобретено. Это прямо следует из неравномерности функции полезности – ведь потеря вещи ощущается сильнее, чем удовольствие от её продажи.

Пример: в начале 1950-х мистер R. купил бутылку вина за пять долларов. Через несколько лет его поставщик предложил продать ему эту бутылку вина за сто долларов. Мистер R. отказался, хотя никогда не покупал вина дороже чем за 35 долларов.

Классический эксперимент по эффекту обладания: “наследство от дяди”. Предположим, вы изучали рынок ценных бумаг, хорошо разбираетесь в нём, но не имеете начального капитала. Вам сообщают, что вы получили наследство от дяди и имеете возможность вложить его в различные ценные бумаги, причём налоги и прочее значения не имеют.

одной группе сообщили про наследство в виде большой суммы денег;
другой группе сообщили про полученные в наследство акции компаний, ценные бумаги и т.п.

Большинство тех, кому сообщили про уже вложенное в бумаги наследство, предпочло ничего не менять.

Также известен пример из реальной жизни, когда один из американских поставщиков электроэнергии провёл опрос среди своих клиентов, предложив им несколько вариантов тарифа по соотношению цена/качество, причём их текущий тариф был обозначен особо. Большинство предпочло остаться на текущем тарифе.

Ещё больше аномалий: переворот предпочтений и инвариантность к процедуре

Инвариантность к описанию – важное свойство рационального выбора. Как мы увидели, оно часто нарушается.

Существует связанное с ним свойство – столь же основное и в равной степени труднопонимаемое:

Инвариантность к процедуре получения: выбор не должен зависеть от того, каким способом были получены предпочтения.

Пример нарушения. Предположим, есть два контракта:

контракт A. Вы получаете $2500 за пять лет;
контракт B. Вы получаете $1600 за полтора года.

Три четверти испытуемых сочли контракт B более выгодным. Однако, когда их попросили оценить, за сколько бы они продавали эти контракты, три четверти оценили контракт A дороже, чем B.

Рассмотрим подробнее. Предположим, вы готовы:

покупать контракт A за три доллара;
покупать контракт B за четыре доллара;
продавать контракт A за четыре доллара;
продавать контракт B за три доллара;

В самом начале у вас есть $100. Последовательность действий:

вам предлагается контракт A. Вы покупаете его (осталось $97);
вам предлагается контракт B. Вы покупаете его (осталось $93);
вы продаёте контракт A (осталось $97);
вам предлагается контракт B. Вы покупаете его (осталось $93);
вы продаёте контракт B (осталось $96);
вы продаёте контракт B (осталось $99);

Принцип регулярности

Аксиома независимости от неуместного контекста говорит, что если вы считаете X ценнее Y, то при появлении третьего варианта Z относительная ценность X и Y меняться не должна. Даже если Z ценнее и X, и Y, X всё равно должен остаться ценнее Y.

Принцип регулярности: если вы предпочитаете A перед B, то при добавлении новых вариантов выбора вариант A не может стать ещё более привлекательным.

В литературе описан анекдотический пример нарушения принципа регулярности. Экономист Томас Шеллинг шёл в магазин купить энциклопедию, причем у него были сомнения, покупать или нет. В магазине он увидел две разные энциклопедии по нужной ему теме. Обе продавались с большими скидками, но Шеллинг ушёл, не купив ни одной!

Предпочтительность варианта “оставить как есть, не купив ничего” выросла при появлении второй энциклопедии.

Нарушение принципа регулярности случается не только в анекдотах. В жизни это приводит к вполне зримым потерям.

Одной группе испытуемых предложили:

микроволновку фирмы Emerson за $110 со скидкой 33%;
микроволновку фирмы Panasonic за $180 со скидкой 33%;

Микроволновки Emerson покупали несколько чаще (57%), чем Panasonic (43%).

Второй группе испытуемых предложили:

микроволновку фирмы Emerson за $110 со скидкой 33%;
микроволновку фирмы Panasonic за $180 со скидкой 33%;
другую микроволновку фирмы Panasonic за $200 со скидкой 10%;

Третий вариант выбрали только 13%, зато доля покупателей Panasonic за $180 подскочила до 60%.

Нарушение принципа регулярности случается и в медицине. 67-летний фермер страдал от болей в бедре и ему был поставлен диагноз “остеоартрит”. Были испробованы различные препараты, но они помогали недолго или вовсе не помогали. Пациенту была предложена операция на бедре и он согласился. Перед операцией обнаружилось, что ещё два препарата (ибупрофен и пироксикам) не были использованы. Собрали два консилиума.

Первому консилиуму предложили выбор:

направить на консультацию к хирургу и попробовать ибупрофен;
направить на консультацию к хирургу и не пробовать новые лекарства.

Второму консилиуму предложили выбор:

направить на консультацию к хирургу и попробовать ибупрофен;
направить на консультацию к хирургу и попробовать пироксикам;
направить на консультацию к хирургу и не пробовать новые лекарства.

В первом случае чуть больше половины врачей (53%) решили направить на консультацию и не пробовать новые лекарства.

Во втором случае направить на консультацию и не пробовать лекарства решили уже 70% врачей.

Принцип регулярности нарушен, так как предпочтительность варианта “направить на консультацию и не пробовать лекарства” растёт по мере добавления вариантов выбора.

Конструирование предпочтений

Модель “рационального человека” хороша в теории, но она совершенно не описывает реальных людей. Впечатление, словно даже в простейших случаях за выбором не стоит никаких правил оптимизации.

В настоящее время в когнитивной психологии основное место в вопросах выбора занимает модель конструирования предпочтений.

Модель конструирования предпочтений: модель принятия решений, основанная на предположении, что в ситуации выбора человек не строит свои предпочтения из памяти, опыта и т.п., а конструирует их буквально “на лету” из поступающих условий, непрерывно достраивая их на основе приходящих в данный момент сведений.

В наших мозгах нет системы предпочтений, готовой к применению. Вместо этого мы строим её на основе приходящих данных, получая в каждой конкретной ситуации другой набор предпочтений. Благодаря такой гибкости системы у нас появляются несколько возможностей.

Первое. Мы способны учиться привлекать более адекватные кусочки знаний и опыта, чтобы каждый раз строить более точный набор предпочтений.

Второе. Мы можем изучать правила построения решений – логику, теорию принятия, оценки свидетельств – чтобы строить менее противоречивые предпочтения и действовать более точным образом.

Искажение оценки результата (outcome bias)

Умение точно оценивать результат действий других крайне важно. Юристы, врачи, учителя, тренеры, политики – все они должны уметь точно оценивать результат действий других.

Искажение оценки результата: действие оценивается более строго, если оно привело к неудаче, даже если оно было продиктовано обстоятельствами.

Пример. Больной 55 лет страдает от болей в груди. Операция на сердце может продлить его активную жизнь на десять-пятнадцать лет, однако какой-то процент людей при этой операции умирает во время неё. Врач решает направить больного на операцию. Возможные варианты исхода:

вероятность смерти 8%, операция прошла благополучно;
вероятность смерти 2%, больной умер во время операции.

Решение врача направить больного на операцию критикуется намного больше во втором варианте – в случае смерти пациента.

Резюме

Принципы аксиоматического подхода запрещают различные неуместные контексты при выборе решения. Отказ от них приводит к иррациональным, невыгодным и просто опасным решениям.

Поэтому рациональность решений и действий – чрезвычайно практическая задача, а вовсе не предмет академических дискуссий. Небольшой перечень последствий иррациональных решений:

выбор менее эффективных методов лечения;
неверные решения на судебных процессах;
необоснованный отказ от прививок;
неэффективные меры оздоровления экономики.

Столь же важна связь между рациональностью и личной свободой. Если на ваши решения влияют ненужные факторы и неуместный контекст, то вы попадаете в зависимость к тем, кто может управлять этими фактами и этим контекстом. Небольшой эксперимент в качестве примера: cтудентам из двух групп выдали по $50, причём для первой группы это обозначили как “подарок”, а для второй как “возврат долга”. Исследователи предполагали, что “подарки” потратят быстрее, так как они воспринимаются как приобретения. Через неделю провели опрос, кто сколько потратил. В группе “подарков” потративших оказалось заметно больше, чем в группе “долгов”.

Подобное управление контекстом можно использовать и во благо. Например:

в Швеции, Бельгии, Франции, Польше и Венгрии действует презумпция согласия на использование донорских органов. Вы должны оформить запрет, если не хотите, чтобы ваши органы использовались в качестве донорских;
в США, Англии, Германии и Нидерландах действует презумпция несогласия на использование донорских органов. Вы должны оформить разрешение, если хотите, чтобы ваши органы использовались в качестве донорских;

“Искажение статус-кво” действует на граждан всех этих государств, но в одних странах статус-кво иной, чем в других. В США с 1995 года умерло около 45000 людей только потому, что не дождались донорского органа, специально разрешённого к использованию. Небольшое изменение статус-кво могло бы спасти тысячи жизней.

Это пример либертарианского патернализма. Патернализм здесь заключается в знании того, что правительство пытается создать наилучший контекст для большинства, а либертарианство гарантирует, что каждый конкретный человек вправе изменить эти правила в части, касающейся его лично.

Decision Making

Ожидаемая выгода и субъективная ожидаемая полезность

Аксиоматичный подход к ожидаемой полезности

Неуместный контекст и аксиомы выбора

Принцип “только одно”

Устранение эффектов контекста: аксиома независимости

Фрейминг-эффекты: нарушение инвариантности описания

Странная притягательность статус-кво: эффект обладания (the endowment effect)

Ещё больше аномалий: переворот предпочтений и инвариантность к процедуре

Принцип регулярности

Конструирование предпочтений

Искажение оценки результата (outcome bias)

Резюме

Add new comment

Plain text

You are here

Decision Making

Ожидаемая выгода и субъективная ожидаемая полезность

Аксиоматичный подход к ожидаемой полезности

Неуместный контекст и аксиомы выбора

Принцип “только одно”

Устранение эффектов контекста: аксиома независимости

Фрейминг-эффекты: нарушение инвариантности описания

Странная притягательность статус-кво: эффект обладания (the endowment effect)

Ещё больше аномалий: переворот предпочтений и инвариантность к процедуре

Принцип регулярности

Конструирование предпочтений

Искажение оценки результата (outcome bias)

Резюме

Add new comment

Plain text