По своему характеру критерий вальда. Критерий вальда, или как получить лучший гарантированный результат

Глава 2. Принятие решений в условиях неопределенности

2.7. Критерий Вальда

Критерий Вальда является самым "осторожным". Согласно ему, оптимальной альтернативой будет та, которая обеспечивает наилучший исход среди всех возможных альтернатив при самом плохом стечении обстоятельств.

Если исходы отражают подлежащие минимизации показатели (убытки, расходы, потери и т.д.), то критерий Вальда ориентируется на "минимакс" (минимум среди максимальных значений потерь всех альтернатив).

Если в качестве исходов альтернатив фигурируют показатели прибыли, дохода и других показателей, которые надо максимизировать (по принципу "чем больше, тем лучше"), то ищется "максимин" выигрыша (максимум среди минимальных выигрышей). Здесь и далее для всех критериев в тексте мы будем рассматривать именно такой случай, когда исход показывает некий выигрыш.

По критерию Вальда оценкой i -й альтернативы является ее наименьший выигрыш:

W i = min (x ij ) , j = 1..M

Оптимальной признается альтернатива с максимальным наихудшим выигрышем:

Х* = Х k , W k = max (W i ) , i = 1..N

Пример применения критерия Вальда

Есть два проекта Х 1 и Х 2 , которые при трех возможных сценариях развития региона (j=1..3) обеспечивают разную прибыль. Значения прибыли приведены в таблице 2.2. Необходимо выбрать проект для реализации.

Среди возможных проектов нет доминирующих ни абсолютно, ни по состояниям. Поэтому решение придется принимать по критериям.

Если выбор оптимального проекта осуществляется по критерию Вальда, то ЛПР должен выполнить следующие действия:

1. Найти минимальные исходы для каждой альтернативы. Это и будут значения критерия Вальда:

W 1 = min (x 1j), j = 1..3 => W 1 = min (45, 25, 50) = 25

W 2 = min (x 2j), j = 1..3 => W 2 = min (20, 60, 25) = 20

2. Сравнить значения критерия Вальда и найти наибольшую величину. Альтернатива с максимальным значением критерия будет считаться оптимальной:

25 > 20 => W 1 > W 2 => X* = X 1

Если бы решение принималось только по критерию Вальда, ЛПР выбрал для реализации проект Х 1 , поскольку прибыль, которую обеспечит данный проект при самом плохом развитии ситуации, выше.

Выбрав оптимальную альтернативу по критерию Вальда, ЛПР гарантирует себе, что при самом плохом стечении обстоятельств он не получит меньше, чем значение критерия. Поэтому данный показатель еще называют критерием гарантированного результата .

Основной проблемой критерия Вальда является его излишняя пессимистичность, и, как следствие, не всегда логичный результат. Так, например, при выборе по данному критерию между альтернативами А{100; 500} и В{90; 1000} следует остановиться на варианте А . Однако в жизни логичнее было бы выбрать В , так как в худшем случае В лишь немного хуже А , тогда как при хорошем стечении обстоятельств В обеспечивает гораздо больший выигрыш.

Этот критерий опирается на «принцип недостаточного основания» Лапласа, согласно которому все состояния «природы» Si, i = 1,n полагаются равновероятными. В соответствии с этим прин­ципом каждому состоянию Si, ставится вероятность q i определяе­мая по формуле

При этом исходной может рассматриваться задача принятия решения в условиях риска, когда выбирается действие R j , дающее наибольший ожидаемый выигрыш. Для принятия решения для каж­дого действия R j вычисляют среднее арифметическое значение вы­игрыша:

(26)

Среди Mj(R) выбирают максимальное значение, которое будет соответствовать оптимальной стратегии R j .

Другими словами, находится действие Rj , соответствующее

(27)

Если в исходной задаче матрица возможных результатов пред­ставлена матрицей рисков ||r ji ||, то критерий Лапласа принимает следующий вид:

(28)

Пример 4. Одно из транспортных предприятий должно опре­делить уровень своих провозных возможностей так, чтобы удовле­творить спрос клиентов на транспортные услуги на планируемый период. Спрос на транспортные услуги не известен, но ожидается (прогнозируется), что он может принять одно из четырех значений: 10, 15, 20 или 25 тыс. т. Для каждого уровня спроса существует на­илучший уровень провозных возможностей транспортного пред­приятия (с точки зрения возможных затрат). Отклонения от этих уровней приводят к дополнительным затратам либо из-за превы­шения провозных возможностей над спросом (из-за простоя по­движного состава), либо из-за неполного удовлетворения спроса на транспортные услуги. Ниже приводится таблица, определяющая возможные прогнозируемые затраты на развитие провозных воз­можностей:

Необходимо выбрать оптимальную стратегию.

Согласно условию задачи, имеются четыре варианта спроса на транспортные услуги, что равнозначно наличию четырех состояний «природы»: S 1 , S 2 , S 3 , S 4 . Известны также четыре стратегии разви­тия провозных возможностей транспортного предприятия: R 1 , R 2 , R 3 , R 4 Затраты на развитие провозных возможностей при каждой паре S i и R j заданы следующей матрицей (таблицей):

Принцип Лапласа предполагает, что S 1 , S 2 , S 3 , S 4 равновероят­ны. Следовательно, P{S = S i }= 1/n= 1/4 = 0,25, i = 1, 2, 3, 4 и ожидае­мые затраты при различных действиях R 1 , R 2 , R 3 , R 4 составляют:

Таким образом, наилучшей стратегией развития провозных воз­можностей в соответствии с критерием Лапласа будет R 2 .

2. Критерий Вальда (минимаксный или максиминный крите­рий). Применение данного критерия не требует знания вероятнос­тей состояний Si. Этот критерий опирается на принцип наиболь­шей осторожности, поскольку он основывается на выборе наилуч­шей из наихудших стратегий Rj.



Если в исходной матрице (по условию задачи) результат V ij представляет потери лица, принимающего решение, то при выборе оптимальной стратегии используется минимаксный критерий. Для определения оптимальной стратегии R j необходимо в каждой строке матрицы результатов найти наибольший элемент max{V ij }, а затем выбирается действие R j (строка j), которому будет соответствовать наименьший элемент из этих наибольших элементов, т. е. дейст­вие, определяющее результат, равный

(29)

Если в исходной матрице по условию задачи результат V ij пред­ставляет выигрыш (полезность) лица, принимающего решение, то при выборе оптимальной стратегии используется максиминный кри­терий.

Для определения оптимальной стратегии R j в каждой строке матрицы результатов находят наименьший элемент min {Vij} , а затем выбирается действие R j (строка j), которому будут соответство­вать наибольшие элементы из этих наименьших элементов, т. е. действие, определяющее результат, равный

(30)

Пример 5. Рассмотрим пример 4. Так как V ij в этом примере представляет потери (затраты), применим минимаксный критерий. Необходимые результаты вычисления приведены в следующей таб­лице:

Таким образом, наилучшей стратегией развития провозных воз­можностей в соответствии с минимаксным критерием «лучшим из худших» будет третья, т. е. R 3 .

Минимаксный критерий Вальда иногда приводит к нелогич­ным выводам из-за своей чрезмерной «пессимистичности». «Пес­симистичность» этого критерия исправляет критерий Сэвиджа.

3. Критерий Сэвиджа использует матрицу рисков || r ij ||. Элементы данной матрицы можно определить по формулам (23), (24), ко­торые перепишем в следующем виде:

(31)

Это означает, что r ij есть разность между наилучшим значени­ем в столбце i и значениями V ji при том же i. Неза­висимо от того, является ли V ji доходом (выигрышем) или потеря­ми (затратами), r ji в обоих случаях определяет величину потерь ли­ца, принимающего решение. Следовательно, можно применять к r ji только минимаксный критерий. Критерий Сэвиджа рекоменду­ет в условиях неопределенности выбирать ту стратегию Rj, при ко­торой величина риска принимает наименьшее значение в самой неблагоприятной ситуации (когда риск максимален).

Пример 6. Рассмотрим пример 4. Заданная матрица опреде­ляет потери (затраты). По формуле (31) вычислим элементы мат­рицы рисков || r ij ||:

Полученные результаты вычислений с использованием крите­рия минимального риска Сэвиджа оформим в следующей таблице:

Введение величины риска r ji , привело к выбору первой страте­гии R 1 , обеспечивающей наименьшие потери (затраты) в самой не­благоприятной ситуации (когда риск максимален).

Применение критерия Сэвиджа позволяет любыми путями из­бежать большого риска при выборе стратегии, а значит, избежать большего проигрыша (потерь).

4. Критерий Гурвица основан на следующих двух предположе­ниях: «природа» может находиться в самом невыгодном состоянии с вероятностью (1 - α) и в самом выгодном состоянии с вероятно­стью α, где α - коэффициент доверия. Если результат V j i - прибыль, полезность, доход и т. п., то критерий Гурвица записыва­ется так:

Когда V ji представляет затраты (потери), то выбирают действие, дающее

Если α = 0, получим пессимистический критерий Вальда.

Если α = 1, то приходим к решающему правилу вида max max V ji , или к так называемой стратегии «здорового оптими­ста», т. е. критерий слишком оптимистичный.

Критерий Гурвица устанавливает баланс между случаями край­него пессимизма и крайнего оптимизма путем взвешивания обоих способов поведения соответствующими весами (1 - α) и α, где 0≤α≤1. Значение α от 0 до 1 может определяться в зависимости от склонности лица, принимающего решение, к пессимизму или к оптимизму. При отсутствии ярко выраженной склонности α = 0,5 представляется наиболее разумной.

Пример 7. Критерий Гурвица используем в примере 4. Поло­жим α = 0,5. Результаты необходимых вычислений приведены ниже:

Оптимальное решение заключается в выборе W.

Таким образом, в примере предстоит сделать выбор, какое из возможных решений предпочтительнее:

по критерию Лапласа - выбор стратегии R 2 ,

по критерию Вальда - выбор стратегии R 3 ;

по критерию Сэвиджа - выбор стратегии R 1 ;

по критерию Гурвица при α = 0,5 - выбор стратегии R 1 , а ес­ли лицо, принимающее решение, - пессимист (α = 0), то выбор стратегии R 3 .

Это определяется выбором соответствующего критерия (Лапла­са, Вальда, Сэвиджа или Гурвица).

Выбор критерия принятия решений в условиях неопределенно­сти является наиболее сложным и ответственным этапом в иссле­довании операций. При этом не существует каких-либо общих со­ветов или рекомендаций. Выбор критерия должно производить ли­цо, принимающее решение (ЛПР), с учетом конкретной специфи­ки решаемой задачи и в соответствии со своими целями, а также опираясь на прошлый опыт и собственную интуицию.

В частности, если даже минимальный риск недопустим, то сле­дует применять критерий Вальда. Если, наоборот, определенный риск вполне приемлем и ЛПР намерено вложить в некоторое пред­приятие столько средств, чтобы потом оно не сожалело, что вложе­но слишком мало, то выбирают критерий Сэвиджа.

Наиболее просто решается задача о выборе решения в условиях неопределенности, когда нам хотя и неизвестны условия выполнения операции (состояние природы) но известны их вероятности:

В этом случае в качестве показателя эффективности, который мы стремимся обратить в максимум, естественно взять среднее значение, или математическое ожидание выигрыша, с учетом вероятностей всех возможных условий.

Обозначим это среднее значение для стратегии игрока через

или, короче,

Очевидно, есть не что иное, как взвешенное среднее выигрышей строки, взятых с кесами . В качестве оптимальной стратегии естественно выбрать ту из стратегий для которой величина обращается в максимум.

С помощью такого приема задача о выборе решения в условиях неопределенности превращается в задачу о выборе решения в условиях определенности, только принятое решение является оптимальным не в каждом отдельном случае, а в среднем.

Пример 1. Планируется операция в заранее неизвестных метеорологических условиях; варианты этих условий: Согласно материалам метеосводок за много лет частоты (вероятности) этих вариантов равны соответственно:

Возможные варианты организации операции в различных метеоусловиях приносят различную выгоду. Значения «дохода» для каждого решения в разные условиях приведены в табл. 13.1

Таблица 13.1

В последней строке даны вероятности условий. Средние выигрыши приведены в последнем столбце. Из него видно, что оптимальной стратегией игрока является его стратегия дающая средний выигрыш (отмечен звездочкой).

При выборе оптимальной стратегии в неизвестных условиях с известными вероятностями можно пользоваться не только средним выигрышем

но и средним риском

который, разумеется, нужно обратить не в максимум, а в минимум.

Покажем, что стратегия, максимизирующая средний выигрыш совпадает со стратегией, минимизирующей средний риск Вычислим оба эти показателя и сложим их:

(13.2)

Эта сумма (среднее взвешенное значение максимумов столбцов) для данной матрицы есть величина постоянная; Обозначим ее С:

откуда средний риск равен

Очевидно, эта величина обращается в минимум тогда же, когда а, - в максимум, следовательно, стратегия, выбранная из условий минимального среднего риска, совпадает со стратегией, выбранной из условий максимального среднего выигрыша.

Заметим, что в случае, когда известны вероятности состояний природы при решении игры с природой всегда можно обойтись одними чистыми стратегиями, не применяя смешанных. Действительно, если мы будем применять какую-то смешанную стратегию

т. е. стратегию с вероятностью стратегию с вероятностью и т. д., то наш средний выигрыш, осредненный и по условиям (состояниям природы) и по нашим стратегиям, будет:

Это - взвешенное среднее выигрышей соответствующих нашим чистым стратегиям.

Но ясно, что любое среднее не может превосходить максимальной из осредняемых величин:

Поэтому применение смешанной стратегии с любыми вероятностями не может быть выгоднее для игрока, чем применение чистой стратегии .

Вероятности условий (состояний природы) могут быть определены из статистических данных, связанных с многократным выполнением подобных операций или просто с проведением наблюдений над состояниями природы. Например, если железной дороге за данный промежуток времени предстоит выполнить не вполне известный объем перевозок, то данные о распределении условий могут быть взяты из опыта прошлых лет. Если, как в предыдущем примере, успех операции зависит от метеоусловий, данные о них могут быть взяты из статистики метеосводок.

Однако часто встречаются случаи, когда, приступая к выполнению операции, мы не имеем представления о вероятностях состояний природы; все наши сведения сводятся к перечню вариантов состояний, а оценить их вероятности мы не можем. Так, например, вряд ли нам удастся разумно оценить вероятность того, что в течение ближайших k лет будет предложено и реализовано важное техническое изобретение.

Разумеется, в подобных случаях вероятности условий (состояний природы) могут быть оценены субъективно: некоторые из них представляются нам более, а другие - менее правдоподобными. Для того чтобы наши субъективные представления о большей или меньшей «правдоподобности» той или другой гипотезы превратить в численные оценки, могут применяться различные технические приемы. Так, если мы не можем предпочесть ни одной гипотезы, если они все для нас равноправны, то естественно назначить их вероятности равными друг другу:

Это - так называемый «принцип недостаточного основания» Лапласа. Другой часто встречающийся случай - когда мы имеем представление о том, какие условия более вероятны, а какие - менее, т. е. можем расположить имеющиеся гипотезы в порядке убывания их правдоподобности: всего правдоподобнее первая гипотеза (ПО, затем вторая ) менее всего правдоподобна гипотеза (). Однако, насколько одна из них вероятнее другой - мы не знаем. В этом случае можно, например, назначить вероятности гипотез пропорциональными членам убывающей арифметической прогрессии:

или, учитывая, что

Иногда удается, исходя из опыта и здравого смысла, оценить и более тонкие различия между степенями правдоподобия гипотез.

Подобные методы субъективной оценки «вероятности-правдоподобности» разных гипотез о состоянии природы могут иногда помочь при выборе решения. Однако нельзя забывать, что «оптимальное решени выбранное на основе субъективных вероятностей, неизбежно окажется тоже субъективным. Степень субъективности решения можно уменьшить, если вместо вероятностей назначенных произвольно одним лицом, ввести средние из таких вероятностей, назначенных, независимо друг от друга, группой квалифицированных лиц («экспертов»). Метод опроса экспертов вообще широко применяется в современной науке, когда речь идет об оценке неопределенной ситуации (например, в футурологии). Опыт применения подобных методов учит, что зачастую оценки экспертов (принятые независимо одним от другого) оказываются далеко не столь разноречивыми, как это можно было предположить заранее, и вывести из них некоторые предпосылки для принятия разумного решения вполне возможно.

Выше мы осветили вопрос о выборе решения на основе объективно вычисленных или субъективно назначенных вероятностей состояний природы. Этот подход в теории решений - не единственный. Кроме него существуют еще несколько «критериев» или подходов к выбору оптимального решения в условиях неопределенности. Остановимся на некоторых из них.

1. Максиминный критерий Вальда

Согласно этому критерию в качестве оптимальной выбирается та стратегия игрока А, при которой минимальный выигрыш максимален, т. е. стратегия, гарантирующая при любых условиях выигрыш, не меньший, чем максимин:

(13.4)

Если руководствоваться этим критерием, надо всегда ориентироваться на худшие условия и выбирать ту стратегию, Для которой в худших условиях выигрыш максимален. Пользуясь таким критерием в играх с природой, мы как бы ставим взамен этой безличной и незаинтересованной инстанции активного и злонамеренного противника. Очевидно, такой подход может быть продиктован только крайним пессимизмом в оценке обстановки - «всегда надо рассчитывать на худшее!» - но как один из возможных подходов заслуживает рассмотрения.

2. Критерий минимаксного риска Сэвиджа

Сущность этого критерия в том, чтобы любыми путями избежать большого риска при принятии решения.

Критерий Сэвиджа, так же как и критерий Вальда - это критерий крайнего пессимизма, но только пессимизм здесь понимается по-другому: худшим объявляется не минимальный выигрыш, а максимальная потеря выигрыша по сравнению с тем, чего можно было бы достичь в данных условиях (максимальный риск).

3. Критерий пессимизма-оптимизма Гурвица

Этот критерий рекомендует в условиях неопределенности при выборе решения не руководствоваться ни крайним пессимизмом (всегда рассчитывай на худшее!) ни крайним, легкомысленным оптимизмом (все обойдется наилучшим образом!) Критерий Гурвица имеет вид:

где - коэффициент, выбираемый между нулем и единицей.

Проанализируем структуру выражения (13.6). При критерий Гурвица превращается в пессимистический критерий Вальда, а при - в критерий «крайнего оптимизма», рекомендующий выбирать ту стратегию, для которой в наилучших условиях выигрыш максимален. При получается нечто среднее между крайним пессимизмом и крайним оптимизмом (коэффициент и выражает как бы «меру пессимизма» исследователя). Этот коэффициент выбирается из субъективных соображений - чем опаснее ситуация, чем больше мы хотим в ней «подстраховаться», тем ближе к единице выбирается и.

При желании можно построить критерий, аналогичный критерию оптимизма-пессимизма Гурвица исходя не из выигрыша, а из риска, как в критерии Сэвиджа, но мы на этом не будем останавливаться.

Несмотря на то, что выбор критерия, как и выбор параметра в критерии Гурвица, являются субъективным, все же может оказаться полезным просмотреть ситуацию с точки зрения этих критериев. Если рекомендации, вытекающие из различных критериев, совпадают - тем лучше, можно смело выбирать рекомендуемое ими решение. Если же, как это часто бывает, рекомендации противоречат друг другу - всегда имеет смысл задуматься над этим и принять окончательное решение с учетом его сильных и слабых сторон. Анализ матрицы игры с природой под углом зрения разных критериев часто дает лучшее представление о ситуации, о достоинствах и недостатках каждого решения, чем непосредственное рассмотрение матрицы, особенно, когда ее размеры велики.

Пример 2. Рассматривается игра с природой 4X3 с четырьмя стратегиями игрока: и тремя вариантами условий (состояний природы): Матрица выигрышей дана в табл. 13.2.

Таблица 13.2

Найти оптимальное решение (стратегию), пользуясь критериями Вальда, Сэвиджа и критерием Гурвица при

Решение. 1. Критерий Вальда.

В каждой строке матрицы берем наименьший выигрыш (табл. 13.3).

Из величин максимальная (отмечена звездочкой) равна 0,25, следовательно, по критерию Вальда оптимальной является стратегия

2. Критерий Сэвиджа.

Строим матрицу рисков и помещаем в правом добавочном столбце максимальный риск в каждой строке (табл. 13.4).

Минимальным из значений является 0,60 (отмечено звездочкой); следовательно, по критерию Сэвиджа, оптимальной является любая из стратегий

Таблица 13.3

3. Критерий Гурвица

Записываем в правых трех столбцах матрицы (табл. 13 5) «пессимистическую» оценку выигрыша «оптимистическую» а); и их среднее взвешенное по формуле (13.6):

для которой достигается

(минимум берется по всем Найти этот минимакс (или максимин в критерии Вальда) можно обычными методами линейного программирования. Могут быть случаи, когда применение смешанных стратегий при пользовании критериями Вальда, Сэвиджа, Гурвица даст преимущество по сравнению с тем решением, где применяются одни чистые стратегии, однако мы будем рассматривать эти критерии только для чистых стратегий.

Одна из причин этого - в том, что мы хотим избежать сложных вычислений, когда их результат может быть сведен на нет недостатком сведений о ситуации (незнание вероятностей условий). Другая, более важная причина - в том, что основное содержание теории статистических решений (мы коснемся его в следующем параграфе) - это планирование получения и использования дополнительной информации о состоянии природы, которую можно добыть путем эксперимента. Исследования показывают, что в типичных случаях, когда речь идет о получении сколько-нибудь значительного количества дополнительной информации, критерии, не пользующиеся вероятностями состояний (Вальда и др.), становятся практически равносильными критерию, основанному на вероятностях состояний. Но мы знаем, что при пользовании таким критерием применение смешанных стратегий не имеет смысла; стало быть, если мы можем получить сколько-нибудь много дополнительной информации, применение смешанных стратегий теряет смысл (каким бы из критериев выбора решения мы ни пользовались). Если же мы не можем, производя эксперименты, добывать новую информацию, то различные критерии могут давать противоречащие друг другу рекомендации, как мы видели в примере 3.

Критерий Вальда

Критерий Вальда является самым "осторожным". Согласно ему, оптимальной альтернативой будет та, которая обеспечивает наилучший исход среди всех возможных альтернатив при самом плохом стечении обстоятельств.

Если исходы отражают подлежащие минимизации показатели (убытки, расходы, потери и т.д.), то критерий Вальда ориентируется на "минимакс" (минимум среди максимальных значений потерь всех альтернатив).

Если в качестве исходов альтернатив фигурируют показатели прибыли, дохода и других показателей, которые надо максимизировать (по принципу "чем больше, тем лучше"), то ищется "максимин" выигрыша (максимум среди минимальных выигрышей). Здесь и далее для всех критериев в тексте мы будем рассматривать именно такой случай, когда исход показывает некий выигрыш.

По критерию Вальда оценкой i-й альтернативы является ее наименьший выигрыш:

W i = min(x ij), j = 1..M

Оптимальной признается альтернатива с максимальным наихудшим выигрышем:

Х* = Х k , W k = max(W i), i = 1..N

Пример применения критерия Вальда

Есть два проекта Х 1 и Х 2 , которые при трех возможных сценариях развития региона (j=1..3) обеспечивают разную прибыль. Значения прибыли приведены в таблице 2. Необходимо выбрать проект для реализации.

Табл.2. Исходные данные.

Среди возможных проектов нет доминирующих ни абсолютно, ни по состояниям. Поэтому решение придется принимать по критериям.

Если выбор оптимального проекта осуществляется по критерию Вальда, то ЛПР должен выполнить следующие действия:

1. Найти минимальные исходы для каждой альтернативы. Это и будут значения критерия Вальда:

W 1 = min(x 1j), j = 1..3 => W 1 = min(45, 25, 50) = 25

W 2 = min(x 2j), j = 1..3 => W 2 = min(20, 60, 25) = 20

2. Сравнить значения критерия Вальда и найти наибольшую величину. Альтернатива с максимальным значением критерия будет считаться оптимальной:

25 > 20 => W 1 > W 2 => X* = X 1

Если бы решение принималось только по критерию Вальда, ЛПР выбрал для реализации проект Х 1 , поскольку прибыль, которую обеспечит данный проект при самом плохом развитии ситуации, выше.

Выбрав оптимальную альтернативу по критерию Вальда, ЛПР гарантирует себе, что при самом плохом стечении обстоятельств он не получит меньше, чем значение критерия. Поэтому данный показатель еще называют критерием гарантированного результата .

Основной проблемой критерия Вальда является его излишняя пессимистичность, и, как следствие, не всегда логичный результат. Так, например, при выборе по данному критерию между альтернативами А{100; 500} и В{90; 1000} следует остановиться на варианте А. Однако в жизни логичнее было бы выбрать В, так как в худшем случае В лишь немного хуже А, тогда как при хорошем стечении обстоятельств В обеспечивает гораздо больший выигрыш.


2. Критерий "максимакса"

Диаметральной противоположностью критерия Вальда является так называемый критерий "максимакса". Если Вальд отражал взгляд предельного пессимиста, то "максимакс" соответствует отношению крайнего оптимизма. Все внимание уделяется только наилучшим исходам, поэтому оценкой i-й альтернативы по данному критерию является ее наибольший выигрыш М i:

М i = mах(x ij), j = 1..M

Оптимальной считается альтернатива с максимальным наибольшим выигрышем:

Х* = Х k , М k = max(М i), i = 1..N

Пример применения критерия "максимакса"

В условиях примера из п. 1 (табл.2) действия ЛПР, использующего критерий "максимакса" для принятия решения, будут следующие:

1. Найти максимальные исходы для каждой альтернативы:

М 1 = max(x 1j), j = 1..3 =>М 1 = max(45, 25, 50) = 50

М 2 = max(x 2j), j = 1..3 =>М 2 = max(20, 60, 25) = 60

2. Сравнить найденные значения и определить альтернативу с максимальной величиной критерия:

50 < 60 => М 1 < М 2 => X* = X 2

По критерию "максимакса" оптимальным является проект Х 2 ., который может обеспечить наибольшую прибыль при наилучшем стечении обстоятельств.

Критерий "максимакса" не учитывает никакие иные исходы, кроме самых лучших. Поэтому его применение, во-первых, может быть весьма опасным, и, во-вторых, также как и критерий Вальда он может приводить к нелогичным решениям. Например, среди альтернатив А{-100; 0; 500} и В{200; 300; 400} с позиции "максимакса" лучшей является А, однако она несет в себе и опасность убытков (-100), и вообще все исходы, кроме лучшего намного уступают В. Поэтому практическое применение критерия "максимакса" весьма

Критерий Лапласа

Критерий Лапласа основан на принципе недостаточного обоснования . Поскольку в рамках информационного подхода в ситуации неопределенности вероятности состояний неизвестны, то нет оснований утверждать, что они различны. Поэтому можно допустить, что они одинаковы.

По критерию Лапласа в качестве оценки альтернативы используется средний выигрыш:

Оптимальной является альтернатива с максимальным средним выигрышем:

Х* = Х k , L k = max(L i), i = 1..N

Критерий сожаления. Критерий математического ожидания . Психология поведения ЛИР в ситуациях риска и неопределенности. Использование теории полезности для выбора оптимального варианта решения. Интуитивный выбор оптимального варианта.  


КРИТЕРИЙ ВАЛЬДА (критерий максимина")  

Как видно из приведенной таблицы, оптимальная альтернатива рискового решения в условиях неопределенности по критерию Вальда (критерию "максимина") находится в затененном поле и соответствует 140 усл. ден. ед. (это значение эффективности является максимальным из всех минимальных ее значений при наихудших вариантах ситуаций).  

Критерием Вальда (критерием "максимина") руководствуется при выборе рисковых решений в условиях неопределенности , как правило, субъект, не склонный к риску или рассматривающий возможные ситуации как пессимист.  

Величина W - это такое значение показателя W(x, у), которое мы можем гарантировать себе при наихудшем для нас поведении природы (гарантированный результат). Если мы применим управление х е X, отличное от найденного в сформулированной задаче, природа -может наказать нас за легкомыслие, выбрав наихудшее значение параметра у, при котором мы получим показатель W, меньший W. Этот критерий выбора решения иногда называют также критерием Вальда.  

Максиминная оценка по критерию Вальда является единственной абсолютно надежной при принятии решения в условиях неопределенности.  

Стратегия S называется максиминной, т.е. при любом из условий конъюнктуры рынка результат будет не хуже, чем W = 49310,03 тыс. руб. Поэтому эту величину называют нижней ценой игры , или максимином, а также принципом наибольшего гарантированного результата на основе критерия Вальда, в соответствии с которым оптимальной стратегией при любом состоянии среды, позволяющем получить максимальный выигрыш в наихудших условиях, является максиминная стратегия.  

Критерий Вальда представляет собой критерий крайнего пессимизма и ориентирует лицо, принимающее решение, на наихудшие условия реализации проекта.  

Максиминный критерий Вальда. Здесь выбирается решение торговой организации, при котором гарантируется максимальный выигрыш в наихудших условиях внешней среды (состояния природы)  

Стратегия, соответствующая максимальному значению среди минимумов строк, называется максиминной стратегией . Соответствующий критерий (критерий Вальда) записывается так  

Другими словами, оптимальной по критерию Вальда будет та стратегия, при которой наименьший выигрыш является наибольшим среди наименьших выигрышей всех стратеги и. Величину W(, i = 1...m назовем показателем оптимальности стратегии А по критерию Вальда. Значит,  

Один из методов заключается в выборе наилучшей из худших возможностей (критерий Вальда). При этом для каждой из стратегий выбирается худший результат, а затем из них - лучший. 108  

Если при этом получаются стратегии с одинаковыми критериями Вальда, то из них выбирают стратегию, которая имеет наименьшую чувствительность ко внешним условиям "  

Его также называют максиминным критерием Вальда. Сущность данного критерия заключается в следующем. ЛПР располагает множеством стратегий (вариантов, альтернатив) решения проблемы  

Поэтому возникает необходимость определения возможных отклонений полученных результатов от их оптимальных значений. Здесь находит применение критерий Сэвиджа . Выбор стратегии аналогичен выбору стратегии по принципу Вальда с тем отличием, что игрок руководствуется не матрицей выигрышей Е, а матрицей рисков R, построенной по формуле (2.2.2).  

Наибольшая осторожность Ег = max min е i j Критерий гарантированного результата (Вальда)  

А. Вальд также доказал, что его критерий существенно выгоднее (по среднему числу наблюдений), чем наилучший из классических критериев - критерий Неймана-Пирсона.  

В частности, максиминный критерий Вальда обеспечивает максимизацию минимального выигрыша или, что то же самое, минимизацию максимальных потерь , которые могут быть при реализации одной из стратегий. Данный критерий прост и четок, но консервативен в том смысле, что ориентирует принимающего решение на слишком осторожную линию поведения. Величина, соответствующая максиминному критерию, называется нижней ценой игры , под которой следует подразумевать максимальный выигрыш, гарантируемый в игре с данным противником выбором одной из своих стратегий при минимальных результатах.  

Критерий Вальда (или критерий "максимина") предполагает, что из всех возможных вариантов "матрицы решений " выбирается та альтернатива, которая из всех самых неблагоприятных ситуаций развития события (минимизирующих значение эффективности) имеет наибольшее из минимальных значений (т.е. значение эффективности, луч-  

Максиминный критерий Вальда используется в случаях, когда требуется гарантия, чтобы выигрыш в любых условиях оказывался не менее чем наибольший из возможных в худших условиях.  критерии Гурвица . Его значение находится в пределах 0

В формуле этого критерия присутствует коэффициент а, значение которого устанавливается в зависимости от степени уверенности лица, принимающего решение, в правильности своего выбора, какому сценарию реализации проекта следует отдать предпочтение). Значение а выбирается в интервале от 0 до 1. При ос=0 критерий Гурвица превращается в критерий крайнего оптимизма при ос=1 - в критерий Вальда. При 0, тем большее желание "подстраховаться", тем ближе к 1 выбирается коэффициент.  

Критерий правдоподобия является несмещенным и состоятельным, при больших выборках -2-log X имеет распределение хи-квадрат (hi-squared distribution) с г степенями свободы , где / - число параметров р, конкретные значения которых определяет Н0. Критерий правдоподобия (LK) эквивалентен критерию Вальда (W) и критерию множителя Лагранжа (LM) при асимптотическом приближении, однако при малых выборках W>LR>LM.  

MAXIMIN- ориентирован на получение гарантированного выигрыша при наихудшем состоянии внешней среды (подход пессимиста, критерий Вальда). В соответствии с ним в качестве оптимальной выбирается альтернатива, имеющая максимальное значение ожидаемого результата в наименее благоприятном состоянии среды. Здесь решение - отказ от строительства.  

Таким образом, критерий гарантированного результата (мак-симинный критерий Вальда) записывается в виде