전략은 Wald 기준에 따라 선택됩니다. 통계적 의사결정 이론의 문제점

제2장. 불확실한 상황에서의 의사결정

2.7. 발트 기준

발트 기준가장 "조심"합니다. 그에 따르면 최적의 대안은 최악의 상황에서 가능한 모든 대안 중에서 최상의 결과를 제공하는 대안이 될 것입니다.

결과가 최소화해야 할 지표(손실, 비용, 손실 등)를 반영하는 경우 Wald 기준은 다음에 중점을 둡니다. "미니맥스"(모든 대안의 최대 손실 값 중 최소값)

대안의 결과에 이익 지표, 소득 지표 및 극대화해야 하는 기타 지표가 포함된 경우(“많을수록 좋다”는 원칙에 따라) 우리는 다음을 찾고 있습니다. "최대"상금(최소 상금 중 최대 상금). 여기서는 본문의 모든 기준에 대해 결과가 특정 이득을 나타내는 경우를 고려할 것입니다.

Wald 기준에 따르면 i번째 대안의 평가는 가장 작은 이득입니다.

Wi = min (x ij ) , j = 1..M

최악의 보상이 최대인 대안이 최적으로 간주됩니다.

X* = X k, W k = 최대(W i), i = 1..N

Wald 기준을 사용한 예

두 개의 프로젝트 X 1과 X 2가 있습니다. 가능한 시나리오지역 발전 (j=1..3 ) 다양한 수익을 제공합니다. 이익 가치는 표 2.2에 나와 있습니다. 구현할 프로젝트를 선택해야 합니다.

가능한 프로젝트 중에서 절대적으로나 국가 측면에서 지배적인 프로젝트는 없습니다. 그러므로 판단은 기준에 따라 이루어져야 할 것입니다.

최적의 프로젝트 선택이 Wald 기준에 따라 수행된 경우 의사결정자는 다음을 수행해야 합니다. 다음 작업:

1. 각 대안에 대한 최소 결과를 찾습니다. Wald 기준의 값은 다음과 같습니다.

W 1 = 최소(x 1j), j = 1..3 => W 1 = 최소(45, 25, 50) = 25

W 2 = 최소(x 2j), j = 1..3 => W 2 = 최소(20, 60, 25) = 20

2. Wald 기준의 값을 비교하여 가장 큰 값을 찾습니다. 대안 최대 기준 값최적으로 간주됩니다.

25 > 20 => W1 > W2 => X* = X1

Wald 기준에 따라서만 결정이 내려졌다면 의사결정자는 제공될 이익이 높기 때문에 구현을 위해 프로젝트 X 1을 선택할 것입니다. 이 프로젝트최악의 경우에는 더 높습니다.

Wald 기준에 따라 최적의 대안을 선택함으로써 의사결정자는 최악의 시나리오에서 기준 값보다 낮은 금액을 받지 않을 것임을 스스로 보장합니다. 따라서 이 지표라고도 합니다. 보장된 결과의 기준.

Wald 기준의 주된 문제는 과도한 비관주의이며, 결과적으로 결과가 항상 논리적이지는 않습니다. 따라서 예를 들어 이 기준에 따라 대안 A(100; 500)와 B(90; 1000) 중에서 선택할 때 옵션 A를 선택해야 합니다. 그러나 인생에서는 B를 선택하는 것이 더 논리적입니다. 최악의 경우 B는 A보다 약간 더 나쁜 반면, 좋은 상황에서는 B가 훨씬 더 큰 이득을 제공합니다.

발트 기준

발트 기준가장 "조심"합니다. 그에 따르면 최적의 대안은 최악의 상황에서 가능한 모든 대안 중에서 최상의 결과를 제공하는 대안이 될 것입니다.

결과가 최소화해야 할 지표(손실, 비용, 손실 등)를 반영하는 경우 Wald 기준은 다음에 중점을 둡니다. "미니맥스"(모든 대안의 최대 손실 값 중 최소값)

대안의 결과에 이익 지표, 소득 지표 및 극대화해야 하는 기타 지표가 포함된 경우(“많을수록 좋다”는 원칙에 따라) 우리는 다음을 찾고 있습니다. "최대"상금(최소 상금 중 최대 상금). 여기서는 본문의 모든 기준에 대해 결과가 특정 이득을 나타내는 경우를 고려할 것입니다.

Wald 기준에 따르면 i번째 평가대안은 가장 작은 보상입니다.

Wi = 최소(x ij), j = 1..M

최악의 보상이 최대인 대안이 최적으로 간주됩니다.

Х* = Х k , W k = 최대(W i), i = 1..N

Wald 기준을 사용한 예

두 개의 프로젝트 X 1 과 X 2 가 있는데, 이는 지역에 대해 가능한 세 가지 개발 시나리오(j=1..3)에서 서로 다른 수익을 제공합니다. 이익 가치는 표 2에 나와 있습니다. 실행할 프로젝트를 선택해야 합니다.

표 2. 초기 데이터.

가능한 프로젝트 중에서 절대적으로나 국가 측면에서 지배적인 프로젝트는 없습니다. 그러므로 판단은 기준에 따라 이루어져야 할 것입니다.

Wald 기준에 따라 최적의 프로젝트 선택이 수행된 경우 의사결정자는 다음 조치를 수행해야 합니다.

1. 각 대안에 대한 최소 결과를 찾습니다. Wald 기준의 값은 다음과 같습니다.

W 1 = 최소(x 1j), j = 1..3 => W 1 = 최소(45, 25, 50) = 25

W 2 = 최소(x 2j), j = 1..3 => W 2 = 최소(20, 60, 25) = 20

2. Wald 기준의 값을 비교하여 가장 큰 값을 찾습니다. 최대 기준 값을 갖는 대안이 최적으로 간주됩니다.

25 > 20 => W1 > W2 => X* = X1

Wald 기준에 따라서만 결정이 내려졌다면 의사결정자는 최악의 시나리오에서 이 프로젝트가 제공할 이익이 더 높기 때문에 구현을 위해 프로젝트 X 1을 선택할 것입니다.

Wald 기준에 따라 최적의 대안을 선택함으로써 의사결정자는 최악의 시나리오에서 기준 값보다 낮은 금액을 받지 않을 것임을 스스로 보장합니다. 따라서 이 지표라고도 합니다. 보장된 결과의 기준.

Wald 기준의 주된 문제는 과도한 비관주의이며, 결과적으로 결과가 항상 논리적이지는 않습니다. 따라서 예를 들어 대안 A(100; 500)와 B(90; 1000) 사이에서 이 기준에 따라 선택할 때 옵션 A를 선택해야 합니다. 그러나 인생에서는 최악의 경우 B를 선택하는 것이 더 논리적입니다. 경우 B는 A보다 약간 나쁠 뿐이지만, 좋은 상황에서는 B가 훨씬 더 큰 이득을 제공합니다.


2. "최대" 기준

정반대 Wald 기준은 소위 "최대" 기준입니다. 발트가 궁극적인 비관주의자의 견해를 반영했다면, "맥시맥스"극도의 낙관주의적 태도에 해당한다. 최선의 결과에만 모든 관심이 집중되므로 평가는 i번째 대안이 기준에 따르면 최대 이득 M i는 다음과 같습니다.

M i = 최대(x ij), j = 1..M

최대의 대안 가장 큰 승리:

X* = X k, M k = 최대(M i), i = 1..N

'최대' 기준을 적용한 예

포인트 1(표 2)의 예시 조건에서 "최대" 기준을 사용하여 결정을 내리는 의사결정자의 조치는 다음과 같습니다.

1. 각 대안의 최대 결과를 찾으십시오.

M 1 = 최대(x 1j), j = 1..3 =>M 1 = 최대(45, 25, 50) = 50

M 2 = 최대(x 2j), j = 1..3 =>M 2 = 최대(20, 60, 25) = 60

2. 발견된 값을 비교하고 최대 기준 값으로 대안을 결정합니다.

50 < 60 =>남 1< М 2 =>X* = X2

“maximax” 기준에 따르면 최적의 프로젝트는 최상의 상황에서 최대의 수익을 제공할 수 있는 X2입니다.

최대치 기준은 최고 이외의 결과를 고려하지 않습니다. 따라서 그 사용은 첫째로 매우 위험할 수 있으며, 둘째로 Wald 기준과 마찬가지로 비논리적인 결정으로 이어질 수 있습니다. 예를 들어, "maximax" 위치의 대안 A(-100; 0; 500)와 B(200; 300; 400) 중에서 가장 좋은 것은 A이지만 손실 위험(-100)도 수반하며, 일반적으로 최고를 제외한 모든 결과는 V보다 훨씬 열등합니다. 따라서 실제 사용"최대" 기준은 매우

라플라스 기준

라플라스의 기준은 다음을 기반으로 합니다. 불충분한 정당화의 원칙. 불확실한 상황에서 정보 접근의 틀 내에서는 상태의 확률을 알 수 없기 때문에 상태가 다르다고 주장할 이유가 없습니다. 그러므로 우리는 그것들이 동일하다고 가정할 수 있습니다.

에 의해 라플라스 기준평균 이득은 대안을 평가하는 데 사용됩니다.

최적의 대안은 최대 평균 보수를 갖는 대안입니다.

Х* = Х k , L k = max(L i), i = 1..N

선택 최고의 솔루션불확실성 조건에서는 이러한 불확실성의 정도에 따라 크게 달라집니다. 의사결정자가 어떤 정보를 갖고 있는지에 따라 달라집니다.

가정은 주관적이므로 의사결정자의 불확실성 정도는 다양해야 합니다. 불확실성이 있는 상황에서 의사결정을 내리는 데에는 두 가지 주요 접근 방식이 있습니다. 의사결정자는 자신이 이용할 수 있는 정보와 자신의 개인적인 판단 및 경험을 사용하여 가능한 외부 조건의 주관적인 확률을 식별하고 결정하고 평가할 수 있습니다. 가능한 결과대안 다른 조건외부 환경. 이는 본질적으로 불확실성 조건을 위험 조건과 유사하게 만들고, 이 경우 위험 조건에 대해 앞서 논의한 의사결정 절차가 수행됩니다.

불확실성의 정도가 너무 높으면 의사결정자는 다양한 외부 조건의 확률에 관해 가정을 하지 않는 것을 선호합니다. 이 사람은 확률을 고려하지 않을 수도 있고, 확률을 동등하다고 생각할 수도 있습니다. 이는 사실상 동일한 것입니다. 이 접근 방식을 사용하는 경우 제안된 전략을 평가하기 위한 네 가지 결정 기준이 있습니다.

  • 1) Wald 결정 기준(maximin이라고도 함)
  • 2) 결정을 위한 Hurwitz의 알파 기준;
  • 3) Savage의 결정 기준, minimax 거부 기준이라고도 함
  • 4) 라플라스(Laplace)의 해 기준, 베이즈의 해 기준이라고도 합니다.

아마도 의사 결정자에게 가장 어려운 작업은 제안된 문제를 해결하는 데 가장 적합한 특정 기준을 선택하는 것입니다. 기준의 선택은 상황에 따라 논리적이어야 합니다. 또한 기준을 선택할 때 회사의 현재 경영진에 대한 철학, 기질 및 견해(낙관적 또는 비관적, 보수적 또는 진보적)를 고려해야 합니다.

이 진술들을 살펴보자 구체적인 예. 불확실한 조건에서 대안을 선택하기 위한 모델의 요소는 의사결정 매트릭스입니다. |A , 슈| 및 목적 함수 전자(A , w (에스 j)) (그림 6.9).

쌀. 6.9.

, – 조치 대안; Sj – 외부 환경 상태 w(에스 제이 ) – 상황이 발생할 확률 에스 제이 , 그리고 Σmj= 1 w(에스 제이 ) = 1; 이자형 ij - 대안이 선택되면 달성될 결과 나와 외부 환경의 상태가 올 것이다 에스 제이

예시적인 예로 다섯 가지 대안을 포함하는 결정 매트릭스(그림 6.10)를 살펴보겠습니다. 나; = 1, ..., 5) 및 외부 환경의 네 가지 상태 (에스 제이 ; j = 1.4). 내린 결정의 결과는 행과 열의 교차점에 표시됩니다. (이자형 ij ).

쌀. 6.10.

확실성 조건 하에서, 즉 사건이 발생한 후에 결정이 내려질 때 외부 환경(사후) 목적 함수를 최대화하는 결정이 내려져야 합니다(그림 6.11). 그래서 이벤트가 발생하면 에스 1 S2 → A4의 경우, S3 → A5의 경우, S4 → A1의 경우 대안 A2를 허용해야 합니다.

쌀. 6.11.

위험 상황에서는 외부 환경에서 사건 Sj가 발생하기 전에(선험적으로) 결정(대체 Ai 선택)을 내려야 하며, 이는 확률을 고려해야 합니다. (Sj) 이 사건의 발생. 이는 해당 이벤트가 발생할 확률을 곱하여 수행할 수 있습니다. (에스 j) 결과에 이자형 ij , 이것저것 결정을 내리면서 받은 것, 그리고 선택 가장 높은 가치아이(그림 6.12).

쌀. 6.12.

불확실성의 정도가 너무 높으면 의사 결정자는 확률 값에 자신의 주관적인 값을 할당하여 위험 상황에서 의사 결정 작업을 줄이거나 다양한 외부 조건의 확률에 대한 가정을 하지 않을 수 있습니다. 다른 선택 기준을 사용하여 확률을 무시하거나 동일하게 취급할 수 있습니다.

Wald 결정 기준

Wald 기준 "최악을 계산"(극단적 비관주의 또는 최대화 기준)은 효과 매개변수가 다음과 같아야 하는 기준입니다.

이 기준은 의사결정자를 최악의 상황으로 안내합니다. 정황 상금이 최대가 되는 전략을 선택하는 것이 좋습니다. 다른 곳에서는 더 많은 유리한 조건이 기준을 사용하면 시스템이나 운영의 효율성이 손실됩니다.

고려 중인 경우(그림 6.13), '극단적 비관론' 기준에 따라 최선의 대안 A1이 될 것이다.

Wald 기준의 또 다른 극단적인 사례는 "무제한 낙관주의" 기준 또는 최대치입니다.

이 기준에 따라 대안을 선택해야 합니다. 2.

쌀. 6.13.

알파 Hurwitz 솔루션 기준

이 기준은 조건에 맞는 솔루션을 선택할 때 권장됩니다. 불확실성 극단적인 비관주의(항상 "최악의 경우를 고려", α = 0) 또는 극단적인 낙관주의("모든 것이 성공할 것입니다")에 따르지 마십시오. 가장 좋은 방법", a = 1). 특정 평균 솔루션이 권장됩니다(0 ≤ α ≤ 1). 이 기준의 형식은 다음과 같습니다.

여기서 α는 0과 1 사이의 간격에서 실험적으로 선택된 특정 계수입니다.

이 계수를 사용하면 Hurwitz 기준을 사용하여 의사 결정에 추가적인 주관성이 도입됩니다.

고려 중인 예(그림 6.14)에서 a = 0.7인 경우 A3이 선호되는 대안이 됩니다.

쌀. 6.14.

여기에는 다음 표기법이 사용됩니다.

Savage의 결정 기준

이 최소최대 기준에 따르면 어떤 조건에서든 큰 위험을 방지해야 하는 경우 최적의 솔루션은 위험이 최대가 되는 솔루션이 됩니다. 다양한 옵션조건은 최소화됩니다.

Savage 기준을 사용하면 다음이 보장됩니다. 가장 작은 값 최대값위험:

위험은 어디에 있습니까? 아르 자형 ij는 다음 식으로 결정됩니다. 아르 자형 ij = β - 이자형 ij , β는 가능한 최대 이득입니다.

Wald 기준과 마찬가지로 Savage 기준은 극도의 비관론의 기준이지만 여기서는 주어진 조건에서 달성할 수 있는 것에 비해 이득의 최대 손실이 최소화된다는 사실에서 비관론만이 나타납니다.

고려중인 예의 경우 대안을 선택한 결과가 그림 1에 나와 있습니다. 6.15.

쌀. 6.15.

이 예에서 대안은 4는 외부 환경의 잘못 정의된 상태에 대한 최대 "처벌"을 최소화합니다.

라플라스의 해 기준

표준 라플라스, 또는 베이지안 기준은 환경 상태의 확률을 알 수 없는 경우 동일한 것으로 받아들여야 한다고 명시합니다. 이 경우 동일한 확률에 따라 가장 예상되는 비용이 특징인 전략이 선택됩니다. 라플라스 기준을 사용하면 불확실성 조건을 위험 조건으로 줄일 수 있습니다. 라플라스의 기준은 합리성의 기준이라 불리며 위에서 언급한 모든 기준과 마찬가지로 전략적, 장기적 의사결정에 적합하다.

고려 중인 예에서 라플라스 기준(그림 6.16)에 따른 최상의 대안은 다음과 같습니다. 5.

쌀. 6.16.

조건에 따른 결정을 내리기 위해 위에서 언급한 4가지 기준 외에도 불확실성 획득과 같은 비정량적 방법이 있습니다. 추가 정보, 헤징, 유연한 투자 등

불확실한 상황에서는 내린 결정의 특정 결과가 발생할 가능성을 판단하는 것이 불가능합니다. 그러므로 기준은 수학적 기대위험 상황에서 널리 사용되며 언급된 확률이 반드시 필요한 것은 여기서는 적용되지 않습니다. 대신 다른 기준이 사용됩니다.

선택을 위해 최적의 전략불확실한 상황에서는 최대값과 최소값이라는 두 가지 주요 기준이 있습니다. 막시민(Maximin)은 비관적 기준이라고도 불린다. 발트 기준및 미니맥스 - 야만적인 기준.

Wald(왈드) 기준은 최대값입니다. 이 기준은 최대 주의 원칙, 즉 "최악에서 최선"을 선택하는 극단적인 비관주의의 기준에 기초합니다. 실제로 이것은 게임 이론의 주요 기준인 미니맥스 기준입니다. 이 기준에 따르면 자연(환경)은 지능적이고 공격적인 적처럼 행동하여 우리가 성공하지 못하도록 모든 일을 다합니다. 최적의 전략은 각 전략에 대한 조치의 가능한 모든 최악의(최소) 결과 중에서 최대(최대) 보상을 보장하는 전략인 보안 수준으로 간주됩니다.

Wald 기준에 따라 최적인 이러한 방식으로 선택된 전략을 maximin이라고 하며, W의 값을 maximin이라고 합니다.

야만적인 기준 위험을 최소화. 이 기준은 소위 "위험"(손실, 후회) 매트릭스의 예비 편집을 전제로 합니다. 통계적 결정 이론에서, 조건 Gj에서 전략 Qi를 사용할 때 위험 rij는 조건 Gj를 알고 있는 경우 얻을 수 있는 보수와 조건을 모르고 전략 Qi를 선택하지 않고 얻을 수 있는 보수 간의 차이입니다.

미니맥스는 손실 최소화보다는 이익 손실에 대한 후회를 최소화하는 데 중점을 두고 있습니다. 그는 추가적인 이익을 얻기 위해 합리적인 위험을 허용합니다. 이 기준은 우발적인 손실로 인해 회사가 완전히 붕괴되지 않을 것이라는 확신이 있는 경우에만 불확실한 상황에서 행동 전략을 선택하는 데 사용될 수 있습니다.



작품기준

고수익 주식은 충분히 신뢰할 수 있는 경우가 거의 없으며 가장 신뢰할 수 있는 주식은 고수익 주식입니다. 따라서 주식을 구매할 때 항상 수익성과 신뢰성 중 하나를 선택하고 이를 어떻게든 연결해야 합니다. 이 문제는 모든 투자 프로젝트에서 항상 발생합니다. 투자를 유지하거나 잃을 확률이 알려지면 수학적 기대 기준을 사용하여 이 문제를 해결합니다. 거기에 없으면 다른 기준으로 전환해야 합니다. 이러한 기준 중 하나는 작품의 기준입니다. 이를 통해 가장 수익성이 높으면서 동시에 위험도가 가장 낮은 프로젝트를 선택할 수 있습니다. 제품 기준은 다음 공식을 사용하여 계산됩니다.

제품 기준은 최소한의 정보로 작동할 수 있습니다.

문제 해결의 예

수요 G j = (3000, 6000, 9000, 12000) 변동 조건에서 무역 기업이 모든 제품을 판매하기 위한 세 가지 전략을 가지고 있다고 가정합니다. Q p (1) = 6000개; Qp(2) = 9000개; Qp(3) = 12000개 판매 가격 C p = 70 문지름. 구매 가격 C p = 30 문지름. 평균 비용 I = 10 루블/개.

무역 기업의 자원 능력에 따라 공식 (1)을 사용하여 평균 연간 이익 옵션을 계산하고 그 결과를 표 3에 요약합니다.

표 3 - 불확실한 시장 상황에서 상업 전략의 이득(이익) 매트릭스

1. 왈드 기준. 최대한의 주의 기준에 따라 최적의 전략을 결정하기 위해 표에 추가하겠습니다. 3, 오른쪽 열 6에서는 각 행에 대해 최소 이익을 표시하고 행의 최소값이 최대가 되는 전략을 선택합니다(표 4 참조).

표 4 - 요약 이익 매트릭스

2. 허위츠 기준. 비관지수 λ를 λ = 0.4로 정의하자.

표 7번 추가열에서는 가중치(합리적) 주의 기준에 따라 전략의 값을 계산합니다. 4 우리는 찾을 것이다 최대값각 라인마다. 그 다음에:

최대값은 두 가지 구매 전략 Qp(1) 및 Qp(2)에 해당합니다.

3. 라플라스 기준. 자연 상태의 균등 확률 원칙을 바탕으로 우리는 "보수"의 평균 값, 즉 각 전략의 이익을 찾을 것입니다.

라플라스 이득 평균화 기준에 따르면 최선의 구매 전략은 Qp(2)입니다.

4. 베이즈-라플라스 기준. 승률의 가중평균 평가기준을 바탕으로 최적의 전략을 결정하기 위해서는 수요의 확률분포를 알아야 한다. 그러한 확률은 과거 경험이나 전문가 분석을 통해 결정됩니다(표 4의 하단 라인).

그러면 각 전략에 대한 기준에 따른 평가는 다음과 같습니다.

최대값은 전략 Qp(2)에 해당합니다.

표 5 - 상업 전략의 위험 매트릭스

5. 야만적인 기준. 승리 매트릭스에서 위험 매트릭스로 이동해 보겠습니다(표 5). 이를 위해 우리는 먼저 표의 추가 행에 각 자연 상태(두 번째 행)에 대해 가능한 최대 이득을 표시한 다음 해당 위험 r i j = max Pi j – Pi j를 계산합니다.

위험 매트릭스를 작성합니다(표 5). 최대 주의 원칙에 따라 행별로 최대 위험 값을 찾고 그 중에서 가능한 최대 위험의 최소값을 갖는 전략 Qp(1) 및 Qp(2)를 선택합니다. 얻은 값을 테이블로 전송해 보겠습니다. 4 선택을 요약합니다.

따라서 전략 Qp(1)과 Qp(2)는 경쟁하는 것으로 나타났습니다(Hurwitz 기준에 따른 전략 Qp(3)의 선택은 λ 지표를 선택할 때 과도한 낙관주의로 인해 발생했을 가능성이 높습니다). 전략 Qp(1)는 Wald, Laplace 및 Savage 기준에 따라 선택되었으며, 전략 Qp(2)는 Laplace, Bayes-Laplace 및 Savage 기준에 따라 선택되었습니다.

하나 또는 다른 전략에 대한 선호도는 대부분의 기준에 따라 최고로 선택됩니다. 그러나 우리의 경우 두 가지 전략 Qp(1)과 Qp(2)는 이러한 의미에서 동일합니다.

옵션 문제:

표 6 - 불확실한 시장 상황에서 상업 전략의 이익 매트릭스

옵션 1

옵션 2

옵션 3

옵션 4

옵션 5

옵션 6

옵션 7

옵션 8

옵션 9

의사결정기준은 의사결정자의 장점을 표현하고, 수용할 수 있는 규칙을 결정하는 기능이다. 최선의 선택솔루션.

불완전한 정보 조건 하의 모든 결정은 결정이 내려지는 상황의 정량적 특성을 고려하여 내려집니다.

기준은 차례로 사용될 수 있으며 여러 옵션 중에서 해당 값을 계산한 후 임의로 최종 솔루션을 선택해야 합니다. 이를 통해 첫째, 의사 결정 문제의 모든 내부 연결에 더 잘 침투하고 둘째, 주관적 요인의 영향을 약화시킬 수 있습니다.

발트 기준

Wald 기준은 극단적인 비관주의의 기준입니다. 왜냐하면 통계학자는 "자연"이 자신에게 최악의 방식으로 작용하고 있다고 믿기 때문입니다. 이는 보장된 결과의 기준입니다.

12월을 플레이어 A의 보수 매트릭스로 지정합니다. 그런 다음 통계학자인 플레이어 A의 의견에 따르면 그에게 최악의 방식으로 행동하는 플레이어 "자연"의 행동은 플레이어 "자연"의 구현에 반영됩니다. "와 같은 상태 Pj 중 플레이어 A의 보수(통계) 값이 가장 작은 값인 minaij를 취합니다. 이를 바탕으로 통계학자는 다음과 같은 것을 선택합니다. 순수 전략최소 이득 minaij가 최대가 되는 Аi, 즉 최대값을 제공합니다. "

공식 (3.12)을 사용하여 계산된 장엄한 aβ는 다음과 같습니다. 더 싼 가격게임 - 이는 최소한의 결과로 전략 중 하나를 선택하여 특정 상대와의 게임에서 보장되는 최대 승리입니다.

12월을 플레이어 A의 손실 매트릭스로 지정하면 플레이어 "자연"의 최악의 행동은 플레이어 A의 손실 금액(통계)이 가장 큰 값 maxaij를 갖는 상태 Pj에서 구현됩니다. 이 통계를 바탕으로 최대 손실 maxaij가 최소화되는 순수 전략 Аi를 선택해야 합니다. 즉, minimax를 보장해야 합니다.

Wald 기준은 최소 이득의 최대화 또는 전략 중 하나를 구현할 때 발생할 수 있는 최대 손실(손실)의 최소화를 보장합니다. 이 기준은 ODA가 매우 신중한 행동을 관찰하도록 지시합니다. 예를 들어 플레이어가 관심이 없는 경우 이러한 행동은 허용됩니다. 큰 승리, 그러나 예상치 못한 손실에 대비하고 싶습니다. 그러한 행동의 선택은 위험에 대한 플레이어의 태도에 따라 결정됩니다. Wald 기준은 어떤 상황에서도 성공을 보장해야 하는 경우에 사용됩니다.

예제 3.3. 예제 3.2의 보수 매트릭스로 제공되는 게임의 경우 Wald 기준을 사용하여 가장 수익성이 높은 전략을 선택합니다.

뜨개질을 내리는 중. 표 3.2의 형태로 승리행렬을 작성하고 각 행에 대해 가장 작은 minaij 값을 찾아보자.

표 3.4. 게임 승리 매트릭스

이는 "자연" 플레이어가 어떤 전략을 사용할 것인지, 즉 어느 주가 시장에서 발전할 것인지에 관계없이 플레이어 A(통계학자)가 전략 A3, 즉 A3 유형의 기술을 적용할 때 다음을 받게 된다는 것을 의미합니다. 최소 3단위의 승리가 보장됩니다. 플레이어 A가 다른 전략, 즉 다른 유형의 장비를 출시하는 경우, 더 나쁜 상황에서는 3 유닛 미만의 승리를 얻을 수 있습니다.

Wald 기준의 적용은 결정이 내려지는 상황이 다음과 같은 경우 정당화됩니다.

가능성에 대해 외부 상태 Pj는 아무것도 모릅니다. 다양한 외부 상태 Pj의 출현을 고려할 필요가 있습니다. 솔루션은 한 번만 구현됩니다. 모든 위험을 제거해야 합니다.

낙관적 기준

최대치 기준이라 불리는 낙관주의 기준은 의사결정자가 가장 유리한 조건에 초점을 맞출 때 사용됩니다.

게임에 보수 매트릭스가 제공되는 경우 낙관적 기준에 따라 상황의 각 변형에 대해 최대 보수(예: 소득)를 최대화하는 솔루션 옵션이 결정됩니다. 낙관주의 기준은 다음과 같은 형식으로 작성됩니다.

게임에 손실 매트릭스가 제공되는 경우 낙관적 기준에 따라 상황의 각 변형에 대해 최소 손실(예: 비용)을 최소화하는 솔루션 옵션이 결정됩니다.

낙관주의 기준은 다음과 같은 형식으로 작성됩니다.

통계학자가 "자연" 플레이어의 전략 선택에 영향을 미칠 수 있는 기회가 있는 경우 낙관주의 기준을 사용하는 것이 좋습니다.

예제 3.4. 예 3.2의 보수 매트릭스로 제공되는 게임의 경우 낙관적 기준에 따라 가장 수익성이 높은 전략을 선택합니다.

해결책. 표 3.5의 형태로 승리행렬을 작성하고 가장 큰 값 max aij 를 구해보자. 각 라인마다.

이는 "자연" 플레이어가 어떤 전략을 사용할 것인지, 즉 어느 주가 시장에서 발전할 것인지에 관계없이 플레이어 A(통계학자)가 전략 A3, 즉 A3 유형의 기술을 적용할 때 다음을 받게 된다는 것을 의미합니다. 9개 단위의 승리가 보장됩니다. ~에

플레이어 A가 다른 전략, 즉 다른 유형의 장비를 출시하는 경우, 더 나쁜 상황에서는 9 유닛의 승리를 얻을 수 있습니다.

Wald 기준과 낙관적 기준으로 얻은 결론은 일치하며 Ap 전략을 선호한다는 점에 유의해야 합니다.

표 3.5