본질적으로 Wald 기준입니다. Wald 기준 또는 최상의 보장된 결과를 얻는 방법

제2장. 불확실한 상황에서의 의사결정

2.7. 발트 기준

발트 기준가장 "조심"합니다. 그에 따르면 최적의 대안은 최악의 상황에서 가능한 모든 대안 중에서 최상의 결과를 제공하는 대안이 될 것입니다.

결과가 최소화해야 할 지표(손실, 비용, 손실 등)를 반영하는 경우 Wald 기준은 다음에 중점을 둡니다. "미니맥스"(모든 대안의 최대 손실 값 중 최소값)

대안의 결과에 이익 지표, 소득 지표 및 극대화해야 하는 기타 지표가 포함된 경우(“많을수록 좋다”는 원칙에 따라) 우리는 다음을 찾고 있습니다. "최대"상금(최소 상금 중 최대 상금). 여기서는 본문의 모든 기준에 대해 결과가 특정 이득을 나타내는 경우를 고려할 것입니다.

Wald 기준에 따르면 i번째 대안의 평가는 가장 작은 이득입니다.

Wi = min (x ij ) , j = 1..M

최악의 보상이 최대인 대안이 최적으로 간주됩니다.

X* = X k, W k = 최대(W i), i = 1..N

Wald 기준을 사용한 예

두 개의 프로젝트 X 1과 X 2가 있습니다. 가능한 시나리오지역 발전 (j=1..3 ) 다양한 수익을 제공합니다. 이익 가치는 표 2.2에 나와 있습니다. 구현할 프로젝트를 선택해야 합니다.

가능한 프로젝트 중에서 절대적으로나 국가 측면에서 지배적인 프로젝트는 없습니다. 그러므로 판단은 기준에 따라 이루어져야 할 것입니다.

최적의 프로젝트 선택이 Wald 기준에 따라 수행된 경우 의사결정자는 다음을 수행해야 합니다. 다음 작업:

1. 각 대안에 대한 최소 결과를 찾습니다. Wald 기준의 값은 다음과 같습니다.

W 1 = 최소(x 1j), j = 1..3 => W 1 = 최소(45, 25, 50) = 25

W 2 = 최소(x 2j), j = 1..3 => W 2 = 최소(20, 60, 25) = 20

2. Wald 기준의 값을 비교하여 가장 큰 값을 찾습니다. 대안 최대 기준 값최적으로 간주됩니다.

25 > 20 => W1 > W2 => X* = X1

Wald 기준에 따라서만 결정이 내려졌다면 의사결정자는 제공될 이익이 높기 때문에 구현을 위해 프로젝트 X 1을 선택할 것입니다. 이 프로젝트최악의 경우에는 더 높습니다.

Wald 기준에 따라 최적의 대안을 선택함으로써 의사결정자는 최악의 시나리오에서 기준 값보다 낮은 금액을 받지 않을 것임을 스스로 보장합니다. 따라서 이 지표라고도 합니다. 보장된 결과의 기준.

Wald 기준의 주된 문제는 과도한 비관주의이며, 결과적으로 결과가 항상 논리적이지는 않습니다. 따라서 예를 들어 이 기준에 따라 대안 A(100; 500)와 B(90; 1000) 중에서 선택할 때 옵션 A를 선택해야 합니다. 그러나 인생에서는 B를 선택하는 것이 더 논리적입니다. 최악의 경우 B는 A보다 약간 더 나쁜 반면, 좋은 상황에서는 B가 훨씬 더 큰 이득을 제공합니다.

이 기준은 "자연" Si, i = 1,n의 모든 상태가 동일하게 가능성이 있다고 가정되는 라플라스의 "불충분한 이성의 원리"에 기반을 두고 있습니다. 이 원리에 따라 각 상태 Si에는 다음 공식에 의해 결정되는 확률 q i가 주어집니다.

이 경우 초기 문제는 가장 큰 기대 이득을 제공하는 행동 Rj가 선택되었을 때 위험 상황에서의 의사 결정 문제로 간주될 수 있습니다. 결정을 내리기 위해 각 행동 R j에 대해 평균이 계산됩니다. 산술 값상금:

(26)

Mj(R) 중 하나를 선택합니다. 최대값, 이는 최적 전략 R j 에 해당합니다.

즉, 다음에 해당하는 액션 Rj는

(27)

원래 문제에서 가능한 결과의 행렬이 위험 행렬 ||r ji ||로 표현되는 경우 라플라스 기준은 다음 형식을 취합니다.

(28)

사례 4. 운송 기업 중 하나는 계획된 기간 동안 운송 서비스에 대한 고객 수요를 충족할 수 있는 방식으로 운송 능력 수준을 결정해야 합니다. 운송 서비스에 대한 수요는 알려져 있지 않지만 10, 15, 20, 25,000톤의 네 가지 값 중 하나를 취할 수 있을 것으로 예상(예측)됩니다. 각 수요 수준에 대해 가장 높은 운송 능력 수준이 있습니다. 운송 기업 (가능한 비용 측면에서). 이러한 수준에서 벗어나면 수요에 비해 초과된 운송 용량(철도 차량의 유휴 시간으로 인해) 또는 운송 서비스에 대한 수요의 불완전한 충족으로 인해 추가 비용이 발생합니다. 다음은 운송 능력 개발을 위한 예상 비용을 식별하는 표입니다.

최적의 전략을 선택하는 것이 필요합니다.

문제의 조건에 따라 운송 서비스 수요에 대한 네 가지 옵션이 있으며 이는 S 1, S 2, S 3, S 4의 네 가지 "자연" 상태의 존재와 동일합니다. 운송 기업의 운송 능력을 개발하기 위한 네 가지 알려진 전략도 있습니다: R 1, R 2, R 3, R 4. 각 쌍 Si 및 R j에 대한 운송 능력 개발 비용은 다음 매트릭스로 제공됩니다(표 ):

라플라스의 원리는 S 1, S 2, S 3, S 4가 동일할 가능성이 있다고 가정합니다. 따라서 P(S = S i )= 1/n= 1/4 = 0.25, i = 1, 2, 3, 4이며 다양한 작업 R 1, R 2, R 3, R 4에 대한 예상 비용은 다음과 같습니다.

따라서, 최고의 전략 Laplace 기준에 따른 운송 능력 개발은 R 2가 됩니다.

2. 발트 기준(최소최대 또는 최대 기준). 이 기준을 적용하려면 Si 상태의 확률에 대한 지식이 필요하지 않습니다. 이 기준은 최악의 전략 Rj 중 최선의 선택을 기반으로 하기 때문에 더 큰 주의 원칙에 의존합니다.



문제의 조건에 따라 원래 행렬에서 결과 Vi ij가 의사 결정자의 손실을 나타내는 경우 최적의 전략을 선택할 때 최소 최대 기준이 사용됩니다. 최적의 전략 R j를 결정하려면 결과 행렬의 각 행에서 가장 큰 요소 max(V ij )를 찾은 다음 이들 중 가장 작은 요소에 해당하는 작업 R j(j 행)를 선택해야 합니다. 가장 큰 요소, 즉 결과를 결정하는 작업은 동일합니다.

(29)

원래 행렬에서 문제 조건에 따라 결과 Vi ij가 의사 결정자의 이득(효용)을 나타내는 경우 최적의 전략을 선택할 때 최대 기준이 사용됩니다.

최적의 전략 Rj를 결정하기 위해 결과 행렬의 각 행에서 가장 작은 요소 min(Vij)을 찾은 다음 이러한 가장 작은 요소 중 가장 큰 요소에 해당하는 작업 Rj(j행)를 선택합니다. , 즉 다음과 같은 결과를 결정하는 작업입니다.

(30)

예 5. 예 4를 생각해 보세요. 이 예에서 Vi ij는 손실(비용)을 나타내므로 최소최대 기준을 적용합니다. 필요한 계산 결과는 다음 표에 나와 있습니다.

따라서 "최악 중 최고"라는 미니맥스 기준에 따라 운반 능력을 개발하기 위한 최선의 전략은 세 번째, 즉 R 3 입니다.

Wald minimax 기준은 과도한 "비관주의"로 인해 때때로 비논리적인 결론으로 ​​이어집니다. 이 기준의 "비관주의"는 Savage 기준을 수정합니다.

3. 야만적인 기준위험 매트릭스를 사용합니다 || r ij ||. 이 행렬의 요소는 공식 (23), (24)에 의해 결정될 수 있으며 다음 형식으로 다시 작성됩니다.

(31)

즉, r ij는 i열의 최고 값과 동일한 i에 대한 V ji 값의 차이입니다. V ji가 소득(이득)인지 손실(비용)인지에 관계없이 두 경우 모두 r ji가 의사결정자의 손실 금액을 결정합니다. 따라서 r ji에는 minimax 기준만 적용할 수 있습니다. Savage 기준은 불확실한 조건에서 위험 값이 취하는 전략 Rj를 선택할 것을 권장합니다. 가장 작은 값가장 불리한 상황에서(위험이 가장 큰 경우)

예 6. 예 4를 고려하십시오. 주어진 매트릭스는 손실(비용)을 결정합니다. 공식 (31)을 사용하여 위험 매트릭스의 요소 || r ij ||:

Savage의 최소 위험 기준을 사용하여 얻은 계산 결과를 다음 표에 제시합니다.

위험 값 r ji의 도입으로 인해 가장 불리한 상황(위험이 최대일 때)에서 손실(비용)을 최소화하는 첫 번째 전략 R 1이 선택되었습니다.

Savage 기준을 적용하면 전략을 선택할 때 어떤 방법으로든 큰 위험을 피할 수 있으므로 더 큰 손실(손실)을 피할 수 있습니다.

4. Hurwitz 기준다음 두 가지 가정을 기반으로 합니다. '자연'은 가장 많은 곳에서 발견됩니다. 좋은 조건확률(1 - α)을 사용하고 확률 α를 사용하여 가장 유리한 상태에 있습니다. 여기서 α는 신뢰 계수입니다. 결과 V j i 가 이윤, 효용, 소득 등이면 Hurwitz 기준은 다음과 같이 작성됩니다.

V ji가 비용(손실)을 나타낼 때 다음을 제공하는 조치를 선택하십시오.

α = 0이면 비관적 Wald 기준을 얻습니다.

α = 1이면 max max V ji 형식의 결정 규칙, 즉 소위 "건강한 낙관주의자" 전략에 도달합니다. 즉, 기준이 너무 낙관적입니다.

Hurwitz 기준은 두 행동에 적절한 가중치(1 - α)와 α(여기서 0≤α≤1)를 적용하여 극도의 비관주의와 극도의 낙관주의 사례 사이의 균형을 설정합니다. 0에서 1까지의 α 값은 의사결정자의 비관적 또는 낙관적 경향에 따라 결정될 수 있습니다. 뚜렷한 성향이 없으면 α = 0.5가 가장 합리적인 것으로 보입니다.

예 7. 예 4에서는 Hurwitz 기준을 사용합니다. α = 0.5로 설정하겠습니다. 필요한 계산 결과는 다음과 같습니다.

최적의 솔루션은 W를 선택하는 것입니다.

따라서 이 예에서 우리는 어느 것을 선택해야 합니다. 가능한 해결책선택할 만한:

라플라스 기준에 따라 - 전략 R 2 선택,

Wald 기준에 따라 - 전략 R 3 선택;

Savage의 기준에 따라 - 전략 선택 R 1;

Hurwitz 기준에 따라 α = 0.5 - 전략 R 1 선택, 의사결정자가 비관주의자인 경우(α = 0) 전략 R 3 선택.

이는 적절한 기준(Laplace, Wald, Savage 또는 Hurwitz)을 선택하여 결정됩니다.

불확실성이 있는 상황에서 의사결정 기준을 선택하는 것은 운영 연구에서 가장 어렵고 중요한 단계입니다. 그러나 일반적인 팁이나 권장 사항은 없습니다. 기준 선택은 의사 결정자(DM)가 해결 중인 문제의 구체적인 세부 사항을 고려하고 자신의 목표에 따라 이루어져야 하며 과거 경험과 자신의 직관에 의존해야 합니다.

특히, 설사 최소한의 위험허용되지 않는 경우 Wald 기준을 적용해야 합니다. 반대로 특정 위험이 상당히 허용 가능하고 의사 결정자가 특정 기업에 너무 많은 돈을 투자하여 나중에 너무 적게 투자한 것을 후회하지 않으려면 Savage 기준이 선택됩니다.

불확실성 조건에서 솔루션을 선택하는 문제는 작업 수행 조건(자연 상태)을 모르지만 해당 확률을 알 때 가장 쉽게 해결됩니다.

이 경우, 우리가 극대화하려고 노력하는 효율성의 지표로서 가능한 모든 조건의 확률을 고려하여 평균값, 즉 승리에 대한 수학적 기대치를 취하는 것이 당연합니다.

플레이어의 전략에 대한 이 평균값을 다음과 같이 표시하겠습니다.

또는 간단히 말해서,

분명히, kes로 얻은 라인의 승리에 대한 가중 평균 이상의 것은 없습니다. 최적의 전략으로서 가치가 최대에 도달하는 전략을 선택하는 것은 당연하다.

이 기법을 사용하면 불확실한 조건에서 해를 선택하는 문제가 확실성의 조건에서 해를 선택하는 문제로 바뀌게 됩니다. 결정모든 사람에게 최적은 아닙니다 특별한 경우, 그러나 평균적으로.

예시 1. 이전에 알려지지 않은 지역에서 작업이 계획되어 있습니다. 기상 조건; 이러한 조건에 대한 옵션: 수년간의 일기 예보에 따르면 이러한 옵션의 빈도(확률)는 각각 동일합니다.

다양한 기상 조건에서 운영을 구성하기 위한 가능한 옵션은 다양한 이점을 제공합니다. 다양한 조건에서 각 솔루션의 "소득"값이 표에 나와 있습니다. 13.1

표 13.1

마지막 줄은 조건의 확률을 제공합니다. 평균 상금은 마지막 열에 표시됩니다. 그것으로부터 분명하다 최적의 전략플레이어는 평균 승리(별표로 표시)를 제공하는 그의 전략입니다.

확률을 알고 알 수 없는 조건에서 최적의 전략을 선택할 때 평균 보수뿐만 아니라

하지만 중간 위험도 있음

물론 이는 최대값이 아닌 최소값으로 전환되어야 합니다.

평균 보상을 최대화하는 전략이 평균 위험을 최소화하는 전략과 일치한다는 것을 보여주고, 이 두 지표를 모두 계산하여 합산해 보겠습니다.

(13.2)

주어진 행렬에 대한 이 합계(열 최대값의 가중 평균)는 상수 값입니다. C라고 부르자:

평균 위험은 다음과 같습니다.

분명히 이 값은 a, - 최대가 될 때 최소로 변합니다. 따라서 최소 평균 위험 조건에서 선택한 전략은 최대 평균 이득 조건에서 선택한 전략과 일치합니다.

자연을 이용한 게임을 풀 때 자연 상태의 확률이 알려진 경우에는 혼합 전략을 사용하지 않고 항상 순수 전략만으로 해낼 수 있습니다. 실제로 일종의 혼합 전략을 적용하면

즉, 확률이 있는 전략, 확률이 있는 전략 등을 사용하면 조건(자연 상태)과 전략 모두에 대해 평균을 낸 평균 이득은 다음과 같습니다.

이는 우리의 순수 전략에 따른 승리의 가중 평균입니다.

그러나 평균은 평균값의 최대값을 초과할 수 없다는 것이 분명합니다.

따라서 어떤 확률로든 혼합 전략을 사용하는 것은 순수 전략을 사용하는 것보다 플레이어에게 더 많은 이익을 줄 수 없습니다.

조건(자연 상태)의 확률은 유사한 작업의 반복 수행과 관련된 통계 데이터 또는 단순히 자연 상태의 관찰을 통해 결정될 수 있습니다. 예를 들어, 철도일정 기간 동안 완전히 알려지지 않은 운송량을 완료해야 하며, 지난 몇 년간의 경험에서 조건 분포에 대한 데이터를 가져올 수 있습니다. 이전 예에서와 같이 작업의 성공 여부가 기상 조건에 따라 달라지는 경우 해당 데이터는 일기 예보 통계에서 가져올 수 있습니다.

그러나 작업 수행을 시작할 때 자연 상태의 확률에 대해 전혀 모르는 경우가 종종 있습니다. 우리의 모든 정보는 변형 상태 목록으로 축소되지만 확률을 추정할 수는 없습니다. 예를 들어, 중요한 기술 발명이 향후 k년 이내에 제안되고 구현될 가능성을 합리적으로 추정할 수 없을 것 같습니다.

물론, 유사한 사례조건(자연 상태)의 확률은 주관적으로 평가할 수 있습니다. 일부는 우리에게 더 그럴듯해 보이는 반면 다른 것들은 덜 그럴듯해 보입니다. 하나 또는 다른 가설의 더 크거나 더 작은 "타당성"에 대한 우리의 주관적인 생각을 수치 추정으로 바꾸기 위해 다양한 기술. 따라서 어떤 가설도 선호할 수 없고 가설이 모두 동일하다면 확률을 서로 동일하게 지정하는 것이 당연합니다.

이것이 바로 라플라스(Laplace)의 '이유부족의 원리'입니다. 자주 접하는 또 다른 경우는 어떤 조건이 더 가능성이 높고 어떤 조건이 덜 가능성이 있는지에 대한 아이디어가 있는 경우입니다. 즉, 기존 가설을 타당성의 내림차순으로 정렬할 수 있습니다. 가장 그럴듯한 첫 번째 가설(PO, 그 다음 두 번째 가설) 가장 그럴듯한 가설 (). 그러나 그 중 하나가 다른 것보다 얼마나 더 가능성이 높은지는 알 수 없습니다. 이 경우, 예를 들어 감소하는 산술 수열의 항에 비례하도록 가설의 확률을 할당할 수 있습니다.

아니면, 그걸 감안할 때

때로는 경험과 경험을 바탕으로 효과가 있습니다. 상식, 가설의 가능성 정도 사이의 보다 미묘한 차이를 평가합니다.

자연 상태에 관한 다양한 가설의 "확률-타당성"을 주관적으로 평가하는 이러한 방법은 때때로 해결책을 선택하는 데 도움이 될 수 있습니다. 그러나 우리는 “주관적인 확률을 바탕으로 선택한 최적의 솔루션은 필연적으로 주관적인 것으로 판명된다는 점을 잊어서는 안됩니다. 한 사람이 임의로 할당한 확률 대신 자격을 갖춘 개인 그룹("전문가")이 서로 독립적으로 할당한 확률의 평균을 도입하면 결정의 주관성 정도가 줄어들 수 있습니다. 전문가를 인터뷰하는 방법은 일반적으로 널리 사용됩니다. 현대 과학, 언제 우리 얘기 중이야불확실한 상황에 대한 평가(예: 미래학) 이러한 방법을 사용한 경험은 전문가의 평가(서로 독립적으로 받아들여짐)가 사전에 가정할 수 있는 것만큼 모순되지 않는 경우가 많으며, 전문가의 평가에서 결정을 내리기 위한 몇 가지 전제 조건을 도출하는 것이 가능하다는 점을 가르쳐줍니다. 합리적인 결정.

위에서 우리는 객관적으로 계산되거나 주관적으로 할당된 자연 상태의 확률을 기반으로 솔루션을 선택하는 문제를 강조했습니다. 결정 이론의 이러한 접근 방식은 유일한 것이 아닙니다. 그 외에도 불확실성이 있는 조건에서 최적의 솔루션을 선택하기 위한 몇 가지 "기준" 또는 접근 방식이 더 있습니다. 그 중 일부를 살펴보겠습니다.

1. 막시민 발트 기준

이 기준에 따르면 최소 보상이 최대인 플레이어 A의 최적 전략, 즉 어떤 조건에서도 최대 보상보다 적은 보상을 보장하는 전략이 선택됩니다.

(13.4)

이 기준에 따르면 항상 최악의 조건에 집중하고 최악의 조건에서 승리가 최대가 되는 전략을 선택해야 합니다. 자연과의 게임에서 이 기준을 사용하면 우리는 이 비인격적이고 사심 없는 권위를 적극적이고 악의적인 적으로 대체하는 것처럼 보입니다. 분명히 그러한 접근 방식은 상황을 평가할 때 극도의 비관주의에 의해서만 결정될 수 있습니다. "항상 최악의 상황을 예상해야합니다!" - 그러나 가능한 접근 방식 중 하나로 고려해 볼 가치가 있습니다.

2. Savage의 최소최대 위험 기준

이 기준의 본질은 결정을 내릴 때 어떤 방법으로든 큰 위험을 피하는 것입니다.

Wald 기준과 마찬가지로 Savage 기준은 극도의 비관주의 기준이지만 여기서 비관주의는 다르게 이해됩니다. 최악이라고 선언되는 것은 최소 이득이 아니라 주어진 조건에서 달성할 수 있는 것과 비교하여 이득의 최대 손실입니다( 최대 위험).

3. 비관-낙관의 Hurwitz 기준

이 기준은 불확실한 상황에서 결정을 선택할 때 극단적인 비관주의(항상 최악의 상황을 예상하세요!)나 극단적이고 경박한 낙관주의(모든 것이 잘 될 것입니다)에 이끌려서는 안 된다고 권장합니다. 가장 좋은 방법!) Hurwitz 기준의 형식은 다음과 같습니다.

여기서 는 0과 1 사이에서 선택된 계수입니다.

표현의 구조(13.6)를 분석해 보자. Hurwitz 기준이 비관적 Wald 기준으로 변할 때와, "극단적 낙관주의" 기준으로 변할 때, 다음과 같은 전략을 선택하도록 권장합니다. 최상의 조건상금은 최대입니다. 그 결과 극단적인 비관주의와 극단적인 낙관주의 사이에 뭔가가 있게 됩니다(계수는 연구원의 "비관주의 척도"를 표현하는 것처럼 보입니다). 이 계수는 주관적인 이유로 선택됩니다. 상황이 더 위험할수록 우리는 그 상황에서 "자신을 보장"하고 싶어할수록 통일성에 더 가까워집니다. i가 선택됩니다.

원하는 경우 Savage의 기준에서와 같이 이득이 아닌 위험에 기반한 Hurwitz의 낙관-비관주의 기준과 유사한 기준을 구성할 수 있지만 이에 대해서는 다루지 않겠습니다.

Hurwitz 기준의 매개변수 선택과 마찬가지로 기준 선택은 주관적이지만 이러한 기준의 관점에서 상황을 보는 것이 여전히 유용할 수 있습니다. 다양한 기준에서 발생하는 권장 사항이 일치하면 더욱 좋고, 해당 기준에서 권장하는 솔루션을 안전하게 선택할 수 있습니다. 자주 발생하는 권장 사항이 서로 모순되는 경우 권장 사항에 대해 생각하고 장점과 장점을 고려하여 최종 결정을 내리는 것이 항상 합리적입니다. 약점. 다양한 기준의 관점에서 자연과 함께 게임의 매트릭스를 분석하면 매트릭스를 직접 고려하는 것보다 상황, 각 솔루션의 장점과 단점에 대한 더 나은 아이디어를 얻을 수 있는 경우가 많습니다. 특히 크기가 큰 경우에는 더욱 그렇습니다.

예 2. 자연이 포함된 4X3 게임은 네 가지 플레이어 전략과 세 가지 조건 변형(자연 상태)으로 고려됩니다. 보상 매트릭스가 표에 나와 있습니다. 13.2.

표 13.2

찾다 최적의 솔루션(전략), Wald and Savage 기준과 Hurwitz 기준을 사용하여

해결책. 1. 왈드 기준.

행렬의 각 행에서 가장 작은 이득을 취합니다(표 13.3).

값 중 최대값(별표로 표시)은 0.25이므로 Wald 기준에 따르면 이 전략은 최적입니다.

2. 야만적인 기준.

우리는 위험 매트릭스를 구축하고 각 행의 최대 위험을 오른쪽 추가 열에 배치합니다(표 13.4).

최소값은 0.60(별표로 표시)입니다. 따라서 Savage의 기준에 따르면 모든 전략이 최적입니다.

표 13.3

3. Hurwitz 기준

우리는 매트릭스의 오른쪽 3개 열(표 13 5)에 이익에 대한 "비관적" 평가를 기록합니다. "낙관적" a); 그리고 공식 (13.6)에 따른 가중 평균:

그것을 달성하기 위해

(최소값은 모든 것을 차지합니다. 일반적인 방법을 사용하여 이 최소값(또는 Wald 기준의 최대값)을 찾을 수 있습니다. 선형 프로그래밍. 사용하는 경우가 있을 수 있습니다. 혼합 전략 Wald, Savage, Hurwitz의 기준을 사용하면 하나만 사용하는 솔루션에 비해 이점을 제공합니다. 순수 전략그러나 우리는 이러한 기준을 순수한 전략에 대해서만 고려할 것입니다.

그 이유 중 하나는 상황에 대한 지식 부족(조건의 확률을 알지 못함)으로 인해 결과가 부정될 수 있는 복잡한 계산을 피하고 싶기 때문입니다. 또 다른, 더 중요한 이유-이것이 이론의 주요 내용인가? 통계적 솔루션(다음 단락에서 이에 대해 다루겠습니다)는 획득하여 사용할 계획입니다. 추가 정보실험을 통해 알 수 있는 자연의 상태에 대해. 연구에 따르면 일반적인 경우 상당한 양의 추가 정보를 얻을 때 상태 확률을 사용하지 않는 기준(Wald et al.)은 상태 확률을 기반으로 하는 기준과 거의 동일해집니다. 그러나 우리는 그러한 기준을 사용하여 혼합 전략을 사용하는 것이 의미가 없다는 것을 알고 있습니다. 따라서 추가 정보를 어느 정도 얻을 수 있다면 혼합 전략의 사용은 그 의미를 잃습니다(우리가 사용하는 솔루션 선택 기준에 관계없이). 실험을 통해 추출할 수 없다면 새로운 정보, 그러면 예시 3에서 본 것처럼 서로 다른 기준이 상충되는 권장 사항을 제공할 수 있습니다.

발트 기준

발트 기준가장 "조심"합니다. 그에 따르면 최적의 대안은 최악의 상황에서 가능한 모든 대안 중에서 최상의 결과를 제공하는 대안이 될 것입니다.

결과가 최소화해야 할 지표(손실, 비용, 손실 등)를 반영하는 경우 Wald 기준은 다음에 중점을 둡니다. "미니맥스"(모든 대안의 최대 손실 값 중 최소값)

대안의 결과에 이익 지표, 소득 지표 및 극대화해야 하는 기타 지표가 포함된 경우(“많을수록 좋다”는 원칙에 따라) 우리는 다음을 찾고 있습니다. "최대"상금(최소 상금 중 최대 상금). 여기서는 본문의 모든 기준에 대해 결과가 특정 이득을 나타내는 경우를 고려할 것입니다.

Wald 기준에 따르면 추정치는 i번째 대안가장 작은 보상은 다음과 같습니다.

Wi = 최소(x ij), j = 1..M

최악의 보상이 최대인 대안이 최적으로 간주됩니다.

Х* = Х k , W k = 최대(W i), i = 1..N

Wald 기준을 사용한 예

두 개의 프로젝트 X 1 과 X 2 가 있는데, 이는 지역에 대해 가능한 세 가지 개발 시나리오(j=1..3)에서 서로 다른 수익을 제공합니다. 이익 가치는 표 2에 나와 있습니다. 실행할 프로젝트를 선택해야 합니다.

표 2. 초기 데이터.

가능한 프로젝트 중에서 절대적으로나 국가 측면에서 지배적인 프로젝트는 없습니다. 그러므로 판단은 기준에 따라 이루어져야 할 것입니다.

Wald 기준에 따라 최적의 프로젝트 선택이 수행된 경우 의사결정자는 다음 조치를 수행해야 합니다.

1. 각 대안에 대한 최소 결과를 찾습니다. Wald 기준의 값은 다음과 같습니다.

W 1 = 최소(x 1j), j = 1..3 => W 1 = 최소(45, 25, 50) = 25

W 2 = 최소(x 2j), j = 1..3 => W 2 = 최소(20, 60, 25) = 20

2. Wald 기준의 값을 비교하여 가장 큰 값을 찾습니다. 최대 기준 값을 갖는 대안이 최적으로 간주됩니다.

25 > 20 => W1 > W2 => X* = X1

Wald 기준에 따라서만 결정이 내려졌다면 의사결정자는 최악의 시나리오에서 이 프로젝트가 제공할 이익이 더 높기 때문에 구현을 위해 프로젝트 X 1을 선택할 것입니다.

Wald 기준에 따라 최적의 대안을 선택함으로써 의사결정자는 최악의 시나리오에서 기준 값보다 낮은 금액을 받지 않을 것임을 스스로 보장합니다. 따라서 이 지표라고도 합니다. 보장된 결과의 기준.

Wald 기준의 주된 문제는 과도한 비관주의이며, 결과적으로 결과가 항상 논리적이지는 않습니다. 따라서 예를 들어 대안 A(100; 500)와 B(90; 1000) 사이에서 이 기준에 따라 선택할 때 옵션 A를 선택해야 합니다. 그러나 인생에서는 최악의 경우 B를 선택하는 것이 더 논리적입니다. 경우 B는 A보다 약간 나쁠 뿐이지만, 좋은 상황에서는 B가 훨씬 더 큰 이득을 제공합니다.


2. "최대" 기준

정반대 Wald 기준은 소위 "최대" 기준입니다. 발트가 궁극적인 비관주의자의 견해를 반영했다면, "맥시맥스"극도의 낙관주의적 태도에 해당한다. 최선의 결과에만 모든 관심이 집중됩니다. i번째 평가이 기준에 따른 대안은 가장 큰 이득 M i입니다:

M i = 최대(x ij), j = 1..M

최대의 대안 가장 큰 승리:

X* = X k, M k = 최대(M i), i = 1..N

'최대' 기준을 적용한 예

포인트 1(표 2)의 예시 조건에서 "최대" 기준을 사용하여 결정을 내리는 의사결정자의 조치는 다음과 같습니다.

1. 각 대안의 최대 결과를 찾으십시오.

M 1 = 최대(x 1j), j = 1..3 =>M 1 = 최대(45, 25, 50) = 50

M 2 = 최대(x 2j), j = 1..3 =>M 2 = 최대(20, 60, 25) = 60

2. 발견된 값을 비교하고 다음과 같은 대안을 결정합니다. 최대값기준:

50 < 60 =>남 1< М 2 =>X* = X2

“maximax” 기준에 따르면 최적의 프로젝트는 최상의 상황에서 최대의 수익을 제공할 수 있는 X2입니다.

최대치 기준은 최고 이외의 결과를 고려하지 않습니다. 따라서 그 사용은 첫째로 매우 위험할 수 있으며, 둘째로 Wald 기준과 마찬가지로 비논리적인 결정으로 이어질 수 있습니다. 예를 들어, "maximax" 위치의 대안 A(-100; 0; 500)와 B(200; 300; 400) 중에서 가장 좋은 것은 A이지만 손실 위험(-100)도 수반하며, 일반적으로 최고를 제외한 모든 결과는 V보다 훨씬 열등합니다. 따라서 실제 사용"최대" 기준은 매우

라플라스 기준

라플라스의 기준은 다음을 기반으로 합니다. 불충분한 정당화의 원칙. 불확실한 상황에서 정보 접근의 틀 내에서는 상태의 확률을 알 수 없기 때문에 상태가 다르다고 주장할 이유가 없습니다. 그러므로 우리는 그것들이 동일하다고 가정할 수 있습니다.

에 의해 라플라스 기준평균 이득은 대안을 평가하는 데 사용됩니다.

최적의 대안은 최대 평균 보수를 갖는 대안입니다.

Х* = Х k , L k = max(L i), i = 1..N

후회의 기준. 수학적 기대 기준. 위험과 불확실성이 있는 상황에서 LIR의 행동 심리학. 선택을 하기 위해 효용이론을 사용하기 최적의 옵션솔루션. 최적의 옵션을 직관적으로 선택합니다.


WALD CRITERION (최대 기준")

위 표에서 볼 수 있듯이 Wald 기준("최대" 기준)에 따라 불확실한 조건에서 위험한 결정에 대한 최적의 대안은 음영 처리된 필드에 있으며 140 기존에 해당합니다. 굴. 단위 (이 효율성 값은 최악의 시나리오에서 모든 최소값의 최대값입니다).

Wald 기준("최대" 기준)은 불확실성이 있는 조건에서 위험한 결정을 선택하는 데 사용됩니다. 일반적으로 위험에 노출되지 않거나 고려 중인 대상입니다. 가능한 상황비관주의자처럼.

W의 값은 자연의 최악의 행동이 발생할 경우 우리가 스스로 보장할 수 있는 지표 W(x, y)의 값입니다( 보장된 결과). 공식화된 문제에서 발견된 것과 다른 제어 x e X를 적용하면 자연은 다음을 선택하여 경박함 때문에 우리를 처벌할 수 있습니다. 최악의 가치 W보다 작은 지수 W를 구하는 매개변수 y. 솔루션을 선택하는 이 기준을 Wald 기준이라고도 합니다.

Wald 기준에 따른 최대 추정치는 불확실한 조건에서 결정을 내릴 때 유일하게 절대적으로 신뢰할 수 있는 추정치입니다.

전략 S를 maximin이라고 합니다. 어떤 시장 상황에서도 결과는 W = 49310.03,000 루블보다 나쁘지 않습니다. 따라서 이 값을 게임의 최저 가격 또는 최대값이라고 하며 Wald 기준에 따라 최대 보장 결과의 원칙이라고 하며, 이에 따라 모든 환경 상태에 대한 최적의 전략을 통해 최대값을 얻을 수 있습니다. 최악의 상황에서 이득을 얻는 것이 최대화 전략이다.

Wald 기준은 극도의 비관주의 기준으로, 의사결정자는 프로젝트의 최악의 조건에 초점을 맞춥니다.

최대 Wald 기준. 여기서는 최악의 환경조건(자연상태)에서 최대의 이익을 보장하는 무역기관의 솔루션을 선택하였습니다.

행 최소값 중 최대값과 일치하는 전략을 최대화 전략이라고 합니다. 해당 기준(Wald 기준)은 다음과 같이 작성됩니다.

즉, Wald 기준에 따른 최적 전략은 모든 전략의 최소 보수 중에서 가장 작은 보수가 가장 큰 전략이 될 것입니다. W(, i = 1...m 값은 Wald 기준에 따라 전략 A의 최적성을 나타내는 지표라고 합니다. 이는 다음을 의미합니다.

한 가지 방법은 최악의 가능성 중에서 가장 좋은 것을 선택하는 것입니다(Wald 기준). 이 경우 각 전략에 대해 최악의 결과가 선택된 다음 가장 좋은 결과가 선택됩니다. 108

이로 인해 동일한 Wald 기준을 가진 전략이 생성되면 외부 조건에 가장 덜 민감한 전략이 선택됩니다.

최대값 Wald 기준이라고도 합니다. 이 기준의 본질은 다음과 같습니다. 의사결정자는 문제를 해결하기 위한 많은 전략(옵션, 대안)을 가지고 있습니다.

따라서, 최적값에서 얻은 결과의 가능한 편차를 결정할 필요가 있습니다. 이것이 Savage의 기준이 적용되는 곳입니다. 전략 선택은 플레이어가 보상 매트릭스 E가 아니라 공식(2.2.2)에 따라 구성된 위험 매트릭스 R에 의해 안내된다는 차이점을 제외하고 Wald 원칙에 따른 전략 선택과 유사합니다.

최대 주의 Eg = max min e i j 보장된 결과 기준(Wald)

A. Wald는 또한 자신의 기준이 (평균 관찰 수를 기준으로) 최고의 기준보다 훨씬 더 수익성이 높다는 것을 증명했습니다. 고전적 기준- 네이먼-피어슨 기준.

특히, Wald 최대치 기준은 최소 이득의 최대화 또는 전략 중 하나를 실행할 때 발생할 수 있는 최대 손실의 최소화를 보장합니다. 이 기준은 간단하고 명확하지만 의사결정자가 지나치게 신중한 행동을 하도록 지시한다는 점에서 보수적입니다. 최대값 기준에 해당하는 값을 게임의 하한 가격이라고 하며, 이는 최소 결과로 전략 중 하나를 선택하여 특정 상대와의 게임에서 보장되는 최대 승리를 의미합니다.

Wald 기준(또는 "최대" 기준)은 다음을 가정합니다. 가능한 옵션"의사 결정 매트릭스"는 이벤트 개발의 가장 불리한 상황(효율성 값 최소화) 중에서 최소값 중 가장 큰 값(즉, 효율성 값, 최고 값)을 갖는 대안이 선택됩니다.

최대 Wald 기준은 어떤 조건에서든 보상이 최악의 조건에서 가능한 최대치 이상이라는 보장이 필요한 경우에 사용됩니다. 허위츠 기준. 그 값은 0 이내입니다.

이 기준의 공식에는 계수 a가 포함되어 있으며, 그 값은 의사 결정자가 선택한 정확성에 대한 확신 정도에 따라 설정되며 어떤 프로젝트 구현 시나리오를 선호해야 하는지에 따라 결정됩니다. a 값은 0부터 1까지의 범위에서 선택되며, oc=0일 경우 Hurwitz 기준은 극도의 낙관적 기준으로 바뀌고, oc=1일 경우 Wald 기준으로 바뀐다. 0에서는 "보호"하려는 욕구가 클수록 계수가 1에 더 가깝게 선택됩니다.

우도 기준은 편향되지 않고 일관됩니다. 큰 표본의 경우 -2-log X는 r 자유도를 갖는 카이제곱 분포를 가지며, 여기서 /는 매개변수 p의 수이고 특정 값은 H0에 의해 결정됩니다. 우도 기준(LK)은 점근 근사의 Wald 기준(W) 및 라그랑주 승수 기준(LM)과 동일하지만 작은 표본의 경우 W>LR>LM입니다.

MAXIMIN은 최악의 외부 환경(비관적 접근, Wald 기준)에서 보장된 이익을 얻는 데 중점을 둡니다. 이에 따라, 가장 불리한 환경 상태에서 기대되는 결과의 최대값을 갖는 대안이 최적으로 선택됩니다. 여기서 해결책은 건설을 거부하는 것입니다.

따라서 보장된 결과에 대한 기준(최대 Wald 기준)은 다음 형식으로 작성됩니다.