Wald 기준의 사용은 다음과 같은 경우에 정당화됩니다. 완전한 불확실성 조건에서의 의사결정 기준

사용 맥시민 발트 테스트최적의 전략은 각 대안의 최소 결과를 최대화하는 전략입니다.

고려 중인 예에 대한 Wald 기준의 값 v op , = 4.이 값은 전략에 해당합니다. X 4.

을 위한 Savage의 최소최대 위험 기준최적의 전략은 위험의 양을 결정하는 것입니다. 최악의 조건에서는 최소입니다. 동일

위험은 다음과 같이 정의됩니다. =(샤 어떻게)-에이.야만적인 기준 값

고려중인 예는 1과 같습니다. 전략이 그에 상응한다 X 2.

낙관적 기준 - Hurwitz의 비관주의해결책을 선택할 때 극단적인 비관주의나 극단적인 낙관주의에 얽매여서는 안 된다는 점을 시사합니다. 이 기준에 따라 전략은 조건에서 선택됩니다.

비관 계수 값 에게 0과 1 중에서 선택하세요. ~에 k = 1 Hurwitz 기준이 Wald 기준으로 바뀌고, k에서> 0 - 극도의 낙관주의 기준.

사용하는 경우 라플라스의 무차별 기준가능한 상태의 (알 수 없는) 확률이 가정됩니다. 환경(본질은) 똑같다. 이 기준은 최대 평균 결과를 가진 대안을 식별합니다.

예제 13.15. 젊은 전문가(DM)가 다음 중 한 곳의 인턴십에 초대됩니다. 유럽 ​​국가 5년 동안. 결과에 따르면 수습 기간 1년 동안 그는 영구적으로 일하도록 초대될 수 있습니다. 그는 자신이 가지고 있는 방 2개짜리 아파트를 처분해야 합니다.

가능한 시장 상황 에스/.

  • 1) 유럽에 남을 것이며 달러는 매년 10%씩 증가할 것입니다.
  • 2) 유럽에 남을 것이며 달러 환율은 매년 10%씩 감소할 것입니다.
  • 3) 러시아로 돌아가고 달러 환율은 매년 10%씩 인상됩니다.
  • 4) 러시아로 돌아가고 달러 환율은 매년 10%씩 하락할 것입니다.

의사결정자를 위한 솔루션 옵션 I):

  • 1) 떠나기 전에 아파트를 7,200,000 루블에 판매합니다. ($240,000);
  • 2) 월 30,000루블에 아파트를 임대합니다.
  • 3) 한 방을 12,000루블에 임대하고 두 번째 방을 2,400,000루블에 판매합니다.
  • 4) 이사 결정이 내려진 후 1년 이내에 아파트를 판매합니다.

분명히, 돌아와야 하고 아파트가 저장된다면 이 옵션이 더 바람직합니다. 이 옵션에 몇 가지 보너스를 추가해 보겠습니다.

  • 1) 아파트가 즉시 판매되는 경우 아파트의 최소 비용인 220,000달러를 공제합니다.
  • 2) 아파트가 저장되면 동일한 금액을 추가합니다.
  • 3) 방 한 개만 판매된 경우 보너스는 방 한 개 비용인 80,000달러와 동일합니다.

달러 환율을 다음과 같이 해보자. 이 순간 30루블과 같습니다. 미국 달러로 수익 매트릭스를 만들어 보겠습니다(표 13.9).

게임의 지불 매트릭스(표 13.10)와 위험 매트릭스(표 13.11)를 계산해 보겠습니다.

고려된 모든 기준을 사용하여 솔루션을 찾아보겠습니다. 최대 Wald 기준을 적용하면 다음을 얻습니다.

전략은 이 기준을 충족합니다. Savage의 최소최대 위험 기준은 다음과 같습니다.

표 13.9

30000 12 , -0000

30000 12 , -0000

12 000 12+2 400 000

12 000 12+ 2400 000

12 000 1 2+ 2 400 000

12 000 12+2 400 000

7200000, 오모

344. 13장. 게임 이론의 요소

표 13.10

g opt = 확인 (0.0.59111.0) = 59111,

전략의 선택에 해당합니다. 엑스 3 .

Hurwitz 기준을 적용하면 다음과 같습니다. 에게= 0.6(평균 통계적 선호도에 해당), 우리는 다음을 얻습니다.


전략도 이 기준을 충족합니다. 엑스삼. 라플라스 기준에 따르면

이 결정은 전략과 일치합니다. X 4.

그래서 세 가지 기준에 따라 최적의 전략~이다 엑스시간.

결론적으로, 우리는 각 기준이 긍정적이고 부정적인 측면. 다양한 기준을 사용하여 게임 매트릭스를 분석하면 문제를 연구할 수 있습니다. 다른 점보기에서는 해당 행렬의 차원이 큰 경우 특히 유용합니다. 어쨌든 이는 많은 옵션을 비교하는 것보다 더 건설적인 접근 방식입니다. 예제에서와 같이 얻은 솔루션이 일치하면 솔루션은 고유합니다. 그렇지 않은 경우에는 고려 중인 기준의 모든 특성을 고려하여 추가 분석을 수행해야 합니다.

Savage 기준은 불확실한 상황에서 의사결정을 내리는 기준 중 하나입니다. 불확실성 조건은 내린 결정의 결과를 알 수 없으며 대략적으로만 추정할 수 있는 상황으로 간주됩니다. 결정을 내리려면... ... 위키피디아

Kolmogorov 적합도 테스트- 또는 Kolmogorov Smirnov 적합도 검정은 두 개의 경험적 분포가 동일한 법칙을 따르는지 또는 결과 분포가 가정된 모델을 따르는지 여부를 결정하는 데 사용되는 통계 검정입니다.... ... Wikipedia

발트 기준- Wald 기준의 다른 철자법은 Maximin을 참조하세요. 경제수학사전

피어슨 적합도 테스트- 피어슨 기준 또는 χ² 기준(카이 제곱)은 분포 법칙에 대한 가설을 검정하는 데 가장 일반적으로 사용되는 기준입니다. 많은 것에서 실질적인 문제정확한 분배 법칙은 알 수 없습니다. 즉, ... ... Wikipedia

크루스칼 기준- Wallis는 여러 표본의 중앙값이 같은지 테스트하도록 설계되었습니다. 이 기준은 Wilcoxon-Mann-Whitney 검정의 다차원 일반화입니다. Kruskal Wallis 기준은 순위 기준이므로 어떤 항목에도 변하지 않습니다... ... Wikipedia

코크란 기준- Cochran의 기준은 다음과 같은 경우에 사용됩니다. 세 가지 비교그리고 같은 크기의 더 많은 샘플. 분산 간의 불일치는 다음과 같은 경우 선택한 유의 수준에서 무작위로 간주됩니다. 합산된 개수가 있는 무작위 변수의 분위수는 어디에 있습니까... ... Wikipedia

릴리포르스 기준- Kolmogorov-Smirnov 테스트를 수정한 George Washington University의 통계학 교수인 Hubert Lilliefors의 이름을 딴 통계 테스트입니다. 표본이 다음과 같은 귀무가설을 검정하는 데 사용됩니다... ... Wikipedia

윌콕슨 테스트- 이 기사를 개선하려면 바람직합니까?: 작성된 내용을 확인하는 권위 있는 출처에 대한 각주 링크를 찾아 정리합니다. 일러스트레이션을 추가합니다. T 크레타 섬 ... 위키피디아

순차적 통계 테스트- 순차통계검정은 순차분석에서 통계적 가설을 검정하는데 사용되는 순차통계절차이다. 통계 실험을 통해 관찰할 수 있도록 하세요. 임의의 값... ... 위키피디아

왈드 테스트- (English Wald 테스트) 표본 데이터를 기반으로 추정된 통계 모델의 매개 변수에 대한 제한 사항을 테스트하는 데 사용되는 통계 테스트입니다. 테스트와 함께 제약 조건을 확인하는 세 가지 기본 테스트 중 하나입니다 ... ... Wikipedia

서적

  • 문제의 확률 이론 및 수학적 통계: 360개 이상의 문제와 연습 문제, Borzykh D.. 제안된 매뉴얼에는 다양한 수준의 복잡성을 지닌 문제가 포함되어 있습니다. 그러나 주요 강조점은 작업에 있습니다. 중간 난이도. 이는 학생들의 학습을 장려하기 위해 의도적으로 수행되었습니다. 443 RUR에 구매
  • 문제의 확률 이론과 수학적 통계. 360개 이상의 작업 및 연습, Borzykh D.A.. 제안된 매뉴얼에는 다양한 수준의 복잡성을 가진 작업이 포함되어 있습니다. 그러나 주요 강조점은 중간 정도의 복잡성을 갖는 작업입니다. 이것은 학생들의 학습을 장려하기 위해 의도적으로 수행되었습니다.

불확실성 조건에서 솔루션을 선택하는 문제는 작업 수행 조건(자연 상태)을 모르지만 해당 확률을 알 때 가장 쉽게 해결됩니다.

이 경우, 우리가 극대화하려고 노력하는 효율성의 지표로서 가능한 모든 조건의 확률을 고려하여 평균값, 즉 승리에 대한 수학적 기대치를 취하는 것이 당연합니다.

플레이어의 전략에 대한 이 평균값을 다음과 같이 표시하겠습니다.

또는 간단히 말해서,

분명히, kes로 얻은 라인의 승리에 대한 가중 평균 이상의 것은 없습니다. 최적의 전략으로서 가치가 최대에 도달하는 전략을 선택하는 것은 당연하다.

이 기법을 사용하면 불확실한 조건에서 해를 선택하는 문제가 확실성의 조건에서 해를 선택하는 문제로 바뀌게 됩니다. 결정모든 사람에게 최적은 아닙니다 특별한 경우, 그러나 평균적으로.

예시 1. 이전에 알려지지 않은 지역에서 작업이 계획되어 있습니다. 기상 조건; 이러한 조건에 대한 옵션: 수년간의 일기 예보에 따르면 이러한 옵션의 빈도(확률)는 각각 동일합니다.

다양한 기상 조건에서 운영을 구성하기 위한 가능한 옵션은 다양한 이점을 제공합니다. 다양한 조건에서 각 솔루션의 "소득"값이 표에 나와 있습니다. 13.1

표 13.1

마지막 줄은 조건의 확률을 제공합니다. 평균 상금은 마지막 열에 표시됩니다. 이는 플레이어의 최적 전략이 평균 승리(별표로 표시)를 제공하는 전략임을 보여줍니다.

확률을 알고 알 수 없는 조건에서 최적의 전략을 선택할 때 평균 보수뿐만 아니라

하지만 중간 위험도 있음

물론 이는 최대값이 아닌 최소값으로 전환되어야 합니다.

평균 보상을 최대화하는 전략이 평균 위험을 최소화하는 전략과 일치한다는 것을 보여주고, 이 두 지표를 모두 계산하여 합산해 보겠습니다.

(13.2)

주어진 행렬에 대한 이 합계(열 최대값의 가중 평균)는 상수 값입니다. C라고 부르자:

평균 위험은 다음과 같습니다.

분명히 이 값은 a, - 최대가 될 때 최소로 변합니다. 따라서 최소 평균 위험 조건에서 선택한 전략은 최대 평균 이득 조건에서 선택한 전략과 일치합니다.

자연으로 게임을 풀 때 자연 상태의 확률이 알려진 경우에는 혼합 전략을 사용하지 않고 항상 순수 전략만으로 해낼 수 있습니다. 실제로 일종의 혼합 전략을 적용하면

즉, 확률이 있는 전략, 확률이 있는 전략 등을 사용하면 조건(자연 상태)과 전략 모두에 대해 평균을 낸 평균 이득은 다음과 같습니다.

이는 우리의 순수 전략에 따른 승리의 가중 평균입니다.

그러나 평균은 평균값의 최대값을 초과할 수 없다는 것이 분명합니다.

따라서 어떤 확률로든 혼합 전략을 사용하는 것은 순수 전략을 사용하는 것보다 플레이어에게 더 많은 이익을 줄 수 없습니다.

조건(자연 상태)의 확률은 유사한 작업의 반복 수행과 관련된 통계 데이터 또는 단순히 자연 상태의 관찰을 통해 결정될 수 있습니다. 예를 들어, 철도일정 기간 동안 완전히 알려지지 않은 운송량을 완료해야 하며, 지난 몇 년간의 경험에서 조건 분포에 대한 데이터를 가져올 수 있습니다. 이전 예에서와 같이 작업의 성공 여부가 기상 조건에 따라 달라지는 경우 해당 데이터는 일기 예보 통계에서 가져올 수 있습니다.

그러나 작업 수행을 시작할 때 자연 상태의 확률에 대해 전혀 모르는 경우가 종종 있습니다. 우리의 모든 정보는 변형 상태 목록으로 축소되지만 확률을 추정할 수는 없습니다. 예를 들어, 중요한 기술 발명이 향후 k년 이내에 제안되고 구현될 가능성을 합리적으로 추정할 수 없을 것 같습니다.

물론, 유사한 사례조건(자연 상태)의 확률은 주관적으로 평가할 수 있습니다. 일부는 우리에게 더 그럴듯해 보이는 반면 다른 것들은 덜 그럴듯해 보입니다. 하나 또는 다른 가설의 더 크거나 더 작은 "타당성"에 대한 우리의 주관적인 생각을 수치 추정으로 바꾸기 위해 다양한 기술. 따라서 어떤 가설도 선호할 수 없고 가설이 모두 동일하다면 확률을 서로 동일하게 지정하는 것이 당연합니다.

이것이 바로 라플라스(Laplace)의 '이유부족의 원리'입니다. 자주 접하는 또 다른 경우는 어떤 조건이 더 가능성이 높고 어떤 조건이 덜 가능성이 있는지에 대한 아이디어가 있는 경우입니다. 즉, 기존 가설을 타당성의 내림차순으로 정렬할 수 있습니다. 가장 그럴듯한 첫 번째 가설(PO, 그 다음 두 번째 가설) 가장 그럴듯한 가설 (). 그러나 그 중 하나가 다른 것보다 얼마나 더 가능성이 높은지는 알 수 없습니다. 이 경우, 예를 들어 감소하는 산술 수열의 항에 비례하도록 가설의 확률을 할당할 수 있습니다.

아니면, 그걸 감안할 때

때로는 경험과 상식, 가설의 가능성 정도 사이의 보다 미묘한 차이를 평가합니다.

자연 상태에 관한 다양한 가설의 "확률-타당성"을 주관적으로 평가하는 이러한 방법은 때때로 해결책을 선택하는 데 도움이 될 수 있습니다. 그러나 우리는 “주관적인 확률을 바탕으로 선택한 최적의 솔루션은 필연적으로 주관적인 것으로 판명된다는 점을 잊어서는 안됩니다. 한 사람이 임의로 할당한 확률 대신 자격을 갖춘 개인 그룹("전문가")이 서로 독립적으로 할당한 확률의 평균을 도입하면 결정의 주관성 정도가 줄어들 수 있습니다. 전문가를 인터뷰하는 방법은 일반적으로 널리 사용됩니다. 현대 과학, 언제 우리 얘기 중이야불확실한 상황에 대한 평가(예: 미래학) 이러한 방법을 사용한 경험은 전문가의 평가(서로 독립적으로 받아들여짐)가 사전에 가정할 수 있는 것만큼 모순되지 않는 경우가 많으며, 전문가의 평가에서 결정을 내리기 위한 몇 가지 전제 조건을 도출하는 것이 가능하다는 점을 가르쳐줍니다. 합리적인 결정.

위에서 우리는 객관적으로 계산되거나 주관적으로 할당된 자연 상태의 확률을 기반으로 솔루션을 선택하는 문제를 강조했습니다. 결정 이론의 이러한 접근 방식은 유일한 것이 아닙니다. 그 외에도 불확실성이 있는 조건에서 최적의 솔루션을 선택하기 위한 몇 가지 "기준" 또는 접근 방식이 더 있습니다. 그 중 일부를 살펴보겠습니다.

1. 막시민 발트 기준

이 기준에 따르면 최소 보상이 최대인 플레이어 A의 최적 전략, 즉 어떤 조건에서도 최대 보상보다 적은 보상을 보장하는 전략이 선택됩니다.

(13.4)

이 기준에 따르면 항상 최악의 조건에 집중하고 최악의 조건에서 승리가 최대가 되는 전략을 선택해야 합니다. 자연과의 게임에서 이 기준을 사용하면 우리는 이 비인격적이고 사심 없는 권위를 적극적이고 악의적인 적으로 대체하는 것처럼 보입니다. 분명히 그러한 접근 방식은 상황을 평가할 때 극도의 비관주의에 의해서만 결정될 수 있습니다. "항상 최악의 상황을 예상해야합니다!" - 그러나 가능한 접근 방식 중 하나로 고려해 볼 가치가 있습니다.

2. Savage의 최소최대 위험 기준

이 기준의 본질은 결정을 내릴 때 어떤 방법으로든 큰 위험을 피하는 것입니다.

Wald 기준과 마찬가지로 Savage 기준은 극도의 비관주의 기준이지만 여기서 비관주의는 다르게 이해됩니다. 최악이라고 선언되는 것은 최소 이득이 아니라 주어진 조건에서 달성할 수 있는 것과 비교하여 이득의 최대 손실입니다( 최대 위험).

3. 비관-낙관의 Hurwitz 기준

이 기준은 불확실한 상황에서 결정을 선택할 때 극단적인 비관주의(항상 최악의 상황을 예상하세요!)나 극단적이고 경박한 낙관주의(모든 것이 잘 될 것입니다)에 이끌려서는 안 된다고 권장합니다. 가장 좋은 방법!) Hurwitz 기준의 형식은 다음과 같습니다.

여기서 는 0과 1 사이에서 선택된 계수입니다.

표현의 구조(13.6)를 분석해 보자. Hurwitz 기준이 비관적 Wald 기준으로 변할 때와, "극단적 낙관주의" 기준으로 변할 때, 다음과 같은 전략을 선택하도록 권장합니다. 최상의 조건상금은 최대입니다. 그 결과 극단적인 비관주의와 극단적인 낙관주의 사이에 뭔가가 있게 됩니다(계수는 연구원의 "비관주의 척도"를 표현하는 것처럼 보입니다). 이 계수는 주관적인 이유로 선택됩니다. 상황이 더 위험할수록 우리는 그 상황에서 "자신을 보장"하고 싶어할수록 통일성에 더 가까워집니다. i가 선택됩니다.

원하는 경우 Savage의 기준에서와 같이 이득이 아닌 위험에 기반한 Hurwitz의 낙관-비관주의 기준과 유사한 기준을 구성할 수 있지만 이에 대해서는 다루지 않겠습니다.

Hurwitz 기준의 매개변수 선택과 마찬가지로 기준 선택은 주관적이지만 이러한 기준의 관점에서 상황을 보는 것이 여전히 유용할 수 있습니다. 다양한 기준에서 발생하는 권장 사항이 일치하면 더욱 좋고, 해당 기준에서 권장하는 솔루션을 안전하게 선택할 수 있습니다. 자주 발생하는 권장 사항이 서로 모순되는 경우 권장 사항에 대해 생각하고 장점과 장점을 고려하여 최종 결정을 내리는 것이 항상 합리적입니다. 약점. 다양한 기준의 관점에서 자연과 함께 게임의 매트릭스를 분석하면 매트릭스를 직접 고려하는 것보다 상황, 각 솔루션의 장점과 단점에 대한 더 나은 아이디어를 얻을 수 있는 경우가 많습니다. 특히 크기가 큰 경우에는 더욱 그렇습니다.

예 2. 자연이 포함된 4X3 게임은 네 가지 플레이어 전략과 세 가지 조건 변형(자연 상태)으로 고려됩니다. 보상 매트릭스가 표에 나와 있습니다. 13.2.

표 13.2

Wald and Savage 기준과 Hurwitz 기준을 사용하여 최적의 솔루션(전략)을 찾습니다.

해결책. 1. 왈드 기준.

행렬의 각 행에서 가장 작은 이득을 취합니다(표 13.3).

값 중 최대값(별표로 표시)은 0.25이므로 Wald 기준에 따르면 이 전략은 최적입니다.

2. 야만적인 기준.

우리는 위험 매트릭스를 구축하고 각 행의 최대 위험을 오른쪽 추가 열에 배치합니다(표 13.4).

최소값은 0.60(별표로 표시)입니다. 따라서 Savage의 기준에 따르면 모든 전략이 최적입니다.

표 13.3

3. Hurwitz 기준

우리는 매트릭스의 오른쪽 3개 열(표 13 5)에 이익에 대한 "비관적" 평가를 기록합니다. "낙관적" a); 그리고 공식 (13.6)에 따른 가중 평균:

그것을 달성하기 위해

(최소값은 모든 것을 차지합니다. 일반적인 방법을 사용하여 이 최소값(또는 Wald 기준의 최대값)을 찾을 수 있습니다. 선형 프로그래밍. 사용하는 경우가 있을 수 있습니다. 혼합 전략 Wald, Savage, Hurwitz의 기준을 사용하면 하나만 사용하는 솔루션에 비해 이점을 제공합니다. 순수 전략그러나 우리는 이러한 기준을 순수한 전략에 대해서만 고려할 것입니다.

그 이유 중 하나는 상황에 대한 지식 부족(조건의 확률을 알지 못함)으로 인해 결과가 부정될 수 있는 복잡한 계산을 피하고 싶기 때문입니다. 또 다른, 더 중요한 이유-이것이 이론의 주요 내용인가? 통계적 솔루션(다음 단락에서 이에 대해 다루겠습니다)는 획득하여 사용할 계획입니다. 추가 정보실험을 통해 알 수 있는 자연의 상태에 대해. 연구에 따르면 일반적인 경우 상당한 양의 추가 정보를 얻을 때 상태 확률을 사용하지 않는 기준(Wald et al.)은 상태 확률을 기반으로 하는 기준과 거의 동일해집니다. 그러나 우리는 그러한 기준을 사용하여 혼합 전략을 사용하는 것이 의미가 없다는 것을 알고 있습니다. 따라서 추가 정보를 어느 정도 얻을 수 있다면 혼합 전략의 사용은 그 의미를 잃습니다(우리가 사용하는 솔루션 선택 기준에 관계없이). 실험을 통해 추출할 수 없다면 새로운 정보, 그러면 예시 3에서 본 것처럼 서로 다른 기준이 상충되는 권장 사항을 제공할 수 있습니다.

완전한 불확실성은 환경(“자연”)의 확률적 상태(예: 실제 상황에 대한 특정 옵션의 확률)에 대한 정보가 없음을 의미합니다. V 최선의 시나리오고려중인 수량의 값 범위가 알려져 있습니다. 환경 상태의 확률에 대한 정보 부족과 관련된 불확실성을 "희망 없음" 또는 "나쁨"이라고 합니다. 채택에 대한 권장사항 최고의 솔루션그러한 상황에서는 다음과 같은 형식으로 공식화됩니다. 특정 규칙(기준). 주요 기준은 다음과 같습니다.

1) 낙관적 기준(최대값 기준)은 낙관적 공격 ​​전략에 해당합니다. 여기서는 최선 외에는 가능한 결과가 고려되지 않습니다.

2) 기준 보장된 결과(최대 Wald 기준)은 본질적으로 비관적 기준입니다. 각 대안의 최악의 결과만 고려됩니다. 이 접근 방식은 보장된 최소값을 설정하므로 실제 결과는 더 나을 수 있습니다.

3) Savage의 최소최대 위험 기준, 즉 최악의 상황을 결정하는 최소 피해 기준 가능한 결과각 대안에 대해 가장 나쁜 값을 가진 대안을 선택합니다.

4) Hurwitz의 일반화된 최대치(비관주의-낙관주의) 기준을 통해 우리는 극도의 비관주의와 극도의 낙관주의 사이의 상태를 고려할 수 있습니다.

5) 비관적 기준은 최악의 투자 회수 가치 중에서 최악의 대안을 선택하는 것이 특징입니다.

~에 비교 분석효율성 기준을 단일 기준으로 선택하는 것은 부적절합니다. 어떤 경우에는 이로 인해 부당한 결정이 내려져 경제적 손실과 기타 콘텐츠 손실이 발생할 수 있습니다. 대부분의 상황에서는 여러 기준을 함께 적용할 필요가 있습니다. 예를 들어 Wald 보장 결과 기준과 함께 Savage minimax 위험 기준 등을 사용할 수 있습니다.

1. 최대치의 기준(규칙). 기준을 사용할 때 의사결정자는 분석된 시스템의 작동 조건이 자신에게 가장 유리할 것이라는 사실에 따라 결정됩니다. 따라서 최적의 솔루션상황의 각 변형에 대해 최대 보상(예: 소득)을 최대화하는 전략입니다. 이것이 기준이다 극단적인(“분홍색”) 낙관주의 , 최대 이득이 다음과 같다고 가정 가장 높은 가치최적성 기준 결제 매트릭스. 기능에 영향을 미칠 수 있는 근본적인 가능성이 있는 경우 기준을 적용하는 것이 좋습니다. 반대편. 한 유형 또는 다른 유형의 효과 매트릭스를 분석하면 최대 효과를 보장하는 방식으로 제어 요인의 선택이 수행됩니다. 이 경우 낙관적 기준은 다음과 같이 작성됩니다.


고려하면 나-이 솔루션에서는 소득을 창출하는 최상의 상황을 가정하고 가장 큰 수익을 창출하는 솔루션을 선택합니다. 나는.

예 (2.2)를 살펴보겠습니다. 예제 2.1의 결과 행렬의 경우 최대값 기준을 사용하여 솔루션 옵션을 선택합니다.

해결책.우리는 값의 순서를 찾습니다. a 1 =8, a 2 =12, a 3 =10, a 4 =8.이 값에서 우리는 가장 큰 값을 찾습니다. 2 =12. 따라서 최대값 기준은 두 번째 결정을 권장합니다( 나는=2).

2. 왈드의 법칙 (최대 규칙 또는 극단적인 비관론의 기준).기준의 본질은 다음과 같습니다. 의사결정자는 문제를 해결하기 위한 다양한 전략을 가지고 있습니다. . 이러한 전략은 제어 가능한(통제 가능한) 요소로 간주됩니다. 이러한 요인에는 다음이 포함될 수 있습니다. 기술 사양설계된 시스템, 기업 상태의 경제 지표, 다양한 옵션할당된 문제 해결 등 제어 가능한 요소와 함께 제어할 수 없는(통제할 수 없는) 요소도 작동합니다. 피={피제이} , j= 1,…N.이러한 요소에는 회사가 제공하는 상품에 대한 수요 수준, 시장 가격, 기술 및 생산 시스템의 운영 조건, 경쟁사의 행동 등이 포함될 수 있습니다.

후회의 기준. 수학적 기대 기준. 위험과 불확실성이 있는 상황에서 LIR의 행동 심리학. 선택을 하기 위해 효용이론을 사용하기 최적의 옵션솔루션. 최적의 옵션을 직관적으로 선택합니다.


WALD CRITERION (최대 기준")

위 표에서 볼 수 있듯이 Wald 기준("최대" 기준)에 따라 불확실한 조건에서 위험한 결정에 대한 최적의 대안은 음영 처리된 필드에 있으며 140 기존에 해당합니다. 굴. 단위 (이 효율성 값은 최악의 시나리오에서 모든 최소값의 최대값입니다).

Wald 기준("최대" 기준)은 불확실성이 있는 조건에서 위험한 결정을 선택하는 데 사용됩니다. 일반적으로 위험에 노출되지 않거나 고려 중인 대상입니다. 가능한 상황비관주의자처럼.

W의 값은 자연의 최악의 행동이 발생할 경우 우리가 스스로 보장할 수 있는 지표 W(x, y)의 값입니다(보장된 결과). 공식화된 문제에서 발견된 것과 다른 제어 x e X를 적용하면 자연은 다음을 선택하여 경박함 때문에 우리를 처벌할 수 있습니다. 최악의 가치 W보다 작은 지수 W를 구하는 매개변수 y. 솔루션을 선택하는 이 기준을 Wald 기준이라고도 합니다.

Wald 기준에 따른 최대 추정치는 불확실한 조건에서 결정을 내릴 때 유일하게 절대적으로 신뢰할 수 있는 추정치입니다.

전략 S를 maximin이라고 합니다. 어떤 시장 상황에서도 결과는 W = 49310.03,000 루블보다 나쁘지 않습니다. 따라서 이 값을 게임의 최저 가격 또는 최대값이라고 하며 Wald 기준에 따라 최대 보장 결과의 원칙이라고 하며, 이에 따라 모든 환경 상태에 대한 최적의 전략을 통해 최대값을 얻을 수 있습니다. 최악의 상황에서 이득을 얻는 것이 최대화 전략이다.

Wald 기준은 극도의 비관주의 기준으로, 의사결정자는 프로젝트의 최악의 조건에 초점을 맞춥니다.

최대 Wald 기준. 여기서는 최악의 환경조건(자연상태)에서 최대의 이익을 보장하는 무역기관의 솔루션을 선택하였습니다.

행 최소값 중 최대값과 일치하는 전략을 최대화 전략이라고 합니다. 해당 기준(Wald 기준)은 다음과 같이 작성됩니다.

즉, Wald 기준에 따른 최적 전략은 모든 전략의 최소 보수 중에서 가장 작은 보수가 가장 큰 전략이 될 것입니다. W(, i = 1...m 값은 Wald 기준에 따라 전략 A의 최적성을 나타내는 지표라고 합니다. 이는 다음을 의미합니다.

한 가지 방법은 최악의 가능성 중에서 가장 좋은 것을 선택하는 것입니다(Wald 기준). 이 경우 각 전략에 대해 최악의 결과가 선택된 다음 가장 좋은 결과가 선택됩니다. 108

이로 인해 동일한 Wald 기준을 가진 전략이 생성되면 외부 조건에 가장 덜 민감한 전략이 선택됩니다.

최대값 Wald 기준이라고도 합니다. 이 기준의 본질은 다음과 같습니다. 의사결정자는 문제 해결을 위한 많은 전략(옵션, 대안)을 가지고 있습니다.

따라서, 최적값에서 얻은 결과의 가능한 편차를 결정할 필요가 있습니다. 이것이 Savage의 기준이 적용되는 곳입니다. 전략 선택은 플레이어가 보상 매트릭스 E가 아니라 공식(2.2.2)에 따라 구성된 위험 매트릭스 R에 의해 안내된다는 차이점을 제외하고 Wald 원칙에 따른 전략 선택과 유사합니다.

최대 주의 Eg = max min e i j 보장된 결과 기준(Wald)

A. Wald는 또한 자신의 기준이 (평균 관찰 수를 기준으로) 최고의 기준보다 훨씬 더 수익성이 높다는 것을 증명했습니다. 고전적 기준- 네이먼-피어슨 기준.

특히, Wald 최대치 기준은 최소 이득의 최대화 또는 전략 중 하나를 실행할 때 발생할 수 있는 최대 손실의 최소화를 보장합니다. 이 기준은 간단하고 명확하지만 의사결정자가 지나치게 신중한 행동을 하도록 지시한다는 점에서 보수적입니다. 최대값 기준에 해당하는 값을 게임의 하한 가격이라고 하며, 이는 최소 결과로 전략 중 하나를 선택하여 특정 상대와의 게임에서 보장되는 최대 승리를 의미합니다.

Wald 기준(또는 "최대" 기준)은 다음을 가정합니다. 가능한 옵션"의사 결정 매트릭스"는 이벤트 개발의 가장 불리한 상황(효율성 값 최소화) 중에서 최소값 중 가장 큰 값(즉, 효율성 값, 최고 값)을 갖는 대안이 선택됩니다.

최대 Wald 기준은 어떤 조건에서든 보상이 최악의 조건에서 가능한 최대치 이상이라는 보장이 필요한 경우에 사용됩니다. 허위츠 기준. 그 값은 0 이내입니다.

이 기준의 공식에는 계수 a가 포함되어 있으며, 그 값은 의사 결정자의 선택 정확성에 대한 신뢰도에 따라 설정되며 어떤 프로젝트 구현 시나리오를 선호해야 하는지에 따라 결정됩니다. a 값은 0~1 범위에서 선택되며, oc=0일 경우 Hurwitz 기준은 극도의 낙관적 기준으로 바뀌고, oc=1일 경우 Wald 기준으로 변경됩니다. 0에서는 "보호"하려는 욕구가 클수록 계수가 1에 더 가깝게 선택됩니다.

우도 기준은 편향되지 않고 일관됩니다. 큰 표본의 경우 -2-log X는 r 자유도를 갖는 카이제곱 분포를 가지며, 여기서 /는 매개변수 p의 수이고 특정 값은 H0에 의해 결정됩니다. 우도 기준(LK)은 점근 근사의 Wald 기준(W) 및 라그랑주 승수 기준(LM)과 동일하지만 작은 표본의 경우 W>LR>LM입니다.

MAXIMIN은 최악의 외부 환경(비관적 접근, Wald 기준)에서 보장된 이익을 얻는 데 중점을 둡니다. 이에 따라 대안은 최대값환경이 가장 불리한 상태에 있을 것으로 예상됩니다. 여기서 해결책은 건설을 거부하는 것입니다.

따라서 보장된 결과에 대한 기준(최대 Wald 기준)은 다음 형식으로 작성됩니다.