바이매트릭스 게임에 존재합니다. 매트릭스 게임에서는 각 플레이어의 전략과 보수함수, 순수전략에서의 게임비용을 알면 다음과 같은 것을 알 수 있다.

30.06.2019

바이매트릭스 게임

갈등 상황 없이는 모든 관리 활동이 존재할 수 없습니다. 서로 다른 이해관계를 가진 둘 이상의 당사자가 충돌하는 상황입니다. 양측 모두 자신에게 유리하게 갈등을 해결하고 최대한의 이익을 얻고 싶어하는 것은 당연한 일입니다. 그러한 문제를 해결하는 것은 충돌하는 당사자가 없다는 사실로 인해 복잡해질 수 있습니다. 완전한 정보갈등 전체에 대해. 그렇지 않으면 갈등 상황에서 다음을 받아들여야 한다고 말할 수 있습니다. 최적의 솔루션불확실한 상황에서.

이런 종류의 문제를 해결하기 위해 사용됩니다. 수학 모델링. 몇 가지 기본 개념을 소개하겠습니다. 갈등 게임의 수학적 모델을 게임이라고 합니다. 갈등의 당사자는 플레이어이고, 플레이어의 행동은 움직임이며, 일련의 움직임은 전략이며, 게임의 결과는 승리입니다.

문제를 해결하기 전에 필수 사항은 식별하는 것입니다. 특정 규칙. 일반적으로 이러한 규칙은 플레이어의 행동, 상대방의 행동에 대한 플레이어 간의 정보 교환, 상대방의 승리 기능 등에 대한 일련의 요구 사항 및 제한 사항입니다. 규칙은 명확해야 하며, 그렇지 않으면 게임이 진행되지 않습니다.

현재까지 게임을 분류하는 방법에는 여러 가지가 있습니다. 주요 부문은 보상이 있는 비협조적인 유한 쌍 게임(행렬, 위치, 이중 행렬)과 연합 게임으로 나뉩니다. 이번 에세이에서는 바이매트릭스 게임을 살펴보겠습니다.

정액 게임은 플레이어의 이익이 일치하지는 않지만 완전히 반대되는 게임은 아닙니다. 특별한 경우는 바이매트릭스 게임입니다.

바이매트릭스 게임은 0이 아닌 합을 사용하는 두 플레이어의 유한 게임으로, 각 플레이어의 보수는 해당 플레이어에 대해 별도로 행렬로 지정됩니다(각 행렬에서 행은 플레이어 1의 전략에 해당하고 열은 플레이어 2의 전략에 해당하며, 첫 번째 행렬의 행과 열의 교차점은 플레이어의 보수 1이고, 두 번째 행렬에서는 플레이어 2의 보수입니다.)

각 참가자가 자신의 행동 방식을 선택할 수 있는 다음과 같은 기회를 갖는 쌍 게임을 고려해 보겠습니다.

플레이어 A - 전략 A 1, ..., A m 중 하나를 선택할 수 있습니다.

플레이어 B - 전략 B 1, ..., B n 중 하나;

플레이어 A가 전략 A i, 플레이어 B - B j를 선택한 경우 결국 플레이어 A의 보상은 a ij, 플레이어 B - b ij가 됩니다. 플레이어 A와 B의 보수는 두 개의 테이블 형식으로 작성할 수 있습니다.

따라서 플레이어의 이해관계가 다르지만 반드시 반대일 필요는 없는 경우 게임을 설명하기 위해 두 가지 보상 매트릭스가 사용됩니다. 이 사실비슷한 게임에 바이매트릭스라는 이름을 붙였습니다.

바이매트릭스 행렬의 평형 상태

바이매트릭스 게임의 솔루션은 어떤 의미에서 두 플레이어 모두에게 적합한 솔루션입니다. 이 공식은 매우 모호합니다. 이는 바이매트릭스 게임에서 플레이어의 목표를 명확하게 공식화하는 것이 매우 어렵기 때문입니다. 가능한 옵션 중 하나는 상대방에게 해를 끼치고 자신의 승리에 해를 끼치려는 플레이어의 욕구입니다. 그렇지 않으면 목표가 반대가 됩니다.

바이매트릭스 게임을 해결하는 데는 일반적으로 두 가지 접근 방식이 고려됩니다. 첫 번째는 균형 상황을 찾는 것입니다. 게임이 어떤 균형 상태에 있을 때 조건을 찾는데, 이는 플레이어가 개별적으로 위반하는 것이 수익성이 없습니다. 두 번째는 파레토 최적 상황을 찾는 것입니다. 즉, 플레이어가 다른 플레이어의 보수를 줄이지 않고는 한 플레이어의 보수를 공동으로 늘릴 수 없는 조건을 찾는 것입니다.

첫 번째 접근 방식에 중점을 두겠습니다.

이 접근 방식은 혼합 전략을 사용합니다. 플레이어가 특정 확률로 순수 전략을 번갈아 사용하는 경우입니다.

플레이어 A가 전략 A 1을 선택하도록 하고 확률은 p 1, A 2 - p 2, ..., A m - p m, 그리고

플레이어 B는 확률 q 1, B 2 - q 2, ..., B n - q n 및 확률로 B 1 전략을 사용합니다.

게임의 "성공"에 대한 기준으로 우리는 다음 공식을 사용하여 계산된 플레이어의 승리에 대한 수학적 기대치를 취합니다.

따라서 우리는 기본 정의를 공식화할 수 있습니다.

확률 분포 P * () 및 Q ()는 다른 분포 P 및 Q에 대해 다음 불평등이 동시에 충족되는 경우 평형 상황을 결정합니다.

균형 상황이 존재한다면, 그 상황에서 벗어나는 것은 플레이어 자신에게 불리합니다.

J. Nash의 정리도 사실입니다. 모든 바이매트릭스 게임에는 혼합 전략에서 적어도 하나의 균형 상황이 있습니다.

1. 불확실성이 존재하는 상황에서의 의사결정 문제는 어떻게 체계적으로 설명됩니까?

2. 제어 하위 시스템이란 무엇이며 환경이란 무엇입니까?

3. 시스템 상태를 결정하는 요소는 무엇입니까?

4. 공식화하다 수학적 모델불확실한 상황에서 의사결정에 문제가 발생합니다. 효용(지불)함수란 무엇인가? 불확정성 조건이란 무엇입니까?

5. 전략과 상태의 집합이 유한하다는 조건 하에서 보수함수는 어떻게 정의됩니까?

6. 의사결정 문제의 주요 목적은 무엇입니까?

7.게임이론에서 말하는 불확실성 하에서의 의사결정의 문제는 무엇인가?

8.플레이어의 최적 전략이란 무엇을 의미하나요? 9. X와 Y 세트가 유한한 경우 게임을 어떻게 정의합니까? 10.두 가지 전략을 비교하는 방법은 무엇입니까? 11.지배의 원리는 무엇인가?

12. 주로 찾는 방법은 무엇입니까? 최적의 전략

V 불확실한 상황에서의 ZPR? 어떤 전략이 최적이라고 간주됩니까?

13.전략을 비교하는 기준은 무엇인가요?

14.불확실한 상황에서 의사결정 문제에 사용되는 가장 중요한 기준은 무엇입니까? 그들은 어떤 가설에 기초하고 있나요?

2. 위험 상황에서의 의사결정

1. 집합이 유한한 경우 자연 상태 집합에 대한 확률 측정은 어떻게 정의됩니까?

2. 일련의 자연 상태에 대한 사전 확률 분포는 무엇입니까?

3. 어떤 경우에 위험 조건 하에서 의사결정이 이루어진다고 말합니까?

4.기준이 어떻게 정해지는가 수학적 기대?

5. 베이지안 전략, 베이지안 접근 방식이란 무엇입니까?

3. 적대적인 게임

1. 시스템이 하나의 제어 하위 시스템이 아닌 여러 제어 하위 시스템의 영향을 받는 의사 결정 문제의 이름은 무엇입니까? 각 제어 하위 시스템에는 고유한 목표와 실행 가능성이 있습니다.

2. 제로섬 게임이라고 불리는 갈등의 수학적 모델은 무엇입니까?

3. 그러한 시스템의 상태를 결정하는 것은 무엇입니까? 적대적인 게임은 시스템에 의해 자연스럽게 정의됩니다. G= (X, Y, F).

4. 적대적이라고 불리는 게임은 무엇이며 그 개체는 무엇입니까?

5. 제어 하위 시스템과 환경의 의미 있는 차이점은 무엇입니까?

6. 적대적인 게임은 무엇입니까? X와 Y는 유한합니까?

7. 게임의 최저 가격과 게임의 최고 가격은 어떻게 결정되나요? 게임 가격은 어떻게 결정되나요?

8. 맥시민과 미니맥스의 관계는 무엇인가요?

9. 안장점이란 무엇입니까? 플레이어의 일방적 후퇴는 무엇입니까? 안장 포인트?

10. 안장점에서 보수함수의 값은 얼마인가?

11.안장점의 상호교환성과 동등성에 관한 정리를 공식화합니다.

12. 안장점이 존재하기 위한 충분조건을 형성합니다.

13. 볼록 게임의 어떤 조건에서 플레이어가 단일 최적 전략을 사용합니까?

4. 매트릭스 게임의 이론

1. 행렬에서 안장점을 검색하는 데 사용되는 알고리즘은 무엇입니까?

2. 항상 그런가요? 매트릭스 게임안장점이 있나요?

3. 어떻게 전략을 무작위로 선택할 수 있나요?

4. 플레이어의 순수한 전략은 무엇입니까?

5. 매트릭스 게임에서 플레이어의 혼합 전략은 무엇이며 어떻게 정의됩니까?

6. 혼합 전략의 콘텐츠 구성 요소는 무엇입니까?

7. 혼합 전략에서 플레이어의 보수 함수는 어떻게 결정됩니까?

8. 혼합 전략을 사용하는 매트릭스 게임은 어떻게 정의되나요? 전략에는 어떤 속성이 있나요?

9. 매트릭스 게임 이론의 주요 정리를 설명하십시오.

10. 플레이어 전략의 최적성에 대한 기준을 제공합니다.

11. 각각에 대한 최적 전략 세트의 구조는 무엇입니까?

12. 순수 전략에서 승리 함수의 최대값과 최소값 달성 가능성에 대한 정리를 공식화합니다.

13. 양의 확률을 갖는 안장점의 구성요소로 어떤 순수 전략이 포함됩니까?

14. 벡터의 볼록조합이란 무엇입니까?

15. 어떤 경우에 한 벡터가 다른 벡터를 지배(엄격히 지배)한다고 말합니까?

16. 지배정리를 기술하라.

5. 매트릭스 게임 해결 방법

1. 2*2 게임에 대한 혼합 최적 전략을 찾는 방법은 무엇입니까? 이런 게임의 가격을 어떻게 알 수 있나요?

2. 그래픽 방법을 사용하여 2*m 게임에서 플레이어의 최적 전략을 어떻게 찾습니까? 이 기술은 어떤 정리에 기초하고 있나요?

3.m*2 게임에 그래픽 방법을 어떻게 사용할 수 있나요?

4.3*3 게임의 그래픽 방식을 설명해주세요.

5.브라운-로빈슨 방법을 설명하십시오.

6. 브라운-로빈슨 방법은 분석적인가요, 아니면 반복적인가요?

7. 브라운-로빈슨 방법에 따라 각 단계에서 전략을 선택할 때 플레이어는 무엇에 의존합니까?

8. 브라운-로빈슨 방법을 사용할 때 행렬 크기에 제한이 있나요?

9.선택 조건을 만족하는 전략이 여러 개 있다면 플레이어는 어떻게 합니까?

10.플레이어들은 초기 전략을 어떻게 선택하나요?

11. 왜, 방법에 따르면브라운-로빈슨, 가상 지불 υ 1 (k) 및 υ 2 (k) 경향은 무엇입니까?

6. 바이매트릭스 게임

1. 바이매트릭스 게임은 어떤 경우에 발생하며 이를 결정하는 요인은 무엇입니까?

2. 플레이어의 승리 기능을 어떻게 정의할 수 있나요?

3. 혼합된 플레이어 전략과 플레이어 보상 함수는 어떻게 결정됩니까?

4. 바이매트릭스 게임에서 평형 상황은 어떻게 결정됩니까?

5. 균형 상황의 의미 있는 의미는 무엇입니까?

6. 안장점은 어떤 의미에서 평형 상황의 특별한 경우입니까?

7. 파레토 최적이라고 불리는 플레이어 전략 쌍은 무엇입니까?

8. 파레토 최적성은 무엇을 의미하나요?

9. 평형 상황과 파레토 최적 상황의 공식적인 차이점은 무엇입니까?

10. 매트릭스 게임의 균형 상황과 파레토 최적 전략은 어떤 관련이 있습니까?

11. 바이매트릭스 게임에서는 항상 균형 상황이 존재합니까?

12.브라워의 정리를 공식화하라.

13. 바이매트릭스 게임에서는 항상 순수한 균형 상황이 존재합니까? 14. 아르 다양한 상황평형 등가물

보수 함수의 값.

15.게임에서 균형 상황이 불안정할 수 있다는 것은 무엇을 의미합니까?

16. 2×2 차원의 바이매트릭스 게임에서 평형 상황을 찾기 위한 알고리즘을 설명하십시오. 완전 혼합 전략이란 무엇입니까?

17.합동 혼합 전략이란 무엇입니까? 그러한 전략이 실제로 어떻게 구현될 수 있습니까?

18. 공동 혼합 전략에서 플레이어 보상은 어떻게 결정됩니까?

19. 바이매트릭스 게임에서 공동 혼합 전략은 어떻게 정의됩니까?

20. 바이매트릭스 게임에서 공동 혼합 전략의 균형 상황은 어떻게 결정됩니까?

21. 차원의 바이매트릭스 게임의 공동 혼합 전략에서 일련의 평형 상황의 구조는 무엇입니까? n×m?

22. 혼합 전략과 협력 혼합 전략의 균형 상황 사이에는 어떤 관계가 있습니까?

최종 제어 테스트

1. 적대적인 게임을 설정할 수 있습니다:

a) 플레이어와 안장 지점을 위한 일련의 전략.

b) 두 플레이어 모두를 위한 일련의 전략과 첫 번째 플레이어의 보상 기능.

2. 혼합 전략의 매트릭스 게임에는 게임 가격이 항상 존재합니다.

가) 그렇습니다.

3.보수 행렬의 모든 열이 동일하고 (4 5 0 1) 형식을 갖는다면 첫 번째 플레이어에게 가장 적합한 전략은 무엇입니까?

가) 먼저.

b) 둘째.

c) 네 가지 중 하나.

4. 매트릭스 게임에서 첫 번째 플레이어의 혼합 전략 중 하나는 (0.3, 0.7)의 형태를 갖고, 두 번째 플레이어의 혼합 전략 중 하나는 (0.4, 0, 0.6)의 형태를 갖는다고 가정합니다. 이 행렬의 차원은 무엇입니까?

가) 2*3.

c) 다른 차원.

5. 지배력의 원리를 사용하면 한 단계로 매트릭스에서 제거할 수 있습니다.

a) 전체 라인.

b) 개별 번호.

6. 2*m 게임을 해결하기 위한 그래픽 방법에서는 그래프에서 직접 다음을 찾습니다.

a) 두 플레이어의 최적 전략.

b) 게임 가격과 두 번째 플레이어의 최적 전략.

c) 게임 가격과 첫 번째 플레이어의 최적 전략.

7.낮은 봉투 그래프 그래픽 방법게임 2*m의 해법은 일반적인 경우에 있습니다:

가) 깨졌다.

b) 똑바로.

c) 포물선.

8. 2*2 매트릭스 게임에는 플레이어의 혼합 전략에 두 가지 구성 요소가 있습니다.

a) 서로의 가치를 결정합니다.

b) 독립적이다.

9. 매트릭스 게임에서 aij 요소는 다음과 같습니다.

a) 첫 번째 플레이어가 i번째 전략을 사용할 때의 승리, 두 번째 플레이어 - j번째 전략.

b) 사용할 때 첫 번째 플레이어의 최적 전략 적 나또는 j번째 전략.

c) 첫 번째 플레이어가 j번째 전략을 사용할 때 손실, 두 번째 - i번째 전략을 사용할 때.

10. 행렬 요소 aij는 안장점에 해당합니다. 다음과 같은 상황이 가능합니다:

a) 이 요소는 라인의 모든 요소 중에서 엄밀히 말하면 가장 작습니다.

b) 이 요소는 줄에서 두 번째 요소입니다.

11. 브라운-로빈슨 방법에서는 각 플레이어가 전략을 선택할 때 다음 단계다음 사항에 따라 안내됩니다:

a) 이전 단계에서 적의 전략.

b) 이전 단계의 전략.

c) 다른 것.

12. 수학적 기대의 기준에 따라 각 플레이어는 다음 사실로부터 진행됩니다.

a) 그에게 최악의 상황이 일어날 것이다.

c) 주어진 확률로 모든 상황 또는 일부 상황이 가능합니다.

13. 모든 요소가 음수인 행렬로 행렬 게임을 구현해 보겠습니다. 게임 가격은 긍정적입니다.

b) 아니요.

c) 명확한 대답이 없습니다.

14. 게임 가격은 다음과 같습니다.

가) 번호.

b) 벡터.

c) 매트릭스.

15. 5*5 차원 게임에서 사용할 수 있는 안장점의 최대 수는 얼마입니까(행렬에는 어떤 숫자도 포함될 수 있습니다):

16. 2*3 차원의 매트릭스 게임에서 첫 번째 플레이어의 혼합 전략 중 하나가 (0.3, 0.7) 형식을 갖고, 두 번째 플레이어의 혼합 전략 중 하나가 (0.3, x, 0.5) 형식을 갖는다고 가정합니다. . 숫자 x는 무엇입니까?

c) 다른 번호.

17. 게임 매트릭스의 어떤 차원에서 Wald 기준이 Laplace 기준으로 바뀌나요?

c) 다른 경우에만.

18. 게임의 최고 가격은 항상 게임의 최저 가격보다 낮습니다.

b) 아니요.

b) 질문이 올바르지 않습니다.

19. 매트릭스 게임에는 어떤 전략이 있습니까?

가) 깨끗하다.

b) 혼합.

c) 둘 다.

20. 일부 적대적 게임에서 일부 변수 값에 대한 두 플레이어의 보수 함수 값이 1이 될 수 있습니까?

가) 항상.

b) 가끔.

c) 결코.

21. 매트릭스 게임에서 첫 번째 플레이어의 혼합 전략 중 하나를 (0.3, 0.7) 형식으로 하고, 두 번째 플레이어의 혼합 전략 중 하나를 (0.4, 0.1,0.1,0.4) 형식으로 설정합니다. . 이 행렬의 차원은 무엇입니까?

c) 다른 차원.

22. 지배력의 원리를 사용하면 한 단계로 매트릭스에서 제거할 수 있습니다.

a) 전체 열,

b) 개별 번호.

c) 더 작은 크기의 부분행렬.

23. 3*3 매트릭스 게임에는 플레이어의 혼합 전략에 두 가지 구성 요소가 있습니다.

a) 세 번째를 결정하십시오.

b) 정의하지 마십시오.

24. 매트릭스 게임에서 aij 요소는 다음과 같습니다.

a) j번째 전략을 사용할 때 두 번째 플레이어의 손실, 그리고 두 번째 - i번째 전략을 사용할 때 손실.

b) 상대가 i번째 또는 j번째 전략을 사용할 때 두 번째 플레이어의 최적 전략,

c) 첫 번째 플레이어가 j번째 전략을 사용할 때의 승리, 그리고 두 번째 - i번째 전략을 사용할 때의 승리,

25. 행렬 요소 aij는 안장점에 해당합니다. 다음과 같은 상황이 가능합니다:

a) 이 요소는 열에서 가장 큽니다.

b) 이 요소는 해당 줄에서 순서대로 가장 큰 요소입니다.

c) 문자열에는 이 요소보다 크고 작은 요소가 모두 포함되어 있습니다.

26. Wald 기준에 따르면 각 플레이어는 다음을 가정합니다.

a) 그에게 최악의 상황이 일어날 것이다.

b) 모든 상황이 동일하게 가능합니다.

c) 주어진 특정 확률로 모든 상황이 가능합니다.

27. 최저 가격더 적은 최고 가격계략:

b) 항상 그런 것은 아닙니다.

c) 결코.

28. 매트릭스 게임의 혼합 전략 구성 요소의 합은 항상 다음과 같습니다.

a) 1과 같습니다.

b) 음수가 아님.

c) 긍정적이다.

d) 항상 그런 것은 아니다.

29. 2*3 차원의 매트릭스 게임에서 첫 번째 플레이어의 혼합 전략 중 하나가 (0.3, 0.7) 형식을 갖고 두 번째 플레이어의 혼합 전략 중 하나가 (0.2, x, x) 형식을 갖는다고 가정합니다. . 숫자 x는 무엇입니까?

게임에서 넌제로섬게임에 참여하는 모든 참가자는 승리하거나 패배할 수 있습니다. 바이매트릭스 게임두 플레이어 사이의 유한한 넌제로섬 게임입니다. 이 경우, 각각에 대해 게임 상황 A i B j 각 플레이어는 첫 번째 플레이어에 대한 자신의 보수 aij와 두 번째 플레이어에 대한 bij를 갖습니다. 예를 들어, 불완전 경쟁 시장에서 생산자의 행동은 바이매트릭스 게임으로 귀결됩니다. 온라인 계산기를 사용하면 해결책을 찾을 수 있습니다. 바이매트릭스 게임, 상황도 그렇고 파레토 최적 및 내쉬 안정 상황.

두 참가자 각각이 자신의 행동 방식을 선택할 수 있는 다음과 같은 기회를 갖는 갈등 상황을 고려해 보겠습니다.

플레이어 A – A 1,…, A m, 전략 중 하나를 선택할 수 있습니다.
플레이어 B – 전략 B 1,…, B n 중 하나.

더욱이, 그들의 공동 선택은 매우 명확하게 평가됩니다. 플레이어 A가 선택한 경우 i번째 전략 A i이고 플레이어 B는 k번째 전략 B k입니다. 그러면 결국 플레이어 A의 보수는 특정 숫자 aik와 같고 플레이어 B의 보수는 일반적으로 말하면 다른 숫자 b와 같습니다. ik.
플레이어 A의 모든 전략과 플레이어 B의 모든 전략을 순차적으로 진행함으로써 두 테이블을 승리로 채울 수 있습니다.

테이블 중 첫 번째는 플레이어 A의 보수를 설명하고 두 번째는 플레이어 B의 보수를 설명합니다. 일반적으로 이러한 테이블은 행렬 형식으로 작성됩니다.
여기서 A는 플레이어 A의 보수 행렬이고, B는 플레이어 B의 보수 행렬입니다.

따라서 플레이어의 이해관계가 다른 경우(반드시 반대는 아님) 두 개의 지불 매트릭스가 얻어집니다. 하나는 플레이어 A에 대한 지불 매트릭스이고 다른 하나는 플레이어 B에 대한 지불 매트릭스입니다. 따라서 일반적으로 그러한 게임에 지정되는 이름은 완전히 자연스럽게 들립니다. 바이매트릭스.

내쉬 균형– 균형, 게임의 각 참가자가 자신에게 가장 적합한 전략을 선택할 때 게임의 다른 참가자가 특정 전략을 고수하는 경우.
내쉬 균형이 항상 참가자에게 가장 최적인 것은 아닙니다. 이 경우에는 균형이 맞지 않는다고 말합니다. 파레토 최적.
순수 전략– 플레이어의 특정 반응 가능한 옵션다른 플레이어의 행동.
혼합 전략– 다른 플레이어의 행동에 대한 플레이어의 확률적(정확하게 정의되지 않은) 반응입니다.

예 1. 시장을 위한 투쟁.
회사 a는 더 큰 회사 b가 통제하는 두 시장 중 하나에서 위탁 상품을 판매하려고 합니다. 이를 위해 특정 비용과 관련된 준비 작업을 수행합니다. 회사 b가 어느 시장 회사 a가 자사 제품을 판매할지 추측하면 대응 조치를 취하고 시장을 "점령"하는 것을 방지합니다(이 옵션은 회사 a의 패배를 의미함). 그렇지 않다면 확고한 승리입니다. 기업 a의 경우 첫 번째 시장에 침투하는 것이 두 번째 시장에 침투하는 것보다 더 수익성이 높지만 첫 번째 시장에서 투쟁하려면 더 많은 자금이 필요하다고 가정해 보겠습니다. 예를 들어, 첫 번째 시장에서 기업이 승리하면 두 번째 시장에서 승리하는 것보다 두 배의 이익을 얻을 수 있지만, 첫 번째 시장에서 패배하면 회사는 완전히 망하게 됩니다.
회사 a를 플레이어 1로, 회사 b를 플레이어 2로 간주하여 이 갈등에 대한 수학적 모델을 만들어 보겠습니다. 플레이어 1을 위한 전략: ㅏ 1 – 시장 침투 1, ㅏ 2 – 시장 침투 2; 플레이어 2 전략: 안에 1 – 시장 1의 대응책, 안에 2 – 시장에서의 대응책 2. 첫 번째 시장에서의 승리는 2유닛의 가치가 있고, 두 번째 시장에서의 승리는 1유닛의 가치가 있다고 가정합니다. 첫 번째 시장에서 A사의 패배는 -10으로, 두 번째 시장에서는 -1로 추정됩니다. 회사 b의 경우 승리는 각각 5와 1 단위이고 패배는 -2와 -1입니다. 결과적으로 우리는 보상 행렬을 갖는 바이매트릭스 게임 Г을 얻습니다.
.
정리에 따르면 이 게임은 순수 균형 상황 또는 완전히 혼합된 균형 상황을 가질 수 있습니다. 여기서 순수 전략에는 균형 상황이 없습니다. 이제 확인해 보겠습니다. 이 게임완전히 혼합된 균형상태를 가지고 있다. 우리는 찾는다 , .
따라서 고려 중인 게임은 독특한 균형 상황(x 0 ;y 0)을 가지고 있으며, 여기서 , . 다음과 같이 게임을 여러 번 반복함으로써(즉, 설명된 상황을 여러 번 반복함으로써) 구현할 수 있습니다. 기업 a는 빈도가 2/9와 7/9인 순수 전략 1과 2를 사용해야 하고, 기업 b는 다음을 사용해야 합니다. 빈도가 3/14 및 11/14인 순수 전략 1 및 2. 이 혼합 전략에서 벗어나는 기업은 기대 수익을 감소시킵니다.

예 2. 바이매트릭스 게임에 대한 파레토 최적 상황과 내쉬 안정 상황을 찾아보세요.

예 번호 3. 2개의 회사가 있습니다. 첫 번째 회사는 두 제품 A1과 A2 중 하나를 생산할 수 있고, 두 번째 회사는 두 제품 B1, B2 중 하나를 생산할 수 있습니다. 첫 번째 회사가 제품 A i (i = 1, 2)를 생산하고 두 번째 회사 - B j (j = 1, 2)를 생산하는 경우 이러한 회사의 이익은 (이 제품이 보완적인지 경쟁적인지에 따라) 다음과 같이 결정됩니다. 테이블 번호 1 :

	1에	2시에
A 1	(5, 6)	(3, 2)
A 2	(2, 1)	(5, 3)

기업이 서로 합의를 체결했다고 가정하고 내쉬 중재 결정을 사용하여 이익의 공정한 분배를 결정하십시오.

예 1. "학생 - 교사."

다음 상황을 고려하십시오. 학생(플레이어 A)은 교사(플레이어 B)가 승인한 시험을 준비하고 있습니다. 학생에게는 시험 준비(+)와 준비하지 않음(-)이라는 두 가지 전략이 있다고 가정할 수 있습니다. 교사는 또한 두 가지 전략, 즉 학점 [+]을 부여하고 [-] 학점을 부여하지 않는 전략을 가지고 있습니다.

우리는 다음 고려 사항을 바탕으로 플레이어의 보상 함수 값을 기반으로 합니다.

이는 예를 들어 다음과 같이 정량적으로 표현될 수 있습니다.

예 2. 각 참가자가 자신의 행동 방식을 선택할 수 있는 다음과 같은 기회를 갖는 쌍 게임을 고려하십시오.

플레이어 A - A1, ..., Am 전략 중 하나를 선택할 수 있습니다.

플레이어 B - 전략 B1, ..., Bn 중 하나;

플레이어 A가 전략 Ai, 플레이어 B - Bj를 선택했다면 결국 플레이어 A의 보상은 aij, 플레이어 B - bij가 될 것입니다. 플레이어 A와 B의 보수는 두 개의 테이블 형식으로 작성할 수 있습니다.

따라서 플레이어의 이해관계가 다르지만 반드시 반대일 필요는 없는 경우 게임을 설명하기 위해 두 가지 보상 매트릭스가 사용됩니다. 이 사실은 그러한 게임에 바이매트릭스라는 이름을 부여했습니다.

바이매트릭스 게임의 혼합 전략

위의 예는 플레이어의 이해관계가 일치하지 않는 상황을 설명합니다. 시뮬레이션을 위해 플레이어에게 어떤 권장 사항을 제공해야 하는지에 대한 의문이 생깁니다. 갈등 상황해결되었습니다. 즉, 바이매트릭스 게임의 해법은 무엇을 이해해야 하는가?

이 질문에 다음과 같이 대답할 수 있습니다.

플레이어의 이익이 일치하지 않는다는 사실 때문에 우리는 같은 의미에서 두 플레이어를 모두 만족시킬 수 있는 (절충) 솔루션을 구축해야 합니다.

이 아이디어를 매우 정확하게 즉각적으로 표현하려고 시도하지 않고 일종의 균형 상황, 즉 플레이어 중 한 명이 상금을 줄일 수 있는 명확한 편차를 찾으려고 노력해야 한다고 가정해 보겠습니다.

매트릭스 게임을 고려할 때도 비슷한 질문이 제기되었습니다. Minimax 접근 방식을 개발하는 동안 발생하는 개념 균형 상황항상 존재하지 않는 안장 지점을 검색하게 되었습니다. 물론 플레이어 A와 B의 순수한 전략으로만 제한한다면, 즉 전략

그러나 혼합 전략, 즉 특정 빈도로 (순수) 전략을 번갈아 사용하는 플레이어의 행동으로 이동하여 매트릭스 게임을 확장하는 경우:

플레이어 A - 전략 A1,..., At 주파수 p1,..., rt, 여기서

플레이어 B - 주파수 q1,..., qn을 갖는 전략 B1,..., Bn, 여기서

혼합 전략에서는 항상 균형 상황이 존재한다는 것이 밝혀졌습니다. 즉, 혼합 전략의 모든 매트릭스 게임은 해결 가능합니다.

따라서 여기서 바이매트릭스 게임을 고려할 때 혼합 플레이어 전략으로 즉시 이동하는 것이 합리적입니다(이를 통해 각 게임은 일정한 상황에서 여러 번 반복될 수 있다고 가정합니다).

매트릭스의 경우 요소에 의해 결정되는 플레이어 A와 B의 평균 보수를 계산하여 계산한다는 점에서 혼합 전략은 지불 가능성의 확장으로 이어졌습니다. 결제 매트릭스그리고 확률과:

바이매트릭스 게임의 혼합 전략을 사용하면 플레이어 B에 대해 더 이상 차별이 없는 규칙에 따라 결정되는 플레이어 A와 B의 평균 보상도 발생합니다.

2x2 바이매트릭스 게임. 평형 상황

여기서는 각 플레이어가 정확히 두 가지 전략을 가지고 있는 경우, 즉 m = n = 2인 경우에 주목해야 합니다. 따라서 그러한 경우에 대해 위의 공식을 정확하게 작성하는 것이 적절해 보입니다.

2 2 바이매트릭스 게임에서 플레이어의 보수 매트릭스는 다음과 같은 형식을 갖습니다.

확률

바이매트릭스 게임 솔루션

평균 상금은 공식을 사용하여 계산됩니다.

조건에 따라 모든 p와 q에 대해 평형 상황을 정의합니다.

솔루션 전략 바이매트릭스 게임 균형

다음 부등식이 동시에 충족됩니다.

설명. 서면 불평등 (1)은 다음을 의미합니다. 혼합 전략(p*, q*)에 의해 결정된 상황은 플레이어 중 한 사람이 자신의 선택을 유지하고 다른 플레이어가 자신의 선택을 유지하면 다음과 같은 사실로 이어지는 경우 균형입니다. 이탈한 플레이어의 보수는 감소할 뿐입니다. 따라서 균형 상황이 존재한다면 그 상황에서 벗어나는 것은 플레이어 자신에게 수익성이 없다는 것이 밝혀졌습니다.

정리 1(J. Nash). 모든 바이매트릭스 게임에는 혼합 전략에서 최소한 하나의 균형 상황(균형점)이 있습니다.

따라서 균형 상황이 존재합니다. 하지만 어떻게 찾을 수 있나요?

특정 숫자 쌍(p*, q*)이 균형 상황을 결정한다고 주장하는 경우 이러한 주장의 타당성을 확인하거나 반대로 근거 없음을 입증하려면 불평등의 타당성을 확인해야 합니다( 1) 0~1 범위의 모든 p와 0~1 범위의 모든 q에 대해. 일반적으로 이러한 확인 횟수는 무한합니다. 따라서 효과적인 방법균형 상황에 대한 정의는 다른 곳에서 찾아야 합니다.

정리 2. 불평등의 만족