바이매트릭스 게임을 정의할 수 있습니다. 바이매트릭스 게임

1. 불확실성이 존재하는 상황에서의 의사결정 문제는 어떻게 체계적으로 설명됩니까?

2. 제어 하위 시스템이란 무엇이며 환경이란 무엇입니까?

3. 시스템 상태를 결정하는 요소는 무엇입니까?

4. 불확실한 조건에서 의사결정 문제에 대한 수학적 모델을 공식화합니다. 효용(지불)함수란 무엇인가? 불확정성 조건이란 무엇입니까?

5. 전략과 상태의 집합이 유한하다는 조건 하에서 보수함수는 어떻게 정의됩니까?

6. 의사결정 문제의 주요 목적은 무엇입니까?

7.게임이론에서 말하는 불확실성 하에서의 의사결정의 문제는 무엇인가?

8.플레이어의 최적 전략이란 무엇을 의미하나요? 9. X와 Y 세트가 유한한 경우 게임을 어떻게 정의합니까? 10.두 가지 전략을 비교하는 방법은 무엇입니까? 11.지배의 원리는 무엇인가?

12. 주로 찾는 방법은 무엇입니까? 최적의 전략

V 불확실한 상황에서의 ZPR? 어떤 전략이 최적이라고 간주됩니까?

13.전략을 비교하는 기준은 무엇인가요?

14.불확실한 상황에서 의사결정 문제에 사용되는 가장 중요한 기준은 무엇입니까? 그들은 어떤 가설에 기초하고 있나요?

2. 위험 상황에서의 의사결정

1. 집합이 유한한 경우 자연 상태 집합에 대한 확률 측정은 어떻게 정의됩니까?

2. 일련의 자연 상태에 대한 사전 확률 분포는 무엇입니까?

3. 어떤 경우에 위험 조건 하에서 의사결정이 이루어진다고 말합니까?

4.기준이 어떻게 정해지는가 수학적 기대?

5. 베이지안 전략, 베이지안 접근 방식이란 무엇입니까?

3. 적대적인 게임

1. 시스템이 하나의 제어 하위 시스템이 아닌 여러 제어 하위 시스템의 영향을 받는 의사 결정 문제의 이름은 무엇입니까? 각 제어 하위 시스템에는 고유한 목표와 실행 가능성이 있습니다.

2. 제로섬 게임이라고 불리는 갈등의 수학적 모델은 무엇입니까?

3. 그러한 시스템의 상태를 결정하는 것은 무엇입니까? 적대적인 게임은 시스템에 의해 자연스럽게 정의됩니다. G= (X, Y, F).

4. 적대적이라고 불리는 게임은 무엇이며 그 개체는 무엇입니까?

5. 제어 하위 시스템과 환경의 의미 있는 차이점은 무엇입니까?

6. 적대적인 게임은 무엇입니까? X와 Y는 유한합니까?

7. 게임의 최저 가격과 게임의 최고 가격은 어떻게 결정되나요? 게임 가격은 어떻게 결정되나요?

8. 맥시민과 미니맥스의 관계는 무엇인가요?

9. 안장점이란 무엇입니까? 안장 지점에서 선수의 일방적인 후퇴는 무엇으로 이어지나요?

10. 보수함수의 가치는 얼마인가? 안장 포인트?

11.안장점의 상호교환성과 동등성에 관한 정리를 공식화합니다.

12. 안장점이 존재하기 위한 충분조건을 형성합니다.

13. 볼록 게임의 어떤 조건에서 플레이어가 단일 최적 전략을 사용합니까?

4. 매트릭스 게임의 이론

1. 행렬에서 안장점을 검색하는 데 사용되는 알고리즘은 무엇입니까?

2. 항상 그런가요? 매트릭스 게임안장점이 있나요?

3. 어떻게 전략을 무작위로 선택할 수 있나요?

4. 플레이어의 순수한 전략은 무엇입니까?

5. 매트릭스 게임에서 플레이어의 혼합 전략은 무엇이며 어떻게 정의됩니까?

6. 혼합 전략의 콘텐츠 구성 요소는 무엇입니까?

7. 혼합 전략에서 플레이어의 보수 함수는 어떻게 결정됩니까?

8. 혼합 전략을 사용하는 매트릭스 게임은 어떻게 정의되나요? 전략에는 어떤 속성이 있나요?

9. 매트릭스 게임 이론의 주요 정리를 설명하십시오.

10. 플레이어 전략의 최적성에 대한 기준을 제공합니다.

11. 각각에 대한 최적 전략 세트의 구조는 무엇입니까?

12. 순수 전략에서 승리 함수의 최대값과 최소값 달성 가능성에 대한 정리를 공식화합니다.

13. 어느 순수 전략양의 확률로 안장점의 구성요소로 포함됩니까?

14. 벡터의 볼록조합이란 무엇입니까?

15. 어떤 경우에 한 벡터가 다른 벡터를 지배(엄격히 지배)한다고 말합니까?

16. 지배정리를 기술하라.

5. 매트릭스 게임 해결 방법

1. 2*2 게임에 대한 혼합 최적 전략을 찾는 방법은 무엇입니까? 이런 게임의 가격을 어떻게 알 수 있나요?

2. 그래픽 방법을 사용하여 2*m 게임에서 플레이어의 최적 전략을 어떻게 찾습니까? 이 기술은 어떤 정리에 기초하고 있나요?

3.m*2 게임에 그래픽 방법을 어떻게 사용할 수 있나요?

4.3*3 게임의 그래픽 방식을 설명해주세요.

5.브라운-로빈슨 방법을 설명하십시오.

6. 브라운-로빈슨 방법은 분석적인가요, 아니면 반복적인가요?

7. 브라운-로빈슨 방법에 따라 각 단계에서 전략을 선택할 때 플레이어는 무엇에 의존합니까?

8. 브라운-로빈슨 방법을 사용할 때 행렬 크기에 제한이 있나요?

9.선택 조건을 만족하는 전략이 여러 개 있다면 플레이어는 어떻게 합니까?

10.플레이어들은 초기 전략을 어떻게 선택하나요?

11. 왜, 방법에 따르면브라운-로빈슨, 가상 지불 υ 1 (k) 및 υ 2 (k) 경향은 무엇입니까?

6. 바이매트릭스 게임

1. 바이매트릭스 게임은 어떤 경우에 발생하며 이를 결정하는 요인은 무엇입니까?

2. 플레이어의 승리 기능을 어떻게 정의할 수 있나요?

3. 혼합된 플레이어 전략과 플레이어 보상 함수는 어떻게 결정됩니까?

4. 바이매트릭스 게임에서 평형 상황은 어떻게 결정됩니까?

5. 균형 상황의 의미 있는 의미는 무엇입니까?

6. 안장점은 어떤 의미에서 평형 상황의 특별한 경우입니까?

7. 파레토 최적이라고 불리는 플레이어 전략 쌍은 무엇입니까?

8. 파레토 최적성은 무엇을 의미하나요?

9. 평형 상황과 파레토 최적 상황의 공식적인 차이점은 무엇입니까?

10. 매트릭스 게임의 균형 상황과 파레토 최적 전략은 어떤 ​​관련이 있습니까?

11. 바이매트릭스 게임에서는 항상 균형 상황이 존재합니까?

12.브라워의 정리를 공식화하라.

13. 바이매트릭스 게임에서는 항상 순수한 균형 상황이 존재합니까? 14. 아르 다양한 상황평형 등가물

보수 함수의 값.

15.게임에서 균형 상황이 불안정할 수 있다는 것은 무엇을 의미합니까?

16. 2×2 차원의 바이매트릭스 게임에서 평형 상황을 찾기 위한 알고리즘을 설명하십시오. 완전 혼합 전략이란 무엇입니까?

17.합동 혼합 전략이란 무엇입니까? 그러한 전략이 실제로 어떻게 구현될 수 있습니까?

18. 공동 혼합 전략에서 플레이어 보상은 어떻게 결정됩니까?

19. 바이매트릭스 게임에서 공동 혼합 전략은 어떻게 정의됩니까?

20. 바이매트릭스 게임에서 공동 혼합 전략의 균형 상황은 어떻게 결정됩니까?

21. 차원의 바이매트릭스 게임의 공동 혼합 전략에서 일련의 평형 상황의 구조는 무엇입니까? n×m?

22. 혼합 전략과 협력 혼합 전략의 균형 상황 사이에는 어떤 관계가 있습니까?

바이매트릭스 파레토 게임

게임은 집합적 행동에 대한 이상화된 수학적 모델입니다. 여러 개인(참가자, 플레이어)이 상황(게임 결과)과 그들의 이익(서로 다른 승리 방식)에 영향을 미칩니다. 가능한 상황) 다르다. 이해관계의 대립은 갈등을 일으키는 반면, 이해관계의 일치는 게임을 순수한 조정으로 축소시키며, 이를 구현하기 위한 유일한 합리적인 행동은 협력입니다. 사회 경제적 상황에 대한 분석을 통해 발생하는 대부분의 게임에서 이해관계는 엄밀하게는 적대적이지도, 정확히 일치하지도 않습니다. 판매자와 구매자는 다음 사항에 동의합니다. 공통 관심사물론 거래가 두 사람 모두에게 이익이 된다는 전제 하에 판매에 동의합니다. 그러나 특정 가격을 선택할 때는 거래의 상호 이익 조건에 따라 결정된 한도 내에서 적극적으로 흥정합니다. 마찬가지로, 일반 유권자들은 일반적으로 극단적인 견해를 대변하는 후보자를 기꺼이 거부합니다.

그러나 서로 다른 절충안을 제시하는 두 후보 중 한 명을 선택하게 되면서 치열한 공방이 벌어진다. 대부분의 게임과 유사한 갈등 상황은 동의하지 않을 수 없습니다. 공공 생활갈등과 협력적인 행동을 모두 야기합니다. 따라서 게임이론은 참여자의 행동 동기를 분석하는 데 유용한 논리적 장치라는 결론을 내릴 수 있다. 비슷한 상황. 이는 비협조적 행동부터 상호 위협을 사용한 협력적 합의에 이르기까지 공식화된 행동 시나리오의 전체 무기고를 갖추고 있습니다. 모든 게임에 대해 정상적인 형태서로 다른 협력적 균형 개념과 비협력적 균형 개념을 사용하는 것은 서로 다른 결과를 가져오는 경향이 있습니다. 이들의 비교는 게임 이론 분석의 기본 원칙이며, 분명히 정상적인 형태의 게임 구조에서만 발생하는 행동의 인센티브 동기에 대한 엄격하고 동시에 의미 있는 추론의 원천입니다.

많은 것에서 사회 과학사용 가능 많은 수의모델을 분석하려면 전략을 선택하는 방법을 연구해야 합니다. 게임 이론의 응용은 주로 경제학 연구와 관련하여 개발됩니다.

이는 게임이론의 창시자인 폰 노이만(Von Neumann)과 모르겐슈테른(Morgenstern)의 원칙과 일치합니다. 그러나 게임이론적 접근 방식에 대한 강력한 평판은 협력 행위의 결과로 경쟁 균형을 고려할 수 있게 해주는 Debreu-Scarfe 정리 이후에만 확립되었습니다. 그 이후로 경제 이론의 전체 부분(불완전 경쟁 이론이나 경제적 인센티브 이론 등)은 게임 이론과 긴밀하게 접촉하여 발전해 왔습니다.

비협조적이고 협동적인 행동 패턴의 전체 스펙트럼을 이상화한 균형 개념에 대한 탐색은 사회학의 기초와 밀접한 관련이 있습니다. 현대 사회학 연구에서 공식적인 게임 이론 모델은 매우 드물며 수학적 관점에서 볼 때 초보적입니다. 그럼에도 불구하고 게임 이론의 영향은 적어도 학습 단계에서는 되돌릴 수 없는 것으로 보입니다.

이러한 문제를 해결하기 위해 수학 이론은 경쟁적 상호 작용 상황에서 최적의 결정을 내리기 위한 공식 모델 구축에 초점을 맞춘 수학의 한 분야로 정의되는 게임 이론을 제안합니다. 이 정의게임 이론의 주요 임무는 경쟁과 갈등 상황에서 효과적인 행동의 일련의 행동입니다.

게임 이론에서는 경쟁적인 상호 작용에 참여하는 참가자를 플레이어라고 하며, 각 참가자는 게임 과정에서 수행하는 이동 또는 선택이라고 하는 비어 있지 않은 허용 가능한 작업 세트를 가지고 있습니다. 각 플레이어의 가능한 동작 목록에서 한 번에 하나씩 가능한 모든 동작의 집합(쌍, 세 쌍 등의 동작으로 참여)을 전략이라고 합니다. 잘 구성된 전략은 상호 배타적입니다. 플레이어 행동의 모든 방식을 상호 소진시킵니다. 게임의 결과는 플레이어가 선택한 전략을 구현하는 것입니다. 게임의 각 결과는 플레이어가 결정하는 효용(승리) 값, 즉 보상에 해당합니다.

게임은 플레이어 수, 전략 수, 플레이어 간 상호 작용 성격, 승리 성격, 이동 횟수, 정보 가용성 등에 따라 분류할 수 있습니다.

  • 1. 플레이어 수에 따라 페어링 게임과 n인 게임이 구분됩니다. 짝을 이루는 게임을 구현하기 위한 수학적 장치가 가장 많이 개발되었습니다. 세 가지 게임어려움으로 인해 연구하기가 더 어려운 플레이어가 많아졌습니다. 기술적 구현솔루션 알고리즘.
  • 2. 전략의 수에 따라 게임은 유한할 수도 있고 무한할 수도 있습니다. 유한한 수의 가능한 플레이어 전략이 있는 게임을 유한 게임이라고 합니다. 플레이어 중 적어도 한 명이 무한한 수의 가능한 전략을 가지고 있다면 게임을 무한이라고 합니다.
  • 3. 상호 작용의 성격에 따라 게임은 다음과 같이 나뉩니다.
    • · 비연합: 플레이어는 계약을 체결하거나 연합을 형성할 권리가 없습니다.
    • · 연합(협동) - 플레이어는 연합에 가입할 수 있습니다.

안에 협동 게임연합은 문제 설정 단계에서 엄격하게 정의되며 게임 중에 변경할 수 없습니다.

  • 4. 상금의 성격에 따라 게임은 다음과 같이 구분됩니다.
    • · 제로섬 게임(모든 플레이어의 총 자본은 변하지 않지만 플레이어 간에 재분배됩니다. 모든 플레이어의 승리 합계는 0입니다.)
    • 넌제로섬 게임.
  • 5. 승리 기능의 유형에 따라 게임은 매트릭스, 바이매트릭스, 연속, 볼록, 분리 가능, 결투 등으로 구분됩니다.

매트릭스 게임은 두 명의 플레이어가 영합을 하는 유한 쌍 게임으로, 플레이어 1의 보수가 매트릭스 형태로 지정됩니다(매트릭스의 행은 플레이어 2가 적용한 전략의 수에 해당하고, 열 - 플레이어 2의 적용된 전략 수; 매트릭스의 행과 열의 교차점에는 적용된 전략에 해당하는 플레이어 1의 보수가 있습니다.

매트릭스 게임의 경우, 그 중 어떤 것이든 해결책이 있다는 것이 입증되었으며 게임을 선형 프로그래밍 문제로 축소하면 쉽게 찾을 수 있습니다.

바이매트릭스 게임은 0이 아닌 합을 사용하는 두 플레이어의 유한 게임으로, 각 플레이어의 보수는 해당 플레이어에 대해 별도로 행렬로 지정됩니다(각 행렬에서 행은 플레이어 1의 전략에 해당하고 열은 플레이어 2의 전략에 해당하며, 첫 번째 행렬의 행과 열의 교차점은 플레이어의 보수 1이고, 두 번째 행렬에서는 플레이어 2의 보수입니다.)

바이매트릭스 게임을 위한 최적의 플레이어 행동 이론도 개발되었지만 이러한 게임을 해결하는 것은 일반 매트릭스 게임보다 어렵습니다.

각 플레이어의 보수함수가 전략에 따라 연속적이면 게임은 연속적이라고 간주됩니다. 이 클래스의 게임에는 솔루션이 있다는 것이 수학적 이론에서 입증되었지만 실제로 허용되는 솔루션을 찾는 방법은 아직 개발되지 않았습니다.

모든 게임의 목표는 각 플레이어가 자신의 이익을 극대화하는 것입니다. 위의 분류를 바탕으로 구축된 수학적 게임이론의 의미는 형식화(단순화)하고 용이하게 하는 것이다. 최적의 선택. 가능한 모든 게임 전략의 집합은 다음과 같습니다. 큰 숫자, 더 강해질수록 더 많은 플레이어와 각 플레이어가 사용할 수 있는 동작 세트가 늘어납니다. 따라서 두 명의 플레이어가 게임 조건에서 각각 n개의 움직임을 허용한다면 게임에는 2n개의 전략이 있습니다.

이러한 수많은 전략을 단순하게 검색하고 평가(비교)하는 것은 기술적으로 매우 어려운 일그리고 실제로는 받아들일 수 없습니다. 수학적 장치를 사용하면 분석과 비교가 필요한 전략의 수를 크게 줄이고 명백히 효과가 없는 전략은 폐기할 수 있습니다. 분석에 합리적인 제한된 균형점 집합이 얻어지면(게임 결과의 모든 플레이어가 동일하게 선호) 플레이어의 보수 분석을 기반으로 가장 합리적인 결과가 선택됩니다. 결과를 선택할 때 게임의 최종 전략에 이름을 부여하는 두 가지 주요 접근 방식이 있습니다.

  • · Minimax 전략(최대(최악) 손실과 최소(최적) 손실 선택)
  • · 최대 전략(최소(최악) 승리부터 최대(최고) 승리까지 선택).

확률론적 분석 방법을 이용한 게임 이론의 발전은 의사결정의 수학적 이론이다. 이 이론은 실제(실제) 솔루션이 아니라 게임이 반복되는 동안 예상되는 솔루션인 평균 솔루션으로 작동합니다. 이 부동산왜냐하면 법의 규범적 성격은 그것이 불확실한 주제에 초점을 맞추고 법적 관계의 반복적인 반복을 수반한다는 것을 의미하기 때문입니다. 깊은 수학적 계산에 들어가지 않기 위해 의사 결정 이론은 게임 결과에 대한 확률적 분석을 사용하는 기준 시스템(예: Hurwitz 기준, Hadji-Lehman, 기대 가치 기준)을 제공한다는 점만 참고하겠습니다. , 위험과 불확실성의 조건에서 최적의 솔루션을 선택할 수 있도록 합니다.

예 1. "학생 - 교사."

다음 상황을 고려하십시오. 학생(플레이어 A)은 교사(플레이어 B)가 승인한 시험을 준비하고 있습니다. 학생에게는 시험 준비(+)와 준비하지 않음(-)이라는 두 가지 전략이 있다고 가정할 수 있습니다. 교사는 또한 두 가지 전략, 즉 학점 [+]을 부여하고 [-] 학점을 부여하지 않는 전략을 가지고 있습니다.

우리는 다음 고려 사항을 바탕으로 플레이어의 보상 함수 값을 기반으로 합니다.

이는 예를 들어 다음과 같이 정량적으로 표현될 수 있습니다.

예 2. 각 참가자가 자신의 행동 방식을 선택할 수 있는 다음과 같은 기회를 갖는 쌍 게임을 고려하십시오.

플레이어 A - A1, ..., Am 전략 중 하나를 선택할 수 있습니다.

플레이어 B - 전략 B1, ..., Bn 중 하나;

플레이어 A가 전략 Ai, 플레이어 B - Bj를 선택했다면 결국 플레이어 A의 보상은 aij, 플레이어 B - bij가 될 것입니다. 플레이어 A와 B의 보수는 두 개의 테이블 형식으로 작성할 수 있습니다.

따라서 플레이어의 이해관계가 다르지만 반드시 반대일 필요는 없는 경우 게임을 설명하기 위해 두 가지 보상 매트릭스가 사용됩니다. 이 사실비슷한 게임에 바이매트릭스라는 이름을 붙였습니다.

바이매트릭스 게임의 혼합 전략

위의 예는 플레이어의 이해관계가 일치하지 않는 상황을 설명합니다. 시뮬레이션된 갈등 상황을 해결하려면 플레이어에게 어떤 권장 사항을 제공해야 하는지에 대한 의문이 생깁니다. 즉, 바이매트릭스 게임의 해법은 무엇을 이해해야 하는가?

이 질문에 다음과 같이 대답할 수 있습니다.

플레이어의 이익이 일치하지 않는다는 사실 때문에 우리는 같은 의미에서 두 플레이어를 모두 만족시킬 수 있는 (절충) 솔루션을 구축해야 합니다.

이 아이디어를 매우 정확하게 즉각적으로 표현하려고 시도하지 않고 일종의 균형 상황, 즉 플레이어 중 한 명이 상금을 줄일 수 있는 명확한 편차를 찾으려고 노력해야 한다고 가정해 보겠습니다.

매트릭스 게임을 고려할 때도 비슷한 질문이 제기되었습니다. 미니맥스 접근법을 개발하는 동안 등장한 균형 상황의 개념은 항상 존재하지 않는 안장점을 찾게 했습니다. 물론 우리가 플레이어 A와 B의 순수한 전략에만 국한한다면, 즉 전략

그러나 혼합 전략, 즉 특정 빈도로 (순수) 전략을 번갈아 사용하는 플레이어의 행동으로 이동하여 매트릭스 게임을 확장하는 경우:

플레이어 A - 전략 A1,..., At 주파수 p1,..., rt, 여기서

플레이어 B - 주파수 q1,..., qn을 갖는 전략 B1,..., Bn, 여기서

혼합 전략에서는 항상 균형 상황이 존재한다는 것이 밝혀졌습니다. 즉, 혼합 전략의 모든 매트릭스 게임은 해결 가능합니다.

따라서 여기서 바이매트릭스 게임을 고려할 때 혼합 플레이어 전략으로 즉시 이동하는 것이 합리적입니다(이를 통해 각 게임은 일정한 상황에서 여러 번 반복될 수 있다고 가정합니다).

매트릭스의 경우 요소에 의해 결정되는 플레이어 A와 B의 평균 보수를 계산하여 계산한다는 점에서 혼합 전략은 지불 가능성의 확장으로 이어졌습니다. 결제 매트릭스그리고 확률과:

바이매트릭스 게임의 혼합 전략을 사용하면 플레이어 B에 대해 더 이상 차별이 없는 규칙에 따라 결정되는 플레이어 A와 B의 평균 보상도 발생합니다.

2x2 바이매트릭스 게임. 평형 상황

여기서는 각 플레이어가 정확히 두 가지 전략을 가지고 있는 경우, 즉 m = n = 2인 경우에 주목해야 합니다. 따라서 그러한 경우에 대해 위의 공식을 정확하게 작성하는 것이 적절해 보입니다.

2 2 바이매트릭스 게임에서 플레이어의 보수 매트릭스는 다음과 같은 형식을 갖습니다.

확률

바이매트릭스 게임 솔루션

평균 상금은 공식을 사용하여 계산됩니다.

조건에 따라 모든 p와 q에 대해 평형 상황을 정의합니다.

솔루션 전략 바이매트릭스 게임 균형

다음 부등식이 동시에 충족됩니다.

설명. 서면 불평등 (1)은 다음을 의미합니다. 혼합 전략(p*, q*)에 의해 결정된 상황은 플레이어 중 한 사람이 자신의 선택을 유지하고 다른 플레이어가 자신의 선택을 유지하면 다음과 같은 사실로 이어지는 경우 균형입니다. 이탈한 플레이어의 보수는 감소할 뿐입니다. 따라서 균형 상황이 존재한다면 그 상황에서 벗어나는 것은 플레이어 자신에게 수익성이 없다는 것이 밝혀졌습니다.

정리 1(J. Nash). 모든 바이매트릭스 게임에는 혼합 전략에서 최소한 하나의 균형 상황(균형점)이 있습니다.

따라서 균형 상황이 존재합니다. 하지만 어떻게 찾을 수 있나요?

특정 숫자 쌍(p*, q*)이 균형 상황을 결정한다고 주장하는 경우 이러한 주장의 타당성을 확인하거나 반대로 근거 없음을 입증하려면 불평등의 타당성을 확인해야 합니다( 1) 0~1 범위의 모든 p와 0~1 범위의 모든 q에 대해. 일반적으로 이러한 확인 횟수는 무한합니다. 따라서 효과적인 방법균형 상황에 대한 정의는 다른 곳에서 찾아야 합니다.

정리 2. 불평등의 만족

바이매트릭스 게임

갈등 상황 없이는 모든 관리 활동이 존재할 수 없습니다. 서로 다른 이해관계를 가진 둘 이상의 당사자가 충돌하는 상황입니다. 양측 모두 자신에게 유리하게 갈등을 해결하고 최대한의 이익을 얻고 싶어하는 것은 당연한 일입니다. 그러한 문제를 해결하는 것은 충돌하는 당사자가 없다는 사실로 인해 복잡해질 수 있습니다. 완전한 정보갈등 전체에 대해. 그렇지 않으면 우리는 다음과 같이 말할 수 있습니다. 갈등 상황받아들여야 한다 최적의 솔루션불확실한 상황에서.

이런 종류의 문제를 해결하기 위해 사용됩니다. 수학 모델링. 몇 가지 기본 개념을 소개하겠습니다. 갈등 게임의 수학적 모델을 게임이라고 합니다. 갈등의 당사자는 플레이어이고, 플레이어의 행동은 움직임이며, 일련의 움직임은 전략이며, 게임의 결과는 승리입니다.

문제를 해결하기 전에 필수 사항은 식별하는 것입니다. 특정 규칙. 일반적으로 이러한 규칙은 플레이어의 행동, 상대방의 행동에 대한 플레이어 간의 정보 교환, 상대방의 승리 기능 등에 대한 일련의 요구 사항 및 제한 사항입니다. 규칙은 명확해야 하며, 그렇지 않으면 게임이 진행되지 않습니다.

현재까지 게임을 분류하는 방법에는 여러 가지가 있습니다. 주요 부문은 보상이 있는 비협조적인 유한 쌍 게임(행렬, 위치, 이중 행렬)과 연합 게임으로 나뉩니다. 이번 에세이에서는 바이매트릭스 게임을 살펴보겠습니다.

정액 게임은 플레이어의 이익이 일치하지는 않지만 완전히 반대되는 게임은 아닙니다. 특별한 경우는 바이매트릭스 게임입니다.

바이매트릭스 게임은 0이 아닌 합을 사용하는 두 플레이어의 유한 게임으로, 각 플레이어의 보수는 해당 플레이어에 대해 별도로 행렬로 지정됩니다(각 행렬에서 행은 플레이어 1의 전략에 해당하고 열은 플레이어 2의 전략에 해당하며, 첫 번째 행렬의 행과 열의 교차점은 플레이어의 보수 1이고, 두 번째 행렬에서는 플레이어 2의 보수입니다.)

각 참가자가 자신의 행동 방식을 선택할 수 있는 다음과 같은 기회를 갖는 쌍 게임을 고려해 보겠습니다.

플레이어 A - 전략 A 1, ..., A m 중 하나를 선택할 수 있습니다.

플레이어 B - 전략 B 1, ..., B n 중 하나;

플레이어 A가 전략 A i, 플레이어 B - B j를 선택한 경우 결국 플레이어 A의 보상은 a ij, 플레이어 B - b ij가 됩니다. 플레이어 A와 B의 보수는 두 개의 테이블 형식으로 작성할 수 있습니다.

따라서 플레이어의 이해관계가 다르지만 반드시 반대일 필요는 없는 경우 게임을 설명하기 위해 두 가지 보상 매트릭스가 사용됩니다. 이 사실은 그러한 게임에 바이매트릭스라는 이름을 부여했습니다.

바이매트릭스 행렬의 평형 상태

바이매트릭스 게임의 솔루션은 어떤 의미에서 두 플레이어 모두에게 적합한 솔루션입니다. 이 공식은 매우 모호합니다. 이는 바이매트릭스 게임에서 플레이어의 목표를 명확하게 공식화하는 것이 매우 어렵기 때문입니다. 중 하나로서 가능한 옵션- 자신의 승리에 해를 끼치기 위해 상대방에게 해를 끼치려는 플레이어의 욕구, 그렇지 않으면 목표가 반대가 됩니다.

바이매트릭스 게임을 해결하는 데는 일반적으로 두 가지 접근 방식이 고려됩니다. 첫 번째는 균형 상황을 찾는 것입니다. 게임이 어떤 균형 상태에 있을 때 조건을 찾는데, 이는 플레이어가 개별적으로 위반하는 것이 수익성이 없습니다. 두 번째는 파레토 최적 상황을 찾는 것입니다. 즉, 플레이어가 다른 플레이어의 보수를 줄이지 않고는 한 플레이어의 보수를 공동으로 늘릴 수 없는 조건을 찾는 것입니다.

첫 번째 접근 방식에 중점을 두겠습니다.

이 접근 방식은 혼합 전략을 사용합니다. 플레이어가 특정 확률로 순수 전략을 번갈아 사용하는 경우입니다.

플레이어 A가 전략 A 1을 선택하도록 하고 확률은 p 1, A 2 - p 2, ..., A m - p m, 그리고

플레이어 B는 확률 q 1, B 2 - q 2, ..., B n - q n 및 확률로 B 1 전략을 사용합니다.

게임의 "성공"에 대한 기준으로 우리는 다음 공식을 사용하여 계산된 플레이어의 승리에 대한 수학적 기대치를 취합니다.

따라서 우리는 기본 정의를 공식화할 수 있습니다.

확률 분포 P * () 및 Q ()는 다른 분포 P 및 Q에 대해 다음 불평등이 동시에 충족되는 경우 평형 상황을 결정합니다.

균형 상황이 존재한다면, 그 상황에서 벗어나는 것은 플레이어 자신에게 불리합니다.

J. Nash의 정리도 사실입니다. 모든 바이매트릭스 게임에는 혼합 전략에서 적어도 하나의 균형 상황이 있습니다.

최종 제어 테스트

1. 적대적인 게임을 설정할 수 있습니다:

a) 플레이어와 안장 지점을 위한 일련의 전략.

b) 두 플레이어 모두를 위한 일련의 전략과 첫 번째 플레이어의 보상 기능.

2. 혼합 전략의 매트릭스 게임에는 게임 가격이 항상 존재합니다.

가) 그렇습니다.

3.보수 행렬의 모든 열이 동일하고 (4 5 0 1) 형식을 갖는다면 첫 번째 플레이어에게 가장 적합한 전략은 무엇입니까?

가) 먼저.

b) 둘째.

c) 네 가지 중 하나.

4. 다음 중 하나의 매트릭스 게임을 시작하세요. 혼합 전략플레이어 1의 전략은 (0.3, 0.7)이고 플레이어 2의 혼합 전략 중 하나는 (0.4, 0, 0.6)입니다. 이 행렬의 차원은 무엇입니까?

가) 2*3.

c) 다른 차원.

5. 지배력의 원리를 사용하면 한 단계로 매트릭스에서 제거할 수 있습니다.

a) 전체 라인.

b) 개별 번호.

6. 2*m 게임을 해결하기 위한 그래픽 방법에서는 그래프에서 직접 다음을 찾습니다.

a) 두 플레이어의 최적 전략.

b) 게임 가격과 두 번째 플레이어의 최적 전략.

c) 게임 가격과 첫 번째 플레이어의 최적 전략.

7.낮은 봉투 그래프 그래픽 방법게임 2*m의 해법은 일반적인 경우에 있습니다:

가) 깨졌다.

b) 똑바로.

c) 포물선.

8. 2*2 매트릭스 게임에는 플레이어의 혼합 전략에 두 가지 구성 요소가 있습니다.

a) 서로의 가치를 결정합니다.

b) 독립적이다.

9. 매트릭스 게임에서 aij 요소는 다음과 같습니다.

a) 첫 번째 플레이어가 i번째 전략을 사용할 때의 승리, 두 번째 플레이어 - j번째 전략.

b) 사용할 때 첫 번째 플레이어의 최적 전략 적 나또는 j번째 전략.

c) 첫 번째 플레이어가 j번째 전략을 사용할 때 손실, 두 번째 - i번째 전략을 사용할 때.

10. 행렬 요소 aij는 안장점에 해당합니다. 다음과 같은 상황이 가능합니다:

a) 이 요소는 라인의 모든 요소 중에서 엄밀히 말하면 가장 작습니다.

b) 이 요소는 줄에서 두 번째 요소입니다.

11. 브라운-로빈슨 방법에서는 각 플레이어가 전략을 선택할 때 다음 단계다음 사항에 따라 안내됩니다:

a) 이전 단계에서 적의 전략.

b) 이전 단계의 전략.

c) 다른 것.

12. 수학적 기대의 기준에 따라 각 플레이어는 다음 사실로부터 진행됩니다.

a) 그에게 최악의 상황이 일어날 것이다.

c) 주어진 확률로 모든 상황 또는 일부 상황이 가능합니다.

13. 모든 요소가 음수인 행렬로 행렬 게임을 구현해 보겠습니다. 게임 가격은 긍정적입니다.

b) 아니요.

c) 명확한 대답이 없습니다.

14. 게임 가격은 다음과 같습니다.

가) 번호.

b) 벡터.

c) 매트릭스.

15. 5*5 차원 게임에서 사용할 수 있는 안장점의 최대 수는 얼마입니까(행렬에는 어떤 숫자도 포함될 수 있습니다):

16. 2*3 차원의 매트릭스 게임에서 첫 번째 플레이어의 혼합 전략 중 하나가 (0.3, 0.7) 형식을 갖고, 두 번째 플레이어의 혼합 전략 중 하나가 (0.3, x, 0.5) 형식을 갖는다고 가정합니다. . 숫자 x는 무엇입니까?

c) 다른 번호.

17. 게임 매트릭스의 어떤 차원에서 Wald 기준이 Laplace 기준으로 바뀌나요?

c) 다른 경우에만.

18. 게임의 최고 가격은 항상 게임의 최저 가격보다 낮습니다.

b) 아니요.

b) 질문이 올바르지 않습니다.

19. 매트릭스 게임에는 어떤 전략이 있습니까?

가) 깨끗하다.

b) 혼합.

c) 둘 다.

20. 일부 적대적 게임에서 일부 변수 값에 대한 두 플레이어의 보수 함수 값이 1이 될 수 있습니까?

가) 항상.

b) 가끔.

c) 결코.

21. 매트릭스 게임에서 첫 번째 플레이어의 혼합 전략 중 하나를 (0.3, 0.7) 형식으로 하고, 두 번째 플레이어의 혼합 전략 중 하나를 (0.4, 0.1,0.1,0.4) 형식으로 설정합니다. . 이 행렬의 차원은 무엇입니까?

c) 다른 차원.

22. 지배력의 원리를 사용하면 한 단계로 매트릭스에서 제거할 수 있습니다.

a) 전체 열,

b) 개별 번호.

c) 더 작은 크기의 부분행렬.

23. 3*3 매트릭스 게임에는 플레이어의 혼합 전략에 두 가지 구성 요소가 있습니다.

a) 세 번째를 결정하십시오.

b) 정의하지 마십시오.

24. 매트릭스 게임에서 aij 요소는 다음과 같습니다.

a) j번째 전략을 사용할 때 두 번째 플레이어의 손실, 그리고 두 번째 - i번째 전략을 사용할 때 손실.

b) 상대가 i번째 또는 j번째 전략을 사용할 때 두 번째 플레이어의 최적 전략,

c) 첫 번째 플레이어가 j번째 전략을 사용할 때의 승리, 그리고 두 번째 - i번째 전략을 사용할 때의 승리,

25. 행렬 요소 aij는 안장점에 해당합니다. 다음과 같은 상황이 가능합니다:

a) 이 요소는 열에서 가장 큽니다.

b) 이 요소는 해당 줄에서 순서대로 가장 큰 요소입니다.

c) 문자열에는 이 요소보다 크고 작은 요소가 모두 포함되어 있습니다.

26. Wald 기준에 따르면 각 플레이어는 다음을 가정합니다.

a) 그에게 최악의 상황이 일어날 것이다.

b) 모든 상황이 동일하게 가능합니다.

c) 주어진 특정 확률로 모든 상황이 가능합니다.

27. 최저 가격더 적은 최고 가격계략:

b) 항상 그런 것은 아닙니다.

c) 결코.

28. 매트릭스 게임의 혼합 전략 구성 요소의 합은 항상 다음과 같습니다.

a) 1과 같습니다.

b) 음수가 아님.

c) 긍정적이다.

d) 항상 그런 것은 아니다.

29. 2*3 차원의 매트릭스 게임에서 첫 번째 플레이어의 혼합 전략 중 하나가 (0.3, 0.7) 형식을 갖고 두 번째 플레이어의 혼합 전략 중 하나가 (0.2, x, x) 형식을 갖는다고 가정합니다. . 숫자 x는 무엇입니까?