바이매트릭스 행렬의 평형 상태. 게임 이론의 일반 소개

모스크바 시립대학교 모스크바 정부 관리 대학

관리부서

응용수학과

수필

학문 분야별로

"제어 시스템 연구를 위한 수학적 방법"

주제: "Bimatrix 게임. 평형 상황 검색"


1. 바이매트릭스 게임

갈등 상황 없이는 모든 관리 활동이 존재할 수 없습니다. 서로 다른 이해관계를 가진 둘 이상의 당사자가 충돌하는 상황입니다. 양측 모두 자신에게 유리하게 갈등을 해결하고 최대한의 이익을 얻고 싶어하는 것은 당연한 일입니다. 그러한 문제를 해결하는 것은 충돌하는 당사자가 없다는 사실로 인해 복잡해질 수 있습니다. 완전한 정보갈등 전체에 대해. 그렇지 않으면 갈등 상황에서 다음을 받아들여야 한다고 말할 수 있습니다. 최적의 솔루션불확실한 상황에서.

이런 종류의 문제를 해결하기 위해 사용됩니다. 수학 모델링. 몇 가지 기본 개념을 소개하겠습니다. 갈등 게임의 수학적 모델을 게임이라고 합니다. 갈등의 당사자는 플레이어이고, 플레이어의 행동은 움직임이며, 일련의 움직임은 전략이며, 게임의 결과는 승리입니다.

문제를 해결하기 전에 필수 사항은 식별하는 것입니다. 특정 규칙. 일반적으로 이러한 규칙은 플레이어의 행동, 상대방의 행동에 대한 플레이어 간의 정보 교환, 상대방의 승리 기능 등에 대한 일련의 요구 사항 및 제한 사항입니다. 규칙은 명확해야 하며, 그렇지 않으면 게임이 진행되지 않습니다.

현재까지 게임을 분류하는 방법에는 여러 가지가 있습니다. 주요 부문은 보상이 있는 비협조적인 유한 쌍 게임(행렬, 위치, 이중 행렬)과 연합 게임으로 나뉩니다. 이번 에세이에서는 바이매트릭스 게임을 살펴보겠습니다.

정액 게임은 플레이어의 이익이 일치하지는 않지만 완전히 반대되는 게임은 아닙니다. 특별한 경우는 바이매트릭스 게임입니다.

매트릭스 게임 0이 아닌 합을 사용하는 두 플레이어의 유한 게임으로, 각 플레이어의 보수는 해당 플레이어에 대해 별도로 행렬로 지정됩니다(각 행렬에서 행은 플레이어 1의 전략에 해당하고 열은 전략에 해당함). 플레이어 2의 경우, 첫 번째 매트릭스의 행과 열의 교차점에는 플레이어 1의 보수가 있고, 두 번째 매트릭스에는 플레이어 2의 보수가 있습니다.)

각 참가자가 자신의 행동 방식을 선택할 수 있는 다음과 같은 기회를 갖는 쌍 게임을 고려해 보겠습니다.

플레이어 A – 전략 A 1, ..., A m 중 하나를 선택할 수 있습니다.

플레이어 B – 전략 B 1, ..., B n 중 하나;

플레이어 A가 전략 A i, 플레이어 B – B j를 선택한 경우 결국 플레이어 A의 보상은 a ij, 플레이어 B – b ij가 됩니다. 플레이어 A와 B의 보수는 두 개의 테이블 형식으로 작성할 수 있습니다.

따라서 플레이어의 관심사가 다르지만 반드시 반대는 아닌 경우 게임을 설명하는 데 두 가지가 사용됩니다. 결제 매트릭스. 이 사실비슷한 게임에 바이매트릭스라는 이름을 붙였습니다.

2. 바이매트릭스 행렬의 평형 상태

바이매트릭스 게임의 솔루션은 어떤 의미에서 두 플레이어 모두에게 적합한 솔루션입니다. 이 공식은 매우 모호합니다. 이는 바이매트릭스 게임에서 플레이어의 목표를 명확하게 공식화하는 것이 매우 어렵기 때문입니다. 가능한 옵션 중 하나는 상대방에게 해를 끼치고 자신의 승리에 해를 끼치려는 플레이어의 욕구입니다. 그렇지 않으면 목표가 반대가 됩니다.

바이매트릭스 게임을 해결하는 데는 일반적으로 두 가지 접근 방식이 고려됩니다. 첫 번째는 균형 상황을 찾는 것입니다. 게임이 어떤 균형 상태에 있을 때 조건을 찾는데, 이는 플레이어가 개별적으로 위반하는 것이 수익성이 없습니다. 두 번째는 파레토 최적 상황을 찾는 것입니다. 즉, 플레이어가 다른 플레이어의 보수를 줄이지 않고는 한 플레이어의 보수를 공동으로 늘릴 수 없는 조건을 찾는 것입니다.

첫 번째 접근 방식에 중점을 두겠습니다.

이 접근 방식은 혼합 전략을 사용합니다. 플레이어가 교대로 플레이하는 경우 순수 전략특정 확률로.

플레이어 A가 확률 p 1, A 2 – p 2, ..., A m – p m, 그리고 전략 A 1을 선택하도록 합니다.

플레이어 B는 확률 q 1, B 2 – q 2, …, B n – q n 및 전략 B 1을 사용합니다.

게임의 '성공'을 기준으로 삼자 수학적 기대다음 공식에 따라 계산되는 플레이어의 상금:


따라서 우리는 기본 정의를 공식화할 수 있습니다.

확률 분포 P * (

) 및 Q()는 다른 분포 P 및 Q에 대해 다음 불평등이 동시에 충족되는 경우 평형 상황을 결정합니다.

균형 상황이 존재한다면, 그 상황에서 벗어나는 것은 플레이어 자신에게 불리합니다.

J. Nash의 정리도 사실입니다. 모든 바이매트릭스 게임에는 혼합 전략에서 적어도 하나의 균형 상황이 있습니다.

3. 일반원리바이매트릭스 게임 솔루션

B가 최적의 전략을 고수한다는 가정하에 플레이어 A의 모든 순수 전략은 시스템의 첫 번째 부등식으로 순차적으로 대체됩니다. A가 최적의 전략을 고수한다는 가정 하에 플레이어 B의 모든 순수 전략은 두 번째 부등식으로 대체됩니다.

결과적으로 m+n 불평등 시스템은 최적의 혼합 전략(P*,Q*) 요소의 가치와 균형점에서 플레이어가 받는 지불액을 제공하는 솔루션입니다.

예: 시장을 위한 투쟁.


문제의 해결

v A =-10×1q 1 +2×1*(1-q 1)+(1-p 1)q 1 -(1-p 1)(1-q 1)=-14×1q 1 +3× 1+2q 1 -1

v B =5×1q 1 -2×1*(1-q 1)-(1-p 1)q 1 +(1-p 1)(1-q 1)=9×1q 1 -3×1- 2분기 1 +1

p 1 =1이면 v A =2-12q 1

-14×1q 1 +3×1+2q 1 -1

p 1 =0이면 v A =-1+2q 1

-14×1q 1 +3×1+2q 1 -1

q 1 =1이면 v B =-1+6×1

9×1q 1 -3×1-2q 1 +1

q 1 =0이면 v B =1–3×1

9×1q 1 -3×1-2q 1 +1

우리는 4가지 시스템을 구성하고, 변환하고, 얻습니다.

65. 최적의 플레이어 전략을 찾기 위해 3*3 게임을 해결하는 그래픽 방법에서:
a) 두 개의 삼각형이 만들어집니다. (*답변*)
b) 하나의 삼각형이 구성됩니다.
c) 삼각형은 전혀 구성되지 않습니다.
66. 하단 엔벨로프 그래프 그래픽 방법일반적인 경우 게임 2*m의 해는 다음과 같은 기능을 나타냅니다.
a) 단조롭게 감소합니다.
b) 단조롭게 증가합니다.
c) 비운동성.
67. 세그먼트의 적대적 게임에서 첫 번째 플레이어의 보수 함수 F(x,y)가 2*x+C와 같다면 C에 따라 다음과 같습니다.
a) 안장 지점이 없습니다.
b) 항상 안장 지점이 있습니다. (*답변*)
c) 다른 옵션
68. 유한 집합에 대한 불확실성 조건에서 의사 결정 문제를 어떻게 설정할 수 있습니까?
a) 두 개의 행렬.
b) 상금.
c) 다른 것 (*답변*)
69. 임의 차원의 적대적 게임에서 첫 번째 플레이어의 보상은 다음과 같습니다.
가) 번호.
b) 많다.
c) 벡터 또는 순서화된 세트.
d) 함수 (*답변*)
70. 3*3 매트릭스 게임에는 플레이어의 혼합 전략에 두 가지 구성 요소가 있습니다.
a) 세 번째 결정 (*답변*)
b) 정의하지 마십시오.
71. 바이매트릭스 게임은 다음과 같이 정의될 수 있습니다.
a) 임의의 요소를 포함하는 동일한 차원의 두 행렬,
b) 반드시 동일한 차원일 필요는 없는 두 개의 행렬,
c) 하나의 행렬.
72. 매트릭스 게임에서 aij 요소는 다음과 같습니다.
a) j번째 전략을 사용할 때 두 번째 플레이어의 손실, 그리고 두 번째 - i번째 전략(*답변*)
비) 최적의 전략두 번째 플레이어 사용 시 적 나또는 j번째 전략,
c) 첫 번째 플레이어가 j번째 전략을 사용할 때의 승리, 그리고 두 번째 - i번째 전략을 사용할 때의 승리,
73. 행렬 요소 aij는 안장점에 해당합니다. 다음과 같은 상황이 가능합니다:
a) 최적.
b) 깨끗하다.
c) 명확한 대답이 없습니다 (*답변*)
84. 행렬의 모든 열이 동일하고 (4 3 0 2) 형식을 갖는다면 두 번째 플레이어에게 가장 적합한 전략은 무엇입니까?
가) 먼저. b) 세 번째. c) 모두 (*답변*)
85. 3*3 게임에서 안장점의 최대 개수는 얼마입니까 (매트릭스에는 어떤 숫자도 포함될 수 있습니다):
가)3.
b)9.
c)27 (*답변*)
86. X=(1;5)를 첫 번째 전략의 집합이라고 하자
플레이어, Y=(2;8) - 두 번째 플레이어의 전략 세트입니다. (1,2) 쌍입니까?
이 게임에서 안장점이 되려면:
가) 항상.
b) 가끔 (*답변*)
c) 결코.
87. 3*3 차원의 바이매트릭스 게임에는 정확히 2개의 평형 상황이 있습니까?
가) 항상.
b) 가끔 (*답변*)
c) 결코.
88. 2*3 차원의 매트릭스 게임에서 첫 번째 플레이어의 혼합 전략 중 하나가 (0.3, 0.7) 형식을 갖고 두 번째 플레이어의 혼합 전략 중 하나가 (0.3, x, x) 형식을 갖는다고 가정합니다. . 숫자 x는 무엇입니까?
a)0.7 b)0.4 c)다른 것 (*답변*)
89. 매트릭스 게임은 바이매트릭스 게임의 특별한 경우이며, 다음 사항이 항상 참입니다:
a) 행렬 A는 반대 부호를 사용하여 행렬 B와 같습니다.
b) 행렬 A는 행렬 B와 같습니다.
c) 행렬 A와 B의 곱은 단위 행렬입니다.
90. 바이매트릭스 게임에서 요소는 다음을 나타냅니다.
a) 두 번째 플레이어가 i번째 전략을 사용할 때, 그리고 첫 번째 - j번째 전략을 사용할 때의 승리,
b) 상대가 i번째 또는 j번째 전략을 사용할 때 두 번째 플레이어의 최적 전략/
c) 다른 것 (*답변*)
91. 바이매트릭스 게임에서 요소 ac는 평형 상황에 해당합니다. 다음과 같은 상황이 가능합니다:
a) 열에 이 요소와 동일한 요소가 있습니다(*답변*)
b) 이 요소는 열의 일부 요소보다 작습니다.
c) 이 요소는 열에서 가장 작습니다.
92. 매트릭스 게임에서 각 플레이어의 전략과 보상함수를 알면,
순수 전략의 게임 가격은 다음에서 확인할 수 있습니다.
가) 항상.
b) 가끔 (*답변*)
c) 질문이 올바르지 않습니다.

바이매트릭스 게임

갈등 상황 없이는 모든 관리 활동이 존재할 수 없습니다. 서로 다른 이해관계를 가진 둘 이상의 당사자가 충돌하는 상황입니다. 양측 모두 자신에게 유리하게 갈등을 해결하고 최대한의 이익을 얻고 싶어하는 것은 당연한 일입니다. 갈등 당사자가 갈등 전체에 대한 완전한 정보를 갖고 있지 않기 때문에 이러한 문제를 해결하는 것은 복잡할 수 있습니다. 즉, 갈등 상황에서는 불확실한 상황에서 최적의 결정을 내리는 것이 필요하다고 말할 수 있습니다.

이러한 유형의 문제를 해결하기 위해 수학적 모델링이 사용됩니다. 몇 가지 기본 개념을 소개하겠습니다. 갈등 게임의 수학적 모델을 게임이라고 합니다. 갈등의 당사자는 플레이어이고, 플레이어의 행동은 움직임이며, 일련의 움직임은 전략이며, 게임의 결과는 승리입니다.

문제를 해결하기 전 필수 단계는 특정 규칙을 식별하는 것입니다. 일반적으로 이러한 규칙은 플레이어의 행동, 상대방의 행동에 대한 플레이어 간의 정보 교환, 상대방의 승리 기능 등에 대한 일련의 요구 사항 및 제한 사항입니다. 규칙은 명확해야 하며, 그렇지 않으면 게임이 진행되지 않습니다.

현재까지 게임을 분류하는 방법에는 여러 가지가 있습니다. 주요 부문은 보상이 있는 비협조적인 유한 쌍 게임(행렬, 위치, 이중 행렬)과 연합 게임으로 나뉩니다. 이번 에세이에서는 바이매트릭스 게임을 살펴보겠습니다.

정액 게임은 플레이어의 이익이 일치하지는 않지만 완전히 반대되는 게임은 아닙니다. 특별한 경우는 바이매트릭스 게임입니다.

바이매트릭스 게임은 0이 아닌 합을 사용하는 두 플레이어의 유한 게임으로, 각 플레이어의 보수는 해당 플레이어에 대해 별도로 행렬로 지정됩니다(각 행렬에서 행은 플레이어 1의 전략에 해당하고 열은 플레이어 2의 전략에 해당하며, 첫 번째 행렬의 행과 열의 교차점은 플레이어의 보수 1이고, 두 번째 행렬에서는 플레이어 2의 보수입니다.)

각 참가자가 자신의 행동 방식을 선택할 수 있는 다음과 같은 기회를 갖는 쌍 게임을 고려해 보겠습니다.

플레이어 A - 전략 A 1, ..., A m 중 하나를 선택할 수 있습니다.

플레이어 B - 전략 B 1, ..., B n 중 하나;

플레이어 A가 전략 A i, 플레이어 B - B j를 선택한 경우 결국 플레이어 A의 보상은 a ij, 플레이어 B - b ij가 됩니다. 플레이어 A와 B의 보수는 두 개의 테이블 형식으로 작성할 수 있습니다.

따라서 플레이어의 이해관계가 다르지만 반드시 반대일 필요는 없는 경우 게임을 설명하기 위해 두 가지 보상 매트릭스가 사용됩니다. 이 사실은 그러한 게임에 바이매트릭스라는 이름을 부여했습니다.

바이매트릭스 행렬의 평형 상태

바이매트릭스 게임의 솔루션은 어떤 의미에서 두 플레이어 모두에게 적합한 솔루션입니다. 이 공식은 매우 모호합니다. 이는 바이매트릭스 게임에서 플레이어의 목표를 명확하게 공식화하는 것이 매우 어렵기 때문입니다. 가능한 옵션 중 하나는 상대방에게 해를 끼치고 자신의 승리에 해를 끼치려는 플레이어의 욕구입니다. 그렇지 않으면 목표가 반대가 됩니다.

바이매트릭스 게임을 해결하는 데는 일반적으로 두 가지 접근 방식이 고려됩니다. 첫 번째는 균형 상황을 찾는 것입니다. 게임이 어떤 균형 상태에 있을 때 조건을 찾는데, 이는 플레이어가 개별적으로 위반하는 것이 수익성이 없습니다. 두 번째는 파레토 최적 상황을 찾는 것입니다. 즉, 플레이어가 다른 플레이어의 보수를 줄이지 않고는 한 플레이어의 보수를 공동으로 늘릴 수 없는 조건을 찾는 것입니다.

첫 번째 접근 방식에 중점을 두겠습니다.

이 접근 방식은 혼합 전략을 사용합니다. 플레이어가 특정 확률로 순수 전략을 번갈아 사용하는 경우입니다.

플레이어 A가 전략 A 1을 선택하도록 하고 확률은 p 1, A 2 - p 2, ..., A m - p m, 그리고

플레이어 B는 확률 q 1, B 2 - q 2, ..., B n - q n 및 확률로 B 1 전략을 사용합니다.

게임의 "성공"에 대한 기준으로 우리는 다음 공식을 사용하여 계산된 플레이어의 승리에 대한 수학적 기대치를 취합니다.

따라서 우리는 기본 정의를 공식화할 수 있습니다.

확률 분포 P * () 및 Q ()는 다른 분포 P 및 Q에 대해 다음 불평등이 동시에 충족되는 경우 평형 상황을 결정합니다.

균형 상황이 존재한다면, 그 상황에서 벗어나는 것은 플레이어 자신에게 불리합니다.

J. Nash의 정리도 사실입니다. 모든 바이매트릭스 게임에는 혼합 전략에서 적어도 하나의 균형 상황이 있습니다.

예 1. "학생 - 교사."

다음 상황을 고려하십시오. 학생(플레이어 A)은 교사(플레이어 B)가 승인한 시험을 준비하고 있습니다. 학생에게는 시험 준비(+)와 준비하지 않음(-)이라는 두 가지 전략이 있다고 가정할 수 있습니다. 교사는 또한 두 가지 전략, 즉 학점 [+]을 부여하고 [-] 학점을 부여하지 않는 전략을 가지고 있습니다.

우리는 다음 고려 사항을 바탕으로 플레이어의 보상 함수 값을 기반으로 합니다.

이는 예를 들어 다음과 같이 정량적으로 표현될 수 있습니다.

예 2. 각 참가자가 자신의 행동 방식을 선택할 수 있는 다음과 같은 기회를 갖는 쌍 게임을 고려하십시오.

플레이어 A - A1, ..., Am 전략 중 하나를 선택할 수 있습니다.

플레이어 B - 전략 B1, ..., Bn 중 하나;

플레이어 A가 전략 Ai, 플레이어 B - Bj를 선택했다면 결국 플레이어 A의 보상은 aij, 플레이어 B - bij가 될 것입니다. 플레이어 A와 B의 보수는 두 개의 테이블 형식으로 작성할 수 있습니다.

따라서 플레이어의 이해관계가 다르지만 반드시 반대일 필요는 없는 경우 게임을 설명하기 위해 두 가지 보상 매트릭스가 사용됩니다. 이 사실은 그러한 게임에 바이매트릭스라는 이름을 부여했습니다.

바이매트릭스 게임의 혼합 전략

위의 예는 플레이어의 이해관계가 일치하지 않는 상황을 설명합니다. 시뮬레이션된 갈등 상황을 해결하려면 플레이어에게 어떤 권장 사항을 제공해야 하는지에 대한 의문이 생깁니다. 즉, 바이매트릭스 게임의 해법은 무엇을 이해해야 하는가?

이 질문에 다음과 같이 답할 수 있습니다.

플레이어의 이익이 일치하지 않는다는 사실 때문에 우리는 같은 의미에서 두 플레이어를 모두 만족시킬 수 있는 (절충) 솔루션을 구축해야 합니다.

이 아이디어를 매우 정확하게 즉각적으로 표현하려고 시도하지 않고 일종의 균형 상황, 즉 플레이어 중 한 명이 상금을 줄일 수 있는 명확한 편차를 찾으려고 노력해야 한다고 가정해 보겠습니다.

매트릭스 게임을 고려할 때도 비슷한 질문이 제기되었습니다. Minimax 접근 방식을 개발하는 동안 발생하는 개념 균형 상황검색으로 이어졌습니다 안장 포인트, 항상 존재하는 것은 아닙니다. 물론 플레이어 A와 B의 순수한 전략에만 국한한다면, 즉 전략

그러나 혼합 전략, 즉 특정 빈도로 (순수) 전략을 번갈아 사용하는 플레이어의 행동으로 이동하여 매트릭스 게임을 확장하는 경우:

플레이어 A - 전략 A1,..., At 주파수 p1,..., rt, 여기서

플레이어 B - 주파수 q1,..., qn을 갖는 전략 B1,..., Bn, 여기서

혼합 전략에서는 항상 균형 상황이 존재한다는 것이 밝혀졌습니다. 즉, 혼합 전략의 모든 매트릭스 게임은 해결 가능합니다.

따라서 여기서 바이매트릭스 게임을 고려할 때 혼합 플레이어 전략으로 즉시 이동하는 것이 합리적입니다(이를 통해 각 게임은 일정한 상황에서 여러 번 반복될 수 있다고 가정합니다).

매트릭스의 경우, 결제 매트릭스 A의 요소와 확률과:

바이매트릭스 게임의 혼합 전략을 사용하면 플레이어 B에 대해 더 이상 차별이 없는 규칙에 따라 결정되는 플레이어 A와 B의 평균 보상도 발생합니다.

2x2 바이매트릭스 게임. 평형 상황

여기서는 각 플레이어가 정확히 두 가지 전략을 가지고 있는 경우, 즉 m = n = 2인 경우에 주목해야 합니다. 따라서 그러한 경우에 대해 위의 공식을 정확하게 작성하는 것이 적절해 보입니다.

2 2 바이매트릭스 게임에서 플레이어의 보수 매트릭스는 다음과 같은 형식을 갖습니다.

확률

바이매트릭스 게임 솔루션

평균 상금은 공식을 사용하여 계산됩니다.

조건에 따라 모든 p와 q에 대해 평형 상황을 정의합니다.

솔루션 전략 바이매트릭스 게임 균형

다음 부등식이 동시에 충족됩니다.

설명. 서면 불평등 (1)은 다음을 의미합니다. 혼합 전략(p*, q*)에 의해 결정된 상황은 플레이어 중 한 사람이 자신의 선택을 유지하고 다른 플레이어가 자신의 선택을 유지하면 다음과 같은 사실로 이어지는 경우 균형입니다. 이탈한 플레이어의 보수는 감소할 뿐입니다. 따라서 균형 상황이 존재한다면 그 상황에서 벗어나는 것은 플레이어 자신에게 수익성이 없다는 것이 밝혀졌습니다.

정리 1(J. Nash). 모든 바이매트릭스 게임에는 혼합 전략에서 최소한 하나의 균형 상황(균형점)이 있습니다.

따라서 균형 상황이 존재합니다. 하지만 어떻게 찾을 수 있나요?

특정 숫자 쌍(p*, q*)이 균형 상황을 결정한다고 주장하는 경우 이러한 주장의 타당성을 확인하거나 반대로 근거 없음을 입증하려면 불평등의 타당성을 확인해야 합니다( 1) 0~1 범위의 모든 p와 0~1 범위의 모든 q에 대해. 일반적으로 이러한 확인 횟수는 무한합니다. 따라서 효과적인 방법균형 상황에 대한 정의는 다른 곳에서 찾아야 합니다.

정리 2. 불평등의 만족

게임에서 넌제로섬게임에 참여하는 모든 참가자는 승리하거나 패배할 수 있습니다. 바이매트릭스 게임두 플레이어 사이의 유한한 넌제로섬 게임입니다. 이 경우, 각각에 대해 게임 상황 A i B j 각 플레이어는 첫 번째 플레이어에 대한 자신의 보수 aij와 두 번째 플레이어에 대한 bij를 갖습니다. 예를 들어, 불완전 경쟁 시장에서 생산자의 행동은 바이매트릭스 게임으로 귀결됩니다. 온라인 계산기를 사용하면 해결책을 찾을 수 있습니다. 바이매트릭스 게임, 상황도 그렇고 파레토 최적 및 내쉬 안정 상황.

고려해 봅시다 갈등 상황, 두 참가자 각각은 자신의 행동 방식을 선택할 수 있는 다음과 같은 기회를 갖습니다.

  • 플레이어 A – A 1,…, A m, 전략 중 하나를 선택할 수 있습니다.
  • 플레이어 B – 전략 B 1,…, B n 중 하나.

더욱이, 그들의 공동 선택은 매우 명확하게 평가됩니다. 플레이어 A가 선택한 경우 i번째 전략 A i이고 플레이어 B는 k번째 전략 B k입니다. 그러면 결국 플레이어 A의 보수는 특정 숫자 aik와 같고 플레이어 B의 보수는 일반적으로 말하면 다른 숫자 b와 같습니다. ik.
플레이어 A의 모든 전략과 플레이어 B의 모든 전략을 순차적으로 진행함으로써 두 테이블을 승리로 채울 수 있습니다.

테이블 중 첫 번째는 플레이어 A의 보수를 설명하고 두 번째는 플레이어 B의 보수를 설명합니다. 일반적으로 이러한 테이블은 행렬 형식으로 작성됩니다.
여기서 A는 플레이어 A의 보수 행렬이고, B는 플레이어 B의 보수 행렬입니다.

따라서 플레이어의 이해관계가 다른 경우(반드시 반대는 아님) 두 개의 지불 매트릭스가 얻어집니다. 하나는 플레이어 A에 대한 지불 매트릭스이고 다른 하나는 플레이어 B에 대한 지불 매트릭스입니다. 따라서 일반적으로 그러한 게임에 지정되는 이름은 완전히 자연스럽게 들립니다. 바이매트릭스.

내쉬 균형– 균형, 게임의 각 참가자가 자신에게 가장 적합한 전략을 선택할 때 게임의 다른 참가자가 특정 전략을 고수하는 경우.
내쉬 균형이 항상 참가자에게 가장 최적인 것은 아닙니다. 이 경우에는 균형이 맞지 않는다고 말합니다. 파레토 최적.
순수 전략– 플레이어의 특정 반응 가능한 옵션다른 플레이어의 행동.
혼합 전략– 다른 플레이어의 행동에 대한 플레이어의 확률적(정확하게 정의되지 않은) 반응입니다.

예 1. 시장을 위한 투쟁.
회사 a는 더 큰 회사 b가 통제하는 두 시장 중 하나에서 위탁 상품을 판매하려고 합니다. 이를 위해 특정 비용과 관련된 준비 작업을 수행합니다. 회사 b가 어느 시장 회사 a가 자사 제품을 판매할지 추측하면 대응 조치를 취하고 시장을 "점령"하는 것을 방지합니다(이 옵션은 회사 a의 패배를 의미함). 그렇지 않다면 확고한 승리입니다. 기업 a의 경우 첫 번째 시장에 침투하는 것이 두 번째 시장에 침투하는 것보다 더 수익성이 높지만 첫 번째 시장에서 투쟁하려면 더 많은 자금이 필요하다고 가정해 보겠습니다. 예를 들어, 첫 번째 시장에서 기업이 승리하면 두 번째 시장에서 승리하는 것보다 두 배의 이익을 얻을 수 있지만, 첫 번째 시장에서 패배하면 회사는 완전히 망하게 됩니다.
작곡하자 수학적 모델이 갈등에서 회사 a를 플레이어 1로, 회사 b를 플레이어 2로 간주합니다. 플레이어 1을 위한 전략: 1 – 시장 침투 1, 2 – 시장 침투 2; 플레이어 2 전략: 안에 1 – 시장 1의 대응책, 안에 2 – 시장에서의 대응책 2. 첫 번째 시장에서의 승리는 2유닛의 가치가 있고, 두 번째 시장에서의 승리는 1유닛의 가치가 있다고 가정합니다. 첫 번째 시장에서 A사의 패배는 -10으로, 두 번째 시장에서는 -1로 추정됩니다. 회사 b의 경우 승리는 각각 5와 1 단위이고 패배는 -2와 -1입니다. 결과적으로 우리는 보상 행렬을 갖는 바이매트릭스 게임 Г을 얻습니다.
.
정리에 따르면 이 게임은 순수 균형 상황 또는 완전히 혼합된 균형 상황을 가질 수 있습니다. 여기서 순수 전략에는 균형 상황이 없습니다. 이제 확인해 보겠습니다. 이 게임완전히 혼합된 균형상태를 가지고 있다. 우리는 찾는다 , .
따라서 고려 중인 게임은 독특한 균형 상황(x 0 ;y 0)을 가지고 있으며, 여기서 , . 다음과 같이 게임을 여러 번 반복함으로써(즉, 설명된 상황을 여러 번 반복함으로써) 구현할 수 있습니다. 기업 a는 빈도가 2/9와 7/9인 순수 전략 1과 2를 사용해야 하고, 기업 b는 다음을 사용해야 합니다. 빈도가 3/14 및 11/14인 순수 전략 1 및 2. 이 혼합 전략에서 벗어나는 기업은 기대 수익을 감소시킵니다.

예 2. 바이매트릭스 게임에 대한 파레토 최적 상황과 내쉬 안정 상황을 찾아보세요.

예 번호 3. 2개의 회사가 있습니다. 첫 번째 회사는 두 제품 A1과 A2 중 하나를 생산할 수 있고, 두 번째 회사는 두 제품 B1, B2 중 하나를 생산할 수 있습니다. 첫 번째 회사가 제품 A i (i = 1, 2)를 생산하고 두 번째 회사 - B j (j = 1, 2)를 생산하는 경우 이러한 회사의 이익은 (이 제품이 보완적인지 경쟁적인지에 따라) 다음과 같이 결정됩니다. 테이블 번호 1 :

1에2시에
A 1(5, 6) (3, 2)
A 2(2, 1) (5, 3)
기업이 서로 합의를 체결했다고 가정하고 내쉬 중재 결정을 사용하여 이익의 공정한 분배를 결정하십시오.