게임 이론 과제. 게임이론의 수학적 모델과 문제의 공식화

15.08.2019

각 플레이어가 자신이 마음대로 사용할 수 있는 유한한 전략 세트를 갖는 제로섬 게임입니다. 매트릭스 게임의 규칙은 지불 매트릭스에 의해 결정되며, 그 요소는 첫 번째 플레이어의 승리이자 두 번째 플레이어의 손실이기도 합니다.

매트릭스 게임 적대적인 게임이다. 첫 번째 플레이어는 게임 가격과 동일한 최대 보장 상금(두 번째 플레이어의 행동과 관계 없음)을 받습니다. 마찬가지로 두 번째 플레이어도 최소 보장 손실을 달성합니다.

아래에 전략 현재 상황에 따라 플레이어의 각 개인 움직임에 대한 행동 선택을 결정하는 일련의 규칙(원칙)으로 이해됩니다.

이제 모든 것에 대해 순서대로 자세히 설명합니다.

결제 매트릭스, 순수 전략, 게임 가격

안에 매트릭스 게임 그 규칙은 정해져 있다 결제 매트릭스 .

첫 번째 플레이어와 두 번째 플레이어라는 두 명의 참가자가 있는 게임을 생각해 보세요. 첫 번째 플레이어가 마음껏 사용할 수 있도록 하세요. 중순수한 전략, 그리고 두 번째 플레이어의 처분에 따라 - N순수한 전략. 승부를 고려하고 있는 이상 이번 경기에서는 승패가 있는 것이 당연하다.

안에 결제 매트릭스 요소는 플레이어의 승패를 나타내는 숫자입니다. 승패는 포인트, 금액 또는 기타 단위로 표현될 수 있습니다.

결제 매트릭스를 만들어 보겠습니다.

첫 번째 플레이어가 선택한 경우 나-순수전략, 그리고 두 번째 플레이어- 제이순수 전략의 경우, 첫 번째 플레이어의 보수는 다음과 같습니다. ㅏij유닛, 두 번째 플레이어의 손실도 ㅏij단위.

왜냐하면 ㅏij + (- ㅏ ij) = 0, 그렇다면 설명된 게임은 제로섬 매트릭스 게임입니다.

매트릭스 게임의 가장 간단한 예는 동전 던지기입니다. 게임의 규칙은 다음과 같습니다. 첫 번째와 두 번째 플레이어가 동전을 던지며 결과는 앞면 또는 뒷면입니다. "앞면"과 "앞면" 또는 "꼬리" 또는 "꼬리"가 동시에 던져지면 첫 번째 플레이어가 유닛 1개를 획득하고, 그렇지 않은 경우에는 유닛 1개를 잃습니다. (두 번째 플레이어가 유닛 1개를 획득합니다.) . 두 번째 플레이어도 동일한 두 가지 전략을 사용할 수 있습니다. 해당 지불 매트릭스는 다음과 같습니다:

게임 이론의 임무는 첫 번째 플레이어의 전략을 결정하여 최대 평균 승리를 보장하고 두 번째 플레이어의 전략을 선택하여 최대 평균 손실을 보장하는 것입니다.

매트릭스 게임에서 전략을 어떻게 선택합니까?

지불 매트릭스를 다시 살펴보겠습니다.

먼저, 첫 번째 플레이어가 다음을 사용하면 승리할 금액을 결정해 보겠습니다. 나순전한 전략. 첫 번째 플레이어가 사용하는 경우 나순수 전략이라면, 두 번째 플레이어가 첫 번째 플레이어의 보상이 최소화되는 순수한 전략을 사용할 것이라고 가정하는 것이 논리적입니다. 차례로, 첫 번째 플레이어는 그에게 최대의 승리를 제공할 수 있는 순수한 전략을 사용할 것입니다. 이러한 조건에 따라 첫 번째 플레이어의 승리를 다음과 같이 표시합니다. V1 , 라고 불리는 최대 상금 또는 게임의 최저 가격 .

~에 이 값에 대해 첫 번째 플레이어는 다음과 같이 진행해야 합니다. 각 줄에서 최소 요소의 값을 기록하고 그 중에서 최대 요소를 선택합니다. 따라서 첫 번째 플레이어의 상금은 최소의 최대 금액이 됩니다. 따라서 이름은 최대 승리입니다. 이 요소의 줄 번호는 첫 번째 플레이어가 선택한 순수 전략의 번호가 됩니다.

이제 두 번째 플레이어가 다음을 사용하면 손실 금액을 결정해 보겠습니다. 제이번째 전략. 이 경우 첫 번째 플레이어는 두 번째 플레이어의 손실이 최대가 되는 자신만의 순수 전략을 사용합니다. 두 번째 플레이어는 자신의 손실이 최소화되는 순수한 전략을 선택해야 합니다. 두 번째 플레이어의 손실을 다음과 같이 표시합니다. V2 , 라고 불리는 최소최대 손실 또는 게임의 최고 가격 .

~에 게임 가격에 대한 문제 해결 및 전략 결정 두 번째 플레이어에 대해 이러한 값을 결정하려면 다음과 같이 진행하십시오. 각 열에서 최대 요소의 값을 기록하고 그 중에서 최소값을 선택합니다. 따라서 두 번째 플레이어의 손실은 최대의 최소가 됩니다. 따라서 이름은 Minimax Win입니다. 이 요소의 열 번호는 두 번째 플레이어가 선택한 순수 전략의 번호가 됩니다. 두 번째 플레이어가 "minimax"를 사용하면 첫 번째 플레이어의 전략 선택에 관계없이 그는 다음보다 더 많이 잃지 않을 것입니다. V2 단위.

예시 1.

행의 가장 작은 요소 중 가장 큰 요소는 2입니다. 이는 게임의 낮은 가격이며 첫 번째 행이 이에 해당하므로 첫 번째 플레이어의 최대 전략이 첫 번째입니다. 열의 가장 큰 요소 중 가장 작은 요소는 5입니다. 이는 게임의 상위 가격이고 두 번째 열은 이에 해당하므로 두 번째 플레이어의 미니맥스 전략은 두 번째입니다.

이제 게임의 최저 가격과 최고 가격, 최대값과 최소값 전략을 배웠으므로 이러한 개념을 공식적으로 정의하는 방법을 배울 차례입니다.

따라서 첫 번째 플레이어의 보장된 승리는 다음과 같습니다.

첫 번째 플레이어는 최소 상금 중 최대를 얻을 수 있는 순수한 전략을 선택해야 합니다. 이 이득(최대값)은 다음과 같이 표시됩니다.

첫 번째 플레이어는 두 번째 플레이어의 손실이 최대가 되도록 순수 전략을 사용합니다. 이 손실은 다음과 같이 표시됩니다.

두 번째 플레이어는 손실이 최소화되도록 순수한 전략을 선택해야 합니다. 이 손실(최소최대)은 다음과 같이 표시됩니다.

같은 시리즈의 또 다른 예입니다.

예시 2.보수 행렬이 있는 행렬 게임이 주어지면

첫 번째 플레이어의 최대화 전략, 두 번째 플레이어의 최소최대화 전략, 게임의 낮은 가격과 높은 가격을 결정합니다.

해결책. 지불 매트릭스 오른쪽에는 행의 가장 작은 요소를 기록하고 최대값을 기록하며, 매트릭스 아래에는 열의 가장 큰 요소인 최소값을 선택합니다.

라인의 가장 작은 요소 중 가장 큰 것은 3입니다. 이것은 게임의 낮은 가격이고 두 번째 라인은 이에 해당하므로 첫 번째 플레이어의 최대 전략은 두 번째입니다. 열의 가장 큰 요소 중 가장 작은 요소는 5입니다. 이는 게임의 상위 가격이고 첫 번째 열은 이에 해당하므로 두 번째 플레이어의 미니맥스 전략이 첫 번째입니다.

매트릭스 게임의 안장점

게임의 상한 가격과 하한 가격이 동일하면 매트릭스 게임에 안장점이 있는 것으로 간주됩니다. 반대의 경우도 마찬가지입니다. 매트릭스 게임에 안장점이 있는 경우 매트릭스 게임의 상한 가격과 하한 가격은 동일합니다. 해당 요소는 행에서 가장 작고 열에서 가장 크며 게임 가격과 같습니다.

따라서 , then 은 첫 번째 플레이어의 최적 순수 전략이고, 두 번째 플레이어의 최적 순수 전략입니다. 즉, 동일한 전략 쌍을 사용하여 동일한 낮은 게임 가격과 높은 게임 가격을 달성합니다.

이 경우 매트릭스 게임은 순수 전략에 대한 해결책을 가지고 있습니다 .

예시 3.보수 행렬이 있는 행렬 게임이 주어지면

게임의 낮은 가격은 게임의 높은 가격과 일치합니다. 따라서 게임의 가격은 5입니다. 즉 . 게임의 가격은 게임의 가치와 동일합니다. 안장 포인트. 첫 번째 플레이어의 맥신 전략은 두 번째 순수 전략이고, 두 번째 플레이어의 미니맥스 전략은 세 번째 순수 전략입니다. 이 매트릭스 게임은 순수한 전략으로 솔루션을 제공합니다.

매트릭스 게임 문제를 직접 해결하고 해결책을 살펴보세요.

예시 4.보수 행렬이 있는 행렬 게임이 주어지면

게임의 최저 가격과 최고 가격을 찾아보세요. 이 매트릭스 게임에 안장 지점이 있나요?

최적의 혼합 전략을 갖춘 매트릭스 게임

대부분의 경우 매트릭스 게임에는 안장점이 없으므로 해당 매트릭스 게임에는 순수 전략에 대한 솔루션이 없습니다.

그러나 최적의 혼합 전략에는 솔루션이 있습니다. 이를 찾으려면 경험을 바탕으로 어떤 전략이 더 바람직한지 추측할 수 있도록 게임이 충분한 횟수만큼 반복된다고 가정해야 합니다. 따라서 결정은 확률과 평균(수학적 기대)의 개념과 관련이 있습니다. 최종 솔루션에는 안장점의 유사점(즉, 게임의 최저 가격과 최고 가격의 동일성)과 그에 상응하는 전략의 유사점이 모두 있습니다.

따라서 첫 번째 플레이어가 최대 평균 승리를 얻고 두 번째 플레이어가 최소 평균 손실을 얻으려면 일정 확률로 순수 전략을 사용해야 합니다.

첫 번째 플레이어가 확률이 있는 순수 전략을 사용하는 경우 , 그 다음 벡터 혼합된 첫 번째 플레이어 전략이라고 합니다. 즉 순수 전략의 '혼합'이다. 이 경우 이러한 확률의 합은 1과 같습니다.

두 번째 플레이어가 확률이 있는 순수 전략을 사용하는 경우 , 그 다음 벡터 두 번째 플레이어 혼합 전략이라고 합니다. 이 경우 이러한 확률의 합은 1과 같습니다.

첫 번째 플레이어가 혼합 전략을 사용하는 경우 피, 그리고 두 번째 플레이어 - 혼합 전략 큐그렇다면 말이 되는군요 기대값 첫 번째 플레이어의 승리(두 번째 플레이어의 패배). 이를 찾으려면 첫 번째 플레이어의 혼합 전략(1행 행렬이 됨)의 벡터, 보수 행렬 및 벡터를 곱해야 합니다. 혼합 전략두 번째 플레이어(단일 열 매트릭스가 됨):

실시예 5.보수 행렬이 있는 행렬 게임이 주어지면

첫 번째 플레이어의 혼합 전략이 이고 두 번째 플레이어의 혼합 전략이 이면 첫 번째 플레이어의 승리(두 번째 플레이어의 패배)에 대한 수학적 기대치를 결정합니다.

해결책. 첫 번째 플레이어의 승리(두 번째 플레이어의 패배)에 대한 수학적 기대 공식에 따르면, 이는 첫 번째 플레이어의 혼합 전략 벡터, 지불 매트릭스 및 두 번째 플레이어의 혼합 전략 벡터의 곱과 같습니다.

첫 번째 플레이어는 게임이 충분한 횟수만큼 반복되면 최대 평균 보상을 제공하는 혼합 전략이라고 합니다.

최적의 혼합 전략 두 번째 플레이어는 게임이 충분한 횟수만큼 반복되면 최소 평균 손실을 제공하는 혼합 전략이라고 합니다.

순수 전략의 경우 maximin 및 minimax 표기법과 유사하게 최적의 혼합 전략은 다음과 같이 표시됩니다. 수학적 기대즉, 첫 번째 플레이어의 승리와 두 번째 플레이어의 손실의 평균입니다.

이 경우 해당 기능에 대해 이자형 안장점이 있어요 , 이는 평등을 의미합니다.

최적의 혼합전략과 안장점을 찾기 위해서는, 즉 혼합 전략으로 매트릭스 게임을 해결하다 , 우리는 매트릭스 게임을 문제로 줄여야 합니다 선형 프로그래밍, 즉 최적화 문제에 대해 대응하는 선형 계획법 문제를 해결합니다.

매트릭스 게임을 선형 계획법 문제로 축소

혼합 전략의 매트릭스 게임을 해결하려면 직선을 구성해야 합니다. 선형 프로그래밍 문제그리고 이중 작업. 쌍대 문제에서는 제약 조건의 변수 계수, 자유 항 및 목적 함수의 변수 계수를 저장하는 확장 행렬이 전치됩니다. 이 경우 원래 문제의 목표 함수의 최소값은 이중 문제의 최대값과 일치합니다.

직접 선형 계획법 문제의 목표 함수:

직접 선형 계획법 문제의 제약 조건 시스템:

쌍대 문제의 목표 함수는 다음과 같습니다.

이중 문제의 제한 시스템:

직접 선형 계획법 문제에 대한 최적 계획은 다음과 같이 표시됩니다.

이중 문제에 대한 최적 계획은 다음과 같이 표시됩니다.

해당 최적 계획의 선형 형태를 다음과 같이 나타냅니다.

최적 계획의 해당 좌표의 합으로 찾아야 합니다.

이전 단락의 정의와 최적 계획의 좌표에 따라 첫 번째와 두 번째 플레이어의 다음 혼합 전략이 유효합니다.

이론 수학자들은 다음을 증명했습니다. 게임 가격 최적 계획의 선형 형태를 통해 다음과 같이 표현됩니다.

즉, 최적계획의 좌표합의 역수이다.

우리 실무자들은 혼합 전략의 매트릭스 게임을 해결하는 데에만 이 공식을 사용할 수 있습니다. 좋다 최적의 혼합 전략을 찾기 위한 공식 첫 번째와 두 번째 플레이어는 각각 다음과 같습니다.

두 번째 요소는 벡터입니다. 최적의 혼합 전략은 이전 단락에서 이미 정의한 대로 벡터이기도 합니다. 따라서 숫자(게임 가격)에 벡터(최적 계획의 좌표 포함)를 곱하면 벡터도 얻을 수 있습니다.

실시예 6.보수 행렬이 있는 행렬 게임이 주어지면

게임 가격 알아보기 V최적의 혼합 전략과 .

해결책. 우리는 이 매트릭스 게임에 해당하는 선형 프로그래밍 문제를 만듭니다.

우리는 직접적인 문제에 대한 해결책을 얻습니다.

발견된 좌표의 합으로 최적 계획의 선형 형태를 찾습니다.

목차 1 일반 정보 2 1.1 게임. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.2 이동. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.3 전략. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.4 매트릭스 게임. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 2 트레일 포인트. 순수 전략 7 2.1 예. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 예시 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 예시 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 3 혼합 전략 9 3.1 게임 2×2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 3.1.1 예시. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 예시 3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 예시 4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 3.1.2 기하학적 해석. . . . . . . . . . . . . . . . . . . . 12 3.2 게임 2×n 및 m×2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 예시 5. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 1 1. 게임이론의 일반정보 1.1. 게임 게임 이론은 수학적 이론갈등 상황, 즉 서로 다른 목표를 추구하는 둘 이상의 당사자의 이해관계가 충돌하는 상황. 게임은 갈등 상황, 규제 특정 규칙, 이는 다음을 나타내야 합니다: 참가자의 행동에 대해 가능한 옵션 게임의 정량적 결과 또는 주어진 일련의 동작으로 인해 발생하는 지불(승리, 패배) 상대방의 행동에 대한 양측의 정보의 양. 복식 게임은 두 명의 파티(두 명의 선수)만이 참가하는 게임입니다. 제로섬 짝 게임은 지불 합계가 0인 짝 게임입니다. 한 플레이어의 손실은 두 번째 플레이어의 이득과 동일합니다. 지불 기능의 가치에 대한 각 플레이어의 태도에 따라 쌍을 이루는 게임은 다음과 같이 세분화됩니다. 제로섬 쌍 게임(적대) - 지불 금액이 0인 쌍 게임, 즉 한 플레이어의 손실은 두 번째 플레이어의 이득과 동일합니다. 비적대적 게임 - 복식 게임플레이어는 서로 다르지만 직접적으로 반대되는 목표는 아닙니다. 2 1.2. 이동 이동 - 게임 규칙에 따라 제공되는 작업 중 하나를 선택하고 이 선택을 구현합니다. 이동에는 두 가지 유형이 있습니다. 개인 이동 - + 의식적인 선택게임 규칙에 따라 제공되는 작업 중 하나 + 이 선택의 구현 무작위 이동 - 무작위 이동은 플레이어의 결정이 아닌 임의 선택 메커니즘에 의해 수행되는 여러 가능성 중에서 선택하는 것입니다. 아래에서는 개인적인 움직임만 포함하는 제로섬 짝 게임을 고려합니다. 양측에는 상대방의 행동에 대한 정보가 부족합니다. 3 1.3. 전략 플레이어의 전략은 게임 중에 발생하는 상황에 따라 이 플레이어의 각 개인 움직임에 대한 행동 선택을 결정하는 일련의 규칙입니다. 가능한 전략의 수에 따라 게임은 유한과 무한으로 구분됩니다. 끝없는 게임- 적어도 한 명의 플레이어가 참여하는 게임 무한한 수전략. 유한 게임은 각 플레이어가 유한한 수의 전략만 가지고 있는 게임입니다. 모든 플레이어의 연속 이동 횟수에 따라 게임이 단일 이동, 다중 이동 또는 위치 지정으로 구분됩니다. + 1턴 게임에서는 각 플레이어가 가능한 옵션 중에서 하나만 선택하고 게임의 결과를 결정합니다. + 다중 이동 또는 위치 게임은 시간이 지남에 따라 개발되어 일련의 연속 단계를 나타내며 각 단계는 플레이어 중 한 사람의 이동과 이에 따른 상황 변화 후에 발생합니다. 1턴 게임에서는 각 플레이어가 다음 중에서 하나만 선택할 수 있습니다. 가능한 옵션그리고 게임의 결과를 결정합니다. 플레이어의 최적 전략은 게임이 여러 번 반복될 때 해당 플레이어에게 가능한 최대 평균 승리(또는 동일한 의미로 최소 평균 손실)를 제공하는 전략입니다. 게임 이론에서 모든 권장 사항은 플레이어의 합리적인 행동을 가정하여 이루어집니다. 모든 갈등 상황에서 불가피한 플레이어의 오산과 실수, 흥분과 위험 요소는 게임 이론에서 고려되지 않습니다. 4 1.4. 매트릭스 게임 매트릭스 게임은 1회 이동 유한 제로섬 게임입니다. 매트릭스 게임은 이론적인 게임입니다. 게임 모델정반대의 목표를 달성하기 위해 상대방이 유한한 수 중에서 하나를 선택(이동)하는 갈등 상황 가능한 방법행동 선택한 행동 방법(전략)에 따라 달성된 결과가 결정됩니다. 예를 살펴보겠습니다. 두 명의 플레이어 A와 B가 있다고 가정합니다. 그 중 한 명은 m개의 가능한 전략 A1, A2, ...Am 중에서 i번째 전략을 선택할 수 있고 두 번째는 선택합니다. j번째 전략가능한 전략 B1, B2, ...Bm에서. 결과적으로 첫 번째 플레이어는 aij 값을 획득하고 두 번째 플레이어는 이 값을 잃습니다. 숫자 aij로부터 우리는 행렬   a11 a11 · · · a1n  a21 a22 · · · a2n    A = (aij) =  .. .. ..   를 생성합니다. . . .  am1 am2 · · · amn 행렬 A = (aij), i = 1, m, j = 1, n을 보수 행렬 또는 m × n 게임 행렬이라고 합니다. 이 행렬에서 행은 항상 승리한(최대화하는) 플레이어 A, 즉 자신의 승리를 극대화하기 위해 노력하는 플레이어의 전략에 대한 것입니다. 패배한 플레이어 B, 즉 효율성 기준을 최소화하려고 노력하는 플레이어의 전략에 대해 열이 할당됩니다. 게임 정규화는 위치 게임을 게임에 의해 매트릭스 게임으로 줄이는 과정입니다. 정상적인 형태- 매트릭스 게임으로 축소된 위치 게임 위치 다중 이동 게임은 상대방이 목표를 달성하기 위해 순차적으로 하나의 선택(이동)을 내리는 갈등 상황에 대한 게임 이론 모델이라는 점을 기억합시다. 이 상황이 전개되는 모든 단계에서 가능한 행동 방침은 유한합니다. 게임의 해결책은 두 플레이어의 최적의 전략을 찾아 게임의 가격을 결정하는 것이며, 게임의 가격은 플레이어의 예상 이익(손실)입니다. 게임에 대한 해결책은 순수 전략(플레이어가 하나의 단일 전략을 따라야 하는 경우) 또는 혼합 전략(플레이어가 특정 확률로 두 개 이상의 순수 전략을 사용해야 하는 경우)에서 찾을 수 있습니다. 이 경우 후자를 활성이라고 합니다. 5 한 플레이어의 혼합 전략은 벡터이며, 각 구성 요소는 해당 순수 전략 플레이어의 사용 빈도를 나타냅니다. 게임의 최대값 또는 낮은 가격 - 숫자 α = 최대 min aij i j 최대값 전략(라인) - 플레이어가 최소 상금을 최대화하기 위해 선택한 전략입니다. 분명히 가장 신중한 최대화 전략을 선택할 때 플레이어 A는 (상대방의 행동에 관계없이) 최소 α의 보상을 보장받습니다. Maximin 또는 게임의 최고 가격 - 숫자 β = min max aij j i Minimax 전략(열) - 플레이어가 최대 손실을 최소화하기 위해 선택한 전략입니다. 분명히 가장 신중한 미니맥스 전략을 선택할 때 플레이어 B는 어떤 상황에서도 플레이어 A가 β보다 더 많은 승리를 거두는 것을 허용하지 않습니다. 게임의 낮은 가격은 항상 게임의 높은 가격을 초과하지 않습니다. α = max min aij 6 min max aij = β i j j i 정리 1(매트릭스 게임 이론의 주요 정리) 모든 유한 게임에는 혼합 전략 영역에서 적어도 하나의 솔루션이 있습니다. 6 2. 안장 포인트가 있는 게임. 순수 전략의 해법 안장점이 있는 게임은 다음과 같은 게임입니다. α = max min aij = min max aij = β i j j i 안장점이 있는 게임의 경우, 해결책을 찾는 것은 최적의 최대화 및 최소최대화 전략을 선택하는 것으로 구성됩니다. 게임의 순수 비용 - 일반적인 의미게임의 낮은 가격과 높은 가격 α=β=ν 2.1. 예 예 1 행렬   8 4 7 A= 6 5 9  7 7 8 해결책: 게임의 상한 가격과 하한 가격을 결정하는 게임의 순수 전략에서 해결책을 찾습니다. 이를 위해 우리는 숫자 aij의 최소값을 찾습니다. i번째 줄αi = 최소 aij j 및 숫자 aij의 최대값 j번째 열βj = max aij i 추가 열 형태로 오른쪽 결제 매트릭스 옆에 숫자 αi(행 최소값)를 작성하겠습니다. 추가 라인 형태로 행렬 아래에 숫자 βi(열 최대값)를 씁니다. αi 8 4 7 4 6 5 9 5 7 7 8 7 βj 8 7 9 7 숫자의 최대값 αi α = max αi = 7 i 및 최소 숫자 βj β = min βj = 7 j α = β - 게임에는 안장 지점이 있습니다. 플레이어의 최적 전략은 전략 A3이고, 플레이어 B의 최적 전략은 전략 B2입니다. 게임의 순 비용 ν = 7 예시 2 주어진 결제 매트릭스 :   2 2 1 1 2  0 1 1 1 1  A=  1 1 1 1 2   1 2 1 1 2 순수 전략으로 게임의 해결책을 찾습니다. 풀이: 2 2 1 1 2 1 0 1 1 1 1 0 1 1 1 1 2 1 1 2 1 1 2 1 βj 2 2 1 1 2 α = β = 1. 게임에는 6개의 안장 점이 있습니다. 최적의 전략은 다음과 같습니다: A1 및 B3 또는 B4 A3 및 B3 또는 B4 A4 및 B3 또는 B4 8 3. 혼합 전략의 게임 솔루션 α = β일 때. 전략을 선택할 때 두 플레이어 모두 상대방의 선택에 대한 정보가 없는 경우 게임에는 혼합 전략의 솔루션이 있습니다. SA = (p1, p2, ..., pm) - 플레이어 A의 혼합 전략, 전략 A1, A2, ..., Am에 확률 ∑ m p1, p2, ..., pm, pi = 1, pi > 0, i = 1, m i=1 SB = (q1, q2, ..., qn) - 플레이어 B의 혼합 전략으로, 전략 B1, B2, ..., Bm에 확률 ∑가 적용됩니다. n q1, q2 , ..., qm , qi = 1, qi > 0, i = 1, n i=1 If: SA*가 플레이어 A의 최적 전략이고, SB*가 플레이어 B의 최적 전략이면, 게임 비용은 ∑ n ∑ m ν = aij · p*i · qi* j=1 i=1 다음 정리는 2 × 2, 2 × n, m × 게임에 대한 해를 구하는 방법에 대한 질문에 답합니다. 2 정리 2(2 × 2, 2 × n, m × 2 게임에 대한 해를 찾는 방법). 플레이어 중 한 명이 최적의 혼합 전략을 사용하는 경우 두 번째 플레이어가 최적의 혼합 전략(순수 전략 포함)에 포함된 전략을 사용할 확률에 관계없이 그의 보상은 게임 비용 ν와 같습니다. 9 3.1. 게임 2 × 2 다음 행렬을 사용하는 2 × 2 게임을 생각해 보십시오. () a11 a21 a21 a22 게임에 순수 전략에는 해결책이 없습니다. 최적의 전략 SA*와 SB*를 찾아보겠습니다. 먼저, SA* = (p*1, p*2) 전략을 정의합니다. 정리에 따르면, 당사자 A가 전략 ν를 고수한다면 당사자 B의 행동 과정에 관계없이 보상은 ν 플레이 비용과 동일하게 유지됩니다. 결과적으로, A 측이 최적의 전략 SA* = (p*1, p*2)을 고수한다면 B 측은 보상을 변경하지 않고 모든 전략을 적용할 수 있습니다. 그런 다음 플레이어 B가 순수 전략 B1 또는 B2를 사용하면 플레이어는 게임 비용과 동일한 평균 보상을 받게 됩니다. a11 p*1 + a21 p*2 = ν ← 전략 B1의 경우 a12 p*1 + a22 p* 2 = ν ← 전략 B2의 경우 p*1 + p*2 = 1이라는 점을 고려하면: p*1 = a2 2−a2 1 a11 +a22 −a12 −a21 p*2 = a1 1−a1 2 a11 +a22 −a12 −a21 게임 가격: a22 a11 − a12 a21 ν= a11 + a22 − a12 − a21 플레이어 B의 최적 전략은 유사하게 발견됩니다: SB* = (q1* , q2*). q1* + q2* = 1이라는 점을 고려하면: q1* = a2 2−a1 2 a11 +a22 −a12 −a21 q2* = a1 1−a2 1 a11 +a22 −a12 −a21 3. 1.1. 예 예 3 행렬 () −1 1 A= 1 −1 10 을 사용하여 게임에 대한 해를 구합니다. 해법: α= -1, β = 1, α ̸= β이므로 게임에 새들 포인트가 없습니다. 우리는 혼합 전략에서 해결책을 찾고 있습니다. p*와 q*에 대한 공식을 사용하여 p*1 = p*2 = 0.5 및 q1* = q2* = 0.5, ν = 0을 얻습니다. 따라서 SA* = (0.5, 0.5) SB* = (0.5, 0.5 ) 예 4 행렬 () 2 5 A= 6 4로 게임에 대한 해를 구합니다. 해법: α= 4, β = 5, α ̸= β이므로 게임에 새들 포인트가 없습니다. 우리는 혼합 전략에서 해결책을 찾고 있습니다. p*와 q*에 대한 공식을 사용하여 p*1 = 0.4, p*2 = 0.6 및 q1* = 0.2를 얻습니다. q2* = 0.8, ν = 4.4 따라서 SA* = (0.4, 0.6) SB* = ( 0.2, 0.8) 11 3.1.2. 기하학적 해석 2×2 게임은 간단한 기하학적 해석을 제공할 수 있습니다. 가로축의 단일 섹션을 취하고 각 지점을 일부 혼합 전략 S = (p1, p2) = (p1, 1 − p1)과 연관시키고 전략 A1의 확률 p1은 다음과 같습니다. SA가 섹션의 오른쪽 끝을 가리키고 확률 p2, 전략 A2 - 왼쪽 끝까지의 거리입니다. .y .I .I I .B1′ .N .B1 .a21 .a11 .I I .I .* .x .P2 .SA* .P1* 특히 섹션의 왼쪽 끝(가로좌표 = 0인 지점)이 해당됩니다. 전략 A1, 세그먼트 오른쪽 끝(x = 1) - 전략 A2 세그먼트 끝에서 x축에 수직인 두 개의 수직선이 복원됩니다: 축 I − I - 전략 A1에 대한 보상이 연기됩니다. 축 II − II - 전략 A2에 대한 보상이 연기되고 플레이어 B가 전략 B1을 적용하도록 합니다. 축 I − I 및 II − II에 각각 좌표 a11 및 a21이 있는 점을 제공합니다. 이 점들을 지나 직선 B1 − B1'을 그립니다. 혼합 전략 SA = (p1, p2)에 대해 플레이어의 보상은 세그먼트를 p2:p1 비율로 나누는 x축의 SA 점에 해당하는 직선 B1 − B1' 위의 점 N에 의해 결정됩니다. 분명히, 전략 B2의 보수를 결정하는 직선 B2 − B2'는 정확히 같은 방식으로 구성될 수 있습니다. 12 .y .I .I I .B2 .N .a21 .B2′ a . 22 .I I .I .* .x .P2 .SA* .P1* 최적의 전략 SA*를 찾는 것이 필요합니다. 즉, 플레이어 A의 최소 보상(플레이어 B가 그에게 최악의 행동을 제공한 경우)이 최대값으로 바뀔 것입니다. 이를 위해 전략 B1, B2에 대해 플레이어 A의 보수에 대한 하한을 구성합니다. 파선 B1 N B2' ;. 이 경계에는 혼합 전략에 대한 플레이어 A의 최소 보수, 즉 N 지점이 있으며, 이 보수는 최대치에 도달하고 게임의 결정과 가격을 결정합니다. .y .I .I I .B2 .B1′ .N .B1 .B2′ .I I .I .* .x .P2 . A* S . 1* P 점 N의 세로 좌표는 게임 비용 ν에 불과하고 가로 좌표는 *2와 같으며 세그먼트 오른쪽 끝까지의 거리는 *1과 같습니다. 점 SA*에서 세그먼트 끝까지의 거리는 플레이어 A의 최적 혼합 전략의 전략 A2 및 A1의 확률 *2 및 *1과 같습니다. 이 경우 게임의 해결책은 교차점에 의해 결정됩니다. 전략 B1과 B2의 포인트. 아래는 플레이어의 최적 전략이 순수 전략 A2인 경우입니다. 여기서 전략 A2(모든 적 전략에 대해)는 전략 A1보다 수익성이 더 높습니다. 13 .y .y .I .I I .I I. I .B2′ . 1′ B .B1′ B . 2 .B2′ B . 2 .B1 .ν = a21 .B1 .ν = a21 I. I I. I .I . .x .I . .엑스. 2* P . A*S = A2. 2* P . A* S = A2 오른쪽은 플레이어 B가 명백히 수익성이 없는 전략을 가지고 있는 경우를 보여줍니다. 기하학적 해석을 통해 게임의 낮은 가격 α와 높은 가격 β .y .I .I I .B2를 시각화할 수도 있습니다. .B1′ .N .B1 . B2′ .β = a21 .α = a22 .I I .I .* .x .P2 . A* S . 1* P 동일한 그래프에서 플레이어 B의 최적 전략에 대한 기하학적 해석도 제공할 수 있습니다. 최적의 혼합 전략 SB* = (q1*, q2*)의 전략 B1의 점유율 q1*이 세그먼트 KB1 길이의 합에 대한 세그먼트 KB2 길이의 비율과 동일하다는 것을 쉽게 확인할 수 있습니다. I − I 축의 KB2: .y .I .I I .B2 . B1′ .N .K .L .B1 .B2′ .I I .I .* .x .P2 . A* S . 1* P 14 KB2 q1* = KB2 + KB1 또는 LB2′ q1* = LB2′ + LB1′ 최적의 전략 SB* = (q1* , q2*)는 선수 B와 B를 교체하면 다른 방법으로 찾을 수 있습니다. 상금 하한의 최대 대신 상한의 최소를 고려하십시오. .y .I .I I .A2 .A'1 .N .A1 .A'2 .I I .I . .x .q2* . B* S.q1* 15 3.2. 2 × n 및 m × 2 게임 2 × n 및 m × 2 게임의 해법은 다음 정리에 기초합니다. 정리 3. 모든 유한 게임 m × n은 각 측의 활성 전략 수가 m과 n 중 가장 작은 숫자를 초과하지 않는 해를 가집니다. 이 정리에 따르면 2×n 게임에는 항상 각 플레이어가 최대 2개의 활성 전략을 갖는 솔루션이 있습니다. 이러한 전략을 찾으면 2×n 게임은 2×2 게임으로 바뀌며, 이는 초보적인 방법으로 해결할 수 있습니다. 활성 전략을 찾는 것은 그래픽으로 수행할 수 있습니다. 1) 그래픽 해석이 구성됩니다. 2) 상금의 하한선이 결정됩니다. 3) 두 번째 플레이어의 두 가지 전략은 보상 하한에서 식별되며, 이는 최대 세로 좌표 지점에서 교차하는 두 개의 선에 해당합니다(이 지점에서 두 개 이상의 선이 교차하는 경우 임의의 쌍이 선택됩니다). 는 플레이어 B의 활성 전략을 나타냅니다. 따라서 2 × n 게임은 2 × 2 게임으로 축소됩니다. m × 2 게임도 풀 수 있지만, 보상의 하한이 아니라 상한이 다음과 같습니다. 구성되어 있으며 최대 값은 아니지만 최소값을 추구합니다. 예 5 게임에 대한 해결책 찾기 () 7 9 8 A= 10 6 9 해결책: 기하학적 방법을 사용하여 활성 전략을 선택합니다. 직선 B1 − B1', B2 − B2' 및 B3 − B3'은 전략 B1, B2, B3에 해당합니다. 점선 B1 N B2는 플레이어의 상금 하한선입니다. 게임에는 S*A = (23, 31)이라는 솔루션이 있습니다. S*B = (0.5; 0.5; 0); v = 8. 16 .y .I .I I . 1′ BB . 2 .B3′ .N .B3 .B1 .B2′ .I I .I . .엑스. 2* P . A* S . 1* P 17 인덱스 게임, 2 이동, 3 2 × 2, 10 개인, 3 2 × 2, 9 무작위, 3 기하학, 12 순 게임 가격, 7 예, 10 2 × n, 9, 16 m × 2, 9 , 16개 무한, 4개 정규형, 5개 유한, 4개 다중 이동, 4개 단일 이동, 4개 행렬, 5개 쌍, 2개 제로섬, 2개 길항, 2개 비길항, 2해, 5개 혼합 전략, 5 , 순수 전략 9개, 안장점 포함 5개, 가격 7개, 상위 5개, 하위 6개, 순수 6개, 최대값 7개, 게임 매트릭스 6개, 보수 5개, 미니맥스 5개, 게임 정규화 5개, 전략 5개, 최대값 4개, 미니맥스 6개, 6개 최적, 4 혼합, 5 게임 이론, 2 18

알아채다!결정은 당신의 것입니다 특정 작업비슷하게 보일 것이다 이 예, 아래 제시된 모든 표, 설명 텍스트 및 그림을 포함하지만 원본 데이터를 고려합니다...

일:
매트릭스 게임은 다음과 같은 보수 매트릭스로 제공됩니다.

전략 "B"

전략 "A"

비 1

비 2

A 1

A 2

3

2

매트릭스 게임에 대한 해결책을 찾으십시오. 즉,
- 게임의 최고 가격을 찾아보세요.
- 게임 가격이 저렴합니다.
- 정가계략;
- 플레이어의 최적 전략을 나타냅니다.
- 가져오다 그래픽 솔루션(기하학적 해석), 필요한 경우.

1 단계

게임의 낮은 가격을 결정합시다 - α

최저 게임 가격α는 게임 전체에서 단 하나의 전략(이 전략을 "순수"라고 함)을 사용하는 경우 합리적인 상대와의 게임에서 우리가 보장할 수 있는 최대 승리입니다.

결제 매트릭스의 각 행에서 찾아보겠습니다. 최저한의요소를 추가 열에 작성합니다(선택됨). 노란색표 1 참조).

그럼 우리가 찾아볼게 최고추가 열의 요소(별표로 표시)는 게임의 더 낮은 가격이 됩니다.

1 번 테이블

전략 "B"

전략 "A"

비 1

비 2

행 최소값

A 1

3 *

A 2

3

2

3

2

우리의 경우 게임의 최저 가격은 다음과 같습니다. α = 3, 3보다 나쁘지 않은 승리를 보장하려면 전략 A 1을 고수해야 합니다.

2 단계

게임의 최고 가격을 결정합시다 - β

최고 게임 가격β는 플레이어 B가 게임 내내 단 하나의 전략만 사용하는 경우 합리적인 상대와의 게임에서 자신이 보장할 수 있는 최소 손실입니다.

결제 매트릭스의 각 열에서 찾아보겠습니다. 최고요소를 선택하고 아래 추가 줄에 작성합니다(노란색으로 강조 표시됨, 표 2 참조).

그럼 우리가 찾아볼게 최저한의추가 라인의 요소(더하기로 표시)가 게임의 최고 가격이 됩니다.

표 2

전략 "B"

전략 "A"

비 1

비 2

행 최소값

A 1

3 *

A 2

3

2

우리의 경우 게임의 최고 가격은 다음과 같습니다. β = 5, 그리고 5보다 나쁘지 않은 손실을 보장하려면 상대(플레이어 "B")는 전략 B 2를 준수해야 합니다.

단계:3
바닥을 비교해 볼까요? 최고 가격게임, 이 작업에서는 서로 다릅니다. α ≠ β, 보수 행렬에는 안장점이 포함되어 있지 않습니다. 이는 게임이 순수한 미니맥스 전략에는 해결책이 없지만 혼합 전략에는 항상 해결책이 있다는 것을 의미합니다.

혼합 전략, 이는 특정 확률(빈도)을 사용하여 무작위로 교대하는 순수 전략입니다.

플레이어 "A"의 혼합 전략을 나타냅니다.

에스 A=

여기서 B 1, B 2 는 플레이어 B의 전략이고 q 1 , q 2 는 각각 이러한 전략이 적용될 확률이며 q 1 + q 2 = 1입니다.

플레이어 "A"를 위한 최적의 혼합 전략은 그에게 최대 보상을 제공하는 전략입니다. 따라서 "B"의 경우 최소 손실이 발생합니다. 이러한 전략은 지정됩니다. 에스 A* 및 에스 B* 각각. 한 쌍의 최적 전략이 게임에 대한 솔루션을 형성합니다.

일반적으로 플레이어의 최적 전략에는 모든 초기 전략이 포함되지 않고 일부만 포함될 수 있습니다. 그러한 전략을 소위 적극적인 전략.

단계:4

어디: 피 1 , 피 2 - 전략 A 1 및 A 2가 각각 적용되는 확률(빈도)

게임 이론에 따르면 플레이어 "A"가 최적의 전략을 사용하고 플레이어 "B"가 활성 전략의 틀 내에 남아 있으면 평균 보상은 변경되지 않고 게임 비용과 동일하다고 알려져 있습니다. V플레이어 "B"가 자신의 활성 전략을 어떻게 사용하는지에 관계없이. 그리고 우리의 경우에는 두 전략이 모두 활성화되어 있습니다. 그렇지 않으면 게임은 순수 전략에 대한 솔루션을 갖게 됩니다. 따라서 플레이어 "B"가 순수 전략 B 1을 사용한다고 가정하면 평균 보상은 다음과 같습니다. V될거야:

케이 11 피 1 + 케이 21 피 2 = v (1)

어디: 케이 ij - 지불 매트릭스의 요소입니다.

반면에 플레이어 "B"가 순수 전략 B 2를 사용한다고 가정하면 평균 보상은 다음과 같습니다.

케이 12 피 1 + 케이 22 피 2 = v (2)

방정식 (1)과 (2)의 왼쪽을 동일시하면 다음을 얻습니다.

k11p1 + k21p2 = k12p1 + k22p2

그리고 그 사실을 고려하면 피 1 + 피 2 = 1 우리는:

k 11 p 1 + k 21 (1 - p 1 ) = k 12 p 1 + k 22 (1 - p 1 )

전략 A 1의 최적 빈도를 쉽게 찾을 수 있는 경우:

피 1 =

케이 22 - 케이 21

케이 11 + 케이 22 - 케이 12 - 케이 21

(3)

이 작업에서는 다음을 수행합니다.

피 1 =

개연성 아르 자형 2 뺄셈으로 찾기 아르 자형 1 유닛에서:

피 2 = 1 - 피 1 =

어디: 큐 1 , 큐 2 - 전략 B 1 및 B 2가 각각 적용되는 확률(빈도)

게임 이론에 따르면 플레이어 "B"가 최적의 전략을 사용하고 플레이어 "A"가 활성 전략의 틀 내에 남아 있으면 평균 보상은 변경되지 않고 게임 비용과 동일하다고 알려져 있습니다. V플레이어 A가 자신의 활성 전략을 어떻게 사용하는지에 관계없이. 따라서 플레이어 "A"가 순수 전략 A 1을 사용한다고 가정하면 평균 보상은 다음과 같습니다. V될거야:

케이 11 q 1 + 케이 12 q 2 = v (4)

게임 가격부터 V 우리는 이미 그것을 알고 있고 그것을 고려하고 있습니다 큐 1 + 큐 2 = 1 , 전략 B 1의 최적 빈도는 다음과 같이 찾을 수 있습니다.

큐 1 =

V - 케이 12

케이 11 - 케이 12

(5)

이 작업에서는 다음을 수행합니다.

큐 1 =

개연성 큐 2 뺄셈으로 찾기 큐 1 유닛에서:

큐 2 = 1 - 큐 1 =

답변:

최저 게임 가격:

α =

최고 게임 가격:

β =

게임 가격:

V =

플레이어 A의 최적 전략:

에스 A*=

A 1

A 2

플레이어 "B"를 위한 최적의 전략:

에스 B*=

비 1

비 2

기하학적 해석(그래픽 솔루션):

고려된 게임에 기하학적 해석을 해보자. 단위 길이의 가로축의 단면을 취하고 그 양끝을 지나는 수직 직선을 그립니다. ㅏ 1 그리고 ㅏ 2 우리의 전략 A 1 및 A 2 에 해당합니다. 이제 플레이어 "B"가 전략 B 1을 사용할 것이라고 가정해 보겠습니다. 순수한 형태. 그런 다음 우리(플레이어 "A")가 순수 전략 A 1을 사용하면 보상은 3이 됩니다. 축에 해당 지점을 표시해 보겠습니다. ㅏ 1 .
순수 전략 A 2를 사용하면 보수는 6이 됩니다. 축에 해당 지점을 표시해 보겠습니다. ㅏ 2
(그림 1 참조). 분명히 A 1과 A 2 전략을 서로 다른 비율로 혼합하여 적용하면 좌표 (0, 3)과 (1, 6)이 있는 점을 통과하는 직선을 따라 승리가 변경됩니다. 이를 전략 B의 라인이라고 부르겠습니다. 1 (그림 .1에서 빨간색으로 표시). 주어진 선에 있는 임의의 점의 가로좌표는 확률과 같습니다. 피 2 (빈도) 전략 A 2를 적용하고 세로 좌표 - 결과 이득 케이 (그림 1 참조).

그림 1.
보수 그래프 케이 주파수에서 2페이지 , 적이 전략을 사용할 때 비 1.

이제 플레이어 "B"가 순수한 형태로 전략 B 2를 사용할 것이라고 가정해 보겠습니다. 그런 다음 우리(플레이어 "A")가 순수 전략 A 1을 사용하면 보수는 5가 됩니다. 순수 전략 A 2를 사용하면 보수는 3/2이 됩니다(그림 2 참조). 마찬가지로 전략 A 1과 A 2를 서로 다른 비율로 혼합하면 좌표 (0, 5)와 (1, 3/2)가 있는 점을 통과하는 직선을 따라 승리가 변경됩니다. 이를 전략 라인이라고 부르겠습니다. ㄴ 2. 이전 사례에서와 마찬가지로 이 선의 임의 지점의 가로 좌표는 전략 A 2를 적용하는 확률과 동일하며 세로 좌표는 결과 이득이지만 전략 B 2에만 해당됩니다(그림 2 참조).

그림 2.
V 그리고 최적의 빈도 2페이지 플레이어를 위해 "ㅏ".

안에 실제 게임, 합리적인 플레이어 "B"가 자신의 모든 전략을 사용하면 우리의 승리는 그림 2에 빨간색으로 표시된 파선을 따라 변경됩니다. 이 줄은 소위를 정의합니다 상금 하한선. 분명 가장 최고점이 파선은 우리의 최적 전략에 해당합니다. 이 경우 이는 전략 B1과 B2의 선이 교차하는 지점입니다. 주파수를 선택하는 경우 피 2 가로좌표와 같으면 이득은 변경되지 않고 동일하게 유지됩니다. V 또한 플레이어 "B"의 모든 전략에 대해 이는 우리가 보장할 수 있는 최대값이 됩니다. 빈도(확률) 피 2 , 이 경우 최적의 혼합 전략에 해당하는 빈도입니다. 그런데 그림 2에서 주파수를 볼 수 있습니다. 피 1 최적의 혼합 전략인 는 세그먼트의 길이입니다. 피 2 ; 1] x 축에. (왜냐하면 피 1 + 피 2 = 1 )

완전히 유사한 추론을 사용하여 그림 3에 표시된 것처럼 플레이어 "B"에 대한 최적의 전략 빈도를 찾을 수 있습니다.

그림 3.
게임 가격의 그래픽 결정 V 최적의 주파수 q 2 플레이어를 위해 "안에".

그에게만 소위 손실의 상한(빨간색 파선) 가장 많이 찾아보세요 낮은 지점, 왜냐하면 플레이어 "B"의 목표는 손실을 최소화하는 것입니다. 동일한 주파수 값 큐 1 , 이것은 세그먼트의 길이입니다 [ 큐 2 ; 1] x 축에.

인기있는 미국 블로그 Cracked에서.

게임 이론은 최선의 움직임을 만드는 방법을 연구하고 결과적으로 다른 플레이어의 파이 중 일부를 잘라서 최대한 많은 승리 파이를 얻는 방법에 관한 것입니다. 다양한 요소를 분석하고 논리적으로 균형 잡힌 결론을 도출하는 방법을 가르쳐줍니다. 숫자 다음, 알파벳 이전에 공부해야 할 것 같아요. 단순히 너무 많은 사람들이 받아들이기 때문에 중요한 결정, 직관, 비밀 예언, 별의 위치 및 기타 유사한 것들을 기반으로 합니다. 지금까지 게임이론을 철저하게 공부했으니 이제 그 기본에 대해 말씀드리고 싶습니다. 아마도 이것이 추가 될 것입니다 상식당신의 삶에.

1. 죄수의 딜레마

Berto와 Robert는 도난당한 차량을 적절하게 사용하여 탈출하지 못한 후 은행 강도 혐의로 체포되었습니다. 경찰은 그들이 은행을 털었다는 것을 증명할 수 없었지만 도난당한 차에서 그들을 적발했습니다. 그들은 서로 다른 방으로 끌려갔고 각각 공범자를 넘겨주고 10년 동안 감옥에 보내고 스스로 석방되는 거래를 제안 받았습니다. 그러나 둘 다 서로 배반하면 각각 7년의 형을 받게 될 것입니다. 아무도 아무 말도 하지 않으면 둘 다 자동차 절도 혐의로 2년 동안 감옥에 갇히게 됩니다.

Berto가 묵비권을 행사했지만 Robert가 그를 신고하면 Berto는 10년 동안 감옥에 갇히고 Robert는 석방됩니다.

각 죄수는 플레이어이며 모든 사람의 이익은 "공식"(둘 다 얻는 것, 다른 사람이 얻는 것)으로 표현될 수 있습니다. 예를 들어, 내가 당신을 때리면 내 승리 패턴은 다음과 같습니다. 극심한 고통). 각 죄수에게는 두 가지 옵션이 있으므로 결과를 표로 표시할 수 있습니다.

실제 적용: 소시오패스 식별

여기서 우리는 게임 이론의 주요 적용을 볼 수 있습니다: 자기 자신만 생각하는 소시오패스를 식별합니다.진정한 게임 이론은 강력한 분석 도구이며 아마추어주의는 종종 명예가 없는 사람을 표시하는 위험 신호 역할을 합니다. 직관적인 계산을 하는 사람들은 추한 일을 하는 것이 다른 플레이어가 무엇을 하든 징역형이 더 짧아지기 때문에 더 낫다고 믿습니다. 기술적으로 이것은 정확하지만 숫자를 더 높게 설정하는 근시안적인 사람인 경우에만 해당됩니다. 인간의 삶. 금융계에서 게임이론이 인기를 끄는 이유가 바로 이것이다.

죄수의 딜레마의 실제 문제는 데이터를 무시한다는 것입니다.예를 들어, 10년 동안 감옥에 보낸 사람의 친구, 친척, 심지어 채권자와 만날 가능성도 고려하지 않습니다.

가장 나쁜 점은 죄수의 딜레마에 관련된 모든 사람이 마치 들어본 적도 없는 것처럼 행동한다는 것입니다.

그리고 최선의 조치는 침묵을 지키는 것이고, 2년 후에는 좋은 친구일반 돈을 사용합니다.

2. 지배적 전략

이것은 당신의 행동이 주는 상황이다 가장 큰 승리, 상대방의 행동에 관계없이.무슨 일이 일어나더라도 당신은 모든 일을 올바르게 했습니다. 이것이 바로 죄수의 딜레마를 겪는 많은 사람들이 상대방이 무엇을 하든 배신이 '최선의' 결과로 이어진다고 믿는 이유이며, 이 방법에 내재된 현실에 대한 무지가 이를 매우 쉽게 보이게 만듭니다.

우리가 플레이하는 대부분의 게임에는 엄격하게 지배적인 전략이 없습니다. 그렇지 않으면 끔찍할 것이기 때문입니다. 당신이 항상 같은 일을 했다고 상상해 보세요. 가위바위보 게임에는 우세한 전략이 없습니다. 하지만 오븐 장갑을 끼고 바위나 종이만 보여줄 수 있는 사람과 놀고 있다면 종이라는 지배적인 전략을 갖게 될 것입니다. 당신의 종이는 그의 돌을 감싸거나 무승부로 이어질 것이며, 상대가 가위를 보여줄 수 없기 때문에 당신은 질 수 없습니다. 이제 당신은 지배적인 전략을 갖고 있으므로 다른 것을 시도하는 것은 바보일 것입니다.

3. 남녀싸움

게임은 엄격하게 지배적인 전략이 없을 때 더 흥미로워집니다. 예를 들어, 남녀 싸움. 안잘리와 보리슬라프는 데이트를 하지만 발레와 복싱 중 하나를 선택할 수 없다. Anjali는 누군가의 머리를 박살내기 위해 돈을 지불했다는 이유만으로 자신들이 문명화되었다고 생각하는 비명을 지르는 관중들의 기쁨을 위해 피가 흐르는 것을 보는 것을 좋아하기 때문에 권투를 좋아합니다.

Borislav는 발레리나가 엄청난 수의 부상과 어려운 훈련을 겪으며 한 번의 부상으로 모든 것이 끝날 수 있다는 것을 이해하기 때문에 발레를 보고 싶어합니다. 발레 댄서는 지구상에서 가장 위대한 운동선수입니다. 발레리나는 당신의 머리를 걷어찰 수 있지만 결코 그렇게 하지 않을 것입니다. 그녀의 다리는 당신의 얼굴보다 훨씬 더 가치가 있기 때문입니다.

각자 자기 갈 길을 가고 싶어해 좋아하는 이벤트, 그러나 그들은 혼자 즐기고 싶어하지 않으므로 우리는 그들의 승리 패턴을 얻습니다. 가장 높은 가치- 그들이 좋아하는 일을 하세요. 가장 작은 값- 그냥 다른 사람과 함께 있는 것, 제로 - 혼자 있는 것.

어떤 사람들은 완고한 벼랑 끝 전술을 제안합니다. 무슨 일이 있어도 당신이 원하는 것을 한다면 상대방도 당신의 선택에 따르거나 그렇지 않으면 모든 것을 잃게 될 것입니다. 내가 이미 말했듯이, 단순화된 게임 이론은 바보를 식별하는 데 탁월합니다.

실제 적용: 날카로운 모서리를 피하십시오

물론 이 전략에는 심각한 단점도 있습니다. 우선 연애를 '성별 대결'로 치부하면 소용이 없다. 각자가 좋아하는 사람을 찾을 수 있도록 헤어지세요. 그리고 두 번째 문제는 이 상황에서 참가자들이 자신에 대해 확신이 없어서 그렇게 할 수 없다는 것입니다.

모든 사람을 위한 진정한 승리 전략은 자신이 원하는 것을 하는 것입니다.그리고 그 다음날이나 시간이 나면 함께 카페에 가세요. 아니면 복싱과 발레를 번갈아 가며 엔터테인먼트의 세계로 나아가세요. 혁명이 일어날 것이다권투 발레는 발명되지 않을 것입니다.

4. 내쉬 균형

내쉬 균형은 사실 이후에 누구도 다르게 행동하고 싶어하지 않는 일련의 움직임입니다.그리고 우리가 그것을 작동시킬 수 있다면 게임 이론은 지구상의 전체 철학적, 종교적, 금융 시스템을 대체하게 될 것입니다. 왜냐하면 "파산하지 않으려는 의지"가 인류에게 더욱 강력해졌기 때문입니다. 추진력불보다.

빨리 100달러를 나누자. 당신과 나는 필요한 수백 개 중 몇 개를 결정하고 동시에 금액을 발표합니다. 합계가 100 미만이면 모두가 원하는 것을 얻습니다. 만약에 총백 개가 넘으면 가장 적은 금액을 요구한 사람이 원하는 금액을 받고, 욕심이 많은 사람이 남은 금액을 얻습니다. 같은 금액을 요구하면 모두가 50달러를 받습니다. 얼마를 물어보실 건가요? 돈을 어떻게 나눌 것인가? 승리하는 움직임은 단 하나뿐입니다.

$51를 청구하면 얻을 수 있습니다. 최대 금액상대가 무엇을 선택하든 상관없습니다. 그가 더 달라고 하면 당신은 51달러를 받게 될 것입니다. 그가 50달러나 51달러를 요구하면 당신은 50달러를 받게 됩니다. 그리고 그가 50달러 미만을 요구하면 귀하는 51달러를 받게 됩니다. 어쨌든, 당신을 데려올 다른 옵션은 없습니다 더 많은 돈이것보다. 내쉬 균형 - 우리 둘 다 $51를 선택하는 상황입니다.

실제 적용: 먼저 생각하세요

이것이 게임이론의 핵심이다. 승리할 필요도 없고 다른 플레이어에게 해를 끼칠 필요도 없지만 주변 사람들이 무엇을 준비하고 있는지에 관계없이 스스로 최선을 다해야 합니다. 그리고 이 움직임이 다른 플레이어에게 도움이 된다면 더욱 좋습니다. 이것은 사회를 변화시킬 수 있는 일종의 수학이다.

이 아이디어의 흥미로운 변형은 시간 의존적 내쉬 균형이라고 부를 수 있는 음주입니다. 술을 충분히 마시면 다른 사람이 무엇을 하든 상관하지 않지만, 다음날에는 다르게 행동하지 않은 것을 정말 후회하게 됩니다.

5. 토스 게임

토스(toss)는 플레이어 1과 플레이어 2 사이에서 진행됩니다. 각 플레이어는 동시에 앞면이나 뒷면을 선택합니다. 추측이 맞다면 플레이어 1은 플레이어 2의 동전을 얻고, 그렇지 않다면 플레이어 2는 플레이어 1의 동전을 얻습니다.

승리 매트릭스는 간단합니다 ...

...최적의 전략: 완전히 무작위로 플레이합니다.선택이 완전히 무작위여야 하기 때문에 생각보다 어렵습니다. 앞면 또는 뒷면을 선호하는 경우 상대방이 이를 사용하여 돈을 가져갈 수 있습니다.

물론 여기서 진짜 문제는 서로에게 한 푼이라도 던져주면 훨씬 나을 것이라는 점이다. 결과적으로, 그들의 이익은 동일할 것이고, 그로 인한 트라우마는 이 불행한 사람들이 끔찍한 지루함 이외의 다른 것을 느끼는 데 도움이 될 수 있습니다. 결국, 이것은 최악의 게임항상 존재합니다. 이 완벽한 모델승부차기를 위해.

실제 적용: 페널티

축구, 하키 및 기타 여러 게임에서 연장 시간은 승부차기입니다. 그리고 플레이어가 몇 번이나 플레이했는지에 따라 결정되면 더 흥미로울 것입니다. 완전한 형태수레바퀴를 굴릴 수 있을 것입니다. 왜냐하면 그것은 적어도 그들의 신체적 능력을 나타내는 지표이고 보는 것이 재미있을 것이기 때문입니다. 골키퍼는 공이나 퍽의 움직임을 처음부터 명확하게 판단할 수 없습니다. 불행히도 로봇은 아직 스포츠 대회에 참여하지 않기 때문입니다. 골키퍼는 왼쪽 또는 오른쪽 방향을 선택해야 하며 자신의 선택이 골을 쏘는 상대의 선택과 일치하기를 바랍니다. 이는 동전 놀이와 공통점이 있습니다.

그러나 이것이 앞면과 뒷면 게임과의 유사성을 보여주는 완벽한 예는 아니라는 점에 유의하십시오. 올바른 선택을 하는 것방향에 따라 골키퍼가 공을 잡지 못할 수도 있고, 공격수가 골대를 맞추지 못할 수도 있습니다.

그렇다면 게임 이론에 따른 결론은 무엇입니까? 구기 게임은 "멀티 볼" 방식으로 끝나야 합니다. 여기서 한쪽이 특정 결과를 얻을 때까지 일대일 플레이어에게 추가 공/퍽이 매분 제공됩니다. 이는 플레이어의 실제 기술을 나타냅니다. 놀라운 우연의 일치가 아닙니다.

결국 게임이론을 활용해 게임을 더욱 스마트하게 만들어야 합니다. 즉, 더 낫다는 뜻입니다.

게임 이론 - 총체성 수학적 방법갈등 상황(이해 상충)을 해결합니다. 게임이론에서는 게임을 게임이라고 부른다. 갈등 상황의 수학적 모델. 게임이론에서 특히 관심을 끄는 주제는 불확실한 상황에서 게임 참가자의 의사결정 전략을 연구하는 것입니다. 불확실성은 둘 이상의 당사자가 반대 목표를 추구한다는 사실에서 비롯되며 각 당사자의 모든 행동 결과는 파트너의 움직임에 따라 달라집니다. 동시에 각 당사자는 이를 받아들이려고 노력합니다. 최적의 솔루션자신의 목표를 가장 잘 실현하는 사람.

게임 이론은 공급자와 소비자, 구매자와 판매자, 은행과 고객 간의 관계와 같이 갈등 상황이 발생하는 경제학에서 가장 일관되게 적용됩니다. 게임 이론의 적용은 정치, 사회학, 생물학, 군사 예술에서도 찾아볼 수 있습니다.

게임이론의 역사에서

게임이론의 역사 1944년 존 폰 노이만(John von Neumann)과 오스카 모르겐스턴(Oscar Morgenstern)이 "게임 이론과 경제적 행동"이라는 책을 출판하면서 독립 학문이 시작되었습니다. 게임 이론의 예는 이전에 접한 적이 있지만, 사망한 남편의 아내 간의 재산 분할에 관한 바빌로니아 탈무드 논문, 18세기 카드 게임, 20세기 초 체스 이론의 발전 세기, 1928년에 동일한 John von Neumann의 미니맥스 정리에 대한 증거이며, 이것이 없으면 게임 이론이 없을 것입니다.

20세기 50년대 멜빈 드레셔(Melvin Drescher)와 메릴 플러드(Meryl Flood)는 랜드 코퍼레이션죄수의 딜레마를 실험적으로 적용한 최초의 존 내쉬(John Nash)는 2인 게임의 균형 상태에 관한 연구에서 내쉬 균형의 개념을 발전시켰습니다.

라인하르트 살텐(Reinhard Salten)은 1965년에 "주문형 게임 이론에서의 과점 처리"("Spieltheoretische Behandlung eines Oligomodells mit Nachfrageträgheit")라는 책을 출판했으며, 이 책을 통해 게임 이론을 경제학에 적용하는 것은 새로운 원동력을 얻었습니다. 게임 이론의 진화에서 한 걸음 더 나아간 것은 John Maynard Smith의 "Evolutionary Stable Strategy"(1974)의 작업과 관련이 있습니다. 죄수의 딜레마는 Robert Axelrod의 1984년 저서 The Evolution of Cooperation에서 대중화되었습니다. 1994년에 John Nash, John Harsanyi 및 Reinhard Selten은 게임 이론에 기여한 공로로 노벨상을 수상했습니다.

인생과 비즈니스에서의 게임 이론

추가 모델링을 위해 게임 이론에서 이해되는 의미에서 갈등 상황(이해 충돌)의 본질에 대해 더 자세히 살펴보겠습니다. 다양한 상황인생과 사업에서. 개인이 여러 가지 가능한 결과 중 하나를 가져오는 위치에 있고 개인은 이러한 결과에 대해 개인적인 선호도를 가지고 있습니다. 그러나 결과를 결정하는 변수를 어느 정도 통제할 수는 있지만 그에 대한 완전한 권한을 갖고 있는 것은 아닙니다. 때때로 통제는 그와 같이 가능한 결과와 관련하여 일부 선호도를 갖는 여러 개인의 손에 있지만 일반적으로 이러한 개인의 이익은 일관성이 없습니다. 다른 경우 최종 결과는 우연에 따라 달라질 수 있습니다(법학에서는 이를 때때로 자연 재해) 및 다른 개인으로부터. 게임 이론은 그러한 상황과 공식에 대한 관찰을 체계화합니다. 일반 원칙그러한 상황에서 합리적인 조치를 안내합니다.

어떤 면에서 "게임 이론"이라는 이름은 불행한 일입니다. 왜냐하면 게임 이론은 응접실 게임에서 발생하는 사회적으로 관련 없는 만남만을 다룬다는 것을 암시하기 때문입니다. 그러나 여전히 이론은 훨씬 더 넓은 의미를 갖고 있습니다.

다음과 같은 경제 상황은 게임 이론의 적용에 대한 아이디어를 줄 수 있습니다. 여러 기업가가 있고, 각자는 최대 이익을 얻으려고 노력하면서 이 이익을 결정하는 변수에 대해 제한된 힘만을 갖고 있다고 가정해 보십시오. 기업가는 다른 기업가가 통제하는 변수에 대해 권한이 없지만 첫 번째 기업가의 소득에 큰 영향을 미칠 수 있습니다. 이 상황을 게임으로 보면 다음과 같은 반론이 제기될 수 있다. 게임 모델은 각 기업가가 해당 영역에서 하나의 선택을 한다고 가정합니다. 가능한 선거그리고 이러한 단 하나의 선택에 의해 이익이 결정됩니다. 분명히 이것은 실제로는 거의 일어날 수 없습니다. 왜냐하면 이 경우 복잡한 관리 장치가 산업계에 필요하지 않기 때문입니다. 다른 참가자의 선택에 따라 이러한 결정에 대한 수많은 결정과 수정이 있을 뿐입니다. 경제 시스템(플레이어에 의해). 그러나 원칙적으로 일부 관리자는 문제가 발생할 때마다 해결하기보다는 가능한 모든 우발 상황을 예상하고 각 경우에 취해야 할 조치를 자세히 설명하는 것을 상상할 수 있습니다.

군사적 갈등은 정의상 이해관계의 충돌로, 일련의 전투를 통해 결정되는 결과를 결정하는 변수를 어느 쪽도 완전히 통제할 수 없습니다. 단순히 결과를 승패로 간주하고 여기에 1과 0의 숫자 값을 할당하면 됩니다.

게임 이론으로 기록하고 해결할 수 있는 가장 간단한 갈등 상황 중 하나는 결투입니다. 결투는 두 플레이어 1과 2 사이의 갈등입니다. 피그리고 큐샷. 각 플레이어마다 플레이어의 슛 확률을 나타내는 함수가 있습니다. 나어느 시점에 티치명적인 타격을 줄 것입니다.

결과적으로 게임 이론은 특정 종류의 이해 상충에 대해 다음과 같이 공식화합니다. N플레이어는 각각 100개의 특정 세트에서 하나의 옵션을 선택해야 하며, 선택을 할 때 플레이어는 다른 플레이어의 선택에 대한 정보가 없습니다. 플레이어가 선택할 수 있는 영역에는 "스페이드 에이스 이동", "자동차 대신 탱크 생산" 등의 요소가 포함될 수 있습니다. 일반적인 의미에서, 가능한 모든 상황에서 취해야 할 모든 조치를 정의하는 전략입니다. 각 플레이어는 과제에 직면해 있습니다. 결과에 대한 개인적인 영향력이 최대한의 승리를 거두려면 어떤 선택을 해야 할까요?

게임이론의 수학적 모델과 문제의 공식화

우리가 이미 언급했듯이, 게임은 갈등 상황의 수학적 모델이다 다음 구성 요소가 필요합니다.

이해 관계자;
양측에서 가능한 조치;
당사자의 이익.

게임에 관심이 있는 당사자를 플레이어라고 합니다. , 그들 각각은 적어도 두 가지 행동을 취할 수 있습니다(플레이어가 자신의 처분에 따라 하나의 행동만 가지고 있는 경우, 그가 취할 행동을 미리 알고 있기 때문에 실제로 게임에 참여하지 않습니다). 게임의 결과를 승리라고 합니다. .

실제 갈등 상황이 항상 그런 것은 아니지만 게임(게임 이론의 개념에서)은 항상 다음과 같이 진행됩니다. 특정 규칙 , 이는 다음을 정확하게 결정합니다.

플레이어의 행동에 대한 옵션;
각 플레이어가 파트너의 행동에 대해 갖고 있는 정보의 양;
각 행동 세트가 가져오는 보상.

공식화된 게임의 예로는 축구, 카드 게임, 체스.

그러나 경제학에서는 플레이어 행동 모델이 나타납니다. 예를 들어 여러 회사가 시장에서 더 유리한 위치를 차지하려고 노력할 때 여러 개인이 모든 사람이 최대한 많은 것을 얻을 수 있도록 일부 상품(자원, 재정)을 서로 나누려고 노력하는 경우가 있습니다. . 게임으로 모델링할 수 있는 경제에서 갈등 상황에 처한 플레이어는 기업, 은행, 개인 및 기타 경제 주체입니다. 결과적으로 전쟁 상황에서 게임 모델은 예를 들어 더 많은 것을 선택하는 데 사용됩니다. 최고의 무기(기존 또는 잠재적으로) 적을 물리치거나 공격으로부터 보호합니다.

게임의 특징은 결과가 불확실하다는 것 . 불확실성의 이유는 다음과 같은 그룹으로 나눌 수 있습니다.

조합적(체스에서와 같이);
무작위 요인의 영향(게임 "앞면 또는 뒷면", 주사위, 카드 게임 등)
전략적(플레이어는 적이 어떤 행동을 취할지 모릅니다).

플레이어 전략 현재 상황에 따라 각 움직임에서 그의 행동을 결정하는 일련의 규칙입니다.

게임이론의 목적 각 플레이어에게 최적의 전략을 결정하는 것입니다. 그러한 전략을 결정한다는 것은 게임을 해결하는 것을 의미합니다. 전략의 최적화 플레이어 중 한 명이 최대 승리를 거두고 두 번째 플레이어가 자신의 전략을 고수할 때 달성됩니다. 그리고 첫 번째 플레이어가 자신의 전략을 고수한다면 두 번째 플레이어의 손실은 최소화되어야 합니다.

게임의 분류

플레이어 수에 따른 분류 (2인 이상의 게임). 2인 게임은 모든 게임 이론의 중심 위치를 차지합니다. 2인 게임에 대한 게임이론의 핵심 개념은 2인 게임에서 자연스럽게 나타나는 균형이라는 매우 중요한 개념을 일반화한 것이다. 게임의 경우 N그렇다면 게임 이론의 한 부분은 플레이어 간의 협력이 금지된 게임에 전념합니다. 게임이론의 또 다른 부분 N개인은 상호 이익을 위해 협력할 수 있다고 가정합니다(비협조적 및 협동 게임오).
플레이어 수와 전략에 따른 분류 (전략의 수는 최소 2개 이상, 무한대일 수 있음)
정보량에 따른 분류 과거 움직임에 비해: 게임 완전한 정보그리고 불완전한 정보. 플레이어 1(구매자)과 플레이어 2(판매자)가 있다고 가정합니다. 플레이어 1이 플레이어 2의 행동에 대한 완전한 정보를 갖고 있지 않으면 플레이어 1은 선택해야 하는 두 가지 대안을 구별하지 못할 수 있습니다. 예를 들어 어떤 제품의 두 가지 유형 중 하나를 선택했는데 어떤 특성에 따라 그 제품이 어떤 것인지 알지 못하는 것입니다. ㅏ더 나쁜 제품 비, 플레이어 1은 대안 간의 차이를 보지 못할 수도 있습니다.
상금 분배 원칙에 따른 분류 : 한편으로는 협력, 연합, 다른 한편으로는 비협조, 비연합. 안에 비협조적 게임 , 또는 그렇지 않은 경우 - 비협조적 게임 , 플레이어는 두 번째 플레이어가 어떤 전략을 선택할지 알지 못한 채 동시에 전략을 선택합니다. 플레이어 간 의사소통이 불가능합니다. 안에 협동 게임 , 또는 그렇지 않은 경우 - 연합 게임 , 플레이어는 연합을 형성하고 공동 행동을 취하여 승리를 늘릴 수 있습니다.
유한한 2인 제로섬 게임 아니면 적대적인 게임은 전략 게임반대 이익을 가진 당사자가 관련된 전체 정보를 포함합니다. 적대적인 게임은 매트릭스 게임 .

게임이론의 전형적인 예는 죄수의 딜레마이다.

두 명의 용의자는 구금되어 서로 분리됩니다. 지방 검사는 이들이 심각한 범죄를 저질렀다고 확신하지만 재판에서 이들을 기소할 충분한 증거가 없습니다. 그는 각 수감자에게 두 가지 선택이 있다고 말합니다. 경찰이 자신이 범했다고 믿는 범죄를 자백하거나 자백하지 않는 것입니다. 두 사람 모두 자백하지 않으면 DA는 그들을 사소한 절도나 불법 무기 소지 등 경범죄로 기소하고 두 사람 모두 소액의 형을 선고받게 됩니다. 두 사람 모두 자백하면 기소 대상이 되지만, 가장 가혹한 형을 요구하지는 않을 것이다. 한 사람은 자백하고 다른 사람은 자백하지 않을 경우, 자백한 사람은 공범 인도 혐의로 감형을 받고, 고집하는 사람은 “최대한” 처벌을 받게 됩니다.

이 전략적 과제를 결론적으로 정리하면 다음과 같이 요약됩니다.

따라서 두 수감자 모두 자백하지 않으면 각각 1년의 징역형을 받게 된다. 둘 다 자백하면 각각 8년형을 받게 된다. 그리고 한 사람은 자백하고 다른 사람은 자백하지 않으면 자백한 사람은 3개월 징역형을 받고, 자백하지 않은 사람은 10년 형을 받게 된다. 위의 매트릭스는 죄수의 딜레마를 정확하게 반영합니다. 모든 사람은 자백할지 여부에 대한 질문에 직면합니다. 지방검사가 죄수들에게 제안하는 게임은 비협조적 게임 아니면 그렇지 않으면 - 비협조적 게임 . 두 수감자 모두 협력할 기회가 있는 경우(예: 게임은 협동 게임이 될 것입니다 그렇지 않으면 연합 게임 ) 그러면 둘 다 자백하지 않고 각각 1년의 징역형을 받게 됩니다.

게임 이론의 수학적 도구를 사용하는 예

이제 우리는 게임 이론의 연구 및 해결 방법이 있는 일반적인 게임 클래스의 예에 대한 솔루션을 고려합니다.

두 사람의 비협조(비협조) 게임의 형식화 예

이전 단락에서 우리는 이미 비협조적(비협조적) 게임(죄수의 딜레마)의 예를 살펴보았습니다. 실력을 강화해보자. Arthur Conan Doyle의 "The Adventures of Sherlock Holmes"에서 영감을 얻은 고전적인 플롯도 이에 적합합니다. 물론 반대할 수도 있습니다. 그 예는 삶에서 나온 것이 아니라 문학에서 나온 것입니다. 코난 도일 SF 작가로 자리매김하지 않았습니다! 클래식은 또한 우리가 이미 확립한 것처럼 게임 이론의 창시자 중 한 명인 Oskar Morgenstern에 의해 작업이 완료되었기 때문입니다.

예시 1."셜록 홈즈의 모험" 중 한 부분에 대한 간략한 요약이 제공됩니다. 에 따르면 알려진 개념게임 이론을 바탕으로 갈등 상황 모델을 만들고 게임을 공식적으로 작성합니다.

셜록 홈즈는 자신을 쫓는 모리아티 교수에게서 탈출하기 위해 대륙(유럽)에 도달하겠다는 더 큰 목표를 안고 런던에서 도버까지 여행할 계획이다. 기차를 탔을 때 그는 역 승강장에서 모리어티 교수를 만났습니다. Sherlock Holmes는 Moriarty가 특수 열차를 선택하고 이를 추월할 수 있음을 인정합니다. Sherlock Holmes에는 두 가지 대안이 있습니다. 도버로 계속 여행하거나 경로의 유일한 중간 역인 캔터베리 역에서 내리는 것입니다. 우리는 그의 상대가 홈즈의 능력을 결정할 만큼 충분히 똑똑하다는 것을 인정하므로 그에게는 동일한 두 가지 대안이 있습니다. 두 상대방은 각자 어떤 결정을 내릴지 알지 못한 채 기차에서 내릴 역을 선택해야 합니다. 결정을 내린 결과 둘 다 같은 역에 도착하면 Sherlock Holmes가 Moriarty 교수에 의해 살해 될 것이라고 확실히 가정 할 수 있습니다. 셜록 홈즈가 도버에 무사히 도착하면 그는 구원받을 것입니다.

해결책. Conan Doyle의 영웅을 게임 참여자, 즉 플레이어로 간주 할 수 있습니다. 모든 플레이어가 이용 가능 나 (나=1,2) 두 가지 순수 전략:

도버에서 하차 (전략 에스나는1( 나=1,2) );
중간역에서 하차(전략) 에스i2( 나=1,2) )

두 플레이어가 각각 두 가지 전략 중 무엇을 선택하는지에 따라 특별한 조합커플로서의 전략 에스 = (에스1 , 에스 2 ) .

각 조합은 모리어티 교수가 셜록 홈즈를 살해하려 시도한 결과인 사건과 연관될 수 있습니다. 우리는 가능한 이벤트로 이 게임의 매트릭스를 만듭니다.

각 이벤트 아래에는 모리어티 교수의 획득을 나타내는 지수가 있으며 홈즈의 구원에 따라 계산됩니다. 두 영웅은 적이 무엇을 선택할지 모르고 동시에 전략을 선택합니다. 따라서 게임은 첫째로 플레이어가 서로 다른 열차에 있고 둘째로 서로 반대되는 이해관계를 가지고 있기 때문에 비협조적입니다.

협동(연합) 게임의 형식화와 해결의 예 N명

이 시점에서 실습적인 부분, 즉 예시 문제를 해결하는 과정에 앞서 이론적인 부분이 선행되며, 협동(비협조) 게임을 해결하기 위한 게임 이론의 개념을 익히게 됩니다. 이 작업을 위해 게임 이론은 다음을 제안합니다.

특징적인 기능(간단히 말하면 플레이어를 연합으로 통합함으로써 얻을 수 있는 이점의 크기를 반영함)
가산성의 개념 (전체 객체에 해당하는 수량의 값이 객체의 특정 파티션 클래스에서 해당 부분에 해당하는 수량 값의 합과 동일하다는 사실로 구성된 수량의 속성) 부분으로) 및 특성 함수의 초가산성(전체 물체에 해당하는 양의 값이 해당 부분에 해당하는 양의 값의 합보다 큽니다).

특성 함수의 초가산성은 연합에 가입하는 것이 플레이어에게 유익하다는 것을 암시합니다. 이 경우 연합의 보상 가치는 플레이어 수에 따라 증가하기 때문입니다.

게임을 공식화하려면 위 개념에 대한 공식 표기법을 도입해야 합니다.

게임용 N모든 플레이어의 집합을 다음과 같이 표시하겠습니다. N= (1,2,...,n) 집합의 비어 있지 않은 부분 집합 N그것을 다음과 같이 표시하자 티(자신을 포함하여 N하나의 요소로 구성된 모든 하위 집합). 사이트에 강의가 있습니다 " 세트와 세트에 대한 연산"라는 링크를 클릭하면 새창으로 열립니다.

특성 함수는 다음과 같이 표시됩니다. V정의 영역은 집합의 가능한 하위 집합으로 구성됩니다. N. V(티) - 특정 하위 집합에 대한 특성 함수의 값(예: 한 명의 플레이어로 구성된 연합을 포함하여 연합이 받는 수입). 게임 이론에서는 모든 분리된 연합의 특성 함수 값에 대한 초가산성의 존재 여부를 확인해야 하기 때문에 이는 중요합니다.

비어 있지 않은 두 개의 하위 집합 연합의 경우 티1 그리고 티2 협동(연합) 게임의 특징적인 기능의 가산성은 다음과 같이 표현됩니다.

그리고 초가산성은 다음과 같습니다:

예시 2.세 명의 음악 학교 학생은 서로 다른 클럽에서 파트타임으로 일하며 클럽 방문자로부터 수입을 얻습니다. 협력 게임을 해결하기 위해 게임 이론의 개념을 사용하여 힘을 합치는 것이 수익성이 있는지(그렇다면 어떤 조건에서) 결정합니다. N사람, 다음과 같은 초기 데이터가 있습니다.

평균적으로 저녁당 수익은 다음과 같습니다.

바이올리니스트의 단위는 600개입니다.
기타리스트는 700개의 유닛을 가지고 있습니다.
가수는 900 유닛을 가지고 있습니다.

수익을 늘리기 위해 학생들은 몇 달에 걸쳐 다양한 그룹을 만들었습니다. 결과에 따르면 팀을 구성하면 저녁 수익이 다음과 같이 증가할 수 있는 것으로 나타났습니다.

바이올리니스트 + 기타리스트 1500점 획득;
바이올리니스트 + 가수는 1,800점을 획득했습니다.
기타리스트+가수 1900점 획득;
바이올리니스트 + 기타리스트 + 가수가 3000점을 획득했습니다.

해결책. 이 예에서는 게임에 참여하는 플레이어 수 N= 3이므로 게임의 특징적인 기능을 정의하는 영역은 모든 플레이어 집합의 2³ = 8개의 가능한 하위 집합으로 구성됩니다. 가능한 모든 연합을 나열해보자 티:

한 요소의 연합으로, 각 요소는 한 명의 플레이어(음악가)로 구성됩니다. 티{1} , 티{2} , 티{3} ;
두 요소의 연합: 티{1,2} , 티{1,3} , 티{2,3} ;
세 가지 요소의 연합: 티{1,2,3} .

각 플레이어에게 일련번호를 할당합니다:

바이올리니스트 - 첫 번째 연주자;
기타리스트 - 두 번째 연주자;
가수 - 3번째 플레이어.

문제 데이터를 바탕으로 게임의 특징적인 기능을 판단합니다. V:

v(T(1)) = 600 ; v(T(2)) = 700 ; v(T(3)) = 900 ; 이러한 특성 함수 값은 첫 번째, 두 번째 및 세 번째 플레이어가 연합으로 통합되지 않은 경우 각각의 보수를 기반으로 결정됩니다.

v(T(1,2)) = 1500 ; v(T(1,3)) = 1800 ; v(T(2,3)) = 1900 ; 이러한 특성 함수 값은 연합으로 연합된 각 플레이어 쌍의 수익에 의해 결정됩니다.

v(T(1,2,3)) = 3000 ; 이 특성 함수의 값은 플레이어가 3명으로 뭉친 경우의 평균 수익에 의해 결정됩니다.

따라서 우리는 가능한 모든 플레이어 연합을 나열했습니다. 게임의 특징적인 기능에 대한 정의 영역은 모든 플레이어 집합의 정확히 8개의 가능한 하위 집합으로 구성되므로 그 중 8개가 있어야 합니다. 이것이 바로 게임 이론이 요구하는 것입니다. 왜냐하면 우리는 모든 분리된 연합의 특성 함수 값에 대한 초가산성의 존재를 확인해야 하기 때문입니다.

이 예에서 초가산성 조건은 어떻게 충족됩니까? 플레이어들이 분리된 연합을 형성하는 방법을 결정합시다 티1 그리고 티2 . 일부 플레이어가 연합에 참여하는 경우 티1 , 그러면 다른 모든 플레이어는 연합의 일부가 됩니다. 티2 정의에 따르면 이 연합은 전체 플레이어 세트와 세트의 차이로 형성됩니다. 티1 . 그렇다면 만약 티1 - 한 플레이어의 연합, 그리고 연합 티2 연합에 있으면 두 번째와 세 번째 플레이어가 있습니다. 티1 첫 번째와 세 번째 플레이어가 있고 그 다음에는 연합이 있습니다. 티2 두 번째 플레이어로만 구성됩니다.