최적 솔루션의 게임 이론 방법. "시스템 이론 및 시스템 분석

  • 혼합 플레이어 전략. 플레이어의 혼합 전략을 찾으십시오.
  • 게임 이론에서의 게임 회로 모델링. 기업은 계절 제품 P 1, P 2, P 3의 생산량을 독립적으로 계획할 수 있습니다.
  • 그래픽 방법을 사용하여 매트릭스 게임 풀기

    선형 프로그래밍 방법을 사용하여 행렬 게임 풀기

    1. 매트릭스 게임. 심플렉스 방법을 사용합니다. 우리는 최대 순수 전략 A 1 을 나타내는 게임 a = max(ai) = 2의 낮은 가격에 의해 결정되는 보장된 보수를 찾습니다.
    2. 선형 계획법으로 행렬 게임을 푸는 예. 선형 계획법을 사용하여 행렬 게임을 풉니다.

    그래픽 표현 제공 정규형위치 게임의 정확한 솔루션을 찾습니다. 다음 기능상금:
    플레이어 A가 첫 번째 이동을 합니다. 그는 두 개의 숫자 집합에서 숫자 x를 선택합니다.
    플레이어 B는 두 번째 이동을 합니다. 첫 번째 이동에서 플레이어 A의 선택에 대해 알지 못하고 두 숫자 집합에서 숫자 y를 선택합니다.
    세 번째 이동은 플레이어 A가 수행합니다. 그는 두 번째 이동에서 플레이어 B가 선택한 y 값을 알고 있지만 기억하지 못하는 두 숫자 집합에서 숫자 z를 선택합니다. 자신의 선택첫 번째 이동에 x.

    자연과 함께하는 게임

    1. 통계 게임
      농업 기업은 일부 제품을 판매할 수 있습니다.
      A1) 세척 직후;
      A2) 겨울 동안;
      A3) 봄철에.
      이익은 주어진 기간 동안의 판매 가격, 보관 비용 및 가능한 손실. 전체 구현 기간 동안 소득 및 비용의 다른 주 비율(S1, S2 및 S3)에 대해 계산된 이익 금액은 매트릭스(백만 루블)의 형태로 표시됩니다.
    2. 회사는 날씨에 따라 판매되는 드레스와 정장을 생산합니다. 4월에서 5월 사이 회사의 출력 단위당 비용은 ...
    3. 원자재 재고 문제 해결. 기업에서 일정 기간 동안 원자재 소비는 품질에 따라 1, 2, 3, 4입니다.
    4. 극단적 비관주의, 극단적 낙관주의, 낙관-비관 전략

    바이매트릭스 게임

    게임 이론의 결정 트리(문제 해결의 예).

    또한 게임 이론에 대한 솔루션 모음(매트릭스 게임 솔루션), EMM에 대한 일반적인 문제( 선형 프로그래밍, 게임 이론).

    이 도시에는 세 개의 TV 회사가 있습니다. ABC, CBS그리고 NBC. 이러한 회사는 저녁 뉴스 프로그램을 6:30 또는 7:00에 시작할 수 있습니다. 시청자의 60%는 저녁 뉴스를 6.30에, 40%는 7.00에 시청하는 것을 선호합니다. 회사에서 가장 인기 있는 저녁 뉴스 프로그램 알파벳, 회사에서 준비한 뉴스가 가장 인기가 없습니다. NBC. 저녁에 TV 시청자의 점유율 뉴스 프로그램표에 제시됨(NBC, CBS, ABC)

    알파벳: 6.30

    N

    남서에스

    알파벳: 7.00

    NB와 함께

    남서에스

    뉴스 프로그램의 타이밍에 따라 기업을 위한 최상의 전략 찾기

    솔루션 힌트: 이 게임은 지배적인 전략을 가지고 있습니다.

    게임 이론 - 충돌 상황(관심 있는 충돌)을 해결하기 위한 일련의 수학적 방법. 게임이론에서 게임이란 수학적 모델 갈등 상황. 게임 이론에서 특히 흥미로운 주제는 불확실한 상황에서 게임 참가자의 의사 결정 전략을 연구하는 것입니다. 불확실성은 둘 이상의 측면이 반대 목표를 추구하고 각 당사자의 행동 결과가 파트너의 움직임에 달려 있다는 사실 때문입니다. 동시에 각 당사자는 설정된 목표를 최대한 실현하는 최적의 결정을 내리기 위해 노력합니다.

    게임 이론은 공급자와 소비자, 구매자와 판매자, 은행과 고객 간의 관계와 같이 갈등 상황이 발생하는 경제에서 가장 일관되게 적용됩니다. 게임 이론의 적용은 정치, 사회학, 생물학 및 군사 예술에서도 찾을 수 있습니다.

    게임 이론의 역사에서

    게임 이론의 역사 독립적인 학문으로서 John von Neumann과 Oscar Morgenstern이 "Theory of Games and Economic Behavior"("Theory of Games and Economic Behavior")라는 책을 출판한 1944년에 시작되었습니다. 게임 이론의 예는 이전에도 접했지만 사망한 남편의 재산을 아내 사이에 분할하는 바빌로니아 탈무드 논문, 18세기 카드 게임, 20세기 초 체스 이론의 발전, 1928 년에 같은 John von Neumann의 미니 최대 정리의 경우 게임 이론이 없을 것입니다.

    1950년대 멜빈 드레셔와 메릴 플러드는 랜드 코퍼레이션죄수의 딜레마를 실험적으로 적용한 최초의 사람인 John Nash는 2인 게임의 평형 상태에 대한 작업에서 Nash 평형의 개념을 개발했습니다.

    Reinhard Selten은 1965년에 "Oligopoly processing in game theory on demand"("Spieltheoretische Behandlung eines Oligomodells mit Nachfrageträgheit")라는 책을 출판했는데, 이 책에서 경제학에 게임 이론을 적용하는 것은 새로운 추진력. 게임 이론의 진화에서 한 단계 발전은 John Maynard Smith "Evolutionary Stable Strategy"( "Evolutionary Stable Strategy", 1974)의 작업과 관련이 있습니다. 죄수의 딜레마는 1984년 출판된 Robert Axelrod의 책 The Evolution of Cooperation에서 대중화되었습니다. 1994년에 John Nash, John Harsanyi, Reinhard Salten이 노벨 게임 이론상을 수상했습니다.

    삶과 비즈니스에서의 게임 이론

    추가 모델링을 위해 게임 이론에서 이해되는 의미에서 충돌 상황(이해 충돌)의 본질에 대해 자세히 살펴보겠습니다. 다양한 상황삶과 사업에서. 개인이 여러 가지 가능한 결과 중 하나로 이어지는 위치에 있고 개인이 이러한 결과와 관련하여 개인적 선호도를 가지고 있다고 가정합니다. 그러나 그는 결과를 결정하는 변수를 어느 정도 통제할 수는 있지만 완전히 통제할 수는 없습니다. 때때로 통제는 그와 같이 가능한 결과에 대해 선호하는 여러 개인의 손에 있지만 일반적으로 이러한 개인의 이익은 동의하지 않습니다. 다른 경우에는 최종 결과가 둘 다 사고에 따라 달라질 수 있습니다. 자연 재해) 및 다른 개인으로부터. 게임 이론은 이러한 상황에 대한 관찰을 체계화하고 공식화합니다. 일반 원칙그러한 상황에서 합리적인 조치를 안내합니다.

    어떤 면에서 "게임 이론"이라는 이름은 게임 이론이 응접실 게임에서 발생하는 사회적으로 중요하지 않은 충돌만을 다룬다는 점에서 유감스럽지만 여전히 이 이론은 훨씬 더 넓은 의미를 가지고 있습니다.

    다음 경제 상황은 게임 이론의 적용에 대한 아이디어를 제공할 수 있습니다. 이윤을 결정하는 변수에 대해 제한된 권한만 가지고 있으면서 각각 이윤을 극대화하려고 하는 여러 기업가가 있다고 가정합니다. 기업가는 다른 기업가가 통제하지만 첫 번째 기업가의 소득에 큰 영향을 미칠 수 있는 변수를 통제할 수 없습니다. 이 상황을 게임으로 해석하면 다음과 같은 이의가 제기될 수 있습니다. 게임 모델은 각 기업가가 영역에서 하나의 선택을 한다고 가정합니다. 가능한 선거이익은 이러한 단일 선택에 의해 결정됩니다. 이것은 현실적으로 거의 불가능하다는 것이 명백합니다. 왜냐하면 이 경우 산업계에서 복잡한 행정 장치가 필요하지 않기 때문입니다. 다른 참가자의 선택에 따라 이러한 결정에 대한 많은 결정과 수정이 있다는 것입니다. 경제 시스템(플레이어). 그러나 원칙적으로 모든 관리자는 발생하는 각 작업을 해결하는 대신 가능한 모든 우발 상황을 예상하고 각 경우에 취해야 할 조치를 자세히 설명한다고 상상할 수 있습니다.

    군사적 충돌은 정의상 일련의 전투에 의해 결정되는 결과를 결정하는 변수에 대해 어느 쪽도 완전한 통제권을 갖지 못하는 이해 충돌입니다. 단순히 결과를 승패로 간주하고 숫자 값 1과 0을 할당할 수 있습니다.

    게임 이론에서 기록하고 해결할 수 있는 가장 간단한 갈등 상황 중 하나는 두 명의 플레이어 1과 2 사이의 갈등인 결투입니다. 그리고 샷. 각 플레이어마다 플레이어의 샷이 나올 확률을 나타내는 함수가 있습니다. 당시 치명적인 타격을 줄 것입니다.

    그 결과, 게임 이론은 특정 종류의 이해 상충에 대해 다음과 같은 정식화를 하게 됩니다. N각 플레이어는 100개의 특정 세트에서 하나의 가능성을 선택해야 하며 선택을 할 때 플레이어는 다른 플레이어의 선택에 대한 정보가 없습니다. 플레이어의 가능한 선택 영역에는 "스페이드 에이스 이동", "자동차 대신 탱크 생산"과 같은 항목이 포함될 수 있습니다. 상식, 가능한 모든 상황에서 취해야 할 모든 조치를 정의하는 전략. 각 플레이어는 다음과 같은 과제에 직면해 있습니다. 결과에 대한 개인적인 영향으로 가능한 최대의 이익을 가져오려면 어떤 선택을 해야 할까요?

    게임 이론 및 문제 공식화의 수학적 모델

    우리가 이미 언급한 바와 같이, 게임은 갈등 상황의 수학적 모델입니다. 다음 구성 요소가 필요합니다.

    1. 이해 관계자;
    2. 양쪽에서 가능한 조치;
    3. 당사자의 이익.

    게임에 관심이 있는 당사자를 플레이어라고 합니다. , 그들 각각은 적어도 두 가지 조치를 취할 수 있습니다 (플레이어가 한 가지 조치 만 가지고 있다면 그가 취할 조치를 미리 알고 있기 때문에 실제로 게임에 참여하지 않습니다). 게임의 결과를 승리라고 합니다. .

    실제 갈등 상황은 항상 그런 것은 아니지만 게임(게임 이론의 개념에서)은 - 항상 - 진행됩니다. 특정 규칙 , 정확히 다음을 정의합니다.

    1. 플레이어 옵션;
    2. 각 플레이어가 파트너의 행동에 대해 가지고 있는 정보의 양;
    3. 각 행동 세트가 가져오는 보상.

    공식화된 게임의 예로는 축구, 카드 게임, 체스.

    그러나 경제학에서는 예를 들어 여러 회사가 시장에서 더 유리한 위치를 차지하려고 할 때 여러 개인이 좋은 (자원, 재정)을 공유하여 모든 사람이 가능한 한 많이 얻을 수 있도록 플레이어 행동 모델이 발생합니다. . 게임으로 모델링할 수 있는 경제의 갈등 상황에 처한 플레이어는 기업, 은행, 개인 및 기타 경제 행위자입니다. 차례로, 전쟁 상황에서 게임 모델은 예를 들어 더 많은 것을 선택하는 데 사용됩니다. 최고의 무기(사용 가능한 또는 잠재적으로 가능한 것에서) 적을 물리치거나 공격으로부터 보호합니다.

    이 게임은 결과의 불확실성이 특징입니다. . 불확실성의 원인은 다음 그룹으로 나눌 수 있습니다.

    1. 조합 (체스에서와 같이);
    2. 무작위 요소의 영향(게임 "앞면 또는 꼬리", 주사위, 카드 게임에서와 같이);
    3. 전략적 (플레이어는 상대방이 어떤 행동을 취할지 모릅니다).

    플레이어 전략 상황에 따라 각 동작에서 동작을 결정하는 일련의 규칙입니다.

    게임 이론의 목표 각 플레이어에 대한 최적의 전략을 결정하는 것입니다. 그러한 전략을 결정하는 것은 게임을 해결하는 것입니다. 전략 최적성 두 번째 플레이어가 자신의 전략을 고수하는 동안 플레이어 중 한 명이 최대 보상을 받아야 할 때 달성됩니다. 그리고 두 번째 플레이어는 첫 번째 플레이어가 자신의 전략을 고수한다면 최소한의 손실을 입어야 합니다.

    게임 분류

    1. 플레이어 수에 따른 분류 (두 사람 이상의 게임). 2인 게임은 모든 게임 이론의 중심입니다. 2인 게임에 대한 게임 이론의 기본 개념은 2인 게임에서 자연스럽게 나타나는 매우 본질적인 균형 개념을 일반화한 것이다. 게임에 관해서는 N그렇다면 게임 이론의 한 부분은 플레이어 간의 협력이 금지된 게임에 할애됩니다. 게임 이론의 다른 부분에서 N플레이어는 상호 이익을 위해 협력할 수 있다고 가정합니다(비협조 및 협력 게임오).
    2. 플레이어 수 및 전략에 따른 분류 (전략의 수는 최소 2개, 무한대일 수 있음).
    3. 정보량에 따른 분류 과거 동작 관련: 게임 완전한 정보그리고 불완전한 정보. 플레이어 1 - 구매자와 플레이어 2 - 판매자가 있다고 가정합니다. 플레이어 1이 플레이어 2의 행동에 대한 완전한 정보를 가지고 있지 않다면, 플레이어 1은 그가 선택해야 하는 두 가지 대안을 구별하지 못할 수 있습니다. 예를 들어 특정 제품의 두 가지 유형 중에서 선택하고 일부 특성에 따라 제품이 상품보다 나쁜 , 플레이어 1은 대안 간의 차이를 보지 못할 수 있습니다.
    4. 상금분할 원칙에 따른 분류 : 한편으로는 협동적, 연합, 다른 한편으로는 비협조적, 비협조적. 안에 비협조 게임 또는 그렇지 않으면 - 비협조 게임 , 플레이어는 두 번째 플레이어가 어떤 전략을 선택할지 모른 채 동시에 전략을 선택합니다. 플레이어 간의 통신이 불가능합니다. 안에 협동 게임 또는 그렇지 않으면 - 연합 게임 , 플레이어는 연합을 형성하고 상금을 늘리기 위해 집단 행동을 취할 수 있습니다.
    5. 2인 유한 제로섬 게임 또는 적대적인 게임은 전략 게임이해관계가 상반되는 당사자와 관련된 완전한 정보를 제공합니다. 적대적 게임은 매트릭스 게임 .

    게임 이론의 고전적인 예는 죄수의 딜레마입니다.

    두 용의자는 구금되어 서로 격리됩니다. 지방 검사는 그들이 심각한 범죄를 저질렀다고 확신하지만 재판에서 그들을 기소할 충분한 증거가 없습니다. 그는 각 수감자에게 두 가지 대안이 있다고 말합니다. 경찰이 그가 저지른 범죄를 자백하거나 자백하지 않는 것입니다. 둘 다 자백하지 않으면 지방 검사는 사소한 절도나 불법 무기 소지와 같은 경미한 범죄로 그들을 기소하고 둘 다 가벼운 형을 받게 됩니다. 두 사람 모두 자백하면 기소 대상이 되지만 가장 중한 형량은 필요하지 않다. 한 사람은 자백하고 다른 한 사람은 자백하지 않으면 자백한 사람은 공범 인도에 대한 감형을 받게 되고 완고한 사람은 "최대한" 받게 됩니다.

    이 전략적 과제를 결론으로 ​​공식화하면 다음과 같이 요약됩니다.

    따라서 두 죄수 모두 자백하지 않으면 각각 1년형을 받게 된다. 둘 다 자백하면 각각 8년형을 받는다. 한 사람이 자백하면 다른 사람은 자백하지 아니하면 자백한 사람은 3개월, 자백하지 아니한 사람은 10년형을 받게 됩니다. 위의 매트릭스는 죄수의 딜레마를 정확하게 반영합니다. 모든 사람은 자백하거나 자백하지 않는 문제에 직면합니다. 지방 검사가 죄수들에게 제공하는 게임은 비협조 게임 또는 그렇지 않으면 - 비 연합 게임 . 두 수감자가 협력할 수 있는 경우(즉, 게임은 협력적일 것입니다 또는 그렇지 않으면 연합 게임 ), 둘 다 자백하지 않고 각각 1 년의 징역형을 받았습니다.

    게임 이론의 수학적 수단 사용의 예

    이제 우리는 게임 이론에서 조사 방법과 해결 방법이 있는 게임의 일반적인 클래스의 예에 대한 해결 방법을 고려합니다.

    2인의 비협조적(non-cooperative) 게임을 형식화한 예

    이전 단락에서 우리는 이미 비협조적(non-cooperative) 게임(죄수의 딜레마)의 예를 고려했습니다. 실력을 굳히자. Arthur Conan Doyle의 The Adventures of Sherlock Holmes에서 영감을 얻은 고전적인 플롯도 이에 적합합니다. 물론 반대 할 수 있습니다. 예는 삶이 아니라 문학에서 나온 것이지만 결국 코난 도일공상 과학 작가로 자리 매김하지 않았습니다! 고전 게임 이론의 창시자 중 한 명인 Oscar Morgenstern이 작업을 완료했기 때문입니다.

    예 1셜록 홈즈의 모험 중 하나에서 발췌한 내용이 제공됩니다. 에 따르면 알려진 개념갈등 상황의 모델을 만들고 공식적으로 게임을 작성하는 게임 이론.

    Sherlock Holmes는 그를 쫓는 Moriarty 교수로부터 탈출하기 위해 대륙 (유럽)에 도착한다는 추가 목표를 가지고 런던에서 Dover로 가려고합니다. 기차를 타면서 그는 역 플랫폼에서 Moriarty 교수를 보았습니다. Sherlock Holmes는 Moriarty가 특수 열차를 선택하여 추월 할 수 있음을 인정합니다. Sherlock Holmes에는 두 가지 대안이 있습니다. Dover로 계속 이동하거나 경로의 유일한 중간 역인 Canterbury 역에서 하차합니다. 우리는 그의 적이 홈즈의 선택을 결정할 만큼 충분히 똑똑하다고 가정하므로 그는 동일한 두 가지 대안을 가지고 있습니다. 두 상대 모두 각자 어떤 결정을 내릴지 알지 못한 채 기차에서 내릴 역을 선택해야 합니다. 결정의 결과 둘 다 같은 역에 도착하면 Sherlock Holmes가 Moriarty 교수에 의해 살해 될 것이라고 확실히 가정 할 수 있습니다. Sherlock Holmes가 Dover에 안전하게 도착하면 그는 구원받을 것입니다.

    해결책. Conan Doyle의 영웅은 게임의 참가자, 즉 플레이어로 간주될 수 있습니다. 각 플레이어의 처분에 따라 (=1,2) 두 가지 순수 전략:

    • 도버에서 하차 (전략 에스i1( =1,2) );
    • 웨이 스테이션에서 하차 (전략 에스i2( =1,2) )

    두 플레이어가 선택한 두 가지 전략 중 어떤 것을 선택하느냐에 따라 특별한 조합부부의 전략 에스 = (에스1 , 에스 2 ) .

    각 조합은 Moriarty 교수가 Sherlock Holmes를 죽이려는 시도의 결과인 이벤트와 연관될 수 있습니다. 가능한 이벤트로 이 게임의 매트릭스를 만듭니다.

    각 이벤트 아래에는 Moriarty 교수의 인수를 의미하는 인덱스가 표시되며 Holmes의 구원에 따라 계산됩니다. 두 영웅은 상대방이 무엇을 선택할지 모른 채 동시에 전략을 선택합니다. 따라서 게임은 비협조적입니다. 첫째, 플레이어는 서로 다른 열차에 있고 둘째, 반대 관심사를 가지고 있기 때문입니다.

    협력(coalition) 게임의 정형화 및 해결 사례 N

    이 시점에서 실제적인 부분, 즉 예제 문제를 해결하는 과정은 협동(비협동) 게임을 해결하기 위한 게임 이론의 개념을 익히는 이론적인 부분이 선행됩니다. 이 작업을 위해 게임 이론은 다음을 제안합니다.

    • 특징적인 기능(간단히 말하면 플레이어를 연합에 합류시키는 이점의 가치를 반영함)
    • 덧셈의 ​​개념 (전체 개체에 해당하는 양의 값이 개체를 분할하는 특정 클래스에서 해당 부분에 해당하는 양의 값의 합과 같다는 사실로 구성된 양의 속성 부분으로) 및 특성 함수의 초가산성(전체 개체에 해당하는 양의 값이 해당 부분에 해당하는 양의 값의 합보다 큼).

    특성 함수의 초가산성은 연합이 플레이어에게 유익하다는 것을 나타냅니다. 이 경우 연합의 보수가 플레이어 수에 따라 증가하기 때문입니다.

    게임을 공식화하려면 위의 개념에 대한 공식 표기법을 도입해야 합니다.

    게임용 N모든 플레이어의 집합을 다음과 같이 나타냅니다. N= (1,2,...,n) 집합의 비어 있지 않은 하위 집합 N로 표시 (자기 포함 N및 하나의 요소로 구성된 모든 하위 집합). 사이트에 활동이 있습니다 집합과 집합에 대한 연산, 링크를 클릭하면 새 창에서 열립니다.

    특성 함수는 다음과 같이 표시됩니다. V정의 영역은 집합의 가능한 하위 집합으로 구성됩니다. N. V() - 특정 하위 집합에 대한 특성 함수의 값, 예를 들어 한 명의 플레이어로 구성된 연합을 포함하여 연합이 받는 수입. 이것은 게임 이론이 모든 겹치지 않는 연합의 특성 함수 값에 대해 초가산성의 존재를 확인해야 하기 때문에 중요합니다.

    하위 집합의 비어 있지 않은 두 연합에 대해 1 그리고 2 협력(coalitional) 게임의 특성 함수의 가산성은 다음과 같이 작성됩니다.

    그리고 초가산성은 다음과 같습니다.

    예 2음악 학교의 세 학생은 다른 클럽에서 여분의 돈을 벌고 클럽 방문자로부터 수익금을 받습니다. 협력 게임을 해결하기 위해 게임 이론의 개념을 사용하여 그들이 힘을 합치는 것이 유익한지(그렇다면 어떤 조건에서) 결정합니다. N다음과 같은 초기 데이터가 있는 사람.

    저녁당 평균 수익은 다음과 같습니다.

    • 바이올리니스트는 600 단위를 가지고 있습니다.
    • 기타리스트는 700 유닛을 가지고 있습니다.
    • 가수는 900 단위를 가지고 있습니다.

    수입을 늘리기 위해 학생들은 몇 달 동안 다양한 그룹을 만들었습니다. 결과는 팀을 구성함으로써 다음과 같이 저녁 수익을 높일 수 있음을 보여주었습니다.

    • 바이올리니스트 + 기타리스트는 1500 단위를 획득했습니다.
    • 바이올리니스트 + 가수는 1800 단위를 획득했습니다.
    • 기타리스트 + 가수는 1900 단위를 얻었습니다.
    • 바이올리니스트 + 기타리스트 + 가수가 3000 단위를 획득했습니다.

    해결책. 이 예에서 게임 참가자 수는 N= 3 따라서 게임의 특성 기능 영역은 모든 플레이어 집합의 2³ = 8 가능한 하위 집합으로 구성됩니다. 가능한 모든 연합을 나열합시다 :

    • 한 요소의 연합, 각 요소는 한 명의 플레이어 - 음악가로 구성됩니다. {1} , {2} , {3} ;
    • 두 요소의 연합: {1,2} , {1,3} , {2,3} ;
    • 세 가지 요소의 연합: {1,2,3} .

    각 플레이어에게 일련 번호를 할당합니다.

    • 바이올리니스트 - 첫 번째 연주자;
    • 기타리스트 - 두 번째 연주자;
    • 가수는 세 번째 플레이어입니다.

    문제 데이터에 따라 게임의 특징적인 기능을 결정합니다. V:

    v(T(1)) = 600 ; v(T(2)) = 700 ; v(T(3)) = 900 ; 특성 함수의 이러한 값은 연합으로 통합되지 않은 경우 각각 첫 번째, 두 번째 및 세 번째 플레이어의 보수에 따라 결정됩니다.

    v(T(1,2)) = 1500 ; v(T(1,3)) = 1800 ; v(T(2,3)) = 1900 ; 특성 함수의 이러한 값은 연합으로 통합된 각 플레이어 쌍의 수익에 의해 결정됩니다.

    v(T(1,2,3)) = 3000 ; 특성 함수의 이 값은 플레이어가 세 쌍둥이로 통합된 경우의 평균 수익에 의해 결정됩니다.

    따라서 우리는 가능한 모든 플레이어 연합을 나열했으며 게임의 특징적인 기능 정의 영역이 모든 플레이어 집합의 가능한 하위 집합 8개로 구성되기 때문에 8개가 있어야 합니다. 모든 겹치지 않는 연합의 특성 함수 값에 대해 초가산성이 존재하는지 확인해야 하기 때문에 게임 이론이 요구하는 것입니다.

    이 예에서 초가산성의 조건은 어떻게 충족됩니까? 플레이어가 겹치지 않는 연합을 형성하는 방법을 정의하겠습니다. 1 그리고 2 . 일부 플레이어가 연합에 있는 경우 1 , 다른 모든 플레이어는 연합에 있습니다. 2 정의에 따라 이 연합은 전체 플레이어 집합과 집합 간의 차이로 형성됩니다. 1 . 그렇다면 만약 1 - 한 플레이어의 연합, 그 다음 연합 2 연합에 있으면 두 번째와 세 번째 플레이어가 있습니다. 1 첫 번째와 세 번째 플레이어가 될 것이며 연합 2 두 번째 플레이어로만 구성됩니다.

    게임 이론운영 연구의 한 분야는 수용의 수학적 모델 이론입니다. 최적의 솔루션이해 관계가 다른 여러 당사자의 불확실성 또는 갈등 상황에서. 게임 이론은 게임 성격의 상황에서 최적의 전략을 탐구합니다. 여기에는 과학 및 경제 실험 시스템, 조직에 가장 유리한 생산 솔루션 선택과 관련된 상황이 포함됩니다. 통계적 통제, 산업 기업과 다른 산업 간의 경제 관계. 갈등 상황을 수학적으로 공식화하면 둘, 셋 등의 게임으로 표현할 수 있습니다. 각각의 플레이어는 자신의 이익을 극대화하려는 목표를 추구하며 상대방을 희생시키면서 이익을 얻습니다.

    "게임 이론" 섹션은 세 가지로 표시됩니다. 온라인 계산기:

    1. 최적의 플레이어 전략. 이와 같은 업무에서 결제 매트릭스. 플레이어의 순수 또는 혼합 전략을 찾는 것이 필요하며, 게임 가격. 풀이하려면 행렬의 차원과 풀이 방법을 지정해야 합니다. 이 서비스는 2인용 게임을 해결하기 위해 다음과 같은 방법을 구현합니다.
      1. 미니맥스 . 플레이어의 순수한 전략을 찾거나 게임의 안장 지점에 대한 질문에 답해야 하는 경우 이 솔루션 방법을 선택합니다.
      2. 심플렉스 방법. 선형 프로그래밍 방법을 사용하여 혼합 전략으로 게임을 해결하는 데 사용됩니다.
      3. 그래픽 방법. 혼합 전략 게임을 해결하는 데 사용됩니다. 안장점이 있으면 솔루션이 중지됩니다. 예: 보상 매트릭스가 주어지면 다음을 사용하여 최적의 혼합 플레이어 전략과 게임 가격을 찾습니다. 그래픽 방법게임 솔루션.
      4. 반복 브라운 로빈슨 방법. iterative 방법은 그래픽 방법을 적용할 수 없을 때와 대수 및 행렬 방법. 이 방법은 게임의 가치에 대한 대략적인 가치를 제공하며, 진정한 가치원하는 정확도로 얻을 수 있습니다. 이 방법은 최적의 전략을 찾는 데 충분하지 않지만 역학을 추적할 수 있습니다. 턴 기반 게임각 단계에서 각 플레이어의 게임 가격을 결정합니다.
      예를 들어, 작업은 "보수 매트릭스에 의해 주어진 게임에 대한 플레이어의 최적 전략을 나타냅니다"처럼 들릴 수 있습니다..
      모든 방법은 주요 행과 열에 대한 검사를 적용합니다.
    2. 바이매트릭스 게임. 일반적으로 이러한 게임에서는 첫 번째 플레이어와 두 번째 플레이어의 보수가 같은 크기의 두 행렬이 설정됩니다. 이 행렬의 행은 첫 번째 플레이어의 전략에 해당하고 행렬의 열은 두 번째 플레이어의 전략에 해당합니다. 이 경우 첫 번째 행렬은 첫 번째 플레이어의 보수를 나타내고 두 번째 행렬은 두 번째 선수의 보수를 나타냅니다.
    3. 자연과 함께하는 게임. Maximax, Bayes, Laplace, Wald, Savage, Hurwitz의 기준에 따라 경영판단을 선택해야 할 때 사용한다.
      Bayes 기준의 경우 이벤트 발생 확률도 도입해야 합니다. 설정되지 않은 경우 기본값을 그대로 둡니다(동등한 이벤트가 있음).
      Hurwitz 기준의 경우 낙관 수준 λ를 지정합니다. 이 매개 변수가 조건에 지정되지 않은 경우 값 0, 0.5 및 1을 사용할 수 있습니다.

    많은 문제에서 컴퓨터를 통해 솔루션을 찾는 것이 필요합니다. 도구 중 하나는 위의 서비스 및 기능입니다.

    인기있는 미국 블로그 Cracked에서.

    게임 이론은 최선의 수를 만드는 방법을 배우고 결과적으로 다른 플레이어의 파이 중 일부를 잘라냄으로써 승리 파이의 가장 큰 조각을 얻는 방법에 관한 것입니다. 그것은 많은 요소를 분석하고 논리적으로 가중된 결론을 도출하도록 가르칩니다. 숫자보다 먼저, 알파벳보다 먼저 공부해야 한다고 생각합니다. 너무 많은 사람들이 받아들이기 때문에 중요한 결정, 직감, 비밀 예언, 별의 위치 등을 기반으로 합니다. 나는 게임 이론을 주의 깊게 연구했으며 이제 그 기초에 대해 이야기하고 싶습니다. 아마도 이것은 추가 될 것입니다 상식당신의 삶에.

    1. 죄수의 딜레마

    Berto와 Robert는 훔친 차를 적절하게 사용하여 탈출하지 못한 후 은행 강도 혐의로 체포되었습니다. 경찰은 그들이 은행을 털었다는 것을 증명할 수 없지만 도난당한 차에 적발되어 적발되었습니다. 그들은 서로 다른 방으로 옮겨졌고 각자 공범을 넘겨주고 그를 10년 동안 감옥에 보내고 스스로 풀려나는 거래를 제안받았습니다. 그러나 두 사람이 서로 배반하면 각각 7년형을 받게 됩니다. 아무도 아무 말도하지 않으면 둘 다 차를 훔친 것에 대해서만 2 년 동안 앉아있을 것입니다.

    Berto가 침묵하지만 Robert가 그를 배신하면 Berto는 10 년 동안 감옥에 가고 Robert는 석방됩니다.

    각 수감자는 플레이어이며 각각의 이점은 "공식"(둘 다 얻는 것, 다른 사람이 얻는 것)으로 나타낼 수 있습니다. 예를 들어, 내가 당신을 때리면 내 승리 계획은 다음과 같습니다. 극심한 고통). 각 수감자에게는 두 가지 옵션이 있으므로 결과를 표로 표시할 수 있습니다.

    실제 적용: 소시오패스 발견

    여기서 우리는 게임 이론의 주요 적용을 봅니다. 자신에 대해서만 생각하는 소시 오 패스를 식별합니다.실제 게임 이론은 강력한 분석 도구이며 아마추어리즘은 종종 명예가 없는 사람을 배신하는 머리를 가진 위험 신호 역할을 합니다. 직관적인 사람들은 다른 플레이어가 무엇을 하든 징역형이 더 짧기 때문에 추한 것이 낫다고 생각합니다. 기술적으로 이것은 정확하지만 숫자를 더 높게 설정하는 근시안적인 사람인 경우에만 해당됩니다. 인간의 삶. 이것이 게임 이론이 금융 분야에서 인기 있는 이유입니다.

    죄수의 딜레마의 진짜 문제는 데이터를 무시한다는 것입니다.예를 들어, 10년 동안 감옥에 갇힌 사람의 친구, 친척 또는 채권자와 만날 가능성은 고려하지 않습니다.

    무엇보다도 죄수의 딜레마에 관련된 모든 사람들은 마치 들어본 적이 없는 것처럼 행동합니다.

    그리고 최선의 조치는 침묵을 유지하는 것이며 2년 후 좋은 친구공금을 사용합니다.

    2. 우월 전략

    이것은 당신의 행동이 주는 상황입니다 가장 큰 승리, 상대방의 행동에 관계없이.무슨 일이 있어도 당신은 모든 것을 올바르게 했습니다. 그렇기 때문에 죄수의 딜레마에 있는 많은 사람들은 배신이 상대방이 무엇을 하든 "최상의" 결과로 이어진다고 믿고 있으며, 이 방법에 내재된 현실에 대한 무지는 모든 것을 매우 단순하게 보이게 합니다.

    우리가 플레이하는 대부분의 게임에는 엄격하게 지배적인 전략이 없습니다. 그렇지 않으면 끔찍할 것이기 때문입니다. 항상 같은 일을 한다고 상상해 보십시오. 가위바위보 게임에는 우월 전략이 없습니다. 하지만 오븐 장갑을 끼고 바위나 종이만 보여줄 수 있는 사람과 놀고 있다면, 당신은 지배적인 전략인 종이를 갖게 될 것입니다. 당신의 종이는 그의 돌을 감싸거나 무승부가 될 것이고 상대가 가위를 보여줄 수 없기 때문에 당신은 질 수 없습니다. 이제 당신은 우월한 전략을 가지고 있으므로 다른 것을 시도하는 것은 바보가 될 것입니다.

    3. 남녀의 대결

    게임은 엄격하게 지배적인 전략이 없을 때 더 재미있습니다. 예를 들어, 남녀의 싸움. 안잘리와 보리슬라프는 데이트를 하지만 발레와 복싱 사이에서 결정을 내리지 못한다. Anjali는 누군가의 부러진 머리에 대한 비용을 지불했기 때문에 자신이 문명화되었다고 생각하는 비명을 지르는 관중의 기쁨으로 피가 흐르는 것을 보는 것을 좋아하기 때문에 권투를 좋아합니다.

    Borislav는 발레리나가 한 번의 부상으로 모든 것을 끝낼 수 있다는 것을 알고 발레리나가 많은 부상과 가장 어려운 훈련을 겪는다는 것을 이해하기 때문에 발레를 보고 싶어합니다. 발레 댄서는 지구상에서 가장 위대한 운동 선수입니다. 발레리나는 당신의 머리를 걷어찰지 모르지만 그녀의 다리는 당신의 얼굴보다 훨씬 더 가치가 있기 때문에 절대 그러지 않을 것입니다.

    각자 자신의 길을 가고 싶어한다. 좋아하는 이벤트, 하지만 그들은 혼자 즐기기를 원하지 않으므로 다음은 그들의 승리 계획입니다. 최고 가치- 그들이 좋아하는 것을 하십시오 가장 작은 값- 그냥 다른 사람과 함께 있고 제로 - 혼자 있습니다.

    어떤 사람들은 전쟁 직전에 완고하게 균형을 잡을 것을 제안합니다. 당신이 원하는 것을 하면 무엇이든 상대방은 당신의 선택에 순응해야 하며 그렇지 않으면 모든 것을 잃게 됩니다. 내가 이미 말했듯이, 단순화된 게임 이론은 바보를 찾아내는 데 탁월합니다.

    실용적인 응용 프로그램: 날카로운 모서리를 피하십시오

    물론 이 전략에도 상당한 단점이 있습니다. 우선, 데이트를 "남녀의 싸움"처럼 취급하면 작동하지 않습니다. 각자가 좋아하는 사람을 찾을 수 있도록 분리하십시오. 그리고 두 번째 문제는 이 상황에서 참여자들이 스스로에 대해 너무 확신이 없어서 할 수 없다는 것입니다.

    모두를 위한 진정으로 승리하는 전략은 그들이 원하는 것을 하는 것입니다.그리고 그 다음 날, 한가할 때 같이 카페에 가요. 또는 복싱과 발레를 번갈아 가며 엔터테인먼트의 세계까지 혁명이 있을 것이다복싱 발레는 발명되지 않을 것입니다.

    4. 내쉬균형

    Nash 균형은 사실 이후에 아무도 무언가를 다르게 하고 싶어하지 않는 일련의 움직임입니다.그리고 우리가 그것을 작동시킬 수 있다면 게임 이론은 지구상의 모든 철학적, 종교적, 금융 시스템을 대체할 것입니다. "실패하지 않으려는 욕망"이 불보다 인류에게 더 강력한 원동력이 되었기 때문입니다.

    100달러를 빨리 나누자. 당신과 나는 우리가 요구하는 100개 중 몇 개를 결정하고 동시에 금액을 발표합니다. 총액이 100 미만이면 모두가 원하는 것을 얻습니다. 만약에 100이 넘으면 가장 적은 금액을 요구한 사람이 원하는 금액을 받고 욕심 많은 사람이 나머지 금액을 가져갑니다. 같은 금액을 요구하면 각자 $50를 받습니다. 얼마를 물을 것인가? 어떻게 돈을 나눌 것인가? 단 하나의 승리 움직임이 있습니다.

    $51 청구는 귀하에게 최대 금액상대가 무엇을 선택하든 상관없다. 그가 더 달라고 하면 당신은 51달러를 받게 될 것입니다. 그가 50달러나 51달러를 요구하면 당신은 50달러를 받게 될 것입니다. 그리고 그가 50달러 미만을 요구하면 당신은 51달러를 받게 될 것입니다. 어쨌든 당신을 데려 올 다른 옵션은 없습니다 더 많은 돈이것보다. 내쉬 균형은 우리 둘 다 $51을 선택하는 상황입니다.

    실제 적용: 먼저 생각하십시오

    이것이 게임 이론의 요점입니다. 다른 플레이어를 다치게 하는 것은 고사하고 승리할 필요도 없지만, 다른 사람들이 당신을 위해 무엇을 준비하고 있든 상관없이 당신 자신을 위해 최선을 다해야 합니다. 그리고 이 움직임이 다른 플레이어에게 도움이 된다면 더욱 좋습니다. 이것은 사회를 변화시킬 수 있는 일종의 수학입니다.

    이 아이디어의 흥미로운 변형은 시간 의존성을 가진 내쉬 평형이라고 불릴 수 있는 음주입니다. 술을 충분히 마시면 다른 사람이 무엇을 하든 그 행동에 신경을 쓰지 않는데, 다음 날에는 그렇지 않은 것을 정말 후회하게 됩니다.

    5. 토스 게임

    플레이어 1과 플레이어 2가 토스에 참여합니다. 각 플레이어는 동시에 앞면 또는 뒷면을 선택합니다. 추측이 맞으면 플레이어 1은 플레이어 2의 페니를 받고 그렇지 않으면 플레이어 2는 플레이어 1의 코인을 받습니다.

    승리 매트릭스는 간단합니다 ...

    ...최적의 전략: 완전히 무작위로 플레이합니다.선택이 완전히 무작위여야 하기 때문에 생각보다 어렵습니다. 앞면 또는 뒷면에 대한 선호도가 있으면 상대방이 이를 사용하여 돈을 가져갈 수 있습니다.

    물론 여기서 진짜 문제는 그들이 서로에게 단지 한 푼만 던지는 것이 훨씬 나을 것이라는 점입니다. 결과적으로 그들의 이익은 같을 것이고 그로 인한 트라우마는 이 불행한 사람들이 지독한 지루함 이외의 것을 느끼는 데 도움이 될 수 있습니다. 결국, 이것은 최악의 게임지금까지 존재합니다. 이 이상적인 모델승부차기 위해.

    적용: 페널티

    축구, 하키 및 기타 여러 게임에서 추가 시간은 승부차기입니다. 그리고 그들은 플레이어가 몇 번이나 완전한 형태"바퀴"를 만들 수 있습니다. 왜냐하면 그것은 적어도 그들의 신체적 능력의 표시가 될 것이고 보는 것이 재미있을 것이기 때문입니다. 불행히도 로봇은 여전히 ​​우리 스포츠에 참여하지 않기 때문에 골키퍼는 이동 초기에 공이나 퍽의 움직임을 명확하게 결정할 수 없습니다. 골키퍼는 왼쪽 또는 오른쪽 방향을 선택해야 하며 자신의 선택이 골문을 차는 상대의 선택과 일치하기를 바랍니다. 그것은 동전 게임과 공통점이 있습니다.

    그러나 이것은 앞면과 뒷면의 게임과 유사한 완벽한 예가 아니라는 점에 유의하십시오. 올바른 선택골키퍼가 공을 잡지 못할 수도 있고 공격수가 골대를 맞추지 못할 수도 있습니다.

    그렇다면 게임 이론에 따른 우리의 결론은 무엇입니까? 볼 게임은 한쪽이 플레이어의 실제 기술을 나타내는 특정 결과를 얻을 때까지 매분 추가 볼/퍽이 플레이어에게 일대일로 제공되는 "멀티 볼" 방식으로 종료되어야 합니다. , 그리고 놀라운 우연이 아닙니다.

    결국, 게임 이론은 게임을 더 스마트하게 만들기 위해 사용되어야 합니다. 그리고 그것은 더 나은 것을 의미합니다.

    여러 충돌 당사자(사람)가 있고 각 당사자는 주어진 규칙 집합에 따라 결정을 내리고 각 당사자는 각 당사자에 대해 미리 결정된 지불로 충돌 상황의 최종 상태를 알고 있는 경우 다음과 같이 말합니다. 게임이 있습니다.

    게임 이론의 임무는 주어진 플레이어에 대해 그러한 행동 라인을 선택하는 것입니다. 편차는 그의 보상을 감소시킬 수 있습니다.

    게임에 대한 몇 가지 정의

    게임 결과에 대한 정량적 평가를 지불이라고 합니다.

    더블스 (2인) 지불액의 합이 0인 경우를 제로섬 게임이라고 합니다. 한 플레이어의 손실이 다른 플레이어의 이득과 동일한 경우.

    플레이어가 개인적인 움직임을 취해야 하는 각 가능한 상황에서 플레이어의 선택에 대한 명확한 설명을 호출합니다. 플레이어 전략 .

    플레이어의 전략은 게임이 여러 번 반복될 때 플레이어에게 가능한 최대 평균 보상(또는 동일한 것으로 가능한 최소 평균 보상)을 제공하는 경우 최적이라고 합니다.

    매트릭스 정의 게임 , 가지고 라인과 N열은 차원의 유한 쌍 게임이라고합니다. * N;

    어디 =
    m 전략을 가진 첫 번째 플레이어의 전략입니다. 제이=n 전략을 가진 두 번째 플레이어의 전략입니다. ij첫 번째 플레이어의 보수입니다. -두 번째가 사용하는 경우의 전략 제이-th 전략(또는 동일한 것은 두 번째 전략을 잃음) 제이 th 전략, 처음 사용할 때 일);

    A =  ij는 게임의 보수 매트릭스입니다.

    1.1 순수 전략 활용

    게임 가격 인하(첫 번째 플레이어용)

    = 최대 ( ij). (1.2)

    제이

    상위 게임 가격(두 번째 플레이어용):

    = (최대 ij) . (1.3)

    제이

    만약에 = , 안장점(1.4)으로 게임을 호출하거나 순수한 전략. 여기서 V = = 귀중한 게임 ( V- 게임 가격).

    예. 2인 게임에 대한 보수 매트릭스가 주어진 경우 A. 각 플레이어에 대한 최적의 전략과 게임 가격을 결정합니다.

    (1.4)

    최대 10 9 12 6

    6

    제이

    첫 번째 플레이어(행)의 전략입니다.

    두 번째 플레이어의 전략(열).

    - 게임 가격.

    따라서 게임에는 안장 지점이 있습니다. 전략 제이 = 4는 두 번째 플레이어를 위한 최적의 전략입니다. =2 - 첫 번째. 순수한 전략을 가진 게임이 있습니다.

    1.2 혼합 전략 게임

    보수 매트릭스가 없는 경우 안장 포인트, 즉.
    , 게임 참가자 중 누구도 최적의 전략으로 하나의 계획을 선택할 수 없으며 플레이어는 "혼합 전략"으로 전환합니다. 이 경우 각 플레이어는 게임 중에 각 전략을 여러 번 사용합니다.

    각 구성 요소가 플레이어의 해당 순수 전략 사용의 상대적 빈도를 나타내는 벡터를 플레이어의 혼합 전략이라고 합니다.

    엑스= (엑스 1 …엑스 …엑스 ) – 혼합 전략첫 번째 선수.

    ~에= (~에 1 ...에 제이 ...에 N)는 두 번째 플레이어의 혼합 전략입니다.

    엑스 , y 제이– 전략을 사용하는 플레이어의 상대적 빈도(확률).

    혼합 전략을 사용하기 위한 조건

    . (1.5)

    만약에 엑스* = (엑스 1 * ….엑스나 * ... 엑스 *) 첫 번째 플레이어가 선택한 최적의 전략입니다. 와이* = (~에 1 * …~에제이 * ... ~에 N*)는 두 번째 플레이어가 선택한 최적의 전략이며 숫자는 게임 가격입니다.

    (1.6)

    번호를 위해서는 V게임 가격이었고, 엑스* 그리고 ~에* - 최적의 전략, 불평등이 필요하고 충분합니다.

    (1.7)

    플레이어 중 한 명이 최적의 혼합 전략을 사용하면 그의 보수는 게임 가격과 같습니다. V두 번째 플레이어가 순수 전략을 포함하여 최적의 전략에 포함된 전략을 적용하는 빈도에 관계없이.

    게임 이론 문제를 선형 프로그래밍 문제로 축소합니다.

    . 보수 매트릭스에 의해 정의된 게임에 대한 솔루션 찾기 .

    에이 = (1.8)

    와이 1 와이 2 와이 3

    해결책:

    선형 프로그래밍 문제의 이중 쌍을 작성해 보겠습니다.

    첫 번째 플레이어의 경우

    (1.9)

    ~에 1 +~에 2 +~에 3 = 1 (1.10)

    변수에서 자유로워지기 V(게임의 가격) 식 (1.9), (1.10)의 왼쪽과 오른쪽을 다음과 같이 나눕니다. V. 받아 들인 ~에 제이 /V새로운 변수에 대한 , 우리는 얻는다 새로운 시스템제약 조건(1.11) 및 목적 함수(1.12)

    (1.11)

    . (1.12)

    마찬가지로 두 번째 플레이어에 대한 게임 모델을 얻습니다.

    (1.13)

    엑스 1 +엑스 2 +엑스 3 = 1 . (1.14)

    모델 (1.13), (1.14)를 변수가 없는 형태로 축소 V, 우리는 얻는다

    (1.15)

    , (1.16)

    어디
    .

    첫 번째 플레이어의 행동 전략을 결정해야 하는 경우, 즉 그의 전략을 사용하는 상대적 빈도( 엑스 1 ….엑스 …엑스 ), 우리는 두 번째 플레이어의 모델을 사용할 것입니다. 왜냐하면 이러한 변수는 그의 보수 모델(1.13), (1.14)에 있습니다.

    (1.15), (1.16)을 정식 형식으로 줄입니다.

    (1.17)