【筆記】賽局理論－鼻涕小姐的肆號宿舍

有鑑於大家都不知道我說的Nash均衡是什麼
決定來一篇補充給大家的筆記整理好了!

不過,小女子我也沒有說很懂啦......
所以,如果有錯,歡迎大家給予批評指教啦!

第一部分:

(這一部分是從維基百科裡面節取出來的東西)
(大家上去看看就可以明白更多資訊,不過看我整理也行啦!!!)

賽局理論(Game Theory)，有時也稱為對策論，或者博弈論
應用:
目前在生物學，經濟學，國際關係，電腦科學, 政治學，軍事戰略和其他很多學科都有廣泛的應用。
賽局理論也應用於數學的其他分支，如機率，統計和線性規劃等。

具有競爭或對抗性質的行為成為博弈行為。在這類行為中，參加鬥爭或競爭的各方各自具有不同的目標或利益。為了達到各自的目標和利益，各方必須考慮對手的各種可能的行動方案，並力圖選取對自己最為有利或最為合理的方案。

目前經濟學家們現在所談的賽局理論一般是指非合作博弈，由於合作賽局理論比非合作賽局理論複雜，在理論上的成熟度遠遠不如非合作賽局理論。非合作博弈又分為：完全信息靜態博弈，完全信息動態博弈，不完全信息靜態博弈，不完全信息動態博弈。與上述四種博弈相對應的均衡概念為：Nash均衡(Nash equilibrium)，子博弈精煉納什均衡（subgame perfect Nash equilibrium←就是我下面提到的子賽局均衡），貝葉斯納什均衡(Bayesian Nash equilibrium)，精煉貝葉斯納什均衡(perfect Bayesian Nash equilibrium)。

相關連結:
賽局理論(博弈論)

第二部分:

(一)基本概念

(1)賽局組成要素:(簡易版)
a. players (2人以上,自己一個無法形成遊戲)
b. strategies (每個參與者都要有2個以上的策略)
c. outcome→payoff

(2)賽局的表達方法:
a.策略形式賽局 normal form(or strategy game):有一點像是表格化的東西(下面的囚犯兩難表格就是這一種表示方式)
b.擴展形式賽局 extensive game(又稱為賽局樹):像是以前學機率用的樹狀圖一樣

(二)

(1)Nash 均衡(Nash equilibrium or Nash stution)

假設A1,A2為1和2所可以作的策略,而最適的策略為A1*以及A2*,而A1以及A2在使用(A1*,A2*)的payoff將最好,為最適反應(best resonse),則稱之為Nash均衡!
但是真正被玩出來的payoff只有一種(是Nash均衡的其中一種,因為Nash均衡不一定只有一種)

(2)優勢策略模型

這一點我只取囚犯兩難來給大家看看!

假設(a,b) → a為甲被關的年數,b為乙被關的年數
而且還要假設,2人都不知道對方所做的決策是什麼!
(如果已經對方所做的決策則是樹於下面的子賽局均衡來解)

玩家		乙囚犯
	決策	招	不招
甲囚犯	招	(7,7) 此項為個人最適化的選擇結果,但是payoff是最差的	(2,10)
	不招	(10,2)	(4,4)

相信如果我沒有解釋大家一定看不太懂!

第一步:

假設我現在是乙囚犯,
在假設甲囚犯"招供"的狀況下,我"招"的payoff是7,而"不招"的payoff是10→選擇"招供"(因為7年比較少嘛)
在假設甲囚犯"不招供"的狀況下,我"招"的payoff是2,而"不招"的payoff是4→選擇"招供"(因為2年比較少嘛)
所以不管怎麼選擇,都是選擇"招供" (稱為優勢策略Dominant strategy)

第二步:
假設我現在是甲囚犯,
在假設乙囚犯"招供"的狀況下,我"招"的payoff是7,而"不招"的payoff是10→選擇"招供"(因為7年比較少嘛)
在假設乙囚犯"不招供"的狀況下,我"招"的payoff是2,而"不招"的payoff是4→選擇"招供"(因為2年比較少嘛)
所以不管怎麼選擇,都是選擇"招供",同第一步!

第三步:
"招供"皆是優勢策略Dominant strategy,所以"招供"則稱為優勢策略均衡Dominant strategy equilibrium
此項為個人最適化的選擇結果,但是payoff是最差的,所以上面的範例稱之為囚犯兩難!

這一點跟我們所學的傳統經濟學不太一樣,因為我們學到的東西告訴我們,當每一個人選擇最適的時候,會得到最好的福祉!
但是上面的東西則不是這樣的觀點,頗為有趣!

(3)子賽局完全均衡
這一部分是有關逐次移動賽局,跟上面的同時移動不太一樣!
不過等我下次有時間在跟大家談談好了...打這一篇網誌打得我好累啊...

這樣大家有沒有多了解一點我再說什麼啊?
嗚...好像沒有耶......