有鑑於大家都不知道我說的Nash均衡是什麼
決定來一篇補充給大家的筆記整理好了!
不過,小女子我也沒有說很懂啦......
所以,如果有錯,歡迎大家給予批評指教啦!
第一部分:
(這一部分是從維基百科裡面節取出來的東西)
(大家上去看看就可以明白更多資訊,不過看我整理也行啦!!!)
賽局理論(Game Theory),有時也稱為對策論,或者博弈論
應用:
目前在生物學,經濟學,國際關係,電腦科學, 政治學,軍事戰略和其他很多學科都有廣泛的應用。
賽局理論也應用於數學的其他分支,如機率,統計和線性規劃等。
具有競爭或對抗性質的行為成為博弈行為。在這類行為中,參加鬥爭或競爭的各方各自具有不同的目標或利益。為了達到各自的目標和利益,各方必須考慮對手的各種可能的行動方案,並力圖選取對自己最為有利或最為合理的方案。
目前經濟學家們現在所談的賽局理論一般是指非合作博弈,由於合作賽局理論比非合作賽局理論複雜,在理論上的成熟度遠遠不如非合作賽局理論。非合作博弈又分為:完全信息靜態博弈,完全信息動態博弈,不完全信息靜態博弈,不完全信息動態博弈。與上述四種博弈相對應的均衡概念為:Nash均衡(Nash equilibrium),子博弈精煉納什均衡(subgame perfect Nash equilibrium←就是我下面提到的子賽局均衡),貝葉斯納什均衡(Bayesian Nash equilibrium),精煉貝葉斯納什均衡(perfect Bayesian Nash equilibrium)。
相關連結:
賽局理論(博弈論)
第二部分:
(一)基本概念
(1)賽局組成要素:(簡易版)
a. players (2人以上,自己一個無法形成遊戲)
b. strategies (每個參與者都要有2個以上的策略)
c. outcome→payoff
(2)賽局的表達方法:
a.策略形式賽局 normal form(or strategy game):有一點像是表格化的東西(下面的囚犯兩難表格就是這一種表示方式)
b.擴展形式賽局 extensive game(又稱為賽局樹):像是以前學機率用的樹狀圖一樣
(二)
(1)Nash 均衡(Nash equilibrium or Nash stution)
假設A1,A2為1和2所可以作的策略,而最適的策略為A1*以及A2*,而A1以及A2在使用(A1*,A2*)的payoff將最好,為最適反應(best resonse),則稱之為Nash均衡!
但是真正被玩出來的payoff只有一種(是Nash均衡的其中一種,因為Nash均衡不一定只有一種)
(2)優勢策略模型
這一點我只取囚犯兩難來給大家看看!
假設(a,b) → a為甲被關的年數,b為乙被關的年數
而且還要假設,2人都不知道對方所做的決策是什麼!
(如果已經對方所做的決策則是樹於下面的子賽局均衡來解)
玩家
乙囚犯
決策
招
不招
甲囚犯
招
(7,7)
此項為個人最適化的選擇結果,但是payoff是最差的(2,10)
不招
(10,2)
(4,4)
相信如果我沒有解釋大家一定看不太懂!
第一步:
假設我現在是乙囚犯,
在假設甲囚犯"招供"的狀況下,我"招"的payoff是7,而"不招"的payoff是10→選擇"招供"(因為7年比較少嘛)
在假設甲囚犯"不招供"的狀況下,我"招"的payoff是2,而"不招"的payoff是4→選擇"招供"(因為2年比較少嘛)
所以不管怎麼選擇,都是選擇"招供" (稱為優勢策略Dominant strategy)
第二步:
假設我現在是甲囚犯,
在假設乙囚犯"招供"的狀況下,我"招"的payoff是7,而"不招"的payoff是10→選擇"招供"(因為7年比較少嘛)
在假設乙囚犯"不招供"的狀況下,我"招"的payoff是2,而"不招"的payoff是4→選擇"招供"(因為2年比較少嘛)
所以不管怎麼選擇,都是選擇"招供",同第一步!
第三步:
"招供"皆是優勢策略Dominant strategy,所以"招供"則稱為優勢策略均衡Dominant strategy equilibrium
此項為個人最適化的選擇結果,但是payoff是最差的,所以上面的範例稱之為囚犯兩難!
這一點跟我們所學的傳統經濟學不太一樣,因為我們學到的東西告訴我們,當每一個人選擇最適的時候,會得到最好的福祉!
但是上面的東西則不是這樣的觀點,頗為有趣!
(3)子賽局完全均衡
這一部分是有關逐次移動賽局,跟上面的同時移動不太一樣!
不過等我下次有時間在跟大家談談好了...打這一篇網誌打得我好累啊...
這樣大家有沒有多了解一點我再說什麼啊?
嗚...好像沒有耶......
留言列表