本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
/ @- a! I3 g- H" n/ w1 E# X( w
4 D5 U' }0 @, N7 y3 @) K' e7 Q严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);+ M, E9 O8 R0 z2 x
以下三个定义:
* r1 e- J5 Y Y u% l- A( ]* Z* | 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
5 U- l1 L8 a0 d5 b& v! ?: M) J 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 & q. h/ F$ G3 P' W( W7 B0 B1 U" l' E
所谓的双方优势策略则是指双方利益总和最大的策略。
- {* g) H- Y" Q4 M[编辑本段]严格优势策略举例分析
' b) F8 |0 ?# F( R4 k+ h 一、经典的囚徒困境
6 k! ]$ L9 m4 j* V, ]% n- n 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
7 T0 @: L* ~: Y) ? 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
* U! z) I$ W. }; X# u 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 : b( u( d9 g" b# i. `
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 9 K9 d& H. l* H* y; [
若二人都互相检举(互相“背叛”),则二人同样判监2年。
/ p( {8 s8 O: x) N9 `7 Z3 j + f9 d( P0 N7 m$ U1 `& G( h% W
用表格概述如下:7 |+ B* C8 [. X6 |3 J
+ z- M! z2 R/ i* m 甲沉默(合作) 甲认罪(背叛) $ ]/ ]2 |* I! _' S" ], h5 [
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
% D, C- x! F. \! D, v7 L. r$ L乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
- P7 W( C0 T: [! A" f1 K! D4 N5 A: |) }/ y
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
4 {. o- Q- H/ V! K 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: : J1 V2 W& ?8 r* U5 X
若对方沉默、背叛会让我获释,所以会选择背叛。
2 b( E' }, ~' U" _ 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 3 A& \1 C; h/ z, d* z3 L- x% F
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
$ O$ e" h8 W0 f; Z9 n9 x% P 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
& a% f6 i. I3 Y- g8 t! i 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。9 {, Z7 \, A2 r
[编辑本段]二、智猪博弈理论2 e) h, c- Z3 |* G
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
0 x. M% O8 p: a1 G6 M6 p 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 & M3 f y0 p5 c3 W
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
5 o. v6 o2 [0 v3 S2 @3 p 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
* y. ?0 {. \: G5 V) {* h' H# r$ @ “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 - M. q" H: k L& g6 L
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 . N* D1 l" [& G3 Y% [
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。! e- i& h5 ?; Z: K! \# B' B
* M* v0 m* Z9 {. `+ K: S
三、关于企业价格策略
) X- c% {6 ?5 c" J, `: s; K7 c i1 P5 Y
# K1 @$ u- g; E; k+ x3 `* a 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ' s" N' Z' f. K6 B( N
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
1 \$ `2 Q! @$ T3 O. }5 t 以下三个定义:
; W8 a- |: n. [2 {5 \& [7 u 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
2 f: u4 x0 a( O% ^) z& Y m# i 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
* [* }) r! @2 D 所谓的双方优势策略则是指双方利益总和最大的策略。 * f9 X2 t% Y/ T( z, P' Q
[编辑本段]严格优势策略举例分析, @$ ?# K9 Z# y8 F3 h
一、经典的囚徒困境
: D: J' B3 I* M' V, j: U z 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
" V/ Y8 B& Q; T' _, C: r L 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
0 `* H* q: b4 |* z2 |6 m 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 # W5 O) ?9 S- K# F, ~
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ! F5 y+ E9 [2 \* q$ L
若二人都互相检举(互相“背叛”),则二人同样判监2年。/ l7 Q3 O! v& a
% X* L9 u6 S: v9 J& T用表格概述如下:
; l% r" Q( u0 B! }( Z# j. T
$ ~1 f& u( E/ h: w) Z7 k$ A% f( }/ Y 甲沉默(合作) 甲认罪(背叛) & W6 M* \+ o( l5 g, p- M& V
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 & l* Y. ~: Z# K5 M0 r1 J# H
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 6 q8 J1 ^* h$ m- c" C* b2 J
8 x# _/ ^# g& B" f 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ) c4 Q3 ^8 }: o, B0 l) H; b% l! K
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: # i: l2 n7 g8 b0 f* q
若对方沉默、背叛会让我获释,所以会选择背叛。 8 Z$ Q& }8 Z2 \: ^6 y, O* H/ l
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 $ u U) J& V) r+ a
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
" O+ ^; U0 Y5 T \ 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ! f7 Q8 U9 ?0 Z5 D! B, J
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。+ y- O h% a+ N/ p" o
[编辑本段]二、智猪博弈理论
) h1 g- W: f j: u 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
4 r7 U" a, B. u' I4 { 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ! ]* Q* r8 w7 ~3 A
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 & q. N* A! W) k i# H( O3 T4 ?8 F& \" F
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 3 M8 F1 ]9 m" F J/ ?$ M8 \
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
$ X3 U$ C0 t' J: L 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
/ F6 B" n' y! e/ X9 S 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
4 } B2 r' o; Z! ~( `9 O8 g * o. R# W, m, x, Y7 c7 C& I# H
三、关于企业价格策略5 ~. d. m( x2 |% ?
1 X/ R( ^1 m' _ g. J ! q! L1 i1 e" Z
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
1 p( l/ c5 w$ z+ h9 p 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);7 M$ X0 {; L @: G$ B
以下三个定义:
s5 b; ?' l) |6 O 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ; M" Q1 x- t/ M% g- i
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
' U$ h% H$ O7 i' {) W 所谓的双方优势策略则是指双方利益总和最大的策略。
1 r; M. O/ h& J; u& S5 c[编辑本段]严格优势策略举例分析! `, \9 T6 N: o
一、经典的囚徒困境 * j: r5 n# Y; H
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
9 ?& f" X$ y. `( u7 i, L" u 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: + i* O! b2 ]5 b
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
# B0 U$ k7 J, I$ V8 q @4 h 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 0 E k" r& a4 V. @( E, N+ |1 t
若二人都互相检举(互相“背叛”),则二人同样判监2年。5 n/ b/ L, o) ]8 U6 e/ H$ s# }) _
# s; O+ g* ^$ K! m8 l" _/ G用表格概述如下:' G$ l5 b8 y* q* w9 ^9 N
3 w, w$ D" O7 M6 ^0 ?2 r
甲沉默(合作) 甲认罪(背叛)
) ~8 x2 e ]- W6 o2 p% D乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 % F( ~5 M6 T# F9 M
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
; I# j6 L4 W# H2 L' @( T, x0 o2 n3 W6 @7 V0 S4 H
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
7 H4 s- m0 I# _: { 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
; D( D+ b+ o- J 若对方沉默、背叛会让我获释,所以会选择背叛。 ) Y: Z" |* R) x( o3 H1 j t+ F! w
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
" `. {# O/ e9 j: d! s 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
! i5 k8 X1 `/ P6 `$ h+ a 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
- O! [+ L# z8 L( B$ Q. v& k0 L 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。/ N3 @8 c) A; ]" \/ v! I$ a0 \( J6 |
[编辑本段]二、智猪博弈理论
3 [6 k' R, I7 g" ~. N+ e6 j K: ^ 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
! C: }- P6 N. h: J$ m: U( c6 G 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
, i; L5 E; s4 S 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 5 x: V1 r0 C* p# M/ M/ w2 }
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
3 w" n* y7 Q2 z2 q7 W z0 L% t “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
. L* @; }' q% I* l2 r$ w 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 2 _* Z9 `& X: p$ D+ Z
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。+ f7 E8 H* D7 ?$ q$ e5 z
; J! l: Y, e9 c9 R- {三、关于企业价格策略- E; y$ K! s x0 Z7 [
6 |& m9 B! p5 e" ]2 m
' Z- t/ j4 q; X2 O9 ` 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
$ ?' ^# _9 D, Y& C4 {+ X 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
0 h1 F5 I& x% _# m% w' @" Y 以下三个定义:6 x q: b/ s/ r1 A, x6 d, x
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 - N7 Y# V9 q! p- ?: X
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
$ f4 n: I' `# w* ? 所谓的双方优势策略则是指双方利益总和最大的策略。
% R/ @4 D/ a$ z* I! `2 l[编辑本段]严格优势策略举例分析
: I+ Q- i! z0 i8 C' x! H 一、经典的囚徒困境 4 ?/ N6 _; R# X5 x
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: + }! P! W; P2 {7 S; S: s$ I
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
' H: e6 y7 D7 n+ T& o5 Z 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 F# F7 Q, C, f+ L& G" `
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 # G9 G: L: M# J8 ^6 t8 @! F( M
若二人都互相检举(互相“背叛”),则二人同样判监2年。
8 m1 D0 `: g- H2 J( y4 c
' a8 O+ |' I$ i( h9 D. x用表格概述如下:
( ]7 p( w2 X4 ]1 l# x W- |" s4 H1 T" z
甲沉默(合作) 甲认罪(背叛)
9 p) v. @0 l0 i: [6 h" X2 O2 G乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 K L2 M$ W8 H+ C
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 * ?1 _2 i' l/ z# w R
# B4 v7 r: ?( U" C: J) {" X 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
# |. [9 n0 M) V7 H' } ] 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
8 f1 u. l# w0 \$ R) x4 {8 z 若对方沉默、背叛会让我获释,所以会选择背叛。 : r. ?& u, m* Y0 ]; l2 U
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 $ P+ D. W; L7 ]! {; L# P- H
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
}3 i; l3 I7 o$ C' M2 o 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 + @) U: G( i! k/ G( {
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。4 v" o" g4 A9 a- ]& @$ N& |
[编辑本段]二、智猪博弈理论 |! o! C- R. Y8 r: Q M
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
* k2 C* O- Y0 X6 H 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
6 ?4 R. G! B3 R' v% | 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
2 F K( i2 c3 v7 w" K9 ^ V 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ) r! w, c; F0 f# o* A$ R
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 4 j- t7 }1 ~$ N7 z7 w& j
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 3 @: M: ^* V* d0 v$ `$ ^
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
0 a i; D0 c- j6 f6 g % M# X; N4 E# |1 L8 O4 b; W) D; p
三、关于企业价格策略
0 A& h2 O$ P8 p% ~ N2 F6 V2 u* c& C9 D9 E
. d, K9 H; Y+ P2 x: K 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
( _2 L) T; G, S) C8 A# g6 r0 S 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |