关于游客困境的见解
这是我高一升高二的暑假社会调查作业(其实明显这不是社会调查)。现在贴在这里,希望大家能够评论评论。
我们用一个故事作为开头:
甲和乙两个人跑到一个小岛上去度假,分别在同一个地方买了一样的花瓶。而负责帮他们托运行李的那家航空公司却不小心把这两个宝贝给打碎了。公司经理负责商榷赔偿事宜。经理知道如果让甲和乙一起报价,他们一定会狮子大开口。所以经理想了一个主意。
他让甲和乙独立地在2到100之间选择一个整数作为花瓶的价钱(姑且认为价钱就在其中)。如果两人选的数是一样的,那么经理便认为这个就是真实的价钱,而照价赔偿。可如果两个人的价钱不一样,经理便会认为较低价是真实价,出较高价的人在说谎。这时他以较低价作为真实的价钱,同时在真实价钱基础上多赔偿给出最低价的人两元,以此来表扬他的诚实;而出较高价钱的人会在真实价格基础上扣去两元,以示惩罚。如果你是甲或者乙中的一人,为了让自己亏得最少(赚得最多),你怎么报价?
这就是著名的游客困境(下简称TD)问题。他是美国的数学家考希克·巴苏(Kaushik Basu)于1994年提出来的一个问题。那么这个问题有着什么意义呢?
你可以先自己跟据问题的描述做出你自己的选择,你会选择几呢?
如果我告诉你,数学家通过博弈论进行数学推导的最佳结果是选择2时,你会有怎样的反应?我相信绝大多数人都不会选择这个答案。这个答案是怎样得到的呢?大多数人又选择多少?数学推导的这个答案究竟是不是最佳的呢?下面我们来一一分析。
我们先说数学家的方法——我们将抛弃代数运算符号,用通俗的语言来描述。就拿甲来说,他的第一个念头就是写下最大的数。如果乙也选择100,那么他们就同时就捞到了100元。然而,甲转念一想,如果自己选择99,那么自己岂不是可以多捞到1元钱么?不过家很快就会想到乙也有这样的打算,这是大家都变成选择99了。看来对甲来说更明智的办法是选择98,但乙肯定也是这么想的。于是他们就在这样天昏地暗的杀价之下,最后选到了2。这种分析方法被称为反向归纳法,是数学家们广泛应用的一种方法。粗看这个“合理”的推断,我们就会觉得这个结果却有些不可思议。两人都选择2,那么最后两人都只得了2元,还不如刚开始不假思索地都选择100,有点像聪明反被聪明误的老故事。那么为什么会有这个矛盾呢?这个问题就是关键。这样看似天衣无缝的推
导过程,结果却接近竹篮打水一场空。
我们再来看看大家遇到这个问题是怎么选择的。我在http://www.my3q.com/home2/167/flsxx/90686.phtml 这个网页上产生了一个问卷调查,并在qq上邀请大家来参与我的调查。很快就有几十个人作出了不尽相同的回答。我要看看当现实生活中两个人进行pk时, 大家到底怎么样出招才能赚最多钱——毕竟我们相信“实践是检验真理的唯一标准”嘛。我想要看看我模拟完每一个人和另外的人对招后,这个人平均的收益是多 少。为了处理几十个人里面每两个人的过招结果,我写了一个专门计算这个调查结果的程序来协助我。通过问卷得到的原数据和程序计算,我得到了这样一些有趣的 结果:
l 选择100的最多。
l 选择100的平均得最多(68.95元),选择2的平均得最少(3.90元)。
l 选的数越大,平均收益越高。
l 这些人平均每人得到28.28元,介于选择23与选择38的人的收益之间。
从这个调查结果看得出来,选择“合理”的2明显是最次的一手棋。这样的结果一定让数学家们大跌眼镜(下文提到了一些科学家进行过的范围更加大的实验)。他们为了寻找符合这个实验结果的数学解释,提出了很多种新的方法——这些方法在研究其它的问题上倒是有了很多的用途,唯独在这个问题上一筹莫展。
为了分析这个问题的原因所在,我们先来看另一个类似的更著名的数学模型:囚徒困境。这个“囚徒困境”是博弈论里最经典的例子之一。讲的是两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是“坦白从宽,抗拒从严“,如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。
这个例子等价于TD的迷你版:即一个把价钱的选择范围缩小到2和3之间的TD(mini)。面对这时候的TD(mini),你会选择什么?我相信大家都会选择2吧!这时候选择2,会让自己怎么样都不会处于下风。在只有两个选项的时候,人们都会选择2,那么为什么在标准的TD中,人们的意见不那么一致呢?
下面,我们就来分析为什么博弈论没能达到它的目的。
请回到前面几行中,我们提到了“不会处于下风”这样的字眼。可以说,问题就出在这里。这句话是什么意思呢?这里有两层意思。一层指的是A只要选择了坦白(即选择2),不论B怎么选择,他都不会比B差;另一层的意思是无论B怎样选择,A选择坦白得到的结果都会比选择不坦白(即选择3)要好。应该说,我们在选择的时候,最好选择能够两个条件同时满足。也就是说,我们最希望找到一个无论和自己比还是和别人比都占上风的选择。可是,如果当问题(如TD) 不能找到这样的选择怎么办?我们必定要倾向于某一方。博弈论就做出了选择。它选择更倾向于比另一个人更好,也就是横向的对比。它一定要在踩倒对方的条件 下,使自己得到更多的东西——这里的更多只是相对于前一步所作的选择,两步之后,他已经没有了纵向对比(自己和自己比)的优势,不过它不在乎,因为它不倾 向于这个。于是,这样的选择倾向,使得它陷入了一个黑洞。
而大多数人的倾向不是这样的。一部分人更在乎纵向(自己和自己比)的对比。他们一开始就会先选择100,然后自然会像前文一样进行一番推理。当他们走到97的时候会猛然惊醒,发现自己的最佳选择已经降下来了。这时候,人们就会停下来,再想想,然后他就会在98,99,100中挑一个,这是一部分人的思维。另一部分人则没有明显的倾向,他们会在两头摇摆不定,最后只好随便选一个数。还有很少一部分人,他们的倾向与博弈论的不谋而合——他们选择了2。这就是人们选择中的三股主要力量。这里我们将其命名,还可以细分一下。在100,99,98三种选择中,100是人的本能选择,而另外两者是倾向比较明确的,我们称之为纵向选择。而97~3是随机选择,2是横向推理选择。
分好类之后,我们回过头来讨论博弈论错误的原因。在这个对局里面,人们的选择是普遍比2要高的,所以当我们进行两两模拟的时候,没有选择2的人不但没有吃亏,反而把选择了2的 人踩在脚下。首先,本能选择的人最多,他们的资金在互利作用下会迅速膨胀起来;然后就是纵向选择,他们依靠本能选择的人赚了很多钱;其次,随机选择的人靠 着前面的本能选择以及纵向选择保值了;最后是惨烈的横向推理者,他们的思维不合群,“合理思维”遭到了迎头痛击。现在原因很明显了,越多的人合群,大家就 会赚得越多,这是个双赢问题。
那么有些人可能会问,如果是一个博弈论专家,他会怎么选?我可不认识什么博弈论专家,所幸的是,在今年第7期的《环球科学》中,由TD的提出者所撰写的文章中给出了一个这样的实验结果。2002年,51位博弈论学会会员参加了这个实验。这场实验还有真钱奖励,所以可以相信不会有什么人使用自己认为不好的策略。组织者还选择了一位幸运者颁发奖金,那位幸运者的平均收益为85美元,最后获得了1700美元的奖金。从这里看得出,要想随机一个人都会有85美元的平均收益,那么他们就会有很多人选择了大数——比我们这次调查里面选择大数的人数还要多。这可是博弈论专家的选择,这更有力地说明了我们大部分人的本能与博弈论的精神不符——即使他们深知博弈论也不会去抵抗自己的本能。
博弈论的失败就在于:它作为一门服务于人类的应用数学,在进行决策选择的时候,应该能够表达一些符合人类
心理学的结果,它的基础应该是基于人类思维的,否则便会陷入与实验的矛盾,失去其应有的作用。
写到这里,我对这个问题的主要思想已经阐述清楚了。思想归思想,数学可不是仅凭思想推动的。但是我现在对博弈论的专业理论还不在行,不理解这样的思维到底为何而起,也不能从理论上说明这样的特殊的横向思维到底是怎么产生的。看来,我离解决这个问题还有很长的路要走。
附:调查源数据以及处理后数据。
l 88 51 100 98 60 42 56 100 100 98 100 60 50 23 98 2 50 50 100 48 49 60 100 80 80 100 100 50 100 70 48 100 51 2 2 23 38 98 48 98 100 70 80 48 50 100 100 49 100 48 100 80 100 100 100 100 100 2 100 48
l 共有60人进行了选择
得到最多的人选择了100
共有4人选择了2,他们的平均收益为 3.90元
共有21人选择了100,他们的平均收益为 68.95元
共有2人选择了23,他们的平均收益为 19.61元
共有1人选择了38,他的平均收益为 33.05元
共有1人选择了42,他的平均收益为 36.58元
共有6人选择了48,他们的平均收益为 41.93元
共有2人选择了49,他们的平均收益为 42.56元
共有5人选择了50,他们的平均收益为 43.39元
共有2人选择了51,他们的平均收益为 43.93元
共有1人选择了56,他的平均收益为 46.95元
共有3人选择了60,他们的平均收益为 49.39元
共有2人选择了70,他们的平均收益为 54.78元
共有
yle=”font-size:78%;”>4人选择了80,他们的平均收益为 59.93元
共有1人选择了88,他的平均收益为 63.36元
共有5人选择了98,他们的平均收益为 67.73元
所有人的所得的平均值为 28.28元
(数据截至2007年8月28日)
本文由 严酷的魔王 创作,转载或引用前请联系我们。
相关文章:
标签:决策, 博弈, 博弈论, 原创, 囚徒困境, 思维, 悖论, 数据, 游客困境, 环球科学, 纳什均衡, 调查
经纪人我来了~
回复
这里有一个问题,花瓶原来值多少价?如果原本一个花瓶值30的话,单纯为了踩别人的话自己也承受损失只是损人不利己.大家还是都说实话.
回复