您好, 访客   登录/注册

决策认知模型比较研究

来源:用户上传      作者:

  【摘要】本文比较地分析了决策理论代表模型:期望效用理论、前景理论及博弈论,并进一步展望了决策认知模型发展。
  【关键词】决策理论 模型 比较
  【中图分类号】C934 【文献标识码】A 【文章编号】1673-8209(2010)02-0-03
  
  决策理论的研究范式主要有两类:一是标准化范式:以理性观及其运算公理为指导、以数学建模为方法、以建立最优化或理性普适的决策模型为目标的规范性公理系统理论。其代表是期望效用理论。二是描述性范式:以西蒙的“有限理性”概念为指导、以实验和过程跟踪为方法、以探讨决策者真实决策行为为目标的行为描述性理论。其代表是前景理论。
  如果说期望效用理论和前景理论是单向决策理论的话,那么,博弈论就是一种双向弈棋式决策理论了。
  
  1 期望效用理论模型
  (1)最大期望效用理论(MEU):期望效用EU的函数形式为:。其中Pi为事件xi发生的客观概率,u(xi)为事件xi的效用函数,EU代表了决策个体偏好。其主要内容包括:
  1)结果发生的概率是客观存在的。
  2)个体决策者应遵循明确的公理系统,这是个体决策符合理性的体现,也是使效用最大化的手段,并用严密的数学方式讨论个人效用的偏好问题。
  最大期望效用理论认为个体选择应遵循的个体偏好公理包括:
  公理1(择优性公理):决策者永远都会选择具有优势的策略。
  公理2(传递性公理):对任意三种方案 A、B、C,如果理性人认为A好于B、而B又好于C,那么他一定认为A好于C。
  公理3(独立性公理):决策者对于某特定事件的策略的选择不受其它不相干的策略影响。
  公理4(完整性公理):对任意的两种策略A、B,理性人具有明确的偏好,或者A好于B,或者B好于A,或者两者无差异,三者必居其一。
  公理5(一致性公理):对于同时含有风险r和收益L的方案A、B中,若A=(r1,L1)、B=(r2,L2),且r1>r2,则决策者偏好B;若A=(r1,L1)、B=(r1,L2),且L1>L2,则决策者偏好A。
  3)个体决策追求效用最大化:理性人总是选择对他来说效用最大的策略。
  (2)主观期望效用理论(SEU):主张用主观概率代替最大期望效用理论的客观概率来计算期望值。认为随机性不是一种可客观测度的现象,而是一种“知识”现象,概率是认识论问题而不是本体论问题,概率仅代表我们对某次试验的信念(beliefs) ,事实上根本就没有什么概率,而只有确定性。
  主观期望效用理论的函数表达式:
  
  其中为事件xi发生的主观概率,u(xi)为事件xi的效用函数。
  (3)完全理性到有限理性的修正
  主观期望效用理论和最大期望效用理论一样,存在以下理想化假设基础:决策者是完全理性的、了解所有备选方案及其相关环境状态、以及它们的结果及其效用和概率测度的人,决策者根据这两者的测度计算出所有方案的期望效用(事件与其发生主观或客观概率乘积的和),择其最大者为最终决策。但是,现实中人的理性、认知能力(包括计算能力)、时间成本等都是有限的。因此,期望效用理论只能是一种形而上的公理系统,它与实际的决策行为的描述相距甚远。
  对此,美国著名的管理学大师Herbert A・Simon(1955)首次提出有限理性概念,他指出,现实中的人是界于完全理性和非理性之间的“有限理性”者(或经济的人)。经济的人寻找的是“满意的”或“足够好的”行为。决策永远不可能达到最优。
  
  2 前景理论模型
  自20世纪50年代起,期望效用理论开始受到质疑,出现了阿莱斯悖论、埃尔斯伯悖论、偏好反转等期望效用理论不能自圆其说的现象,研究替代期望效用模型的决策理论成为必要,其中前景理论(Prospect theory)最具代表性和影响力。
  前景理论由Kahneman和Tversky(1979)首次明确提出,其基本思想是保留最大期望效用理论形式,从实证出发,从人自身的心理特征、行为特点出发,研究影响判断和决策行为的非理性因素,对“理性”假设提出严肃质疑,通过对其内部各因子进行改造,以更真实地描述决策行为。
  前景理论认为,风险决策过程包括编辑(editing)和评价(evaluation)两个阶段。决策者在编辑阶段对信息进行编码、化简、归并等加工处理,找到一个中性参照点将结果区分为收益和损失;在评价阶段则以编辑的结果为基础,依据价值函数、权重函数赋予选项不同的效用值做相应计算,取其最大者作出决策。该理论的核心内容包括三方面:(1)价值函数v(x)(包括价值函数的形式及其参数估计、心理学解释、引出方法等,反映前景结果x与人的主观满足大小之间的关系)、(2)权重函数(概率P的权重与确定性事件的权重的比率,同样地包括权重函数的形式及其参数估计、心理学解释、引出方法等)、(3)价值函数与权重函数的组合:。决策结果取决于该组合的最大值。
  与期望效用函数相比,价值V取代了效用U,决策权重取代了主观概率P。
  
  3 博弈论模型
  博弈论(Game Theory)的基本概念包括参与者(Player)、行动(Actions)、信息I(Information)、策略(Strategies)、收益(Utility)、均衡和结果等,其中参与者、策略和收益是最基本的要素,参与人、行动和结果则被统称为博弈规则。博弈分析的目的就是在给定信息的条件下,运用博弈规则预测均衡。
  博弈的一个基本特征就是,参与者的收益不仅取决于自己的策略选择,而且取决于所有其他参与者的策略选择。因而有一个均衡组合的命题结果。
  博弈有很多种类型,可按不同的标志、从不同的角度进行分类。分类之间是交叉的,不存在严格的层次关系。按参与人在博弈过程中是否能够达成一个具有约束力的协议,博弈可分为合作博弈(cooperative game)和非合作博弈(non-cooperative game)。
  (1)合作博弈:是指这样一种博弈类型,它使博弈双方的利益都有所增加,或者至少一方的利益增加,而另一方的利益不受损害,因而整体的利益有所增加。合作博弈强调的是集体主义、团体理性、合作联盟。
  Shapley提出了一套公理,并据此给出了n人合作博弈的一种解法―Shapley值(由特征函数v确定,记作X(v)=(x1(v)...,xn(v)),称为合作博弈的分配策略):
  
  
  其中是N中包含i的所有子集组成的集合,|S|是子集S中的元素个数(人数),w(|S|)是加权因子。Shapley值可被认为是一种概率解释。
  (2)非合作博弈:是指一种参与者不可能达成具有约束力协议的博弈类型。非合作博弈强调个人理性、个人最优决策。非合作博弈研究人们在利益相互影响的局势中如何选决策使自己收益最大,即策略选择问题。
  1)Nash均衡(Nash equilibrium):在博弈
  
  中,如由各参与者的各一个策略组成的某个策略组合中,任一参与者i的策略,都是对其余参与者策略组合
  
  的最佳策略,也即有
  
  对都成立,则称为G的一个“纳什均衡”(Nash equilibrium)。
  对应不同的博弈类型,博弈论相应的一系列均衡概念都是在纳什均衡基础上发展起来的,基本思路是通过逐步发展为更精确合理的均衡概念。
  
  2 纳什均衡的解
  纳什均衡解的求解问题始终是博弈论的一个主要难题,其解有从只能求解简单的博弈几何图形算法向引进人工智能、群智能计算技术的演变发展趋势。
  具有量子行为的粒子群(Quantum-behaved Particle Swarm Optimization,QPSO)算法是其中一种较理想的随机全局优化算法。其原理是:在具有量子行为的粒子群算法(QPSO) 中, 粒子的主迭代公式是:
  mbest=
  随机函数
  
  其中M是该群体中粒子的总数,mbest是粒子群的中间位置,pij为Pij和Pgj之间的随机点。和u都是[0,1]的随机数。a为 QPSO的收缩扩张系数。
  QPSO的算法流程为:(1)初始化粒子群;(2)根据上述第一个公式计算mbest的值;(3) 求每个粒子适应度值, 比较求Pij;(4) 对于每个粒子比较Pij,求得Pgj;(5)更新Pgj;(6)对于粒子的每一维, 根据上述第二个公式,在Pij和Pgj之间取得一个随机点;(7)根据上述第三个公式获得一个新的位置;(8)重复(2)-(7)直到条件不满足, 迭代结束。搜索到全局最优值。
  
  4 决策模型适用范围及其局限性
  (1)期望效用理论的适用范围和局限性
  期望效用理论(EU)的一个重要意义是将不确定性和风险态度区分开来。概率描述结果的不确定性,而定义在结果空间上的效用函数性质描述了决策者对待风险的态度。对选择的态度和对结果的态度都反映在效用函数上。EU的简单和节省使它成为一个强大的模型分析工具。
  根据期望效用理论要求满足的公理而定义的效用函数并不唯一,经正仿射变换,时,U(x)与u(x)等价。效用函数是主观的,它随决策者改变,而决策者的主观看法也可能随时间变化。因此,效用函数是非常多样的。在应用中必须注意选取最切合实际情况的效用函数进行研究,否则效用理论就起不到应有的作用。
  传统的基于期望效用理论的研究方法,忽视了人的个体性。现实上,人是非理性,存在各种认识偏差,况且直觉决策大量存在于现实中。引入有限理性使得模型的理论结构复杂化。
  期望效用理论不能解释著名的Allais悖论、Friedman-Savage困惑、处置效应等(Kahneman和Tversky, 1979;Camerer, 1998)。
  (2)前景理论的适用范围和局限性
  前景理论成功地解释了很多期望效用理论不能解释的上述悖论,
  前景理论的理论前提――H・Simon首先提出来的“人是有限理性的”。前景理论的理论基础――几个试探性的判断法则及偏差: (1)代表性经验推断及偏差;(2)可得性推断及偏差;(3)锚定效应和调整性;(4)框架依赖效应及偏差。前景理论通过大量的实验和效用函数的运用,概括起来基本内容主要有四点:(1)人们不仅看重财富的绝对量,更加看重的是财富的变化量。(2)当人们面临条件相当的获得前景时更加倾向于实现风险规避;而面临条件相当的损失前景时更加倾向于风险趋向。(3)人们对损失和获得的敏感程度是不同的,人们对损失比对得更敏感。即财富减少产生的痛苦与等量财富增加给人带来的快乐不相等,前者要大于后者。(4)前期的决策的实际结果会影响后期的风险态度和决策。前期盈利可以使人的风险偏好增强,还可以降低后期的损失;而前期的损失会加剧以后亏损的痛苦,风险厌恶程度也相应提高。
  但前景理论也存在着一些不足地方。Kahneman和Tversky (1979)指出权重函数存在一些问题。例如假设,比较和两个前景,其中p+q=p'+q'<1,按前景理论,个人对这两个期望前景的偏好应该是无差异的。因此
  
  权重函数是恒等函数,这和当前的前景理论矛盾;而函数的非线性又带来了一个更严重的问题――对占优原理的潜在违背。假设x>y>0,p>p',p+q=p'+q'<1;因此占优于,如果偏好满足占优的话就有:,即当y接近x时,接近又因为,所以必须是线性的,否则必然会违背占优理论。
  前景理论作为一个描述性的模型,具有描述性模型共有的缺点:只对人们的行为进行描述,缺乏严格的理论和数学推导。因此,前景理论的研究也只能使其描述性越来越好,只是说明了人们会怎样做,而不能很好地说明人们应该怎么做。
  其次前景理论的研究方法问题,目前关于概率转换函数的研究因实验的规范化问题带来了研究的结论各不相同,甚至相互矛盾,造成各学者提出的概率转换函数和价值函数的函数形式以及估计所得的参数没有足够的解释力,阻碍了前景理论的普遍应用。
  (3)博弈论的适用范围和局限性
  博弈论的核心是研究一个多向性问题,即一个人在决策时,要充分考虑对手的反应。博弈分析的目标就是寻求一种战略均衡,在这种均衡下每个博弈者都没有兴趣选择其它的战略。
  传统决策研究的是方案最优问题,博弈论研究的是战略均衡问题。在博弈论中,参与博弈的各方在充分考虑对手的情况下,寻求自身效用的最大化,这种效用最大化是某种约束条件下的均衡结果。博弈模型中,当决策参与人的个数变为一个时,就演化成了单人的传统决策模型。
  从分析方法上来说博弈论更侧重于对多个利益主体的行为特征和规律的分析。
  期望理论、前景理论、博弈论模型的比较见附表1。
  
  5 决策认知模型研究展望
  引入新的数学方法处理决策问题或许是一种新的研究方向。线性代数中的矩阵被看成是向量空间到向量空间的映射,因此,可把决策的主要模型因素统一映射到一个数学量――矩阵来考量,并且视直觉决策为权重效用跳跃放大的结果。效用矩阵模型或许是研究决策问题的一种新模型。
  (1)定义1 效用矩阵(Utility Matrix)
  
   反映前景结果x与人的主观满足程度的映射。1×3效用矩阵UM由个人效用u11(x)、博弈效用u21(x)和直觉效用u31(x)组成。
  (2)定义2 权重矩阵(Weighting Matrix)
  
  反映人的主观对前景结果xi衡量程度的映射。3×1权重矩阵由同向权重、博弈权重和直觉权重组成。
  (3)决策认知模型:权重效用矩阵 (Matrix of Weighting Utility)
  
  决策结果取决于在权重满足大权重排它性原则下取得的、令决策者满意的权重效用。
  权重效用矩阵是1×1矩阵,因此,效用矩阵模型是个人决策(或群体决策)、博弈决策以及直觉决策等模型因素的综合结果。
  
  参考文献
  [1] 庄锦英著.决策心理学.上海教育出版社,2006.
  [2] Von Neumann,J.& Morgenstern,O.(1947).Theory of Games and Economic Behavior.Princeton: Princeton University.
  [3] Savage,L.J.The Foundations of Statistics,New York:Wiley,1954.
  [4] H.A.Simon.A Behavior Model of Rational Choice.Quarterly Journal of Economics,69,1955.
  [5] 熊立文.贝叶斯决策理论与归纳逻辑.北京师范大学学报(社会科学版)2005年第2期.
  [6] 郭文英.期望效用理论的发展.首都经济贸易大学学报.2005年第5期.
  [7] 张玲.偏好反转研究述评.心理科学.1999年第6期,P545-548.
  [8] Kahneman,D. & Tversky, A.(1979).Prospect Theory: An Analysis of Decision under Risk.Econometrica,47.
  [9] 倪中新.n人合作对策的shapley值与最大嫡法.上海师范大学学报(自然科学版)第27卷第2 期.
  [10]于敏,须文波,孙俊.纳什均衡解及其 QPSO 算法求解.计算机工程与应用.2007年第10期.
  [11]余谦,王先甲.基于粒子群优化求解纳什均衡的演化算法.武汉大学学报(理学版)2006年第1期.
  [12]姜立利.期望价值理论的研究进展.上海教育科研.2003年第2期.
  [13]夏飞,李成智.前景理论及其对政府决策的启示.现代管理科学.2005年第3期.
  [14]丁际钢,兰肇华.前景理论述评.经济学动态.2002年第9期.
  [15]王平,徐选华.前景理论研究综述.企业技术开发.2005年12月,12th期.
  [16]Kahneman, D.and Amos Tversky."Prospect Theory: An analysis of Decision Making under Risk"[J].Econometrics,1979 vo1.47,no.2:263-29.

转载注明来源:https://www.xzbu.com/3/view-11563368.htm