您好, 访客   登录/注册

经济中基于马尔科夫决策过程的预测决策研究

来源:用户上传      作者:

   摘 要:经济领域中有很多系统带有马尔科夫链的特性,虽然系统状态的变化是随机的,但最终会表现出一定的统计规律性。可以通过数据分析,建立转移矩阵,构建马尔科夫决策模型,做出贴合实际情况的预测决策。在酒店用餐人数的预测问题上,通过建立模型,计算出用餐人数趋于稳定,警醒酒店提供更好的管理与服务水平;在银行不良债务变化趋势的预测上,通过计算可回收贷款预测数,便于合理设定贷款利率。
   关键词:马尔科夫链;转移矩阵;马尔科夫决策模型;预测决策
   在实际生活中,经常会碰到随机运动的系统,即系统不断的改变它的状态。而马尔科夫模型是描述这类系统的有力工具,它是最简单的一类随机系统,在自然科学和社会科学的各个领域都有着重要的作用。在经济领域方面,有许多系统具有马尔科夫链的特征,因此可以运用该理论与方法,对系统进行分析研究,做出科学的预测决策[1,2]。
  一、马尔科夫决策模型
  (2)若P(k)在k→∝的极限矩阵存在,记作limP,则limP是一个随机矩阵。该矩阵也是一个转移矩阵,且对任意的n,都有(limP)n=limP。
  假设能够计算出k步转移矩阵P(k)的极限矩阵limP,这就意味着,虽然系统的状态一直是变化的,但随着时间的推移,最终系统状态之间的转移概率会出现稳定不变的情况,即有了统计规律的特性,因此系统将演变成为一个稳定的系统[2-6]。
  二、应用举例
  在应用马尔科夫决策模型解决实际问题的过程中,为便于进行计算和分析,一般考虑实际问题的有限个状态的齐次马氏链,且其步转移矩阵的极限矩阵能够求出。下面通过对两个具体的案例进行分析,如何用马尔科夫决策模型进行科学的预测决策。
  (一)酒店用餐人数预测模型
  设某一地段有两家酒店A,B,每天到这两家酒店用餐的总人数一定,假设为N,通过统计分析发现,今日在酒店A用餐的人,明天还在A酒店用餐的概率为p1,而明天转移到B酒店的概率为1-p1;同理,今日在B酒店用餐的人,明天还在B酒店用餐的概率为p2,而明天转移到A酒店的概率为1-p2,那么经过一段时间以后,这N个人在这两家酒店用餐的分布情况如何?
   问题分析:该地段没有其他酒店,那么对于每一个顾客都有两个选择,要么去A酒店就餐,要么去B酒店,用概率论的语言来说,这个系统只有两种状态,顾客可以在这两种状态之间进行转移,虽然每次的转移都是随机的,偶然的,但在大量和长期的转移过程中,存在一定的统计规律,既可以建立概率转移矩阵,并求出极限矩阵。
  模型建立:由A→A的概率为p1,A→B的概率为1-p1,B→B的概率为p2,B→A概率1-p2,即概率转移矩阵为
  计算结果表明,如果酒店不改变原有的经营模式,300人的顾客量,每天一般分别到A,B酒店的人约有120人和180人。且随着总人数的增加,两酒店的用餐人数的比例趋于2:3。上述模型可推广至更多家酒店的用餐人数预测分析。
  由模型的计算结果可知,虽然每个人到酒店的用餐情况是随机的,但随着时间的推移,到各个酒店用餐的人数是比较固定的,体现出一定的统计规律,这是酒店管理者不可忽视的信息,这也便于警醒他们进一步改善提高管理和服务的质量,吸引更多的顾客。
  (二)银行不良债务变化趋势的预测
  银行对外发放的贷款中,会有一部分贷款逐渐变为不良贷款,一部分贷款可收回,因此,为便于对不良贷款未来变化的趋势进行预测,银行通常按以下五种方式对贷款进行分类。
  现假设上述模型中银行当前贷款总额N=500万元,其中的N1=210万元,N2=160万元,N3=130万元,即X1={210,160,130,0,0}。根据隔月账面变化情况分析,假设状态之间的转移矩阵为
   上述例子中,通过极限矩阵limP可得到,逾期贷款和怀疑贷款的变化趋势良好,约有90%和76%的贷款会被收回,即付清本金利息,小部分比例成为呆账。但是呆滞贷款的变化趋势堪忧,约有一半多的贷款会成为呆账。而贷款总额的不良债务的变化趋势X显示,500万的贷款总额,最终约有130.9万元会成为呆账,369.1万元可能收回。根据可回收贷款预测数,便于合理设定贷款利率。
  结束语:
  通过对上述问题进行模型的建立与求解,可以得到,在经济领域方面,带有马尔科夫链特性的随机系统,可采用类似的方法进行分析研究。虽然系统的状态是一个随机变化的过程,但随着系统的不断演化,最终系统状态之间的转移概率会保持不变,系统就会出现统计规律的特征,就演化为一个比较稳定的系统。能够为决策者提供预测决策的参考依据,进而提高经济效益,避免资金的亏损,改善管理质量。
  参考文献:
  [1]刘克.实用马尔科夫决策过程[M].北京:清华大学出版社,2005:8-11.
  [2]郝海,熊德国.物流运筹学[M].北京大学出版社,2017:196-203.
  [3]毕文杰,胡兵伟.基于消费者惰性与企业需求学习的动态定价[J].经济与管理,2019(04):78-85.
  [4]申成霖,張新鑫,侯文华.需求学习下考虑顾客策略行为的供应链决策[J].中国管理科学,2015(04):11-15.
  [5]黎明,沈锦发,张旭.空载出租车在马尔科夫决策中的平稳分布[J].生产力研究,2017(09):121-123.
  [6]龙浩,张书奎,张力.基于马尔科夫决策过程的高能效任务调度算法[J].计算机应用与软件,2020,37(01):242-246.
转载注明来源:https://www.xzbu.com/3/view-15301703.htm