您好, 访客   登录/注册

基于马尔科夫链的股市大盘指数预测

来源:用户上传      作者: 车险峰

  【摘要】马尔科夫链是一种应用于随机过程的有效预测方法。在本文中,我们主要的工作是运用马尔科夫链预测模型对沪市和深市的大盘指数进行预测。我们首先是对相关的股市专用名词、马尔科夫链及其他实践中会用到的方法进行了简单介绍;在此之后的实际预测中,我们在近期沪市上证综合指数、深市深证成分股指数原始数据的基础上进行适当的计算转化,将大盘指数的变化幅度转化成3个状态,这样在很大程度上方便简化了我们后续的转移概率矩阵计算;在处理整合后的数据基础上,我们建立了马尔科夫预测模型,并结合C-K方程,转移概率矩阵对之后的大盘指数的变化(上涨、持平、下跌)的可能性进行了预测;最后,我们对模型进行了适当的评价。
  【关键词】马尔科夫链;随机过程;大盘指数;C—K方程
  一、相关背景知识介绍
  在做基于马尔科夫链的股市大盘指数预测之前,我们就“什么是股市大盘”,马尔科夫链的相关背景知识以及之前学者在此类问题上的研究分析做了一定的了解。下面,我们将把我们了解到的知识在本文的第一板块做出归纳总结。
  1、大盘指数
  中国股票大盘指数是指:沪市的“上证综合指数”和深市的“深证成分股指数”。上证综合指数(Shanghai(securities)composite index):在上海证券交易所挂牌上市的全部股票(包括A股和B股)为样本,以发行量为权数(包括流通股本和非流通股本),以加权平均法计算,以1990年12月19日为基日,基日指数定为100点的股价指数。深证成分股指数是深圳证券交易所编制的一种成份股指数,是从上市的所有股票中抽取具有市场代表性的40家上市公司的股票作为计算对象,并以流通股为权数计算,以1994年7月20日为基期,基日指数定为1000点的加权股价指数,综合反映了深交所上市A、B股的股价走势。股票价格指数是由证券交易所或金融服务机构编制的表明股票行市变动的一种供参考的指示数字。由于股票价格起伏无常,投资者必然面临市场价格风险。对于多种股票的价格变化,投资者要逐一了解,既不容易,也不胜其烦。为了适应这种情况和需要,一些金融服务机构就利用自己的业务知识和熟悉市场的优势,编制出股票价格指数,公开发布,作为市场价格变动的指标。投资者据此就可以检验自己投资的效果,并用以预测股票市场的动向。同时,新闻界、公司老板乃至政界领导人等也以此为参考指标,来观察、预测社会政治、经济发展形势。这种股票指数,也就是表明股票行市变动情况的价格平均数。
  大盘指数有其两面性。一方面,它只是反映了整个股票市场中资金和股票的流动量;而另一方面,它又会给投资者造成极大的假象,极大地误导投资者。大盘指数对整个股票市场的涨跌有很大的放大效应,却不能真实地反映个股也就是上市公司的基本面。
  2、马尔科夫链
  2.1、马尔科夫性
  马尔科夫链(Markov Chain),因安德烈·马尔科夫(A.A.Markov,1856-1922)得名,是数学中具有马尔科夫性质的离散时间随机过程。我们知道,事物的发展状态总是随着时间的推移而不断变化的。在一般情况下,人们要了解事物未来的发展状态,不但要看到事物现在的状态,还要看到事物过去的状态。马尔科夫认为,还存在另外一种情况,人们要了解事物未来的发展状态,只需知道事物现在的状态,而与事物以前的状态毫无关系。
  马尔科夫链描述了一种状态序列,其每个状态值取决于前面有限个状态。马尔科夫链是具有马尔科夫性质的随机变量X1,X2,X3……的一个数列。这些变量的范围,即它们所有可能取值的集合,被称为“状态空间”,而Xn的值则是在时间的n状态。如果Xn+1对于过去状态的条件概率分布仅是Xn的一个函数,则P(Xn+1=χ|X1=χ1,X2=χ2,…,Xn=χn)这里χ为过程中的某个状态,上面这个恒等式可以被看作是马尔科夫性质。
  2.2、马尔科夫过程及马尔科夫链
  在已知客观事物目前的状态(现在)条件下,它未来的演变(将来)不依赖它以往的演变(过去)。这种已知“现在”的条件下“将来”与“过去”独立的特性称为马尔科夫性,具有这种性质的过程称为马尔科夫过程。时间和状态均为离散的马尔科夫过程称为马尔科夫链。
  状态是指客观事物可能出现或存在的状态;状态空间是指随机过程可能取到值的集合,记为S(S至多是一个可数集,即或者S是有限集,或者S可与自然数一一对应);状态转移是指客观事物从一种状态转移到另一种状态的概率。
  在链的状态下,马尔科夫性通常用条件分布表示,离散状态的马尔科夫链,记为随机序列{Xn=X(n),n=1,2,…},对于任意的正整数n,m和0t1  P(Xn+m=αj|Xt1=αi1,Xt2=αi2…,Xm=αi)=P(Xn+m=αj|Xm=αi)
  记P(Xn+m=αj|Xm=αi)=Pij(m,n+m),
  P(Xn+m=αj|Xm=αi)=Pij(m,n+m)为马尔科夫链在时刻m处于状态i条件下,在时刻n+m转移到状态j的转移概率。
  2.3、转移概率矩阵
  由转移概率组成的矩阵P(n,n+m)=(Pij(n,n+m))称为马尔科夫链的转移概率矩阵。
  由概率矩阵性质有:0Pij1 P(n,m)1T=1T(上标T表示转置运算)
  1是分量全是1的无穷行向量矩阵,其维数与马尔科夫的状态数一致。
  证明如下:ΣkPij(n,m)=ΣjP(Xm=αj|Xn=αi)
  =P(∪j{Xm=αj|Xn=αi})
  =P(Ω|Xn=αi)
  =1
  即此矩阵的每一行元素之和为1.
  当转移概率Pij(n,n+m)只与i,j及时间间距有关时,称此转移概率具有平稳性,也称此链为时齐的。   2.4、C-K方程
  设{X(n),n=0,1,2…}是一齐次马尔科夫链,则对任意的u,v∈T1,有
  Pij(u+ν)=Σ∞k=1PiK(u)Pkj(ν),i,j=1,2,…
  这就是著名的Chapman-Kolmogoro方程,简称C-K方程。C-K方程基于下述事实,即“从时刻S所处的状态αi,即X(s)=αi出发,经时段u+v转移到状态αj,即X(s+u+v)=αj”。这一事件可分解为“从X(s)=αi出发,先经过时段u转移到中间状态αk(k=1,2…),再从αk经时段v转移到状态αj”这样一些事件的和事件。
  也就是说,对齐次马尔科夫链而言,n步转移概率矩阵是一步转移概率矩阵的次方。进而可知,链的有限维分布可由初始分布与一步转移概率完全确定。
  3、马尔科夫链在股市大盘指数预测中的运用
  随着我国市场经济建设的高速发展,人们的生活水平大幅度提高,可支配收入也渐渐多了起来,人们的金融意识和投资意识也日益增强,投资理财越来越成为一个热门的话题。由于我国的资本市场不发达,人们的投资选择范围相对要窄一些,在实际利率为负的情况下,投资股市成为主流投资行为。中国证券登记结算有限责任公司官网数据,2012年9月24日—2012年9月28日,新增A股开户数11.80万户,新增B股开户数157户,期末A股账户数16713.04万户,期末B股账户数252.91万户,期末有效账户数13941.49万;人民币结算总额44482.68亿元,人民币结算净额2362.84亿元。作为市场经济的组成部分—股票市场,也正逐步走向成熟与规范。国外资本市场的发展历史已经证明股票是一种不仅在过去已提供了投资者可观的长期利益,并且在将来也将提供良好机遇的投资载体。在买卖股票中有一个事半功倍的原则就是“顺势而为”,即当大盘处于持续上涨阶段的时候买入股票,选股成功率会比较高。一个有效的股票市场,其大盘指数应该是随机波动的,反映市场信息的同质等量分布。我们可以通过分析过去的信息,分析大盘指数运动趋势,来预测大盘指数的未来可能的走势。马尔科夫模型是利用某一变量的现在状态和动向,去预测该变量未来的状态及其动向的一种分析手段。
  二、马尔科夫链预测模型的建立
  1、马尔科夫链预测模型需要满足的条件
  当用马尔科夫链进行预测时,要求预测对象必须满足下列条件:
  ①过程的随机性。即客观事物从一个状态转移到另一个状态是随机的。
  ②过程的无后效性。即客观事物的转移概率只与当前状态有关,不受以前状态的影响。
  ③转移概率矩阵保持稳定。
  2、股市大盘指数满足马尔科夫链预测模型需要满足的条件
  ①股市大盘指数为依赖时间的随机变量,其变化过程是一个随机过程。
  ②股市大盘指数所处的状态只与所在时刻有关,而与时刻以前的状态无关。
  ③股市大盘指数状态的一步转移概率只与时间差S有关,与时间起点无关,即保证转移矩阵稳定。
  3、马尔科夫预测模型的建立
  运用马尔科夫链预测方法来预测目标对象,就需要建立马尔科夫链预测数学模型。模型建立的基本原理前面已经做出介绍,即利用初始状态概率向量和转移状态概率矩阵来推知被预测对象将来一个时期所处的状态。
  记Pj(0)=P{X0=αj},αj∈S,j=1,2,…(1)
  上式为马尔科夫链的初始分布。
  Pj(n)=P{X0=αj},αj∈S,j=1,2,…(2)
  上式为马尔科夫链任意时刻的一维分布。
  显然,应有Σ∞j=1Pj(n)=1。又P{Xn=αj}=Σ∞i=1Pj{X0=αi,Xn=αj}
  P{Xn=αj}=Σ∞i=1Pj{Xn=αi|X0=αj}P{X0=αi}
  =Σ∞i=1Pj{X0=αi,Xn=αj}(3)
  一维分布(2)也可用行向量表示成
  P(n)=(P1(n),P2(n),…,Pj(n),…)(4)
  利用矩阵乘法,(2)可以表示成
  P(n)=P(0)P(n)=P(0)Pn(5)
  此式表明,马尔科夫链在任意时刻n∈T1时的一维分布由初始分布P(0)和n步转移矩阵所确定,(5)式即为马尔科夫链预测模型。
  三、模型在指数大盘指数预测中的应用
  对于股市大盘而言,大盘点数在第n天的收盘价是一个随机变量,{X(n),n0}是一个随机过程,我们假定股市大盘具有无后效性与齐次性。
  为了简化问题,我们将沪市2012年09月06日—2012年10月11日全部交易日内大盘指数情况(如表1)做如下处理:大盘指数下跌超过30点,称为下降,记为状态“1”,大盘指数下跌或者上涨在30点范围内,称为持平,记为状态“2”,大盘指数上涨超过30点,称为上涨,记为状态“3”,处理后的数据如表2.
  沪市2012.09.06——2012.10.11全部交易日内大盘指数情况
  表1
  交易日期收盘价格
  2012-10-112302.53
  2012-10-102324.12
  2012-10-092320.16
  2012-10-082270.05
  2012-09-282293.11
  2012-09-272251.72
  2012-09-262184.89
  2012-09-252210.15
  2012-09-242215.52
  2012-09-212199.06
  2012-09-202195.95   2012-09-192246.24
  2012-09-182235.24
  2012-09-172258.71
  2012-09-142315.54
  2012-09-132298.46
  2012-09-122320.07
  2012-09-112311.89
  2012-09-102326.67
  2012-09-072317.18
  2012-09-062217.82
  表2
  顺序状态顺序状态顺序状态
  1392172
  22101183
  32112192
  42122202
  52132212
  62142
  71153
  82163
  资料来源:根据网易财经专页数据整理
  由表2可知,最后一个交易日的大盘状态为2而无转移状态,故出现2的次数为15-1=14,出现3的次数为4次,出现1的次数为2,由3转为1的次数为0,故P31=0,由3转为2的次数为3,故P32=3|4=0.75,由3转为3的次数为1,故P33=0.25。同理可得,P21=0.14286,P22=0.71428,P23=0.14286。P11=0,P12 =1,P13=0。由此可得到沪市大盘此阶段收盘价的一步转移概率矩阵为:
  用2012.10.11沪市大盘收盘价为初始状态,P(0)=(0,1,0)。利用模型,可计算得
  P(1)=P(0)×P 0100.14286 0.71428 0.14286 0 0.750.25
  =(0 1 0)× 0100.14286 0.71428 0.14286 0 0.750.25
  =(0.14286 0.71428 0.14286)
  这表明2012.10.11后沪市第一个交易日大盘指数下跌的可能性为14.286%,持平的可能性为71.428%,上涨的可能性为14.286%。
  第二个交易日大盘指数状态概率向量为:
  P(2)=P(0)×P2=(0.10204 0.7602 0.13776)
  即第二个交易日大盘指数下跌的可能性为10.204%,持平的可能性为76.02%,上涨的可能性为13.776%。
  第n个交易日状态指数概率向量为:
  P(n)=P(0)×Pn
  用同样的方法我们对深市的大盘指数进行了预测。深市2012年09月06日—2012年10月11日的全部交易日内大盘指数原始数据如表3所示,处理后的数据如表4所示:
  深市2012.09.06——2012.10.11全部交易日内大盘指数情况
  表3
  交易日期收盘价格
  2012-10-118665.09
  2012-10-108773.68
  2012-10-098743.86
  2012-10-088540.08
  2012-09-288679.22
  2012-09-278486.27
  2012-09-268193.37
  2012-09-258284.25
  2012-09-248310.94
  2012-09-218201.53
  2012-09-208202.20
  2012-09-198431.74
  2012-09-188390.15
  2012-09-178483.69
  2012-09-148740.05
  2012-09-138691.00
  2012-09-128786.73
  2012-09-118739.47
  2012-09-108769.54
  2012-09-078709.07
  2012-09-068288.27
  表4
  顺序状态顺序状态顺序状态
  1391173
  23103181
  33111193
  42122202
  53133211
  61142
  73151
  81163
  资料来源:根据网易财经专页数据整理
  由此表可知,最后一个交易日的大盘状态为1而无转移状态,故出现1的次数为7-1=6,出现2的次数为4次,出现3的次数为10,由3转为1的次数为4,故P31=4|10=0.4,由3转为2的次数为3,故P32=0.3,由3转为3的次数为3,故P33=0.3。同理,P21=0.5,P22=0,P23=0.5,P11=0.1667,P12 =0.1667,P13=0.6666。
  由此可得到深市大盘此阶段收盘价的一步转移概率矩阵为:
  用2012.10.11深市大盘收盘价为初始状态,P(0)=(1,0,0),利用模型,可计算得
  P(1)=P(0)×P0.1667 0.1667 0.6666 0.5 0 0.5 0.4 0.3 0.3
  =(1,0,0)×0.1667 0.1667 0.6666 0.5 0 0.5 0.4 0.3 0.3
  =(0.1667 0.1667 0.6666)
  这表明2012.10.11后深市第一个交易日大盘指数下跌的可能性为16.67%,持平的可能性为16.67%,上涨的可能性为66.66%。   第二个交易日大盘指数状态概率向量为P(2)=P(0)×P2
  =(0.37779 0.227769 0.394452)
  第n个交易日状态指数概率向量为:
  P(n)=P(0)×Pn
  根据作出的模型,然后我们小组的成员查阅沪市2012年10月11以后若干日的收盘价格,列表如下:
  表5
  交易日期收盘价格
  2012-10-122304.53
  2012-10-152294.86
  又由于已知2012年10月11日的大盘指数为2302.53点,比较可知下一个交易日为持平状态,而我们预测的2012.10.11后沪市第一个交易日大盘指数持平的可能性为71.428%,说明马尔科夫预测模型效果还是不错的,同理可以知道2012年10月15日的大盘指数为2294.86点,也为持平状态,而我们预测的P(2)=P(0)×P2=(0.10204 0.7602 0.13776),即持平的可能性为76.02%,这两次预测值与实际值的对比说明了用马尔科夫预测模型预测大盘指数还是具有较强可行性的。
  深市2012年10月11以后若干日的收盘价格,列表如下:
  表6
  交易日期收盘价格
  2012-10-128650.19
  2012-10-158621.97
  已知2012年10月11日的大盘指数为8665.09点,可知道下一个交易日为持平状态,而我们预测的2011年10月11日后深市第一个交易日大盘指数持平的可能性为16.67%,而上涨的可能性为66.66%;10月15日的收盘价格为8621.97点,是持平状态紧邻我们设定的下跌边缘,而我们预测的2012年10月15日的大盘指数持平的概率为22.78%,下跌的概率为37.78%,这说明仅凭马尔科夫预测模型估计大盘指数并不完全可靠,但这也并不能否定其在大盘指数预测中的作用,毕竟,大盘指数受很多方面因素的影响,通过这一简单模型并不能代表所有因素。
  四、模型评价
  1.马尔科夫性(无后效性),对历史数据需求不多,预测方法具有很多优点;
  2.马尔科夫模型不需要从复杂的预测因子中寻找各因素之间的相互规律,只需要考虑事件本身的历史状况的演变特点,通过计算状态转移概率来预测内部状态的变化;
  3.马尔科夫链预测模型关键在于转移概率矩阵的可靠性,因此该模型需要适量的足够准确的统计数据才能保证预测精度,这样的统计数据要求长时期内变化的详细记录。我们直接通过相关软件查到上市大盘和沪市大盘数据并作适当的处理,保证了统计数据的准确性;
  4.由于影响股票价格的因素很多,而其中大多是无法量化更不能用简单的模型简化,因此通过马尔科夫预测模型预测出来的大盘指数往往与真实值存在较大差异;
  5.马尔科夫链预测只适用于短期预测,在长期预测方面精度不够;
  6.为了分析问题的方便,我们将指数变化情况转化成了3个状态,这使得预测出来的结果只能体现大盘指数变化的大致趋势,对于实际操作指导方向不是很具体明确。
  参考文献:
  [1]韦丁源,股市大盘指数的马尔科夫链预测法[J],广西广播电视大学学报,19卷第3期:66—69页,2008(9).
  [2]盛骤,概率论与数理统计[M],北京:高等教育出版社,2003.
  [3]夏莉,黄正洪,马尔科夫链在股票价格预测中的应用[J],商业研究,2003(4)
  [4]王成镇,股票价格指数的预测与风险分析[D],东南大学,2003
  [5]Sheldon M.Ross,应用随机过程:概率模型导论(第10版)[M],北京:人民邮电出版社,2012.
  [6]http://www.chinaclear.cn/,2012.10.11中国证券登记结算有限责任公司,每周市场概貌.
  [7]http://quotes.money.163.com/gi/home/detail/399300.html,上证综合指数.
  [8]http://quotes.money.163.com/gi/home/detail/399001.html,深证成分股指数.
转载注明来源:https://www.xzbu.com/2/view-4148634.htm