基于因子分析的会计舞弊识别模型
来源:用户上传
作者: 赵英林 陈素华
[摘要]本文采用我国64家有过会计舞弊行为的上市公司以及与之对应的64个非会计舞弊的上市公司为样本,采用因子分析与logistic回归相结合的方法构建会计舞弊识别模型。首先,对选取的17个财务指标进行因子分析,并提取出5个公因子,其次将这五个公因子纳入logistic回归模型中进行分析,最终构建出判正率达到79.7%的会计舞弊识别模型。
[关键词]会计舞弊;因子分析;logistic回归
[中图分类号]F230 [文献标识码]A [文章编号]1008-2670(2007)06-0057-04
随着全球资本市场一体化的加速,会计介入经济活动的范围日益扩大。会计在对经济发展起着重要促进作用的同时,会计舞弊现象也日益盛行和蔓延。21世纪以来,会计舞弊案件接踵而至,会计舞弊问题已成为全球的焦点。安然、世通、施乐、南方保健等公司会计舞弊丑闻相继曝光。在我国,由于证券市场起步较晚,法律制度不完备,监管体制不健全等诸多原因,我国上市公司会计舞弊案件更是层出不穷,从20世纪90年代初的深圳原野、长城机电、海南新华到21世纪的郑百文、黎明股份、三九医药、银广厦、蓝田股份等。会计舞弊案件严重损害了投资者的利益,威胁了证券市场的生存与发展。因此,如何从纷繁复杂的财务信息中识别会计舞弊行为,从而减少会计舞弊的误导行为成为当务之急。根据我国证券市场的实际情况,本文尝试运用多元统计分析的因子分析法与Logistic回归分析相结合的方法,建立一种新的识别上市公司会计舞弊行为的模型。
一、国内外相关研究回顾
国外学术界对会计舞弊问题关注已久,并在识别方法上取得了大量的研究成果。Persons(1995)运用logistic回归模型成功判定了大部分会计舞弊,并指出会计数据包含甄别会计舞弊的有效信息。Greenand Choi(1997)以财务指标为输出变量,采用人工神经网络技术构造了在原始财务数据基础上的会计舞弊判别模型,并发现这一模型将大大改善独立审计师发现舞弊行为的能力,并建议审计师在审计初始阶段使用该模型。Benish(1997,1999)提出概率分析法,他以1987~1993年问受美国证监会处罚的74家公司为会计舞弊样本,选用8个财务指标,建立Probit回归预测模型,该模型准确率达到75%。
我国理论界对会计舞弊研究起步较晚,且大部分研究集中于规范研究,实证分析较少。阎达五、王建英(2001)对上市公司的财务指标进行分析,发现应收账款周转率、毛利率、资产质量指标、销售额增长指标、资产负债率指标可为投资者分析上市公司是否进行会计舞弊提供有益的参考。柏宝春(2003)从定性角度介绍了五种识别会计欺诈的方法和途径:关注外部财务指标、关注审计风险大的科目、三大报表的勾稽关系分析、现金流量表的结构分析和异常波动指标分析。娄权(2003)采用描述性统计、两总体均植异方差检验和二元Logistic回归对我国上市公司财务报告舞弊的经验研究表明,规模较小和财务状况恶化的企业更容易发生财务舞弊。张长海等(2005)以29个舞弊样本和29个非舞弊样本,采用单变量和多变量统计技术建立识别虚假财务报告的模型,并发现模型的正确识别率在75%以上。毛道维(2006)以68个舞弊样本和68个非舞弊样本,分别采用4方法建立识别模型,并发现Logistic回归模,型识别率最高,达到77%。
总的看来,我国学术界绝大多数研究者仍然采用对异常的财务指标进行分析来识别上市公司会计舞弊行为,这种经验分析方法不仅工作量大,而且对分析者的专业知识水平要求较高。相对于这种经验识别方法,基于统计分析的识别模型在处理财务数据,减少主观判断和提高识别准确率方面更具有优势。
二、研究方法与研究设计
(一)研究方法
本文主要采用的研究方法是因子分析和Logistic回归相结合的分析方法。因子分析(Factor Analysis)是多元统计分析技术的一个分支。起源于1904年查尔斯・斯皮尔曼在美国心理学杂志上发表的一篇文章。在以后的三四十年里,因子分析的理论和数学基础得到逐步完善。其主要思想是:在科学研究过程中,需要对反映事物的多个变量进行大量的观测,收集大量数据进行分析寻找规律。多变量大样本会为研究提供丰富的信息。但是多个变量之间可能存在相关性,会增加问题分析的复杂性。盲目减少指标会使原指标包含的信息丢失。因子分析是一种降维的方法。通过因子分析把一组观测便量化为少数几个因子,这几个因子包含了原来指标的大部分信息。然后可以用这几个因子代替原来的观测变量,进行其他的统计分析,如回归分析、路径分析、判别分析和聚类分析等。
因子模型的一般表达式为:xi=ai1f1+ai2f2+…+aimfm+ui(i=1,2,3,4,…,k)
在该模型中f1、f2…fm叫做公因子(CommonFactors),它们是各个观测变量所共有的因子。ui称为特殊因子(unique Factors),相当于多元回归中的残差项,表示该变量不能被公因子所解释的部分。aim称为因子负载(Factor Loading),它是第i个变量在第m个公因子的负载。
因子分析通常包括以下四个步骤:
首先,计算所有变量的相关矩阵。相关矩阵是因子分析要常用的数据,根据计算的相关矩阵,还应该进一步判断应用因子分析方法是否合适。第二步提取因子。在这一步里要确定因子的个数和求因子解的方法。第三步是进行因子旋转。这一步的目的是通过坐标变换使因子解的实际意义更容易理解。第四步是计算因子值。因子值是各个因子在每个案例上的得分值。有了因子值可以在其他的分析中使用这些因素。
Logistic回归类似于线性回归模型,但它更适用于因变量为二值的情况,而且相对于多元判别分析,它的理论前提宽松,没有严格假定限制。在Logist回归模型中,通常用N表示一个试验单元,它的取值由两种可能,分别记为0和1。M=(M1,M2…Mt)表示自变量,可用来说明N发生概率的大小,即p=Prob(N=1 lM),而p可以由Logistic回归方程得到:
Logit(p):ln(p/1-p)=α+β1M1+β2M2+…
+βtMt
其中,M表示自变量,β表示与M对应回归系数,α表示模型截距,α和β都是待估计的参数。在计算出待估计的参数后,某一特定情况发生的概率就可以通过以下公式得到:
p=exp(α+βM)/[1+exp(α+βM)]
(二)研究设计
1.样本选择
本文选取1998~2005年被证监会网站公开查处的64家会计舞弊的上市公司为研究样本,并选取了与舞弊样本配对的64个控制样本。控制样本的选取条件为:与舞弊公司行业相同、规模相近、且未被证监会处罚的非ST、PT公司。数据来源于中国证监会网站、巨潮资讯网、上市公司资讯网。
2.变量定义
由于各公司出现会计舞弊的本质原因不一定完全相同,很难用简单的几个财务指标来做充分描述,因此本文选取会计舞弊可能导致异常波动的17个财务指标作为研究自变量:X1销售毛利率、X2总资产收益率、X3应收账款周转率、X4存货周转率、X5固定资产周转率、X6总资产周转率、X7流动比率、x8速动比率、X9资产负债率、X10股东权益比率、X11净利润增长率、X12利润总额增长率、X13现金比率(现金与现金等价物之和/流动负债)、X14销售现金比率(销售商品提供劳务收到的现金/主营业务收入)、X15现金营运指数(净利润/经营活动产生的现金净流量)、X16全部资产现金收回率(经营活动产生的现金净流量/平均资产)、X17每股经营活动现金流量。因变量为Y,表示上市公司是否会计舞弊,如果舞弊,则Y为1,否则为0。
三、实证检验与分析
(一)因子分析
本文首先采用因子分析,借助SPSS13.0软件对自变量X1至X17进行数据分析。在分析过程中主要采用以下几个方案:首先,采用主成分分析法求解因子载荷矩阵;第二,在提取公因子时选取特征值大于1的因子;第三,在因子旋转时采用最大方差分析法。分析结果如下:
根据旋转后的因子成分矩阵(表3)显示,可以提取5个公因子。将原来的17个变量用这5个公因子来表不。
FACl=0.952X7+0.947X8+0.825X9-0.81X10+0.775X13+…+0.045X12,在公因子FACl中,X7流动比率,X8速动比率,X9资产负债率,X10股东权益比率,X13现金比率具有较大的载荷,因此可以将第一个因子命名为偿债能力因子。
FAC2=0.04X7+0.04X8+0.191X9-0.215X10+0.178X13+…+0.022X12,在公因子FAC2中,X16全部资产现金收回率,X17每股经营活动现金流量,X14销售现金比率,X15现金营运指数具有较大的载荷,因此可以将第二个因子命名为现金创造能力因子。
FAC3=0.018X7+0.017X8+0.029X9-0.018X10+0.108 X13+…+0.026X12,在公因子FAC3中,X5固定资产周转率,X6总资产周转率,X4存货周转率,X3应收账款周转率具有较大的载荷,因此可以将第三个因子命名为经营能力因子。
FACA=-0.016X7-0.018X8+0.102X9-0.119X10+0.081X13+…+0.07X12。在公因子FACA中,X1销售毛利率,X2总资产收益率具有较大的载荷,因此可以将第四个因子命名为获利能力因子。
FAC5=0.006X7+0.017X8-0.033X9-0.005X10+0.037X13+…+0.884X12。在公因子FAC4中,X11净利润增长率,X12利润总额增长率具有较大的载荷,因此可以将第五个因子命名为发展能力因子。
(二)Logistic回归检验及会计舞弊识别模型的构建
根据因子分析得到了五个变量即FACl(偿债能力因子)、FAC2(现金创造能力因子)、FAC3(经营能力因子)、FAC4(获利能力因子)、FAC5(发展能力因子),将其纳入模型中进行Logistic回归分析。运用SPSS13.0软件,选择Forward:Wald方式,将不符合条件的变量剔除出模型。最终得到模型的卡方值为68.603,显著性水平为.000,说明模型包含的自变量整体检验非常显著。Cox&Snell R2为0.415,Nagelkerke R2为0.553,说明方程的拟和度较好。Hosmer-Lemeshow统计量大于0.05,也可以说明模型的拟和度较好。
表4是以概率值0.5作为舞弊公司和非舞弊公司的分界点,得出的预测值与实际数据的比较表。可以看出64家舞弊公司中有11家被误判为非舞弊公司;64家非舞弊公司中有15家被误判为舞弊公司。总的正确判断率为79.7%,可以有效地识别会计舞弊的公司,误判率较低。
表5为最终模型中各变量的相关统计量,从显著性水平来看,FACl(偿债能力因子)、FAC2(现金创造能力因子)、FAC3(经营能力因子)、FAC4(获利能力因子)的显著性都小于0.05,说明这四个变量都是显著的。因此可以得出会计舞弊的识别模型为Logit(p)=-0.724-0.593FAC1-1.141FAC2-3.584FAC3+1.109FAC4,记z=Logit(p),则概率p=ez/(1+ez)。即利用FAC1、FAC2、FAC3、FACA就可以计算出上市公司发生会计舞弊的概率。
四、研究结论
实证结果表明,采用采用因子分析和Logistic回归模型相结合建立的会计舞弊识别模型具有较好的预测效果。由于因子分析方法是一种科学的统计分析方法,因此使得模型最终包含的变量具有较强的解释力。此外,利用该模型对会计舞弊行为的识别成本低。由于模型最终仅包含15个财务指标,而且这些指标计算简单,因此使得模型具有很强的实用性。对于监管部门,可以利用该识别模型缩小监管范围,集中监管资源,取得更好的监管效果。对于投资者,也可以利用该模型识别上市公司的会计舞弊行为,从而避免遭受损失。
尽管模型具有一定有效性,但是仍然不能将舞弊公司完全从样本中筛选出来。主要是因为模型可能还存在以下局限性:第一,受我国证券市场的局限,所选取的样本容量不大,且随机性较大,这对模型的有效性会产生一定影响。第二,受资料来源的局限,本文选择的识别变量仅限于财务指标,如果考虑一些非财务指标如公司治理结构、管理当局特征等,可能会提高模型的有效性。
责任编辑 赵 利
转载注明来源:https://www.xzbu.com/2/view-458206.htm