您好, 访客   登录/注册

基于BP算法和LSTM算法的汽车销售预测模型比较研究

来源:用户上传      作者:

  摘 要:汽车销售过程中存在新车与二手车销售不平均、放款受季节影响等问题。而人工神经网络适用于处理不规则、非线性的汽车销量数据,基于BP算法和LSTM算法建立15日的汽车销售预测模型,比较二者的预测效果,可以帮助销售商处理放款量及放款金额的不确定性问题。结果显示,LSTM模型对于受季节因素影响的汽车销售数据在销售台数和销售金额趋势预测方面更为有效合理,在模型预测的精度上比BP模型效果更优,可为汽车行业的销售预测提供参考。
  关键词:人工神经网络;销售预测;BP算法;LSTM算法
  中图分类号:F724.7      文献标志码:A      文章编号:1673-291X(2020)20-0084-05
  引言
  随着我国人们生活水平的提高,我国汽车销售市场重心开始下沉,汽车行业痛点显现。在此竞争局面下,以经销商的销售能力为中心解决强压库存的难题,以节约汽车相关企业的经营成本和经营风险为目标显得尤为重要。通过建立汽车销售预测模型,合理规划产能安排放款金额,免掉不必要的多余费用,是降低经营成本的重要举措。
  BP算法是人工神经网络中重要的一个算法,在解决非线性系统问题时优势明显,不少学者通过进行持续改进[1-3],在预测股价、电力、钢铁等方面应用价值突出[4-6]。杨婷、杨根科、潘常春[7](2009)利用BP神经网络定性分析每个因素的权重,建立了汽车故障率预测模型。罗戎蕾、刘绍华、苏晨[8](2014)将对服装销售影响因子分为季节、节假日和品类因素,建立3层BP神经网络学习销售预测网络模型。王锦、赵德群[9](2018)将BP神经网络与遗传算法相结合,发现可以更好地预测北京市某大型超市的大米日销量。而LSTM算法是循环神经网络的一种变体,在深度学习后能更好地处理序列化数据,其在电力负荷、流量等预测具有良好的预测效果[10-13]。李鹏、何帅等[14](2018)使用自适应矩估计算法进行深度学习发现LSTM算法在预测中精度较高。李珍珍、吴群[15](2019)在Pytorch框架下搭建LSTM模型对上证、深证指数和国内特定4支股票的最高价进行预测,发现在短时间内股票预测结果与真实值接近程度高,长时间则出现相差较大的问题。宋刚、张云峰、包芳勋和秦超[16](2019)通过自适应学习策略的PSO优化算法对LSTM模型的关键参数进行寻优,提高股票价格预测精度。因此,本文选择使用BP神经网络和LSTM神经网络解决汽车销售相关的预测问题。
  一、BP算法和LSTM算法原理
  (一)BP算法简介
  BP(Back Propagation)神经网络由Rumelhart和McClelland等科学家[17](1986)提出,用梯度下降法的基本理念和梯度搜索技术,目标是求得网络的实际输出值和期望输出值的误差均方差为最小。BP神经网络由输入层、隐藏层和输出层三部分组成,结构示意如图1所示。
  图1中,Xi表示来自第i个神经元的输入,Wh表示从输入层到隐藏层第i个神经元的连接权重,ho表示偏置项,f(x)表示激活函数,O表示模型计算输出值,y表示最终输出值。本文选取的是Sigmoid+Adaline模型。
  在上述模型的基础上,又细分为4组。
  由其特性,本文将收集到的汽车销售数据分为15天为一周期,将对象分为二手车、新车,使得BP算法在应用于解决本文中汽车销售放款问题时可以一定程度上避免陷入局部极小值。
  (二)LSTM算法简介
  LSTM(Long Short Term Mermory network)神经网络在1997年由Sepp Hochreiter[19]等人提出,主要改良了循环神经网络在处理距离较远的序列时的梯度消失问题。LSTM实现了3个门计算,即遗忘门、输入门和输出门。?滓表示sigmoid激活函数,wf表示遗忘门的权重矩阵,wi表示输入门的权重矩阵,w′c表示更新门的权重矩阵,wo表示输出门的权重矩阵,bf表示遗忘门的偏置,bi表示输入门的偏置,b′c表示更新门的偏置,bo表示输出门的偏置,ht表示t时刻的输出,C′t表示t时刻更新的细胞状态。
  二、某公司汽车销售预测分析
  (一)处理数据
  1.日期整理
  本文收集并整理了某公司汽车销售数据,并非传统连续型数据,时间范围为2017年9月30日至2019年2月20日,共510个离散数据,补全缺失的数据。
  2.数据分类
  按照汽车类别分为两类:①新车;②二手车。按照汽车销售属性分为两类:①销售台数;②销售金额。做预测时分别预测台数和金额,给公司的库存系统和业务员的业绩重点提供参考。为了避免陷入局部极小值和梯度消失等问题,将510天的数据每隔15天为一周期进行合计,缺失值以0為记录,构建完整有效的数据集,预处理后得到:①15天新车台数;②15天新车销售金额;③15天二手车台数;④15天二手车销售金额。
  (二)BP算法和LSTM算法参数设计
  本文的硬件环境和软件环境,具体如表1所示。
  根据对数据的预处理分析,BP和LSTM训练模型的参数设置总结如表2所示。
  本文选取均方误差(MSE)以及决定系数(R2)作为两个模型预测精准度的评价指标[21,22],其中,均方误差是指参数估计值与参数真值之差平方的期望值,计算公式如(1);决定系数也称拟合优度,计算公式如(2)。
  (三)预测结果对比分析
  某公司2017年9月30日至2019年2月20日的日销售数据共计510条,分别对15天新车台数、15天新车销售金额、15天二手车台数和15天二手车销售金额共4类需要进行预测的数据进行预测。左图为BP模型的预测结果,右图为LSTM模型的预测结果,蓝色表示真实数据,红色表示预测数据。预测结果如下。   如图所示,汽车销售量变化幅度较大。王旭天[23]在研究中发现,针对月度数据有周期波动特点,LSTM模型整体而言比BP模型的预测效果更佳。(1)从预测趋势上看,LSTM模型的预测值曲线在趋势上与真实值非常接近,BP模型整体趋势曲线只能大致反映真实值的情况,在数据分布差别较小的集中区域预测效果好,但一旦出现数据波动强烈处就无法表现。(2)从峰值表现上看,LSTM模型曲线明显有峰值与低值,但在每个时间点的峰值与低值的呈现结果上误差较大,在15天新车台数预测中具有明显的大于真实值的反映,在15天二手车台数和销售金额预测中误差较小,但具有明显的提前信号,每个峰值提前的间隔类似,图像表现上看比BP模型的效果要更准确。(3)从模型评价上看,BP的模型预测误差在MSE评价标准下都低于LSTM模型,说明BP模型也有较好的预测效果,数据的变化程度小的时候使用BP模型是有效的,但在决定系数R2评价标准下LSTM模型更接近1且BP模型的偏差比较大,说明整个预测曲线的拟合优度更高,跟图像表现的一致,模型预测效果更好。预测结果表明,本文发现LSTM模型对于受季节因素影响的汽车销售数据有较好的预测能力,在销售台数和销售金额趋势预测方面更有效合理,在模型预测的精度上比BP模型效果更优。
  三、结论
  在汽车行业逐渐走向饱和的今天,汽车行业的产值在国民生产中占了极其重要的地位。通过研究销售数据去预测汽车在不同季节、新车和二手车的购买动向和对客户购买习惯进行局部了解,能为市场定位和市场营销做一个深入分析,能为实体工业经济市场细分提供重要依据。
  本文对比了BP算法和LSTM算法的汽车销售台数和汽车销售金额的预测效果,对数据进行归一化处理,使用深度学习优化算法进行模型参数寻优,通过对比四类数据的预测结果,从图象和评价指标上发现LSTM神经网络的预测效果优于传统的BP神经网络,可以克服BP神经网络对非线性特征学习不充分的问题。LSTM神经网络具有记忆性,对于受季节、节假日和品类因素影响波动较大的汽车销售数据而言,可以更好进行学习和挖掘规律,为未来研究更复杂的其他类型的数据提供参考。
  参考文献:
  [1]  周永进.BP网络的改进及其应用[D].南京:南京信息工程大学,2007.
  [2]  黄庆斌.BP算法的改进及其应用研究[D].成都:西南交通大学,2010.
  [3]  刘天舒.BP神经网络的改进研究及应用[D].哈尔滨:东北农业大学,2011.
  [4]  隋惠惠.基于BP神经网络的短期电力负荷预测的研究[D].哈尔滨:哈尔滨工业大学,2015.
  [5]  趙振勇.基于遗传BP神经网络的股市预测[D].贵阳:贵州大学,2007.
  [6]  杨宏韬,张德江,李秀兰,王秀英.遗传神经网络能耗预测模型在钢铁企业中的应用[J].长春工业大学学报:自然科学版,2007,(S1):186-189.
  [7]  杨婷,杨根科,潘常春.基于BP神经网络的汽车故障率预测[J].计算机仿真,2009,26(1):267-270,275.
  [8]  罗戎蕾,刘绍华,苏晨.基于遗传算法的BP神经网络服装销售预测方法[J].北京邮电大学学报,2014,37(4):39-43.
  [9]  王锦,赵德群.遗传BP神经网络在超市大米日销售预测中的应用[J].信息与电脑:理论版,2018,(21):42-44.
  [10]  李松岭.基于TensorFlow的LSTM循环神经网络短期电力负荷预测[J].上海节能,2018,(12):974-977.
  [11]  李万,冯芬玲,蒋琦玮.改进粒子群算法优化LSTM神经网络的铁路客运量预测[J].铁道科学与工程学报,2018,15(12):3274-3280.
  [12]  李校林,吴腾.基于PF-LSTM网络的高效网络流量预测方法[J/OL].计算机应用研究:1-6.[2019-10-31].http://kns.cnki.net/kcms/detail/51.1196.TP.20181129.1137.015.html.
  [13]  胡欣球,马立新.VMD-LSTM算法在短期负荷预测中的应用[J].电力科学与工程,2018,34(6):9-13.
  [14]  李鹏,何帅,韩鹏飞,郑苗苗,黄敏,孙健.基于长短期记忆的实时电价条件下智能电网短期负荷预测[J].电网技术,2018,42(12):4045-4052.
  [15]  李珍珍,吴群.基于LSTM神经网络的股票预测算法研究[J].福建电脑,2019,35(7):41-43.
  [16]  宋刚,张云峰,包芳勋,秦超.基于粒子群优化LSTM的股票预测模型[J/OL].北京航空航天大学学报:1-11.[2019-10-21].https://doi.org/10.13700/j.bh.1001-5965.2019.0388.
  [17]  Learning internal representations by back-propagation error.Rumelhart D E,Hinton G E.Nature.1986
  [18]  陈小玲.基于ARIMA模型与神经网络模型的股价预测[J].经济数学,2017,34(4):30-34.
  [19]  Long Short-Term Memory[J].Sepp Hochreiter,Jü,rgen Schmidhuber.Neural Computation.1997(8)   [20]  Carl G.Looney.Stabilization and speedup of convergence in training feedforward neural networks[J].Neurocomputing,1996,10(01):7-31.
  [21]  Onur K?觟ksoy.Multiresponse robust design:Mean square error(MSE)criterion[J].Applied Mathematics and Computation,2005,175(2).
  [22]  楊振海.拟合优度检验[M].北京:科学出版社,2011.
  [23]  王旭天.基于BP神经网络的我国汽车销量预测分析[D].上海:东华大学,2016.
  Abstract:There are some problems in the process of automobile sales,such as uneven sales of new cars and used cars,and seasonal influence on lending.The artificial neural network is suitable to deal with irregular and nonlinear vehicle sales data.Based on the BP algorithm and the LSTM algorithm,a 15 day vehicle sales forecast model is established.the results show that the LSTM model is more effective and reasonable for the vehicle sales data affected by seasonal factors in the number of sales stations and the trend forecast of sales amount,and the accuracy of the model prediction is better than that of the BP model,which can provide a reference for the sales forecast of the automobile industry.
  Key words:artificial neural network;sales prediction;BP algorithm;LSTM algorithm
转载注明来源:https://www.xzbu.com/2/view-15298178.htm