基于熵和神经网络的世界语言人数预测模型
来源:用户上传
作者:
摘 要:随着时代的进步,全球的语言正发生着巨大的变化。语言的交流与人数增长趋势将对经济全球化的发展带来影响。基于以上问题,我们用建立模型的方法,利用熵权法初步处理不同语言各个维度信息,再利用神经网络来预测未来各语言人数的发展趋势。
关键词:世界语言人数;熵权法;神经网络
近年来随着科技的进步与世界文化的融合与交流,随之而来的是语言的问题。目前地球上大约有6900种语言。说某种语言的人口总数受到多种因素的影响,比如移民政策,国际交流等。在学校、迁移的文化团体和移民国等地的人们很有可能会说第二语言。此外,在我们经济全球化发展的的世界中,还有一些额外的因素使得地理上相距遥远的语言可以相互作用。这些因素包括国际贸易的兴起,世界旅行的增加,社交媒体与电子通讯的发达,以及技术的进步可以实现快速和简单的语言翻译。因此研究语言分布人口总数就有着重要的意义。
1 研究方法概述
(1)熵目前在工程与经济等领域得到了非常广泛的应用。根据信息论基本原理,信息用来度量系统有序程度,熵是用来度量系统无序程度;如果指标的信息熵很小,表明该指标拥有的信息量很大,在综合评价中起着更大的作用,权重就会更高。[3]因此,我们可利用信息熵这个工具,得到每个指标的权重。
(2)神经网络。人工神经网络是在现代神经科学的基础上提出和发展起来的,旨在反映人脑结构及功能的一种抽象数学模型。[1]人工神经网络基本神经元模型包括一组连接,一个求和单元和一个非线性激活函数还有一个阈值。连接中的强度用权值表示,权值为正表示激活,反之表示抑制。
J(w)=12‖t-y‖
J是输出均方误差,w是权值,t是期望输出,y是实际输出。
通過训练,我们不断改变网络权重,使输出均方差最小化。[2]
2 研究过程
首先,我们收集关于每年说一种语言的人数的数据,以及使用该语言作为官方语言的主要国家的得分。我们希望根据人口增长和各种因素对增长率的影响来预测语言的人口分布。在此基础上,我们构建模型。我们清楚地知道,每种语言的人口分布都与文化交流,经济发展和国家政策等有关。我们的模型将考虑这些因素,以便能够全面分析每个因素的变化对结果的影响。
我们的观点是,要预测每种语言中母语人口数量的变化,实际上要研究他们的增长率。事实上,有许多因素直接或间接地影响了人口的增长。因此,我们将这些因素分为两大类:正面和负面。从这个角度来看,我们指的是影响增长率的以下因素:
积极因素:国家收支平衡;对生活指数的满意度;人类发展指数;智能手机普及率排名。
消极因素:全球恐怖主义指数;脆弱国家指数。
对于上述因素,我们需要知道影响程度,即每个影响因子的具体权重,为此我们引入了熵权法来评估这些因素。基于熵方法,我们计算每个影响因子的权重,通过上述权重,我们可以得到人口变化率的实际表达:
r1=k1w1+k2w2
r1是语言人口增长率,k是影响因子,w是权重。
为了综合考虑多种因素对语言数量变化的影响,我们用BP神经网络对权重不断的优化。我们使用BP神经网络模型进行不断的训练,并获得正确的权重,以便我们可以预测各种语言的人口增长模型。我们分析了前十名的语言并预测了人口的分布。
3 结果分析
在实际情况中,可以随机获得值矩阵中的值,并且根本没有特定的顺序。因此,我们使用数学软件来模拟随机过程并将数据带入预测。根据结果显示每种语言都是一个波浪上升的过程。除了比其他语言具有更大基距的中文外,其他语言相对接近。由于影响因素的影响,语言将有不同的增长趋势,因此此时发生的变化将改变原始排名。
第二语言人口预测,与我们处理母语人群的方式相同,我们还提到了两个影响因素来预测每种语言的外语人口变化。以下是影响因素:世界旅游排名;世界移民排名同样使用熵权法与神经网络预测,我们得到了这些语言人数的发展趋势通过收集前几年的数据,收集的数据将在一定程度上与现有数据四舍五入。以中文为例,将数据引入神经网络进行训练,得到了预测结果。因此,由于诸多因素,虽然未来几年会有一些增长,但人口增长将在2020年后逐渐放缓,最终趋于饱和。最后,基于神经网络预测方法,我们得到了50年后每种语言的人口(总数)变化。我们通过预测预测后面没有超过前10种语言,但内部排名已发生变化。例如,印度排名更高,而马来西亚排名更低。
4 结语
在接下来的五十年中,特别是在2020年之后,每种语言的用户数量将逐渐增加甚至变得饱和。前十种语言尚未被其他语言取代,但内部顺序已发生变化。通过BP神经网络算法对熵方法模型进行改进,预测各种语言用户的发展趋势,得到更加合理的结果在预测人数时,我们通过熵方法得到所有研究影响因子的权重,以便更准确地衡量每个因素对增长率的影响。并且通过神经网络优化,预测结果可以更符合实际增长模型。此外我们的模型也有很多需要改进的地方:我们在假设我们收集的数据是正确的情况下构建模型,并且在数据收集和处理过程中可能存在一些主观因素。而且当我们预测人口时,我们忽略了一些快速变化的因素,如国家政策和该地区的热点。真正的体重变化会更复杂,考虑到这些因素需要进一步研究。
参考文献:
[1]司守奎.数学建模算法与程序[M].第二版.海军航空工程学院.
[2]屈桢深.人工神经网络理论及应用.哈尔滨工业大学.
[3]倪九派,李萍,魏朝富,等.基于AHP和熵权法赋权的区域土地开发整理潜力评价[J].农业工程学报,2009,25(5):202-209.
转载注明来源:https://www.xzbu.com/1/view-14913011.htm