您好, 访客   登录/注册

基于机器学习的英语分层在线考试系统设计与实现

来源:用户上传      作者:董泽东 孙新杰 胡洋

  摘 要:传统考试和现阶段的考试系统已不满足教育行业对于考试的需求了,因此,总结了目前的考试系统的不足,结合人工智能的方式,在抽题组卷上,采用自适应化遗传算法,达到高效率的智能组卷。再结合神经网络算法,通过LDA模型、词向量、CNN、RNN、sigmoid激活函数等方式相结合,在经过训练后即可进行作文自动评分的体系,实现一个高效率的智能在线英语考试系统。
  关键词:智能组卷;神经网络;自动评分;在线英语考试系统
  
  1 概述
  随着计算机的高速发展,工作岗位上对于工作效率也要求越来越高。而最为传统的纸质考试已经不满足对于现在对于考试方面的需求了,这种传统的考试中,不仅耗时,而且对于纸张的浪费量大,成本需求高。而且在一个考场里,作弊率会非常的高。在最后的评卷时,评卷老师需要批阅大量的时间,很容易精神疲惫,这样就会在不经意间将一些试题批改错误,而且对于一张试卷上的总分也需要教师手动计算,在大量的评卷后,进行这样的数学计算,很容易计算错误,导致试卷实际分数与评改的分数不一致,造成不公平现象。
  在多年的发展下,对于使用计算机来进行考试的技术已经逐渐成熟了。这些考试系统相对于传统的考试是一个很大的提升,但这样的考试系统并不完善,在考试方面已经很好了,而在抽题方面只能从试题库里随机抽题,导致两个学生的试题可能完全不同,失去了一定的公平性。在评卷方面,只能对于一些固定答案的题型(选择题、判断题、填空题)来进行评判。而对于一些主观题(问答题、作文)却很难做出评改。而对于这样的题型来说,一般都是通过人工来进行评分,这样的方法确实提高了对于主观题的准确性,但是对于评改的教师来说,无疑与传统考试并无两样,只是少了一部分题型而已。
  这样的传统考试系统虽然解决了考试上客观题的评判,但是在主观题上还是没有太大办法,最多也只能通过对比正确的参考答案进行一个模糊的评判,正确率十分的低。
  2 基于遗传算法的抽题体系
  在传统的抽题中,是在一个题库里的每种题型中给每个学生进行随机抽题,题型里肯定是由一个难度值的,对于一个学生来说,可能抽的题很简单,对于另一个来说,也許都是难题,所以这样的抽题方法,虽然很大程度的杜绝了作弊现象的发生,但是还是影响了考试的公平性。
  而一个基于机器学习的抽题是一个从遗传算法中脱胎出来一个抽题算法,遗传算法借用于生物进化中“适者生存”的规律,通过对于生物进化过程中的选择、交叉、变异机理的一个模仿,完成对最优解的自适应搜索过程;可以说,遗传算法是通过自适应的寻优的只能搜索技术。[1]最后经过一系列运算,得到一个适应值满足条件的最优解。
  在遗传算法的基础上产生以下的结果:通过随机函数生成试卷群体,然后在试卷群体中的试题基因进行打散并在再次重组,从而产生新的试卷群体,周而往复会产生大量的组合型群体,在每次基因重组完成后在对群体进行逐一标记,最后编排判断,以获取满足需求的最佳匹配结果。完成以上需求后进行实际情况分析。试题库出题的过程中,通过获取题型、知识点等种群标记需求,然后将里面的试题(基因)随机打乱,同时选项(基因)也进行打乱,在双重随机的情况下尽量的杜绝规律性、重复性、偶然性。相较于其他的算法来说,既提高了算法速率,又满足了实际情况下的系统需求。重组后的每张试卷题目的顺序不同的目的,从而在一定程度上杜绝作弊。所以以遗传算法来抽取试卷,相对于其他算法来说,不仅提高了速率,更能根据需求来得到一张更为合理的试卷。
  3 基于机器学习的试卷主观题评分
  在一场英语考试中,作文的评分对人的精力消耗最大。评改过程中,要关注作文中单词的正确性,语法结构是否正确,上下文是否合理。对于评分老师来讲,不仅评分需要合理,而且也是十分耗时的。在现有的一些考试系统中,虽然解决了客观题的评分,但是这样一个主观题还是需要由老师来进行评分。从一定角度来说,失去了考试系统的意义。
  一片作文就是由一个个单词构成的,在这些单词之间,则是通过语法来衔接单词,构成语句,再由语句构成作文。要构成智能的作文评分,那么就需要LDA模型将文本中每一个话题下词分布、每个词对应得话题分布,再通过使用词向量one-hot representation将单词数字化。再以卷积神经网络操作,将通过计算词向量组得到的卷积值拼接,再次将作文特征提取,然后在通过循环神经网络LSTM对信息处理,得到关于文本离散程度特征的向量,最终将得到的多个向量进行一个回归分析,并给出分数。
  LDA模型:这是一种能够用于特征提取的技术,在使用LDA模型之后,对于数据分析中的计算效率用明显的提高,在对一篇作文分析评分前,我们使用LDA模型将作文中潜在的主题结构。更能直观的看出每一个主题与词汇表中的N个词的分布,也能看出一个词与N个主题之间的分布。
  词向量:一个英语单词是不能直接被计算机所识别的,而我们要让计算机能够识别这些词,因此,我们需要将这些词转换成计算机能识别的数学信号。在词向量里,word2Vec是一种模型,一种精简化的神经网络,经过算法不停的锻炼神经网络,在经历长时间的训练后,就可以的一个权重矩阵,使用来作为输入的词向量,相比one-hot(离散表示)不受维数灾难的困扰。经常使用的word2Vec模型有两种:CBOW,Skip-gram。
  CBOW模型是一种连续性的词袋模型,它是根据文章的上下文,在经过编码,形成权重矩阵,最后计算,预测出中心词,而Skip-gram模型则恰恰相反,它和CBOW模型相比就是一个镜像关系,它是通过中心词来预测上下文。要具体分析作文的分数,采用CBow模型,通过上下文来预测出中心词。
  CBOW模型通过不断的训练,就会获得权重矩阵WV*N,这种权重矩阵就是输入的词向量的表示。   卷积神经网络:在通过词向量得到了一个权重矩阵后,在卷积神经网络的输入层,将各个词向量拼接,在卷积神经网络的卷积层中,每次卷积的过程都会产生一个卷积核。[1][2]
  c={c1,c2,…,cn-h+1}
  在经过池化层、全连接层之后后,将得到的卷积结果拼接形成一个维度l·CLT的平均向量x,因此:
  Conv(x)=W·x+b
  循环神经网络:在循环神经网络中,这一步让机器真正的像人一样的记忆,循环神经网络中,循环神经网络中,有RNN结构,但是RNN结构有个小缺点,当一个神经元距离长了之后,RNN结构就无法有效的利用历史的信息,因此更多时候采用的是LSTM结构,它没有RNN的缺点,能够很好的保持与遗忘信息。
  LSTM的数学公式为:
  
  均值分析:在这这一步骤中,将从循环神经网络中得到结果h=(h1,h2,…,hm),通過计算其平均值得到一个与作文评分相关的特征,在多层的神经网络之中,要将上一层信号作为下一层的输入,那么在输入到下一层前就要通过sigmoid激活函数f=sigmoid(Wx+b)得到一个基于0到1之间的值,在最后平均值带入得到的值就是一个相关于分数的权重,值越大,这个权重的作用就会越大。
  作为一个刚建好的作文自动评分是还不能使用的,需要将大量的作文篇幅用于训练这个系统,使其在训练中不断更新参数,做到能合理的评分。
  4 结语
  本文通过传统的英语纸质考试的繁杂与现有系统只能自动评改客观题,不能评作文这一类主观题的缺点。为了提高考试效率以及维护考试公平性,以及提高评卷速率,结合现有系统的优缺点,结合书籍找到一个通过自适应的遗传算法作为组卷的方式,大大的提高了组卷的效率,同时并再次打乱试卷来改变题目顺序,达到预防作弊效果,在作文这类主观题方面,通过使用LDA文档主题模型,词向量,神经网络中、卷积神经网络、循环神经网络等方式建立了一个自主评分的作文评分体系。实现了从出卷到评分过程一体化的英语考试系统。
  参考文献:
  [1]王万良.人工智能导论[M].高等教育出版社,2017.7:134-135.
  [2]王耀华,李舟军,何跃鹰,巢文涵,周建设.基于文本语义离散度的自动作文评分关键技术研究[J].北京:北京航空航天大学计算机学院.
  基金:六盘水师范学院大学生项目(LPSSYDXS18018)
转载注明来源:https://www.xzbu.com/1/view-15061537.htm