您好, 访客   登录/注册

遗传算法在组卷系统中的应用

来源:用户上传      作者: 刘敬敬

  摘要:组卷是各类考试的核心工作,本文依托某高校的考试系统,在组卷过程中采用遗传算法,用来代替人工组卷。这种方法能快捷、科学、合理的完成组卷工作。从而最大程度的反应学生的学习水平,以便老师改进教学方法提供重要依据。
  关键字:组卷 遗传算法 分段编码
  
  一、引言
   组卷是各类考试的核心工作,而试题内容组织的是否合理是一次考试成功与否的关键。如现在的大多数考试的组卷工作都是由人工来完成。即先给定考试大纲,再由组卷人员根据考试大纲进行组卷。这样便产生以下问题:
   第一,由于人工组卷过程中,存在很多主观的因素,因而很可能造成所出题目的不科学,反应不出考试对象的真实水平。
   第二,在某些重要的考试中给试题的保密工作带来了不便。
   第三.造成了人员和时间的浪费。
   本文在组卷的过程中采用遗传算法,用来代替由人工进行组卷。这种算法能快捷、科学、合理的完成组卷,从而最大限度的节省人力并反应考试对象的真实水平。
  二、参数的确定
  1、试题序号:指的是该试题在题库中的序号或者编号。
  2、试题类型:指的是该试题的类型。如单选、多选、填空、判断、简答、计算、论述等。各种题型的数量应该在组卷开始前设定。
  3、试题知识点:指的是该试题所考查的知识点。可以用章节号或者纯数字的序号来代替。
  4、试题难度:指的是该试题的难易程度。可以分为极难、难、适中、易、极易。在组卷前应设定各种难易程度的试题所占的比例。
  5、试题区分度:试题区分不同水平受试者的程度,即考出学生的不同水平,把优秀、一般、差三个层次的学生真正分别开。区分度高的考试,优秀、一般、差三个层次的学生都有一定比例,如果某一分数区间学生相对集中,高分太多或不及格太多的考试,区分度则低。
  区分度一般在-1~+1之间,值越大区分度越好。试题的区分度在0.4以上表明此题的区分度很好,0.3~0.39表明此题的区分度较好,0.2~0.29表明此题的区分度不太好需修改,0.19以下表明此题的区分度不好应淘汰。
  6、试题分值:是指试题的分值。
  7、试题时间:是指正常情况系答完该题所用时间。
  8、试题总数:是指在要组成的试卷中题目的组数。一般在组卷开始级可以确定。
   另外还应在组卷开始之前实现设定组卷方案的总分和该方案所组试卷的考试时间。
  三、基于遗传算法的组卷模型
   根据以上分析我们以矩阵b代表题库中的题目。其中
  为序号为i的试题的第j个参数(试题类型、知识点、难度、区分度、分值、时间等)值。
  1、编码
   三维向量 表示第k个方案中第i个试题的第j个参数值。i的上限就是目标试卷的试题总数。j代表该试题的第j个参数值,j的取值为1到7。 表示第该算法的一个个体也是该算法的一个组卷方案。本文采取的是分段编码的方法,即根据试卷中各种题型的数目的要求把染色体分成几段,某一段对应某种题型。
  2、初始群体的生成
  给所有的 取任意数(当然不能超过题库的题目总数)生成初始群体
   3、适应度函数
   衡量某份试题组卷组的是否合理,应看它的组卷方案中试题类型是否齐全,知识面涵盖是否合理,难度是否适中,区分度是否清晰。因此适应度函数应当反映以上信息。设函数
  为适应度函数。
   设数组 为i组卷方案的知识点总数。设为第i种组卷方案第j种难度所占的比例。 为第i种组卷方案的区分度。
   设ken为数组 中的最大值,也即知识点最多。Dep为数组初始设定区分度与中各个元素做差之最小值;har为
  与初始设定各种难度题型所占比例值做差然后求和。Dep与har都是取最小值为了一致令ken与一个合适的数(应该为此次考试的所有知识点)做差记为 。
   则
  4、选择
  选择是从群体中选择优胜个体,淘汰劣质个体的操作,即从当前群体中选出适应度值高的个体以生成交配池的过程。
  本文采用的是轮盘赌选择法(roulette wheel selection),在该方法中,各个个体的选择概率和其适应度值成比例。设群体大小为n,其中个体i的适应度为fi,则i 被选择的概率pi,可表示如下
   。若该组卷方案的考试时间 、总分值
   、m(试题总数)不等于事先设定值则直接淘汰。
  5、交叉
  交叉过程分为以下几个步骤:首先从交配池中随机选择一对个体;其次选择0到试题总数之间的一个整数当做交叉位;对两个个体从交叉位(随机取)后的进行基因值互换,从而形成一对新个体。
  6、变异
  变异操作是模拟自然界进化中染色体上某基因位发生突变而改变染色体的结构和性状。本文中遗传操作的实现方法是:对某个染色体中(即)的题号以概率p取1到题库题目总数之间的任意整数。
  四、结束语
   用遗传算法建立的组卷模型具有灵活的组卷能力,只要在组卷前输入本次考试的相关参数如:试题总数、题目类型即各种题型的数量,考试性质(试题难度和试题区分度)等,就可以达到比较满意的组卷效果效果。


转载注明来源:https://www.xzbu.com/1/view-2570335.htm