您好, 访客   登录/注册

基于粗糙集理论的遗传挖掘在教学质量评估中的应用

来源:用户上传      作者:

  摘要:本文提出了一种基于粗糙集理论和遗传算法的方法,即对样本数据的属性集进行约简后通过遗传算法对约简后数据进行数据挖掘,并将该方法应用在教学质量评估中。通过实例验证了该方法使得评估结果更加科学、客观,具有实用性和可行性。
  关键词:教学评估;粗糙集理论;遗传算法;数据挖掘
  中图分类号:TP273文献标识码:A文章编号:1007-9599 (2011) 03-0000-02
  The Application of Genetic Mining in Teaching Quality Assessment Based on Rough Set Theory
  Liu Xu1,Zhang Yuanyuan2,Wang Xiaozhuo1
  (1.General Basis Department,Military Transportation University,Tianjin300161,China;2.Training Division,Military Transportation University,Tianjin300161,China)
  Abstract:This paper proposes a method based on rough sets theory and genetic algorithm,which means making the data mining through the genetic algorithm after the reduction of the properties of the sample data sets.And proposed this method applied to the current teaching quality assessment,this method was verified through practice to assess the results more scientific,objective,practical and feasible.
  Keyword:Teaching assessment;Rough sets theory;Genetic algorithm;
  Data mining
  教学质量评估是高校教学管理工作的重要内容,目前现有的教学质量评价多采用线性模型,即专家对评价体系中的观测点进行打分,对所有观测点值带权计算并作为最终的综合评判得分。这种线性模型简单、实用,但也存在两个问题:一是线性模型忽视了评价中的模糊性和不确定性,它只是一种近似的、粗略的精简模型;二是权重的设置没有确切的理论依据,一般都是经验数据,主观性较强。
  一、传统教学评估体系的建立
  结合借鉴一流大学采用的课堂教学质量评价模式,从定量和定性相结合的原则入手来确定指标,通过分析、调研目前大部分高校使用的教学质量评价体系模型,本文从中提取共性指标形成如表1的教学质量评价模型,其中一级指标6项,二级指标18项,见表1。
  二、基于粗糙集理论的遗传算法
  (一)使用粗集理论完成对教学评价二级指标属性的约简
  粗集理论的数据约简包括属性约简和值约简,属性约简就是化简决策表中的条件属性,化简后的决策表具有与化简前的决策表相同的功能,但是化简后的决策表具有更少的条件属性。本文采取基于可辨识矩阵的属性约简算法。基于可辨识矩阵的属性约简算法已经比较成熟,该方法通过建立可辨识矩阵实现对条件属性组合情况的简化,并以逻辑运算代替属性组合情况的搜索[3]。
  设S=(U,A,V,f)为一个决策表,|U|=n.决策表S的可辨识矩阵M(S)是一个n×n矩阵,其第i行第j列的元素为
  定义:
  Ci,j=
  式中i,j=1,2,…,n
  (二)通过遗传算法对属性约简后样本集进行数据挖掘并进行分类
  利用遗传算法将通过粗集理论对样本属性集进行约简后得到的属性列进一步处理。遗传算法用于优化连接权值矩阵W={wij}m×n,遗传算法中的优化准则所采用的判断条件是:当进化代数超过预先设定值,且最大适应度针对不同随机初始种群在达到一定进化代数后趋于稳定,没有明显变化,最终得到评估结果。
  三、粗集遗传挖掘算法在教学评估中的应用
  (一)基于粗集的属性约简
  运用粗糙集理论处理决策表时,要求决策表中各值用离散值表述。如果某些条件属性或决策属性的值域为连续值(如浮点型),则在处理前必须经过离散化。利用离散化后的数据进行属性约简,本文选取某系26位教师传统教学质量评估记录中的20个作为训练样本,6个评估记录作为验证样本。表1中,18个条件属性对教师的教学评价都是很重要的,但是根据属性重要性和属性约简算法,可以对决策表属性进行约简。
  具体的约简算法步骤如下:
  step1:首先计算决策表的可辨识矩阵CD;将选用上面算法所产生的离散化后的数据作为约简对象;
  step2:如果在计算过程中出现了只含有一个属性值的元素,这些是决策表中的核,则将所有包含核属性的元素的值修改为空;
  step3:若ui,uj均不在POSc(D)中,则置Ci,j=0;
  step4:经过计算得到了一个改进的可分辨矩阵CD′,对可辨识矩阵CD′中所有为非空集的元素Ci,j,建立析取逻辑表达式Li,j= ;
  step5:将所得的Li,j进行合取运算,得到合取范式Li,j= Li,j;
  step6:将合取范式结果转化成析取范式的形式,得L′= ;用到逻辑运算的吸收律;
  step7:最终的析取范式中的每一个合取范式都对应于一个属性约简结果并将其输出;
  step8:根据实际问题需要选择满意的属性组合RED。一般为属性数目最少的组合。
  通过对教学评价决策表约简,得到影响教学评价的关键因素,分别是备课认真(X1)、清晰表达(X4)、教学辅导手段(X6)、重点突出(X11)、方法灵活(X12)、注重学生反馈(X14),这6个因素对教学评价结果起着关键作用,因此加强对备课、表达、教辅手段、重点突出、教学方法、学生反馈等属性的管理,有利于教学质量的提高。
  (二)遗传算法应用
  根据表3,用遗传算法对样本集建立分类模型,在应用遗传算法过程中,算法采用综合选择法,设定适应度最小阈值,建模过程如下:
  1.确定个体字符串的组成及基因度,并编码。应用有监督等距离划分方法设定的参数p,用户给定的参数p与表示属性的基因宽度w(字符的长度)的关系为:2w≥p,w≥log2p。这样条件属性X1,X4,X6,X11,X12,X14的基因宽度分别为1,3,4,4,1,4。决策属性D的基因宽度为3。所以个体的字符串由6个条件属性和1个决策属性组成,基因宽度为1+3+4+4+1+4+3=20,用二进制编码。
  2.设定遗传算法的运行参数。群体规模M=6;终止进化代数N=1000;选择概率Pr=0.17;交叉概率Pc=0.33;变异概率Pm=0.02。测试时发现常常两个适应度值较小的个体进行交换操作,其适应度值仍然小甚至为0,为此设定最小适应度阈值。当出现个体适应度值小于该阈值时,淘汰该个体,再生成一个个体。算法中设定适应度阈值为0.2。
  3.限制基因位并随机建立初始种群。初始群体随机生成时,代表故障类别的基因位控制生成,而其它的基因位仍是随机产生的。在执行交叉和变异操作时,为避免表示评估结果的基因位出现110和1l1的现象,同样采取了限制基因位的方法。
  4.定义适应度函数。对于初始种群的个体E,其适应度函数定义f=m/(n+1),m表示个体E的输入属性值与同类中训练实例匹配的个数;n为输入属性值与不同类中训练实例匹配的个数。
  5.计算初始种群中每个个体E的适应度值。只计算每代群体中交换、突变所产生的新个体的适应度值,选择将上一代的优良个体复制到下一代的个体,其适应度已知,无需重新计算,以节约CPU时间。
  6.选择个体进行复制、交换及突变操作。遗传算法在搜索过程中,群体多样性和选择力度是遗传算法中一对矛盾。其算法步骤为:
  (1)从第t代群体中选择适应度小的r个个体,再用轮盘法选择r个个体,供交换及突变用。其中r=Pr*M取整,Pr表示选择概率,M表示群体规模;
  (2)将第t代群体中剩余的(M-2r)个个体复制到第t+1代群体;
  (3)将选择的2r个个体进行交换、突变操作,产生2r个新个体;
  (4)将2r个新个体插入第t+l代中。
  7.继续执行遗传操作(选择、交叉和变异),直到满足终止条件为止。
  (三)分类结果与实际结果比较
  经过软件编程实现,得出基于粗集遗传挖掘算法的最终决策值见表4。并为了检验算法的有效性,选择了学院某系6组数据来进行验证,并将其利用传统方法进行决策分析,该方法分为专家评价、同行评价和学生评价,在此基础上再次形成综合评价,结果见表5。通过对两表评价值的对比分析,共有4项评价存在差别,两个结果比较发现基于粗集遗传挖掘算法的评价值更能正确的反应真实情况,并且节省了大量人工调查分析的工作量,提高了决策效率。
  五、结语
  应用粗糙集结合遗传算法进行数据挖掘,利用遗传算法在大量规则中提取出了最优的规则进行分类分析,最后形成分类原则。这种方法可以对教学相关的信息进行本质上的数据挖掘,找出影响教学效果的最主要原因,从而改革教学方法,提高教学水平,促进教学最终效果。
  参考文献:
  [1]付海艳.粗糙集理论在高校教学质量评价分析中的应用[J].计算机工程与应用,2007,43,36:214
  [2]谢虹.基于神经网络的教学质量评估模型研究[J].广东财经职业学院学报,2007,6,2:72
  [3]张国权.基于遗传算法的粗糙集属性约简[J].现代计算机,2006,229:84

转载注明来源:https://www.xzbu.com/8/view-8731887.htm