您好, 访客   登录/注册

基于apriori算法的关联规则在高校专业技术人员考核中的应用

来源:用户上传      作者:吕亚娟 吴英 杜秋

  【摘要】    本论文的研究视角是当前比较热门的高校专业技术人员考核问题,针对高校这一特殊的群体,提出了基于apriori算法的关联规则在专业技术人员考核中应用方法,为高校校长和决策机构、机关,提供科学的决策依据。
  【关键字】    apriori算法    高校专业技术人员    考核
  引言
  高校专业技术人员考核系统,主要包括对专业技术人员进行年度和任期考核。考核是了解掌握专业技术人员情况的一个重要手段,同时也是正确实施奖惩和选拔使用专业技术人员的必要前提。各个高校每年都要进行专业技术人员考核工作,该工作的组织与实施是由学校人事部门来完成。专业技术人员考核的实施可以对专业技术人员的教育、管理工作起到了良好的推进作用,同时也为人事部门提拔使用专业技术人员提供了科学的依据。从人事干部数据库和职称考核数据库中进行数据挖掘,找出专业技术人员工作绩效与其职称、学历、年龄、学缘结构、任职经历、工作经历等方面的关联。找到专业技术人员成长进步和人员整体素质的关系,从而做到合理安排专业技术人员,使其始终保持积极向上的工作状態,为高校校长和决策机构、机关提供科学的决策依据。
  一、apriori关联规则算法
  在算法的选择方面,因为我们要从人事干部数据库和职称考核数据库中挖掘出专业技术人员工作绩效与干部属性的关联性,所以应该选用关联规则算法。典型的关联规则挖掘算法是R.Agralwal等人提出的apriori算法,它有效解决了传统关联规则算法中候选项目集大、计算量大等问题,现行的关联规则算法大多是以apriori为核心,或是其变体,或是其扩展[1]。但是,因为apriori算法在挖掘过程中需要多次扫描数据库,还是会产生大量的候选项目集,针对专业技术人员考核的特殊性,提出apriori算法在专业技术人员考核中应用的改进算法。
  二、apriori关联规则算法及其在人员考核系统中的改进
  Apriori关联规则算法采用apriori-gen函数产生候选集的方法大大减少了候选项目集的数量,减少了关联规则挖掘的计算量,极大地提高了数据挖掘的效率,但是对于海量的挖掘数据来说,apriori关联规则算法所带来的计算量也是惊人的,特别是当事务和候选项集的数目非常大时,这种计算方法还是非常昂贵的,例如:假设算法得到的1项频繁集的数量是104,则根据apriori算法将会产生107个2项候选集,由于2项候选集没有剪枝,所以所有这些候选集都需要校验,由此带来的计算量是惊人的。Apriori算法在大量候选集产生的情况下基本很难运行。
  将apriori关联规则算法应用到高校专业技术人员考核系统中的目标是找出专业技术人员工作绩效与人员的职称、学历、年龄、学缘结构、任职经历等方面的关联。如果将apriori算法简单地应用到这些关联规则的挖掘上面,不仅给挖掘工作带来了惊人的计算量,并且将会产生很多我们不想关注的关联规则,例如:
  三、结论
  改进后的apriori算法之所以能够大大减少关联规则挖掘的计算量,在于它极大地减少了候选频繁项集的数量,也就是将大量我们并不想关注的频繁项集忽略掉,而只考虑我们关注的频繁项集。因为我们要找出专业技术人员工作绩效与人员的职称、学历、年龄、学缘结构、任职经历等方面的关联,所以在候选集以及频繁项集的生成过程中将考核成绩项it作为所有频繁项集和候选集(除1-项集以外)的子集。下面我们将结合人员管理数据库使用apriori关联规则的改进算法对高校专业技术人员考核系统进行关联规则分析。
  参  考  文  献
  [1] (美)Olivia Parr Rud著.朱杨勇等译.数据挖掘实践[M].北京:机械工业出版社,2003.
  [2] 蒋孝明. 基于LINQ的人事档案管理系统的设计与实现[J]. 计算机与现代化. 2014(03)
  [3] 邱瑾,吴丹.协同信息检索用户行为研究方法综述[J].信息资源管理学报,2012,(01): 74-81,97.
  [4]王培吉,赵玉琳,吕剑峰.基Apriori算法的关联规则数据挖掘研究[J]. 统计与决策. 2011(23)
转载注明来源:https://www.xzbu.com/1/view-15139096.htm