您好, 访客   登录/注册

真实场景驱动的《数据仓库与数据挖掘》教学方法探索

来源:用户上传      作者:孟坤 凌涛 李淑琴 丁濛

  摘要:本文以《数据仓库与数据挖掘》课程为载体探索了利用真实场景服务教学活动的方法。根据课程教学目标的核心知识点,规划了课程演示案例、课程实验场景和课程综合设计等环节,并以在校园内运营的物联网化智能售货机网络为背景,把各环节有机地贯穿其中。实践结果表明,在课堂上引入真实运营场景能较好地向学生展示所学知识的应用方法,能极大地激发学生求知的主观能动性,并有利于培养和激发学生的创新能力。
  关键词:真实场景;教学探索;“互联网+”
  中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2019)09-0167-02
  一、相关教学方法和学习理论的探索
  探索能够综合培养学生发现问题、分析问题和解决问题的方法是当前开展高等教育活动的根本目标。当前的教育理论和教育实践研究越来越多地回归到真实的教育场景,并形成了诸多方法。就开展的方向而言,分别从理论教学和实践教学两种典型的教学模式着手,构建能够提高学生学习积极性和学习效果的教学方法和模式是研究的重点,以实践为主的建构主义的教育理念越来越受到关注。所谓建构主义的学习理论,更多地强调了学生参与和学生的中心性,希望通过借助“情景”、“协作”、“会话”和“意义建构”环节来让学生主动完成知识的建构,其主要的实践成果为任务驱动的教学方法。
  二、真实场景驱动的教学设计
  1.知识点规划。本课程内容包括认识数据、数据仓库、数据预处理、数据挖掘技术、数据挖掘应用与分析及大数据的相关知识等。针对多数学生对数据的认识常局限于数值型数据的现状,我们把拓展学生对数据的全面认识,建立数据、信息和知识等概念以及相互关系确定为该模块的讲解重点。此外,由于数据不仅是数据挖掘的对象,更是各种信息化系统的血液,根据数据所支撑的应用类型不同,该部分的另一个重点为明晰处理型数据和分析型数据的概念及它们之间的关系。
  数据仓库与数据库具有密切联系,它们的主要作用在于实现对数据的高效组织与管理,重点在于提高所支撑应用的运行性能。因此,通过类比数据库讲解数据仓库的相关概念和操作是本部分的重点,针对数据挖掘需求,应让学生明确数据提取、数据转化和数据载入等操作,并进一步理解数据仓库的特点。更为重要的是应向学生讲清楚数据仓库并不是数据挖掘技术实施的必备条件。
  数据预处理是提高数据质量、保障数据挖掘结果准确性的重要方法,讲解数据属性值空缺、属性值不一致、数据清洗方法和数据的组织模型等是该部分的重点,并应通过实例分析让学生认识到数据预处理的重要性,始终意识到恰当的数据预处理能够對数据挖掘实施起到事半功倍的效果。
  数据挖掘技术模块重点在于让学生理解各种典型的数据挖掘方法,并掌握具有代表性的挖掘算法。聚类、分类、预测、孤立点分析及机器学习是重点讲解的典型方法,需让学生理解各种算法的适用场景和特点,能够灵活的根据实际的挖掘需求选择相应的挖掘方法。
  展示数据挖掘被广泛应用的案例分析也是本课程关注的重点,通过讲解其已在商业、体育、传媒等行业的成功应用案例,让学生掌握数据挖掘实施的一般流程,并为后续的实践环节提供借鉴。本课程将选择运营于校园内的自动售货机场景来让学生切身参与体验数据挖掘的全过程。
  2.教学模式选择。教学活动开展的目的是帮助学生建立系统的理论体系,并让他们高效掌握相应的知识点和应用方法。为了更好地支撑完成上述目标,我们从课堂演示讲解和课后综合实践两方面设计了恰当的支撑机制,利用真实场景案例讲解和基于真实运营场景设计课程实践,让所选择的真实场景贯穿于教学的全过程。在执行过程中,我们选择了用于类比相关知识点(如分析型数据)的真实运营信息系统、用于说明数据挖掘技术应用的场景需求以及用于学生开展综合课程设计与实践的数据和工具等资源,并把它们有机的贯穿到教学中。
  3.教学资源选择与学生交互。纵观当前流行的各类数据挖掘教材,尽管都提供了丰富的案例,但对于未踏入社会的在校大学生来说虽然能够帮助他们理解相关的应用方法,但是由于距离他们的生活和学习较远,难以真正地对他们产生共鸣。基于此,可选择学生熟知且具有说服力的应用场景成为我们对教学资源选择的根本出发点,并最终选择了在校园成功运营两年的物联网化自动售货机网络作为贯穿教学活动的场景。
  三、实验、课程设计与考核
  1.课程实验。课程实验旨在让学生更深入地理解其学习到的知识点,初步实践数据挖掘常用工具的操作。基于此,我们把课程实验分为随堂在线演示和实验室操作实验。针对学生难以理解的知识点,我们设计了采用直观、真实、系统的演示方式,如针对分析型数据和处理型数据,关键点在于是否可以修改数据细节,而非完整添加和删除数据,处理型数据往往支撑的操作包括增、删、改、查,而分析型数据是不能修改的。为了便于说明,我们选择在线查看运行系统的数据库,让学生清晰地看到销售记录的生成和故障记录的排除等,直观加深他们对处理型数据的理解。
  2.课程设计。课程设计在于帮助学生建立系统的数据挖掘思维模式,能够针对给定的问题给出一套完整、可靠的分析方案。由于我们采用自动售货机运营网络为背景,课程设计的题目是在与学生们充分沟通的基础上确定的,需要针对特定的选题说明所使用的数据、采用的分析方法和得到的结论,并形成报告阐明各方面的实施过程和动机。主要规划了如下四类题目:售货机选点,商品布置,广告投放,物流优化。针对上述建议选题,采取最多不超过4人的小组协作方式完成。31位同学共分成了9个小组,其中售货机选点3个小组、商品布置1个小组、广告投放2个小组、物流优化2个小组。
  3.课程考核。课程考核采用50%考试+20%实验+30%课程设计的方式进行,考试内容主要涉及对基本知识点的考查,如各种挖掘算法的思想和适用情况、各种数据预处理的方法等,以笔试为主。实验重点是考查学生对相关工具的使用,考查重点以实验报告为依据。课程设计则重点考查学生对所学知识的综合应用能力,采用以小组为单位共同完成的方式,最终以课程设计答辩和课程设计报告为主要依据。
  四、实践启示
  (1)教学案例的选择应更多的贴近学生的生活和学习环境。(2)真实、动态数据与场景对学生更具冲击力,能更好地调动学生的学习积极性。(3)重视学生参与,激发学生主动学习的动力,能极大提升教学效果。(4)多种模式的考核不仅能更加全面地评价教学效果,还有助于把握每位学生的个性化特征,为有针对性的指导提供支撑。(5)利用先进的技术手段能够极大便利师生对教学资源的使用,能极大降低教学活动开展的时间成本。
  参考文献:
  [1]韦艳艳,张超群.“数据仓库与数据挖掘”课程教学实践与探索[J].高教论坛,2011,(1):94-96.
  [2]何克抗.建构主义——革新传统教的理论基础(中)[J].电化教育研究,1997,(4):25-27.
转载注明来源:https://www.xzbu.com/9/view-15269500.htm