您好, 访客   登录/注册

大数据时代高校地理教师信息化能力及提升路径探讨

来源:用户上传      作者:

  摘要:跟随信息技术的飞速发展,人类进入了大数据时代,科学研究方法也产生了数据科学研究范式。针对大数据特点及数据科学研究方法,分析了大数据领域云计算技术、数据分析与挖掘技术以及数据可视化技术及其应用现状,并结合高校地理学教学与科研需求,剖析了大数据时代高校地理教师的信息化能力构成及提升路径,为提升其教学科研水平提供借鉴与参考。
  关键词:大数据;地理;信息化;教师
  中图分类号:G633 文献标识码:A 文章编号:1007-9416(2019)06-0224-03
  人类社会进入21世纪以来,随着信息技术的飞速发展,互联网、物联网及各类数字终端产生了海量信息数据等,每天世界上新产生的信息飞速增长;人类社会进入了大数据时代[1-2]。在此背景下,科学研究出现了新的研究范式:数据科学范式[3-4],由传统的假设驱动的研究方法转向基于科学数据开展探索分析的方法。由于数据内在的时空特性,使得这些数据多数具有地理空间本质,利用大数据为地理学领域提供了一种新的思路和模式,出现了地理大数据研究范式[5-6]。高校地理教师承担着地理学教学与科研两种角色,面临着大数据时代的一系列新问题、新挑战,而积极应对这些挑战、全面融入大数据时代是其必然选择。本文从高校地理教师信息化能力着手,分析大数据时代这一群体的应对策略,为拓展其教学科研、适应新科学研究范式提供借鉴。
  1 大数据及数据科学研究范式
  大数据是一类庞大、多样化和分布式的数据集,可由各类仪器设备、传感器、网上交易、电子邮件、视频等,以及现在与未来所有可以利用的其他数字化信号源产生[2]。它是一类无法使用目前的数据管理工具在可接受的时间范围内去收集、分析、管理和处理的数据集。大数据带来的挑战不仅包括数据量的挑战,而且包括数据融合和数据处理效率方面的挑战。大数据具有4V的特点[2]:(1)数据量大。当前产生的数据量已经从TB级别跃升到PB级、EB级乃至ZB级别。(2)数据类型多。大数据主要来源包括传感器数据、网站点击数据、移动终端数据以及射频ID数据等,这些数据源每天产生数以亿计的结构化与非结构化数据,包括网页、图片、文本、视频、音频、位置等不同形式,需要多样化的数据管理与处理方式。(3)价值密度低。数据价值密度的高低与数据总量的大小成反比。以视频为例,一部1小时的视频,在连续不间断的监控中,有用数据可能仅有一二秒。(4)处理速度快。随着移动互联及物联网的快速进展,人们对数据的实时应用需求更加普遍,比如通过手持终端设备关注交通与物流信息。高速性要求能在第一时间检测并识别重要事件发生的信息。
  科学研究范式是在进行科学研究时必须遵循的的科学理论体系。科学从经验科学发展到理论科学,及至计算科学,目前又产生了数据科学,科学研究范式也相应发生了从经验范式到理论范式,以及计算范式与第四范式的转变。Jim Grey认为人类在科学研究上,先后历经了实验、理论和计算三种范式[4,7-8]。经验范式主要描述自然现象,以经验事实的描述为主,缺乏抽象理论的概括与总结。其研究方法以归纳为主,并开展经验观测和实验。理论是人类按照已有的实证知识经验与假说,通过概括与演绎推理进行的推论性总结。理论范式偏重理论总结和理性概括,强调较高普遍的理论认识,以演绎法为主要研究方法。计算机出现后,通过模拟现实世界,科学研究范式转向了计算范式。它通过构建数学模型开展定量分析,主要用于对各个学科中的问题进行计算机模拟和计算。而大数据的出现使得科学研究以数据为中心、以数据为驱动的特征越来越突出。Jim Grey提出了数据探索型的新的研究方式,即为第四范式[3-4]。它以数据处理为中心,其研究对象是各类科学数据。在大数据时代,数据已经成为各个领域的基础资源,用数据资源来协同解决各个具体问题已经成为人们的共识。
  2 大数据关键技术分析
  2.1 云计算技术
  云计算是用于实现对可配置计算资源(例如,网络,服务器,存储,应用程序和服务)的共享池、支持按需网络访问的计算模型,能够通过最少的服务提供商管理或交互工作进行各类资源快速调用和发布[9]。云计算具有如下特征:(1)以服务方式提供计算和基础架构资源和应用程序。(2)提供商以按使用付费的方式向客户提供服务。(3)计算资源的虚拟化可实现按需配置和计算资源的大规模动态伸缩。(4)服务作为综合交付提供,包括支持基础设施。(5)云计算通常通过Web浏览器或自定义应用程序编程接口(API)访问。云计算支持基础架构即服务IaaS、平台即服务PaaS、软件即服务SaaS三大服务模型。其中,IaaS提供配置计算、存储、网络和其他可以部署操作系统和应用程序的基础计算资源的功能。通过IaaS,可以获取和访问虚拟服务器,类似于访问传统的远程服务器;并且根据业务需求支持动态伸缩。各大云计算供应商的多种类型计算实例如Amazon EC2、阿里云ECS等即为IaaS典型实例。PaaS提供了一个计算平台,消费者可以使用云提供商提供的工具和库开发软件,并将软件部署到云服务上。SaaS支持在云上托管并作为服务提供的软件和数据,云用户或用户通常通过Web浏览器访问此类服务;SaaS的典型应用是Gmail等具体应用。从技术上看,大数据与云计算是密不可分的,由于其海量数据特涨,大数据无法使用传统单台计算设备进行处理,必须采用分布式并行计算架构。它的特色在于对海量数据的分析挖掘,但必须依托云计算的分布式处理与分析、云存储以及虚拟化等关键技术。
  2.2 数据分析与挖掘技术
  数据分析是整个大数据处理的核心,从异构数据源抽取和集成的数据构成了数据分析的原始数据,其分析技术包括数据挖掘与机器学习等。地理空间数据具有空间位置信息,其中蕴含了丰富的知识与价值。通过考虑时空信息,传统的数据挖掘方法扩展到空间分类,空间聚类,空间关联等;由此延伸出的时空信息挖掘方法将成为从不断增加的时空数据中提取信息和知识的关键技术。在传统的数据分析中,研究人员根据经验和手头的数据形成假设,并使用数据来验证提出的假设。相反,数据挖掘技术被用作产生假设的探索性方法,统计分析用于确认假设。通过时空数据挖掘,可以识别隐藏在大量多源异构的大数据隐藏的时空模式与时空规律。由于空间依赖性和空间数据异质性的存在,时空数据为数据挖掘带来了新的挑战,位置和其他属性的关联都可能导致挖掘规则和模式的复杂性,需在传统数据挖掘方法的基础上进一步考虑空间关系、时间关系以及时空关系。传统的数据挖掘通常处理来自单个领域的数据。在大数据时代,面临来自不同领域的不同来源的多样化数据集。这些数据集由多个模态组成,每个模态具有不同的表示与分布以及比例和密度。如何科学描述、表达和揭示不同类型、不同尺度、不同时间、不同语义和不同参考系统的地理大数据的复杂关系及其相互转换规律,实现基于地理大數据的地理知识发现,多源异构地理大数据的跨域融合方法成为亟待解决的问题。   2.3 数据可视化技术
  数据可视化技术是将数据库中每一个数据项作为单个图元表示,大量的数据集构成数据图像,同时以多维数据的形式表示数据的各个属性值,可以从不同的维度对数据进行深入观察和分析。由于地理空间数据蕴含丰富的时空信息,其可视化是各类地理大数据及其分析结果的图形表示,用来面向用户屏蔽时空数据的复杂性,有助于洞察数据隐含的时空规律。传统的制图可视化过程涉及将数字或非数字数据转换为视觉表示,例如地图,图像,图形,3D模型和其他视觉产品,它侧重于设计和使用地图来传播已知信息;而基于地理大数据的地理可视化则强调通过开发高度交互式地图和相关数据探索工具来发现未知信息、验证假设并获取知识。同时,由于大数据量导致大多数现有可视化技术存在一系列问题。首先,大量样本经常导致混乱的视觉显示,因此使得分析人员在视觉上感知模式非常困难。其次,如果可视化涉及复杂的计算任务,则大数据集需要相当多且通常过多的时间进程。结合云计算平台,在Web浏览器或独立地图查看器下进行地理大数据的在线可视化,可以帮助用户从协作角度研究地理参考事实和空间关系,而无需考虑专用的GIS系统管理需求。
  3 大数据时代高校地理教师信息化能力构成及其提升路径
  大数据时代,尽管其数据来源、应用需求和数据类型不尽相同,但其基本处理流程是相似的。海量Web数据处理是一类非常典型的大数据应用,以其为例,大数据处理的最基本流程包括在辅助工具支持下,对异构多源数据进行抽取和集成,采用机器学习与数据挖掘方法对存储的数据进行分析,从中抽取有价值信息与知识,并利用可视化技术将结果展现给终端用户。在每一处理环节,需要的信息化技术不尽相同,结合大数据分析与处理流程,高校地理教师信息化能力包括如下数据获取能力、数据分析与挖掘能力以及数据可视化能力三个方面。
  3.1 数据获取能力
  由于当前地理信息不再局限于传统地图,除了传统的地理空间数据采集手段外,从非传统数据源获取时空数据出现了多种新方法,包括地理文本(GeoText[10])、自发地理信息等。其中,文本提供了诸多时空描述,自然语言的语义包含丰富的时空信息。应用自然语言处理技术,从文本中抽取实体信息,并通过关联地名地址库,可以提取自然语言的空间上下文信息。这种提取时空信息的方法已被用于社交媒体舆情挖掘、极端言论检测与灾害预警等领域。此外,用户利用手持设备,应用移动互联技术主动提交或被动收集的自发地理信息,例如公众使用的OpensStreetMap[11],也成为新的时空大数据来源之一。高校地理教师应具备网络在线数据的检索与收集能力,并开发相应的数据获取爬虫程序采集地理文本等新型空间数据。
  3.2 数据分析与挖掘能力
  大数据分析的目的是挖掘大数据中有价值的信息,是从大数据中获取更准确、更深层次的知识,而不是对数据的简单统计分析。要达到这一目标,需要提高计算机的智能计算能力,让系统具备对数据的分析、推理和决策,基于神经网络与知识图谱的人工智能是实现以上能力的核心技术。受益于训练数据的丰富及计算能力的提升,传统的神经网络模型在近年来得以突破;特别是自深度神经网络(DNN)提出以来,基于DNN 的深度学习已被成功地应用到图像、自然语言处理以及自动驾驶等多个领域。高校地理教师需结合各种主流机器学习平台与框架,重点关注地理时空大数据分析与挖掘方法,提升针对地理时空大数据的分析与挖掘能力。
  3.3 数据可视化能力
  由于地理空间大数据的特殊性,为了应对当今庞大而多样化的时空数据集并促进从数据中发现和理解复杂信息,地理大数据可视化需要解决实时或准实时的处理海量数据集;时处理多个主题和多个变量以发现复杂的模式;设计交互性强的用户界面和互动策略,以增强可视化发现过程等一系列挑战。这些挑战需要教师具备图形学、可视分析等多学科的技术背景并应用部分商业或开源可视化工具的能力,如地图可视化可使用Google Maps等工具,报表可视化可使用Tableau等工具;部分需要用户编写代码调用相应的可视化工具或函数库,如R、D3.js等。
  总体来看,从大数据处理流程出发,需要在云计算等计算基础设施、HADOOP等数据处理工具以及R等数据分析、可视化工具开展学习与实践;具体学习提升路径包括各产品设计与应用文档、会议培训以及MOOC课程等。
  4 结语
  海量数据的日益增长带来了新的机遇与挑战。本文在对大数据特征分析的基础上,对科学研究范式转变进行了深入剖析,并对高校地理教师在大数据时代应该掌握的各项技术进行了讨论,并分析了学习及提升路径。大数据时代的到来已不可避免,高校地理教师在教學与科研实践中,应该结合地理学科的特点积极应对这些挑战,并应用于自己的研究领域,从而提升自己的科研水平,达到教学、科研相互促进的目的。
  参考文献
  [1] 李学龙,龚海刚.大数据系统综述[J].中国科学:信息科学,2015(01):1-44.
  [2] 孟小峰,慈祥.大数据管理:概念、技术与挑战[J].计算机研究与发展,2013,50(01):146-169.
  [3] 邓仲华,李志芳.科学研究范式的演化-大数据时代的科学研究第四范式[J].情报资料工作,2013(04):19-23.
  [4] Tansley,S.,Tolle, K.M. The fourth paradigm:data-intensive scientific discovery[M].Redmond,WA: Microsoft research,2009.
  [5] 宋长青.地理学研究范式的思考[J].地理科学进展,2016(01):1-3.
  [6] 陆锋,张恒才.大数据与广义GIS[J].武汉大学学报(信息科学版),2014(06):645-654.   [7] 方璐.大數据时代的科学研究方法[D].浙江工业大学,2014.
  [8] 李志芳,邓仲华.科学研究范式演变视角下的情报学[J].情报理论与实践,2014,37(01):4-7.
  [9] Yang, C., Huang, Q. Spatial cloud computing:a practical approach[M].CRC Press,2013.
  [10] Hu, Y. Geo-text data and data-driven geospatial semantics[J].Geography Compass,2018,12(11):12404.
  [11] Haklay, M., Weber, P.Openstreetmap:User-generated street maps[J].IEEE Pervasive Computing,2008,7(4):12-18.
  Discussion on the Information Capability and Improvement Path of University Geography Teachers in the Big Data Era
  HAN Zhi-gang,CUI Cai-hui
  (College of Environmental & Planning, Henan University,Kaifeng Henan  475004)
  Abstract:Following the rapid development of information technology, human beings have entered the era of big data, and the data science paradigm has also been emerged as a research paradigm in scientific research. According to the characteristics of big data and data science research paradigm, the paper analyzes three key technologies in the field of big data and its application status, including cloud computing technology, data analysis and mining technology, and data visualization technology. Based on the teaching and research needs of university geography, this paper detailed the composition and promotion path of college geography teachers in the era of big data and provides reference and support for improving the level of teaching and research.
  Key words:Big data; Geography; Information; Teacher
转载注明来源:https://www.xzbu.com/8/view-15008195.htm