您好, 访客   登录/注册

基于大数据技术高校档案开发利用与信息服务研究

来源:用户上传      作者:

  摘 要  高校档案资源具有较高的学术价值、经济价值和社会价值,充分开发利用有利于促进社会经济和文化的发展。大数据技术作为当前最先进的数据分析技术已经在很多领域内产生了巨大而深远的影响。利用大数据技术能够深度开发海量数据,同时为档案信息的服务创造新的空间。
  关键词  大数据 高校档案 档案管理 档案开发 档案信息服务
  中图分类号 G273.5 文献标识码 A 收稿日期 2018-11-09
  Abstract College archives resources have high academic value, economic value and social value, and the full development and utilization of them can promote the development of society, economy and culture. Big data technology, as the most advanced data analysis technology, has produced huge and far-reaching impact in many fields. With the big data technology, a large amount of data can be deeply developed and a new space for archival information service can be created.
  Keyword big data; college archives; archives management; archives development; archival information service
  据最新教育部发布的《中国高等教育质量报告》,新中国成立至今高校毕业生人数为8400万,2018年在校大学生人数3700万,巨大的数字必有巨大的数据,如何利用好如此巨大的数据,在很长时间里,都是一个巨大的难题。以传统的方式,如此海量的数据仅管理就十分耗费人力和物力,根本没有更多的力量去开发它们,因此它们只能沉默,沉默在各大高校的档案室里。自从有了大数据分析技术以后,这一难题已经得到了有效的解决,随着科学技术的进步,未来数据分析的成本将大幅度地降低,届时高校档案开发和服务将上升到新的阶段。
  一、大数据技术与档案开发
  大数据技术是近年来最受关注的科技话题,实践证明,它不是一个空洞的科技概念,而是一种切实有效的分析技术,它已为各行业的发展提供了切实有效的服务。于高校档案管理来说,大数据技术的实用性是非常显著的,因此作为档案的管理者必须掌握这一技术,否则将落后于时代的发展,将陷入管理工作的被动。
  1.预测分析。预测分析,即对未来的分析,一般观点认为未来是不可预测的,但事实上未来是可以预测的,只是无法以人力预测。简单来说,未来是由现在构成的,按蝴蝶效应理论,任何一个微小的变量都会引发巨大的变化,或者说产生一种未来,也就是说变量有多少,未来就有多少,因此只要统计出所有变量,也就能够计算出所有的未来。但以传统技术,这是根本无法做到的,因此人们才会觉得未来是不可预测的。利用大数据技术则能够有效地解决这一问题,大数据技术不仅能够分析结构化的数据,也可以分析非结构化的数据,非结构化的数据是传统技术所无法处理的,也就是上述的海量变量。具体到高校档案,利用大数据的预测功能,学校可以在诸多方面开展预测,从而为决策奠定基础,例如设定最优化的录取分数线、优化专业设置等。
  2.分布式存储。分布式存储是大数据的基础管理模式,此种管理模式的最大优势集中体现在两方面:一是降低了管理成本。简单来说,学校不需要购置大量的存储设备,利用现有硬件设备,搭载数据管理软件,就可以完成大数据分析的硬件部署。二是增加了数据的安全性。采用分布式部署,信息是分散的,即便遇到病毒或网络攻击,也能够有效地避免数据损坏或集体泄露。
  3.数据可视化。传统分析技术,往往以数字说明问题,于非专业人员而言,数字的意义往往是不明确的,而大数据分析提供可视化的分析结果,任何人都能够以一目了然,理解分析的结果。不仅如此,大数据分析的可视化是自动生成的,免去了开发者后期处理数据的时间成本,因此于开发者和使用者来说,都是极为便利的。
  4.数据挖掘算法。算法,在大数据中,是最核心的技术,也是最复杂的技术。算法,简单来说,是一种公式。目前,已经产生的算法大约有数千种,其中最著名的有遗传算法、贝叶斯算法、迭代算法。严格来说,任何一种算法都有其局限性,需要根据具体的分析对象加以调整。从某种意义上而言,掌握算法才算是掌握了大数据分析,掌握算法才能夠创新大数据分析。此外,开发者应当注意到算法的性能,即算法的效率问题,不同算法的效率是不同的,而且针对不同的数据,算法的效率也会发生变化,因此开发者必须根据数据采用或开发适合的算法。
  二、高校档案信息服务现状
  高校档案信息服务大体上可分为两部分,一是校内服务,二是社会服务。长期以来,由于受各种因素的限制,尤其是技术的限制,高校档案信息服务无论是校内或校外都不太尽如人意。目前,除发达地区的高校,例如清华、北大、复旦、交大及其他一些985、211高校,基本上完成了档案的数字化,但仍旧有为数不少的高校,尤其是偏远地区的高校,由于受人力和物力的限制,尚未能完成档案的数字化,距离大数据分析尚有很多的路要走。此外,即便是已经完成档案数字化的高校,也存在档案设置单一、信息不足等问题,归根结底是未能重视档案建设,尤其是未能意识到大数据分析于学校决策的重要性。此外,各高校的档案信息未能整合到一个数据库中,从而影响了大数据分析的发挥,产生此问题的原因十分复杂,需要在宏观层面上协调。   三、高校档案信息服务体系建设
  新中国成立至今,高校所累积的档案数量可以说是一个天文数字,其中所包含的历史价值、文化价值、社会价值、经济价值、学术价值无疑是巨大的。由于受技术条件的限制,长期以来无法有效地利用它们,无疑是一种遗憾,也是一种无奈。如今有了大数据技术,应当尽快地开发它们,让它们为当前社会的发展提供优质的服务。但任何技术都存在风险,因此建立一个完善的服务体系,是提供优质服务的重要保障,也是可持续发展的重要基础。具体而言,应当注意以下几点。
  1.建立数据标准统一的数据库。目前,各高校的档案数据都是分散的,且在数字化的过程中采用的是不同的标准、不同的格式。例如,有些高校的档案是扫描文档,根本不能作为大数据分析的素材,而大数据分析的基本条件之一就是要有统一的数据标准,只有统一标准的数据才能导入同一个的数据库,才能得到有效的分析。此外,大数据是海量分析,也就是说数据量越大,分析的准确性越高,因此高校和高校间应当尽快地达成协议,成立统一数据库,实现数据共享,同时也有利于降低大数据分析的成本。
  2.建立大数据信息收集體制。在传统技术条件下,档案信息收集的效率是极低的,而且大量的信息只能被忽略掉。而在大数据技术条件下,高校内产生的一切信息,即使是非结构数据,例如文档信息、图像信息、音频信息、视频信息、图表信息、网站流量信息、多媒体信息等都纳入档案管理的范围中。同时,为了持续有效地管理这些信息,应当尽快建立一个系统性的信息收集制度,具体来说,应当建立一个非结构化的数据库,这既能提高服务的效率,也能有效地降低管理的成本。此外,鉴于当前是一个非结构化信息大量产生的时代,管理者应当提高这方面的意识,将收集非结构化的信息作为今后工作的重点。
  3.建立云服务信息管理体制。云计算,又被称为分布式计算,以分布式管理为基础,能够在不增加硬件投入的基础上,完成海量的计算,于高校来说,采用云计算是最适合的大数据分析方案。但云计算存在一定的安全隐患,因为云网络中的任何一台计算机理论上可以调取其他任何一个计算机上的信息,因此一旦某一台计算遭到网络攻击,势必会影响到档案信息的完整性和安全性。因此,部署云网络、实施云计算、提供云服务,首先要建立一个严格的科学的安全的云管理体系。具体来说,应当成立一个专门的云安全小组,由技术人员对网络实施有效的监控,一旦发现安全隐患,及时切断隐患来源与整个系统的联系。
  4.建立档案信息服务产品化管理体制。美国前总统奥巴马曾言,大数据是未来的石油。目前,大数据服务已经产品化、商业化,其经济价值非常巨大。高校作为大数据中心,如果能够充分开发自有的档案资源,将其产品化,不仅能够为社会发展作出贡献,且于高校自身的发展极为有利。或许有人会说,高校档案信息涉及学生隐私,不应当用于商业用途。的确,此类担心是有必要的,但从根本上来说,此类担心是不存在的,因为大数据所分析的是抽象的信息,例如行为模式、经济状态,因此其结果不会导致隐私的泄露。但高校体制毕竟不同于企业公司,因此有必要设立一个专门的管理体制,以确保信息服务的持续和稳定。此外,应当注意到任何产品都有其生命周期,因此设立一个专门的机构,有利于产品管理,及时调整产品结构,为使用者提供更多的便利。
  四、高校档案信息服务应用前景
  改革开放以来,我国高校发展进入了空前的阶段,相比于新中国之初,目前高校的数量是当时的150倍,我国高校的数量已经位居世界第一,但能够和世界一流名校竞争的,仍旧是少数。大数据技术,本质上是一种分析技术,是信息化的分析技术,其具有高效和准确的特点,能够为各行各业的决策提供有效的参考。因此,如果能够利用好大数据分析技术,高校在发展的道路上必能少走一些弯路,从而赶超发达国家,为国家培养更多的人才。此外,高校和社会是极为紧密的,高校学生最终都将走向社会,为社会提供服务,因此高校档案在很大程度上是社会档案的组成部分,也是社会决策的重要依据。因此高校档案不仅要为学校提供服务,而且要为社会提供服务。
  1.学科建设服务。学校的发展不应当只是规模的发展,而应当是学科的发展。一流的大学必有一流的学科,建设一流的学科离不开科学的决策。大数据分析技术,作为当前最先进的分析技术,必能为学校的发展提供最科学的决策。
  2.为教学创新提供决策。教学创新是学科发展的重要基础,新的理论、新的技术都能够推动教学创新,但要从海量的信息中判断哪一种才是最适合教学创新的理论,无疑需要依靠大数据技术。
  3.就业指导服务。任何一个学生无疑都有这样的体验,毕业之际,茫然无措,不知道未来在哪里,也不知道哪一个行业适合自己。利用大数据分析,学校可以为学生提供有效的就业决策。
  4.学术发展。学术水平是衡量一个高校优劣的重要标准。学术创新不是凭空产生的,需要投入大量的人力和物力。基于大数据分析,学校可以综合评价自身的能力,利用现有的资金投入可能性较大的学术活动。
  5.人才管理。人才管理主要包含两方面的内容,一是人才引进,二是人才发展。以往,人才引进主要依据的是人才的经历,但从大数据的角度来看,人才引进不仅要考量人才,也要考量学校自身,简单来说,不适合学校的人才就不是人才。其次在人才培养方面,利用大数据可以较为准确地得知人才需要什么,能够为留住人才提供有效的决策。
  总的来说,大数据分析的优势是非常明显的,在其帮助下,高校信息档案的开发利用和信息服务将获得飞跃的变化,必定能够为高校的发展及社会的发展作出巨大的贡献。当然,未来会有更新更好的技术产生,因此作为高校档案的研究者、管理者应当不断地学习最新的理论和前沿的技术,如此才能将工作做好,发挥档案信息的价值。
  参考文献
  [1]杨碧倩.大数据背景下高校人事档案管理面临的挑战及策略[J].管理观察,2018(28):126-127.
  [2]石剑文.大数据时代高校数字档案共享服务研究[J].遵义师范学院学报,2018,20(5):167-169.
  [3]刘丹丹.高校人事档案信息化管理中的大数据技术运用[J].山西档案,2018(6):44-46.
  [4]杨柳.大数据时代数据挖掘技术在高校档案管理中的应用[J].办公室业务,2018(17):119-120.
  ★作者简介:蒋碧蓉,海南大学档案馆,经济师,本科,研究方向为综合档案管理。
转载注明来源:https://www.xzbu.com/1/view-14920316.htm