您好, 访客   登录/注册

大数据时代档案数据质量控制:现状、机制与优化路径

来源:用户上传      作者:周林兴 林凯

  摘 要:档案数据是大数据时代经济社会发展的重要信息资源,进行档案数据质量控制研究有助于促进档案治理能力现代化的提升。通过调查分析可知,档案数据存有政策法规缺失、数量巨大结构复杂、数据实践处于起步阶段等现状。基于现状特征构建了档案数据质量控制机制:数据监督管控机制、技术保障机制、质量评估机制,并提出增强档案数据质量控制顶层设计,筑造档案数据质量技术保护屏障,构建档案数据质量评估方法体系等优化路径。
  关键词:大数据时代;档案数据;数据质量控制;质量优化
  分类号:G273
  Quality control of archival data in the era of big data: Current situation, Mechanism and Optimization path
  Zhou Linxing, Lin Kai
  ( School of Cultural Heritage and Information Management Shanghai University, Shanghai 200444 )
  Abstract: Archival data is an important information resource for economic and social development in the era of big data. The research on archival data quality control will help to promote the modernization of archival management ability. Through investigation and analysis, it can be seen that there are some current situations in archival data, such as lack of policies and regulations, huge quantity and complex structure, data practice in the initial stage and so on. Based on the current characteristics, this paper constructs the archives data quality control mechanism: data Supervision and control mechanism, technical guarantee mechanism and quality evaluation mechanism. Meanwhile it proposes to strengthen the supervision and control of archival data quality, building technical guarantee barriers for archival data quality, construction of archives data quality evaluation method system and other optimization paths.
  Keywords: Big data era; Archival data; Data quality control; Quality optimization
  1 引 言
  大稻菔贝,随着档案管理数字转型不断推进及数据处理技术应用推广,档案数据管理逐渐成为档案工作的新常态。然而,档案部门仍然存在严重的重数量轻质量的管理思想,数据污染、数据异构、数据安全、数据孤岛等问题突出。[1]究其原因,主要在于档案数据质量控制缺失,难以适应海量档案数据管理需求。现阶段,迫切需要开展关于档案数据质量控制的研究,实现档案数据规范化、标准化管控,推动档案数据朝着善治方向发展。
  档案数据属于档案信息资源范畴,具备档案的基本属性,既包括档案部门已经掌握的各类数字化档案资源、电子档案等,还包括具有长久保存价值但还没有纳入档案部门保管范围的数据,以及档案管理业务过程中产生的各类数据等。[2]档案数据质量控制,即在档案部门主导下联合业务部门、数据管理部门、档案外包机构等,在相关法律法规、标准规范指引下,采用一定手段对处在形成、运行、传输、保管、利用等过程中的档案数据进行管控,使其保持稳定的质量效果,符合档案工作需求。
  学界对档案数据质量控制研究已有初步探索,主要集中于三个方面。一是对档案数据质量控制的认知。档案数据质量控制是档案规范管理的基础,[3]是大数据时代维护档案数据质量的关键,要采取一定的方式和手段加以优化。[4]二是从顶层设计上提出档案数据质量控制的规范。从构建档案部门数据治理权责体系着手,明确各部门的权责,[5]重视档案数据治理中的质量问题,制定档案数据质量标准和管理制度,维护档案数据质量。[6]三是根据可能出现的数据质量问题提出对应的技术措施。如面对数量巨大、类型众多的档案数据,可构建档案数据基因系统,促进大规模档案数据的融合与共享,[7]亦可将档案数据进行语义化重组,使得大量参差不齐的数据能够有效组织。[8]同时,在面对众多异构档案数据时,应探索使用开源类软件工具,将异构数据转化为同构数据,[9]从而保障数据质量。可见,档案数据质量控制已成为大数据时代构建档案数据治理体系的重要组成部分,但是,现有研究主要从分析档案数据质量的内涵和提升其质量的路径等方面出发,未对其现状和机制进行研究。因此,本文希望构建一套合理的档案数据质量控制机制,并提出优化路径,以期全面维护档案数据质量。
  2 大数据时代档案数据质量控制现状分析

转载注明来源:https://www.xzbu.com/1/view-15426958.htm

相关文章