您好, 访客   登录/注册

吉林省科学数据共享服务平台建设方案探讨

来源:用户上传      作者:

  摘  要:在吉林省各类科技计划项目的实施过程中,会产生大量的科学数据,这些数据的产生和加工得到吉林省科技计划资金支持,同时也是科技工作者长时间辛勤劳动的结晶。为了提高数据利用率,急需集中建库,实现科学数据共享。吉林省科学数据共享服务平台建设,通过整理省内数据拥有单位的科学数据,建立起若干数据中心和主体数据库,搭建吉林省科学数据平台门户网站,为吉林省各行各业提供支持和服务。
  关键词:科学数据  数据共享  数字吉林  科学数据中心
  中图分类号:F224                                   文献标识码:A                          文章编号:1672-3791(2019)04(c)-0021-02
  科学数据是指人类社会科技活动所产生的基本数据,以及按照不同需求而系统加工的数据产品和相关信息,具有客观性、多样性、基础性、资源性、传递性、共享性、增值性等特点[1]。科学数据是信息时代最基本、最活跃且影响面最宽的科技资源[2]。我国已经在科学数据领域进行了大量深入的研究,比较有代表性的比如我国地球系统科学数据共享平台。该平台以中科院地球系统的科研院所、长期野外监测台站的观测数据为主要来源,同时联合了相关机构科学家形成了一个科学数据共享联盟,并积极吸纳科研项目参与数据共享[3],整合后的数据通过科学数据共享服务平台对外开放。
  为了加快吉林省科技创新体系建设,增强科技创新能力,有效地支撑全省经济社会快速发展,迫切需要我们建设科学数据共享平台,对省内科学数据进行整合,为全社会创建开放高效、共建共享和合作交流的研发支撑体系。
  1  建设目标
  吉林省科学数据共享服务平台的建设,通过整理省内数据拥有单位的科学研究数据、检测数据、勘查数据等,建立起若干数据中心和主体数据库,搭建吉林省科学数据平台门户网站,为吉林省各行各业,特别是政府部门开展科技管理、决策,企业、高校、研究院所开展研发及横向联合、信息沟通,为发挥吉林省科教优势,促进经济发展提供及时有效的服务和支持。它是吉林省创新体系的重要组成部分,具有投入稳定、社会共享、公益性和持续性等特点,对全省经济、社会和科技快速发展具有重要意义,是一项“功在当代、利在千秋”的伟业。
  2  主要建设内容
  (1)根据国家、吉林省的科学数据相关文件要求,结合“数字吉林”战略部署,研究制定吉林省科学数据共享服务平台的总体规划和建设方案。
  (2)搭建“吉林省科学数据共享服务平台”。通过元数据技术有机链接各数据中心的主体数据库,构建基于元数据的目录交换服务体系与科学数据信息发布系统,提供基于科学数据的专业化信息服务,包括目录查询、数据检索、统计分析等服务,实现数据的统一收集、统一管理、統一发布,确保数据的真实性和安全性。
  (3)结合当前实际,建设若干省级科学数据中心和一批特色主体数据库。第一批组建两个数据中心——“吉林省科技管理数据中心”、“吉林省农业科学数据中心”,建立三个特色数据库——吉林省科技统计数据库、吉林省基础科学数据库、吉林省农业科学数据库。
  “吉林省科技管理数据中心”由吉林省科学技术信息研究所牵头,其核心任务是对吉林省科技管理数据进行整理,进行数字化建设,特别是吉林省科技厅掌握的相关数据。通过对整个数据调查结果整理分析,确定了数据中心第一期数据库及信息内容,即建设两个特色主体数据库:吉林省科技统计数据库、吉林省基础科学数据库。“吉林省农业科学数据中心”由吉林省农业科学院牵头组建,负责收集、整理、加工与农业相关的科技数据,通过整理分析,确定了该数据中心第一期数据库的建设内容,即建设吉林省农业产业科学数据库。主要内容为近五年吉林省各市州主要农畜产品生产规模、产量、单产、经济效益,各种主要农产品生产环节各项成本、总成本。
  (4)开展“吉林省科学数据共享服务平台”共享机制研究,包括吉林省科学数据资源的整合与分类分级共享机制的研究,撰写研究报告。在报告中可以提出将吉林省内凡是列入吉林省科技厅各类科技计划的项目,其研究中产生的数据统一纳入共享范围,将“数据汇交”作为项目验收时的必备条件之一,实现省内科学数据的整合与共享。
  3  要解决的关键技术
  吉林省科学数据共享服务平台和三个特色科学数据库建设拟采用以下关键技术。
  (1)元数据建设,科学数据多维分析与挖掘研究。
  元数据建设:吉林省科学数据平台以元数据为核心实现科学的描述、分类、检索、关联,借助技术手段实现数据的物理存储与逻辑表达的分离。元数据作为描述科学数据的结构化数据,包含了数据的标识信息、内容信息、人员和权责信息、关联信息、技术信息等方面。该项目对省内基础科学数据、科技统计数据以及农业科学数据信息进行规范整理、整合,进行统一的数据编码、数据清洗、数据标签化等操作,建立元数据标准和元数据索引,为我省科学数据今后的一系列相关工作奠定基础。
  科学数据多维分析与挖掘研究:基于多形态科学数据,引入深度学习、知识检索的记忆机制和逻辑推理机制,提出基于深度学习的用户隐式知识检索需求理解技术,提升检索结果查准率、查全率,平衡检索结果的多样性和个性化,构建多形态科学数据的存储和管理模型,实现智能检索及海量复杂科学数据的可视化展示;综合时效性、个性化和多样性的检索结果排序和推荐。
  (2)数据库整合,统一跨库检索。
  本项目按照“吉林省科学数据共享服务平台门户网站——科学数据分中心——数据生产系统”三级架构模式,整合我省的科学数据资源,通过标准的元数据整合规范,将各种类型数据资源的元数据进行重新清洗、补充与标引,使元数据集实现统一、规范、清晰、完备。通过这样的整合方式,可以完全打破各个数据库的壁垒,并保证效率和准确性。
  数据中心的各个科学数据库资源并不部署在平台上,只是提供接口,由各类科学数据分布的资源单位进行元数据加工,数据库建设,更新完善和日常维护管理,并为平台提供接口,平台可以随时调用,真正从底层实现了科学数据资源的统一检索,统一应用,并为进一步的数据分析,对象化处理奠定了基础。
  4  预期取得的成果
  针对目前我省科学数据管理中存在的薄弱环节,《吉林省科学数据管理办法》进行系统的部署和安排,加强和规范科学数据的采集生产、加工整理、开放共享等各个环节的工作;完成《吉林省科学数据共享服务平台》建设,提供科学数据的目录查询、数据统一检索和分布式的延伸功能服务,实现数据的统一发布;建设完成《吉林省科技统计数据库》、《吉林省基础科学数据库》、《吉林省农业产业科学数据库》。
  参考文献
  [1] 刘润达,诸云强.科学数据共享关键问题探索——以地球系统科学数据共享网为例[J].地理科学进展,2007(5):118-126.
  [2] 张红.我国科技资源共享的现状及其分析[J].科技与法律,2007(2):18-24.
  [3] 孙九林,黄鼎成,李晓波.我国科技数据管理和共享服务的新进展[J].世界科技研究与发展,2002(5):15-19.
转载注明来源:https://www.xzbu.com/8/view-14909725.htm