您好, 访客   登录/注册

数据挖掘在实验室信息管理系统中的应用研究①

来源:用户上传      作者:

  摘   要:由于网络中信息的愈加丰富以及拓扑结构的复杂性,使得信息存在着信息数量过载和资源导向迷向的问题,面对当今网络中浩如烟海的信息,如何实现在其中进行有效数据的挖掘使其更好地应用到实验室信息管理系统中成为当今实验室管理人员所要面临的重要考验。基于此,本篇文章中笔者针对于实验室信息管理系统中数据挖掘的应用进行分析和论述。
  关键词:数据挖掘  实验室  信息管理  系统
  中图分类号:TP311.1                               文献标识码:A                       文章编号:1674-098X(2019)09(b)-0179-02
  随着时代的不断发展,各国都开始愈发重视数据挖掘在实验室信息管理系统中的重要性。在我国也不例外,虽然很多数据得以被应用,但是在数据之后内涵的大量信息未被应用,故此,重视数据挖掘在实验室信息管理系统中的应用对于社会各行业等都有着较为深远的影响,从中可以获得和提取无法预料的模式,并且可以透过不同的数据库推断出其中的知识。
  1  数据挖掘相关概念的阐述
  数据挖掘是随着时代发展而新兴的热门学科,其理论基础来源于统计学科和数据库系统相关知识,再通过机器获得相关算法来发现模式,从而实现将大量数据库中的信息进行整合使其变换成相对容易被理解的知识再被进一步供相关人员进行使用的目的。数据挖掘可以对相关数据进行自动或者半自动分析,从而在其中获得数据的模型或者相关的知识,故此,认为数据挖掘仅仅是发现知识或者仅仅是为了获得数据的想法是不正确的。当前在我国,数据挖掘可以被应用于人工智能和电子商务等领域。
  2  实验室管理系统的发展历程
  在20世纪90年代末至本世纪初,LIMS网络系统技术才逐渐引入我国,并开始被相关研究人员所了解。此后,我国实验室管理信息系统学术相关研讨与展示会的成功创办和我国相关实验室管理系统的建设以及相关软件系统的开发都对LIMS网络系统技术在我国的推广起到了推波助澜的作用。2001年12月,随着我国不断打开国门加入了世界贸易组织(即WTO)使得许多国外的实验室管理理念和LIMS网络系统技术的相关产品进入我国,以及我国国内相关行业与国外同行业的竞争加剧,虽然很多国外的LIMS网络系统技术相关产品具有较为成熟的技术水平,但是很多LIMS网络系统技术相关产品不能实现很好的中国化,实施的成功率较低,对此形势,迫使我国国内相关行业必须要不断提高自身的管理水平,研究出适合我国本土使用的LIMS网络技术系统来增强其竞争力,从而推进实验室管理系统的不断发展,生产处更具灵活性的LIMS网络技术系统相关产品。
  3  在实验室信息管理系统中应用数据挖掘的重要性
  数据挖掘的任务就是将大量的、模糊的数据集中在一起进行识别,从中挖掘出其背后所蕴含的信息,进而将其转化为可供人们方便理解使用的模式的过程。但是由于互联网自身存在的复杂性和更新速度快等特性,使得数据挖掘成为一门涉及统计学、数据库、模糊数学等诸多知识的交叉学科。因此,其技术的复杂性使得数据挖掘成为了一门社会各界认为任重而道远的研究热点。
  4  数据挖掘在实验室信息管理系统应用中的现状
  就近年来看,数据挖掘在各个领域都有了长足的进步,例如,在医学对疾病的治疗和新药物的开发,乃至基因方面的研究都取得了出色的成果。但是,仍旧存在着只对数据进行采取和对数据结果的看重的现象,并未深入对数据本身进行分析,且数据挖掘相关的算法颇多,仅依赖于LIMS网络系统技术是远远不够的,同时,面对着不断快速发展的时代,如果不对数据进行科学的处理就无法迅速从其中获得有效的信息,从而产生资源大量浪费的现象,对此,重视数据挖掘能够高效地应用于实验室信息管理系统中是当前实验室信息管理人员所需要重视的研究方向。
  5  数据挖掘在实验室信息管理系统应用中存在的问题
  5.1 数据挖掘方法方面
  数据挖掘技术越来越应用于更多的发展领域,不断出现新的数据挖掘的相关任务,使得数据挖掘技术成为更加充满美好发展前景的领域。当前,数据挖掘技术包含了数据表征和相关分析、数据回归等涉及广泛的数据分析和数据知识,但是这些任务不能实现在同一个范式下使用同样的数据库,并且其中还需要大量的数据挖掘的相关算法。除此之外,还可以在数据库搜索知识时实现多维空间对数据的探索,同时通过将多学科开放的数据进行集中可以提高数据挖掘技术的能力。大部分的数据还是停留在互联网的大环境之中,且有些可能出存在着残缺甚至模糊,为此,提升互联网大环境下对数据的发现和处理能力能够促进数据挖掘技术的不断发展。
  5.2 数据挖掘算法方面
  数据挖掘要求能够及时有效地从多个数据库中挖掘出相关的数据并提取出有关的信息,对此数据挖掘的算法必须具有有效性和一定的伸缩性。由于数据库中数据分布具有广泛性和流动性快的特征,为此所挖掘的数据很有可能呈片段式,并且要将这些片段的数据进行处理,最终将其合并起来。
  5.3 数据挖掘类型方面
  数据挖掘技术由于涉及诸多领域,对此,其数据挖掘的类型也呈多样化的特点,既包括动态数据也包括静态数据,既包括时间数据又包括空间数据,但是要想让系统进行所有数据类型的挖掘是无法实现的。
  6  数据挖掘技术在实验室信息管理系统中的应用
  6.1 数据挖掘和预处理阶段
  可以采用开源log4日志引擎系统来实现在不影响系统性能的前提下方便获取实验室信息管理系统的使用以及用户的访问情况的目的,数据挖掘来自于系统中的日志数据系统,为减少因数据数量过多而加重的负担,可以只保留所认为最有用的数据,使一些没有字段的信息被删除掉。同时要建立索引来保证在检索频繁的情况下依旧能保证数据存储性能的良好,从而达到提高实验室信息管理数据库效率的目的。
  6.2 数据挖掘技术的应用
  由于各个用户都有着自己独特的需求,对此实验室信息管理系统要根据数据记录对其进行聚类分析,从而找到访问频率较高的板块来为用户提供更加优质的服务。首先要进行数据源的前期清洗工作,要将系统中之前是数据纪录进行删除同时也要删除掉已经离职的用户的访问数据记录,并主要针对系统总的访问次数和当年的访问次数进行记录从而使得数据更加能够贴近用户的实际访问情况。其次,要对所挖掘的数据进行聚类分析,将其分类为活跃、一般和懒惰三个系统模块,从而可以了解到用户对每个板块的使用情况,进而为用户提供更为方便的服务。
  7  结语
  综上所述,数据挖掘技术是一门涉及诸多学科的技术,虽然目前我国对于其相关的研究已经获得了一定的成果,但是数据挖掘技术仍旧缺乏较为完善的理论系统,对此社会各学者都积极对此展开相关研究,从而出现了百花齐放的特征。而将数据挖掘应用于实验室信息管理系统之中,从中找到其内在知识和联系,揭示其内在规律对科研项目、人员及其成果的评价方面都能起到重要的作用,同时对进一步提高数据挖掘技术在实验室信息管理系统之中的应用也具有积极的促进作用。
  参考文献
  [1] 李海林,杨丽彬.信息管理专业数据挖掘人才培养模式研究[J].计算机时代,2017(11):92-94.
  [2] 李玥,吴丽丽,魏霖静.高等农业院校信息管理与信息系统专业培养模式与专业改革探索[J].河北农业大学学报:农林教育版,2017,19(5):34-38.
  [3] 張美华,王文涛.数据挖掘技术在机房信息管理中的应用[J].电脑知识与技术,2017,13(12):5-6,30.
转载注明来源:https://www.xzbu.com/1/view-15106554.htm