基于数据挖掘技术的数字图书馆个性化服务发展研究
来源:用户上传
作者:陈佩欣
作者简介:陈佩欣(1991―):女,本科,助理工程师,研究方向图书情报。
摘要:随着互联网技术的不断发展,数据爆炸性的整体发展紧随其后。人们每天都在处理各式各样的数字化信息,如何在众多的信息中快速得到人们所需要的信息尤为重要。数字图书馆作为人们获取信息的重要渠道之一,在帮助用户找到所需要信息方面不断进行探索,应用各种信息挖掘技术方法,实现数字资源的个性化建设,是新时期数字图书馆发展的必然服务趋势。该文将从数字图书馆和数字图书馆的个性化服务发展的现状展开研究,主要研究了数据挖掘的相关技术、数据探索技术在数字图书馆的发展、促进图书馆的互联网技术的应用服务提供方面发现的问题,并在此基础上提出了解决对策。
关键词:数据挖掘 数字图书馆 个性化 服务建设
中图分类号: G25 文I标识码:A文章编号:1672-3791(2021)12(c)-0000-00
Abstract: With the development of IT, digital information developed explosively. People are dealing with all kinds of digital information, how to get the information we need is particularly important. As one of the important ways for people to obtain information, the digital library is constantly exploring in helping users to find the information they need. This article starts from the current status of the development of digital library and digital library's personalized service, mainly researches the related technology of data mining and promotes the service of library's Internet technology. The countermeasures have been proposed to solve problems at the moment.
Key Words: Data mining; Digital library; Personalization; Service construction
在信息技术的飞速发展下,一方面大量的信息内容给现代人的生活带来了便利,另一方面数量巨大且冗杂的信息也为人们带来了搜寻上的不便。数字图书馆使用者增加的同时,人们对数字图书馆个性化服务的需求也随之增加。为了在大量的信息中得到用户真正需要的信息,数据挖掘技术应运而生。在数字图书馆中应用各种深度数据挖掘技术,可以增强在数字图书馆中筛选相关图书信息的效率。在数字图书馆的基础上丰富个性化服务,更能满足用户的信息检索和图书阅读的需求,提高用户的阅读效率[1]。为用户提供更优质的个性化服务,已然成为每个数字图书馆管理者需要考虑的主要问题,也是和同类网络信息资源建设产品竞争的重要手段。
1数字图书馆的概述
1.1数字图书馆的概念
美国密歇根大学于1990年提出建立电子图书馆,并将与阅览室密切相关的各部门建立的馆藏标准定义为数字化图书馆。该文对数字化图书馆的标准定义没有研究不做过多阐述,将其具体定义为利用数字的含义、各种技术流程以内部存储各种相关信息的软件系统[2]。
1.2数据挖掘及相关技术
数据挖掘是指从数据中找出隐藏的、具有市场价值的信息内容,通过各种知识的删除和选择、提取以及寻找数据规律,使用统计、检索信息数据库以及多种模型识别等在数据库中查找可用数据,然后寻找数据规则并运用规则,它能输入特定名词进行驱动查询,挖掘信息中的规律[3]。数据进行深度挖掘的主要方式有聚类、分类与预测、关联和偏差检测。主要技术有决策树、回归分析、人工神经网络等。建设数字图书馆只有综合运用以上技术,才能建设好具有个性化特点的数字图书馆。
2个性化数字图书馆系统模型的设计与实施
2.1模型设计思路
数字图书馆个性化系统模型的设计应以用户为中心,重点考虑数字图书馆的操作性,结构性以及可更新性,并对用户、图书资源进行分析挖掘。数据挖掘的个性化数字图书馆系统模型的设计就是要挖掘数字图书馆用户的个人信息、上网行为,并从中分析出用户的兴趣爱好、学习关注点以及行为习惯,这样才能向用户提供优质的个性化服务,并为图书馆文献的录入提供依据[4]。
2.2对资源的分析
对用户行为分析,根据用户的注册信息,借阅、浏览记录进行聚类分析,划分类别,针对不同的群组提供不同的服务方式和推荐模式;对被借阅书籍分析,被借阅次数多的图书受众面大,可作为图书馆的热门图书放在用户登录首页或推送图书板块处。
2.3个性化系统结构模型设计
系统根据用户在数字图书馆的注册、登录信息,建立用户模型,根据用户的检索记录形成信息库。将用户模型与信息库进行匹配,通过匹配结果向用户提供个性化信息服务。
2.4系统工作流程
根据用户的注册信息、检索信息以及阅读信息建立用户信息库和信息资源库,个性化系统会调用用户资源库及信息资源库,把用户归类并建立借阅行为模型,利用数据挖掘技术找出用户意向资源,把信息推送给用户。
转载注明来源:https://www.xzbu.com/8/view-15425408.htm