建构图书馆的“云”时代
来源:用户上传
作者:
[摘要]介绍云计算基本原理和应用实例,论述云计算给图书馆发展提供的机遇,从技术角度设计图书馆云计算应用的模型结构,探讨图书馆云计算的应用方向及云平台的建设,阐述图书馆云计算技术开发方面存在的瓶颈,指出图书馆应该充分利用云计算技术,在现实的基础上架构图书馆资源共享和图书馆大联盟,最终进入图书馆云时代。
[关键词]云计算 云协同 云时代
[分类号]G250.7
随着信息技术的飞速发展,传统图书馆遇到了前所未有的挑战,同时也带来了前所未有的机会。目前,IBM、微软、雅虎、亚马逊、Sun、EMC、Google等大型IT厂商都已涉足云计算。“云”计算作为一种技术与应用结合的理念,为传统图书馆和数字图书馆未来的发展,提供了全方位的指导和启发,也为传统图书馆提供了一种新的运营模式,图书馆的“云”时代即将到来。图书馆作为知识和公共资源提供者,将在最大限度上满足用户对知识的需要,用户可以通过各种网络终端,任意获得图书馆的资源和应用。各类型图书馆也将以分布式的节点方式、以极低的投入、充分利用设备资源的冗余,实现在传统上只有大型超级计算机能够实现的梦想。同时,各个图书馆独具特色的馆藏资源,也将纳入统一的数字图书馆整体架构之中。
1 “云”计算介绍
1.1 “云”计算原理
“云”就是计算机群,每一群包括了几十万台,甚至上百万台计算机。云计算(cloud computing)其实就是分布计算、网格计算、并行计算等既有理论的延续,其最基本的概念,是透过网络将庞大的计算处理程序自动分拆成无数个较小的子程序,再交由多部服务器所组成的庞大系统,经搜寻、计算分析之后将处理结果回传给用户。透过这项技术,网络服务提供者可以在数秒之内处理海量信息,达到和“超级计算机”同样强大效能的网络服务。
“云”计算分三层:最下面是基础架构,包括硬件、服务器等物理资源;第二层是中间平台;再上面一层是应用和服务。“云”计算的基本原理是,通过并行计算,协同大量的分布式计算机,实现统一工作,这些计算机并非本地计算机而是网络上的远程服务器或各节点上的计算机,其数据中心的运行方式类似于互联网的运行方式,云计算网络服务提供者,能够快速把资源查找和处理转换到需要的应用上,使用户根据需求访问计算机和存储系统。
1.2 “云”时代展望
目前,Pc依然是我们日常工作生活中的核心工具,我们依赖PC的硬盘和在硬盘上安装的各种软件,否则我们会束手无策。
而在“云计算”时代,通过互联网把所有的计算应用和信息资源都连接起来,供个人和企业用户随时访问、分享,管理和使用――相关的应用和资源可以通过全球任何一个服务器和数据中心来获取,我们只需要一台可以上网的设备,如电脑、手机等,在任何地方,只要能以任何方式登录网络,就可以使用通过云计算提供的网络服务生成、制作编辑各种文档、文件进行办公了,也可以快速地计算和找到需要的资料,再也不用担心资料丢失和电脑的损坏了。
1.3 “云”计算的几大应用形式
“云”计算从应用模式上看,其核心是提供服务,目前主要有三种方式:①SAAS(软件即服务):这种类型的“云”计算通过浏览器,把程序展现给成千上万的用户使用;②效用计算(Utility Computing):这种云计算是为IT行业创造虚拟的数据中心使得其能够把内存、I/O设备、存储和计算能力集中起来成为一个虚拟的资源池来为整个网络提供服务;③网络平台服务:通过提供一个计算机开发的API(接口),让开发者能够开发更多基于互联网的应用;或者通过云计算把开发环境作为一种服务提供给用户。
1.4 “云”计算的应用实例
“云”计算有很多应用实例,但比较有代表性和借鉴意义的主要是谷歌公司、百度公司和亚马逊公司所推出的应用:①搜索:为了满足搜索引擎迅速增长的数据处理需求,谷歌搜索引擎的GFS文件系统(GoogleFile System)针对内部网络数据规模超大的特点,基于分布式并行集群方式的基础架构,部署在廉价的普通硬件上,用来处理集群中经常发生的节点失效问题。通过高容错技术,满足大量用户同时访问时仍然能保证总体性能较高的服务。②数据规范:搜索引擎为提高搜索效率,将数据库系统扩展到分布式平台上,开发了分布式大规模数据库管理系统BigTable系统。这个系统可以有效处理大量的格式化以及半格式化数据,构建了弱致性要求,可以确保半结构化数据如Search、History、Maps、Orkut和RSS阅读器等应用程序运行在BigTable之上。③办公应用:百度公司的百会系统和谷歌公司的googledocs是一个基于Web的工具,它有跟MSoffice相近的编辑界面,有一套简单易用的文档权限管理,而且它还记录下所有用户对文档所做的修改。百会的这些功能令它非常适用于网上共享与协作编辑文档。百度公司已经推出了文档编辑、电子表格、幻灯片演示、日程管理等多个功能的编辑模块,能够替代MSoffice相应的一部分功能。值得注意的是,通过这种云计算方式形成的应用程序非常适合于多个用户进行共享以及协同编辑,为一个小组的人员进行共同创作带来很大的方便性。④计算应用:亚马逊的弹性计算云(Elastic Compute Cloud,EC2),用户可以通过弹性计算云的网络界面去操作在“云”计算平台上运行的各个实例(Instance),而付费方式则由用户的使用状况决定,即用户仅需要为自己所使用的计算平台实例付费,运行结束后计费也随之结束。
2 “云”计算给图书馆发展提供的机遇
2.1 图书馆在当今遭遇的挑战
传统图书馆的分散性导致各图书馆各自为战,资源不能充分利用和开发。数字图=}5资源供应商也对传统图书馆提出了新的要求,数字图书资源以海量的内容和较低的成本,通过计算机和网络,向用户提供服务,导致传统图书馆的利用率大幅降低。同时,数字图书馆也遭遇搜索引擎巨头的挑战,国际大的软件和互联网厂商,给中国信息技术和信息安全带来了极大的挑战。
2.2 图书馆的机遇
2.2.1 确立“云”计算图书馆架构体系和服务,构筑图书馆数字联盟①建立馆际联盟,整合分享馆藏资源,通过云计算技术,实现面向客户和公共服务的体系。②建立传统图书馆与第三方数字资源供应商和信息技术开发企业的联盟,确保传统图书馆在信息技术飞速发展中保持不败。在云时代依托技术不断创新,虽然可以保障图书馆的生命力,但其核心依旧要以标准的、权威的图书文献及其内容为服务依托,不断充实、扩展和更新的图书文献才是其生命力根本所在。③图书馆与公共信息服务平台的联盟与融合,图书馆向个人和机构提供个性化的信息应用服务。这些联盟作为图书
馆“云”计算应用与服务的支撑,共同协作,向用户提供服务。
2.2.2 以全面推进“云”计算图书馆建设为契机,建立图书馆数字化建设标准 图书馆数字化标准的建立,可以保证图书馆资源利用最大化,节约迁移、改造和合作成本,尤其是图书馆数字化的技术和接口建设,在保持各图书馆特色的同时,也通过接口的标准化,作为云服务平台的一部分,向社会公众提供图书馆统一的云-计算开放接口服务。
2.2.3 以“云”计算服务为手段,变革图书馆服务模式 传统的图书服务模式,在信息技术应用过程中,已经开始产生了巨大的变化和服务扩展,通过云计算方式提供的服务,可以更加贴近用户个性化应用,同时又可以衍生出更多的、新的服务项目。
3 图书馆云平台的架构与实现
3.1 图书馆云计算的架构模型
图书馆的云计算的架构,从技术应用角度,需要三个方面支撑来实现:一是底层硬件的算法技术,实现硬件的集群;二是虚拟计算服务技术,保证图书馆服务和应用的托管;三是应用技术的开发,为用户提供多种应用和服务。图书馆云计算应用平台通过面向用户接口和界面,为不同用户提供多种综合应用。作为图书馆云平台的机构用户――图书馆,可以享受和使用图书馆云平台的图书编目、图书管理、借阅管理、应用开发扩展、计费、订购等服务;作为公共个人用户,在不受任何终端和接入限制情况下,享受图书馆云平台提供的文献检索、动态跟踪、论文写作存储、博客、RSS以及其它在线协同办公等服务。
3.2 图书馆“云”计算应用的技术需要
“云”计算在技术和应用上的逐渐完善,为图书馆进入云时代,全面整合分散在各图书馆的设备、协同各图书馆的应用、组织各图书馆的数据资源等方面,提供了现实的技术保障。
3.2.1 图书馆的“云”设备――底层硬件实现 图书馆云计算是指用云计算技术建造的虚拟数据中心或超级计算机,并以免费或按需租用方式提供给软件开发者,即硬件服务HaaS(Hardware-as-a-Service),通过多种设备的协同并行运算实现。图书馆云设备协同就是利用分布在各地的图书馆部署的不同的廉价服务器组成的服务器集群,在计算能力、可靠性、性价比等方面能够达到大型计算机的水准。目前比较成熟可借鉴的开发应用Hardtop技术就是google搜索引擎的MapReduce算法实现的开源平台,MapReduce可以让TB级别的数据在数千台服务器上运行计算,Hadoop可以让计算模型细化到一个个小块,这些小块能够通过很多服务器并行计算。图书馆的云计算在底层应用上,就可以借鉴和采用Hardtop技术,在不扩大设备部署的情况下,实现图书馆云设备的协同高效运行,其核心技术就是开发出控制大型网络服务器集群的计算资源操作系统,它不但可以自动将计算任务并行化,充分调动大型服务器集群的计算能力,而且还可以自动应对大多数系统故障,实现高水平的自主管理。
3.2.2 图书馆的“云”协同――应用层实现 软件应用的协同分布式运算实现。利用高速互联网的传输能力,将数据的处理过程从个人计算机或服务器移到互联网上的计算机集群中。数据被包装在对象Object中,而对象是运行在应用服务器的内存中,这样,整个计算负载才会集中到这些应用服务器上,然后就可以架设多台应用服务器,进行分布计算;比较成熟的应用Gigaspaces是一个基于Space-Based Architecture架构的可伸缩方案,也是网格计算grid computing的一种。图书馆云协同就是需要把一个Web应用,简单部署到网格中的处理单元,实现集群和并行计算。
3.2.3 图书馆的“云”数据――数据库层的实现数据库的分布式协同运算。图书馆的应用根本就是提供数据查询,通过云数据技术,打破目前已经应用了30多年的基于磁盘的数据库技术,采用云计算可以在分布式环境中运行――可以同时调用分布在多个地点的众多服务器存储图书数据资源。Google的Bigtable,Amazon的SimpleDB,10Gen的Mongo,AppJet的AppJet数据库以及甲骨文开源BerkelyDB,Nimbus的云计算数据库NimbusDB将被设计为能够通过简单的增加-更多的服务器来无限扩展数据库的运算能力,并且支持软件的在线升级、软件和硬件的容错性。此类技术完全可以满足图书馆资源的云数据部署和整合。
3.2.4 图书馆的“云”应用――软件服务的实现 云计算软件应用有几个特点:一是用户注册后可以立即开始使用,或者叫做即需即用、随需应变;二是所有客户的程序和数据统一管理;三是程序和数据库采用多重租赁架构(Multi-tenant),从而提高稳定性可扩展性,并降低维护成本。通过软件服务方式超越不同图书馆异构式操作系统、数据库、管理软件等环境,实现各分散的资源协同。不依赖于特定的操作系统和数据库,实现对各图书馆现有的管理系统、馆藏数字文献的数据库,进行整合,最后部署到分散到各图书馆服务器、乃至终端计算机上,再利用云计算方式,把每个图书馆的资源以分布式方式提供给终端用户。
3.3 图书馆云服务平台的开放接口(API)和界面
图书馆的云服务平台,其服务对象的不同和服务内容的不同,需要提供的服务接口也不相同,但主要有四个层面的关键接口。
面向终端公共用户的统一服务界面:这是指图书馆云提供给用户的个性化的应用,用户在这里自由使用分布在云端上资源和数据,只有用户需要借阅具体的图书和文献时,才会根据获得的索引查询结果以及自己拥有的用户权限,决定在哪一个图书馆借阅。
面向图书馆的数据托管接口:这是图书馆云平台提供各个图书馆的接口,每个图书馆可以通过把自己的数据托管到云平台上,分享自己的馆藏资源。
面向图书馆软件租用接口:图书馆云平台,把图书馆软件放到网络上,供各个图书馆租用或下载使用。
面向图书馆服务器集群接口:这是图书馆与的底层技术,通过并行算法,把分散的图书馆服务器集成起来,以获得更佳的运行速度和效率。
3.4 图书馆的云服务
图书馆需要使用的云服务,主要是图书馆的业务应用,分为两种情况:第一种情况是小图书馆,不必购买专业的图书馆软件,而是通过使用云计算的SAAS服务,不用专门购买服务器,也不用专业的管理员,就可以处理图书编目、借阅以及其他基本使用需要;第二种情况是已经有一定信息化规模的图书馆,数据库具有一定的规模,数据比较完善,可以采用数据托管方式,也可以通过系统改造,向具有云服务功能的系统平台迁移。
面向终端用户的云服务,是把图书馆最基本的服务功能,并通过云计算技术的应用,把终端用户开展科研和学术研究有机的结合到一起,真正做到脱离设备和地点的限制。根据图书馆的服务的内容和图书馆建设的需要,图书馆需要在几个层面提供服务,主要包括:①文献利用:包括,文件检索、浏览、保存、卡片、笔记、标签等。②情报跟踪:通过RSS对指定学术期刊、杂志、出版社、研究机构以及其他图书馆的网站进行跟踪,及时获得科研最新动态和成果。③学术交流:各种学术会议动态,通过博客等系统进行学术交流。
4 图书馆云平台建设的瓶颈和突破的可能性
图书馆的云计算研究还处在起步阶段,现有的研究大都停留在模式的探索和前景的展望层面,距离真正开展云计算平台建设,还有很大的一段距离。云计算与图书馆行业的交叉结合,需要一大批信息技术人才。但是长期以来,图书馆信息技术人员极为短缺,能够真正开展研究的专业人员寥寥无几,导致图书馆对信息技术的高端应用明显滞后。目前,图书馆信息技术的应用软件开发大都还停留在C/S结构上,几乎还未出现对图书馆云计算开发的技术力量投入。
图书馆云平台建设的突破,最大的机会主要在技术和资金两方面。从根本上来说,要依托底层信息技术的支撑和资金的注入。比如开放源码技术的广泛应用,就可以在短时期内初步实现一些最基础的云计算应用,也可以从长远的角度为图书馆云平台的开发和应用奠定坚实的基础。
人类已经进入信息时代,信息技术已经渗透到人们生活的各个方面,图书馆的发展面临着前所未有的契机,应该充分利用云计算技术,尽早搭建图书馆云平台,在现实的基础上架构图书馆资源共享和图书馆大联盟,实现真正意义上的图书馆协同、图书馆服务、图书馆联盟,打造出云时代的图书馆。
转载注明来源:https://www.xzbu.com/1/view-153516.htm