数字图书馆系统 利用开放存取资源建立个人数字图书馆

  [摘要]从开放存取与个人数字图书馆的关系出发,按照个人数字图书馆建立步骤,构建其应有的模块。在此基础上分析个人数字图书馆开源软件的选择、个人数字图书馆中开放存取资源的采集、与自建数字资源的整合,最后阐述如何利用个人数字图书馆及其中的开放存取资源服务于个人。
  [关键词]开放存取资源 个人数字图书馆 开源软件
  [分类号]G253
  
  1945年,被誉为“信息科学之父”的Vannevar Bush在“诚如所思”一文中描述了一个个人图书馆Memex,个人将自己的图书、记录和交流信息存储在Memex设备中,进行组织,以便于快速查找。该文被尊称为情报学诞生的标志。个人数字图书馆就是其实现方式之一。
  个人数字图书馆早在上个世纪90年代就引起了一些专家的注意,如国外的Cathy Marshall在个人数字文档的服务模型、评价、保存和利用方面做了大量的调查,对其中存在的挑战提出了自己的看法。也有一些学者建立了个人数字图书馆促进个人的研究、工作和生活质量的提高。开放存取运动的发展则为个人数字图书馆的建立提供了更多的便利。本文拟讨论如何利用OA资源建立个人数字图书馆。
  
  1 从个人数字图书馆概念看开放存取资源与个人数字图书馆的关系
  
  个人数字图书馆,是指个人为了读书治学的目的,在自己的计算机上采用免费的或基本免费的全文数据库软件,将有关的网上信息和自创的数字化信息资源进行采集、存储,使之成为有组织的信息集合,以供个人有效利用。该定义有3个关键点:
  
  第一,个人数字图书馆软件为免费的或基本免费的。开源软件是开放存取资源的重要类型,它不限制用户的使用权限,允许用户更改、复制和传播开放源代码。从用户角度而言,开源软件不需要付费,还能根据个人的需求更改设置。很多数字图书馆开源软件已经得到应用,如Eprint、Dspace、Fedora、Greenstone和CWIS,其功能基本可满足个人数字图书馆的需要。因而,开源软件是建立个人数字图书馆相对理想的软件。
  第二,个人数字图书馆中的信息资源由两部分构成――可以采集与存储的网上信息和自创的数字化信息资源。后者数量有限,且因人而异,因而前者应该是个人数字图书馆信息资源的主体,即个人生活、工作、学习与研究所需的大量资源要依靠网络进行采集。绝大多数商用数字资源需要付费或者授权方可获得,一般的个人用户不可能像图书馆那样能够购买或者拥有很多学术资源,对这些资源的获取和利用相对困难,开放存取资源(open access resources,以下简称OA资源)则可在很大程度上解决该问题。OA资源最大的优势就在于其免费性,用户只要遵循相应的协议,就可任意复制、打印或下载这些资源。国际上著名的OA资源目录、OA资源注册站点和ISI等机构的统计与调查表明,OA资源来源广泛、形式与涉及的主题多样,数量在不断增加,质量也在不断提高,故其有充分的理由成为个人数字图书馆重要的信息资源。
  第三,个人数字图书馆中的资源要经过组织才能被个人有效利用。个人对信息资源的内容、形态以及个人数字图书馆功能的需求千差万别,开源数字图书馆软件具有的可以根据个人需要进行设置的功能以及上文所述的OA资源的特点可以满足用户的差异性需求。
  因此,利用开放存取资源建立个人数字图书馆是必要的、也是可行的。
  
  2 个人数字图书馆的功能及模块构建
  
  2.1 个人数字图书馆的功能
  从上述个人数字图书馆定义可以看出,个人数字图书馆应该含有适合人们的行为、技能、习惯的灵活的工具,允许人们按照自己的意愿聚集、管理和共享他们的信息资源。它是一系列资源和服务的结合,能够支撑创造、利用、再利用、保存或者处理的信息生命周期和资源查找、组织、利用和共享的学习周期。但同时个人数字图书馆使用应该尽量简单方便,不需要人们花费太多的时间来管理,否则人们会淹没在大多数没有经过整理的资源中而无所适从。
  
  2.2个人数字图书馆的模块构建
  综合上述个人数字图书馆功能,结合一般用户的学习与研究习惯和对学习资源利用的特点,从资源搜集、整理到利用的需要出发,笔者认为,个人数字图书馆应该具备的功能模块如图1所示:
  在图1中,资源层主要收集从网络上获得的OA资源;资源层与服务层之间的组织层整合从网上采集的信息资源和自创的数字信息资源;经过组织整理后通过服务层查询和共享;辅助层为资源层和服务层提供必要的支持,包括数据备份、数据移植、个性化界面设置、实时帮助等。交互层则支持个人数字图书馆与他人的个人数字图书馆、公共数字图书馆和数字仓储通过互操作协议进行交互或者共享资源和服务。
  
  3 选择开源软件作为个人数字图书馆的建设软件
  
  构建好个人数字图书馆模块之后,需要选择合适的软件进行具体的操作。如前所述,出于经济上的考虑,开源软件是建立个人数字图书馆相对理想的软件。在众多的开源软件中选择一款合适者需要考虑一些因素。
  
  3.1 选择个人数字图书馆开源软件应考虑的因素
  个人数字图书馆软件是构建个人数字图书馆的基础,尤其是建立于个人计算机之上的个人数字图书馆,个人信息资源组织和检索也依赖于软件所支持的功能。软件选择的合适与否直接关系到以后的利用是否便利。目前适合构建个人数字图书馆的开源软件主要是开源数字图书馆软件。
  《开源数字图书馆软件评价一览表》一文从内容管理、用户界面、用户管理、系统管理和其他要求5个方面对目前流行的4种开源软件(CDSware、Eprints、Fedora和Greenstone)进行了比较分析,认为Greenstone是最好的开源数字图书馆软件。“数字机构仓储学习研讨项目”(Learning About Digital Institutional Repositories Seminars programme,简称LEADIRS)在机构仓储软件平台部分详细说明了选择软件应该考虑的因素,包括:基本技术构建模块、产品特色模块、技术产品模型、运行服务要求的其他技术、主要研究提供者等。开源数字图书馆软件主要是为图书馆、机构等建立大型数据库、数据仓储而设计的,如将其运用于个人数字图书馆中则还有一些特殊的要求。在选择个人数字图书馆软件时应该考虑的因素如下:
  3.1.1 软件功能 软件是为个人服务的,软件功能是否齐全并符合个人需求就成为用户考虑的重点因素。具体细节如:元数据能否自动生成;用户能否选择元数据格式并对其进行分类、浏览和检索;用户可否添加、删除元数据元素,等等。
  3.1.2 语种及本地化程度 是否提供了多语种、软件是否本地化也是用户考虑的因素。目前一些开源软件建立了自己的联盟,世界各地的人都可以成为其开发者。如果软件能 提供用户熟悉的语言,用户选择的余地会更大。
  3.1.3 软件支撑技术 是否支持通用的操作系统、安装是否便利、软件更新是否会给原有数据带来麻烦、是否提供数据备份及恢复也是用户在选择软件时考虑的因素。
  
  3.2 易用的Greenstone可作为个人数字图书馆软件的优先选择
  根据上述考虑因素和开源软件的性能以及Greenstone开发者的介绍,着重考察功能的全面性、易用性、灵活性和可扩展性,笔者选择Greenstone软件建立了微型的个人数字图书馆。笔者在使用中发现,Greenstone具备了个人数字图书馆的主要功能:
  资源采集服务。①帮助用户将个人计算机上的自创数字资源直接导入到数据库中;②提供搜索下载界面,运用HTTP协议从网上下载资源,支持下载遵循OAI协议、Z39.50/SRW等互操作协议的数字仓储中的资源;③内嵌有MideaWiki开源搜索引擎软件,在检索框中输入关键词,就可以在网络上搜索。当然,开放存取资源的收集、评价与知识产权保护等问题都是开放存取资源采集工作中需要考虑的,本专题其他论文分别进行了专门的讨论,这里不再赘述。
  资源组织服务。允许用户采用文件夹的方式组织信息,用户可以新建文件夹,建立文件夹等级结构。文件夹内的文献采用元数据进行组织,提供多种元数据格式供用户选择,默认的元数据格式为DC元数据。可以将两种不同的元数据集融合,也可以运用辅助工具Greenstone元数据集编辑器(Greenstone Editor for Metadata Sets,GEMS)修改现在的元数据。
  查询服务。①允许用户像平时浏览硬盘文件那样浏览该系统的文件,也可以按照作者、题名、日期、文件夹等浏览;②可以同时在多个文件夹中检索,也可以检索元数据的某一具体元素;③支持全文检索;④支持信息过滤功能,如可选择只显示某一格式如HTML、XML的文件;⑤提供插件供用户自行设置,扩展符合用户需要的特定检索功能需求。
  支持与其他数据仓储之间及元数据层面的共享。用户可以通过StoneD将Greenstone的内容导入Dspace中,也可以将Dspaee的内容导入到Greenstone中。Greenstone使用的特殊格式遵循元数据编码与传输标准(Metadata Enco-ding and Transmission Standard,简称METS),其元数据可以导出到METS中,也可从METS中导入元数据。用户还可以将个人数字图书馆中的资源发布到网络上。
  其他功能。包括界面个性化设置、支持多种文件格式、随时都有帮助功能、软件更新不会影响数据的使用等。
  从前文所述不难看出,Greenstone基本上可满足用户建立个人数字图书馆的需求,并且功能可以根据用户自身的需求设置,有较强的灵活性,操作简单,适合各类人群使用。不过,与上述个人数字图书馆功能需求还有一定的差距,用户在选择时可以根据自身需求和使用习惯选择贴近自己需求、功能齐全的软件。
  
  4 采集开放存取资源作为个人数字图书馆的主要信息资源
  
  “巧妇难为无米之炊”,个人数字图书馆要满足个人的需要,信息资源建设是基础。如前所述,个人数字图书馆信息资源的主体是开放存取资源。搜索引擎是人们获取OA资源的重要途径。个人数字图书馆可以将搜索工具栏嵌入到系统中,用户直接从个人数字图书馆就可以搜索下载外部的OA资源。RSS订阅功能够免除用户登陆各个信息提供网站的麻烦,使用户能了解该领域的最新信息,这也是资源采集的重要来源。越来越多的开放存取站点开始提供RSS订阅功能。用户可将专门的开放存取资源RSS阅读器嵌入到软件中,每天都能及时看到该学科最新的OA资源。用户还可以通过互操作协议对其他个人数字图书馆或者OA仓储的资源直接进行采集。
  
  5 整合个人数字图书馆中的开放存取资源与自创的数字信息资源
  
  有组织的信息集合才能实现个人数字图书馆的功能。个人自创的数字信息资源采用不同的软件,有不同的格式。OA资源来源广泛,类型多样,既有文本资源,也有网页资源,有时甚至是某一博客或者学科仓储的具体网址。如何对它们进行有效的整合,使其既能符合用户的资源组织习惯又能方便用户查询与共享,是一道难题。
  国外对一些用户的调查表明,用户在网络时代还是更倾向于采用文件夹等级结构的形式管理自己的资源。《个人信息管理组织结构述评》一文对用户经常使用的几种组织方式如等级结构、线性结构、扁平结构等进行了具体分析,认为等级结构是用户目前使用最多的个人信息组织方式。使用文件夹等级结构符合用户的使用习惯,组织形式简单快捷,可存储多种类型的信息资源。
  随着个人数字图书馆OA资源与自创数字资源的不断丰富,用户希望尽快找到自己所需的特定文献单元甚至知识单元,但是利用文件夹组织资源不能深层次地揭示文献的内容,如果文件过多,要进行有效地揭示和组织较困难,也不利于检索。元数据已经成为揭示网络资源的首选方式,它简单方便,又能深层次揭示资源内容,便于用户对自创数字资源与OA资源进行揭示。许多OA资源列表和登记机构都采用元数据来描述资源,而这些资源正是用户采集的来源。将个人数字图书馆中的OA资源用元数据来描述,不仅能够直接从OA资源列表中下载,也能方便用户按照自己的习惯选择合适的元数据元素。METS的出现也为实现元数据层面的共享提供了条件。它采用XML形式表示,可将有关数字化资源的元数据打包,包括所有描述性和管理性的元数据。与OA资源揭示密切相关的标准之一OAI-PMH协议也对XML形式的元数据进行采集,对实现元数据层面的资源共享具有很好的促进作用。
  因此,用户可以根据自己的使用习惯和需要,将个人数字图书馆中的OA资源和自创数字资源利用文件夹进行简单的学科分类,文件夹中的具体内容则按照元数据来描述,既方便资源的组织与管理,也便于查询和共享。
  
  6 利用个人数字图书馆及其中的开放存取资源服务于个人
  
  开放存取运动提供了免费、开放的学术信息自由存取的环境,这为个人进行学术研究提供了条件,为用户在第一时间了解该领域最新开展的研究及其成果提供了可能。用户在建立个人数字图书馆学术馆藏时,以自己的需要为基准,按照某一主题或者研究领域进行搜集,将网上的OA资源进行整理并加以利用。因此,个人数字图书馆的馆藏质量高、针对性强,收录信息范围专深,是个人的知识仓储,能充分满足个性化学习的需求。
  个人数字图书馆中的OA资源便于用户进行知识创新。信息的获取是创新的基础。创新需要人们从多种渠道收集多种类型的信息,有时甚至是收集多个学科的知识。用户可利用这些知识扩大自己的视野,将其和自己的学习相结合,从而创造出自己的新观点、框架和模型等。OA资源类型的多样性和个人数字图书馆内容的多元化为知识创新提供了条件。个人数字图书馆为这些多来源多类型的信息提供了聚集之地,为他们的科研成果产出提供了便利。它允许人们以一种新的、有效的方式对知识进行选择、组织、利用和再利用。个人数字图书馆是许多工具的集成,能够让我们管理创造性的知识。
  综上所述,个人数字图书馆的建设软件、其信息资源的主体都是开放存取资源,利用OA资源建立个人数字图书馆可在不增加开支的情况下,使个人的生活、学习与研究资源大大增加。随着开放存取资源的不断增多以及Web2.O和Library2.0等开放理念的不断深入人心,这种增长是可持续的,也会使OA资源得到更广泛的传播。可以预见,利用开放存取资源建立个人数字图书馆具有广阔的前景,可加速个人与社会知识创新的进程,促进全社会个性化学习环境的发展,有助于形成泛在的学习环境。
  
  责任编辑:易 飞