信息查寻与信息检索的整合研究|信息检索论文

  [摘要] 国际著名情报学家Ingwersen和Jǎ/rvelin从情境观和认知观的角度,将信息查寻和信息检索这两个以往相互隔离的研究领域进行整合和集成,提出一个全新的信息查寻与检索(Is&R)集成研究框架,为这两个领域开辟了一个新的研究路径。通过对国外文献的调研分析,从而剖析Is&R集成研究框架的理论基础,对其进行分析并论述其意义。
  [关键词] 认知观 情境 信息查寻 信息检索 信息查寻与检索 IS&R
  [分类号] G354
  
  1、引 言
  
  信息查寻(Information Seeking,以下简称IS)和信息检索(Information Retrieval,以下简称IR)以往是两个不同阵营的研究团体所从事的不同的研究领域,虽然两者都是对人类的信息行为进行的研究,但一个具有强烈的社会科学性特别是图书馆学的人文传统;另一个具有明显的情报学性特别计算机科学的技术传统,并各自沿着不同的轨道向前发展。然而,近年来却出现了一种新的动向,即两者开始走向互动与交流,出现了整合与集成的趋势。其中尤以国际知名情报学家Ingwersen和J2irvelin为代表,他们从整体主义的认知观点出发,认为IS与IR应该抛弃他们以往相互隔离和狭窄的研究路径,这两个阵营的研究人员应当认识到各自的价值和局限性。他们倡导在情境中将IS与IR进行有机的集成,并提出了集成的信息查寻与检索(Is&R)研究框架,从而为这两个领域开辟了一个新的研究路径。
  
  2、IS & R的理论基础
  
  正如所有的学说和理论一样,明确定义和阐释概念是其立论的基础和首要步骤。对于IS&R的集成研究来说也是如此。整体主义认知观、情境观以及在此基础之上的认知信息概念,构成了IS&R的理论基础。
  
  2.1 整体主义认知观
  整体主义认知观起源于DeMey,其核心观点是:“任何信息的处理,无论是感官信息,还是符号化信息,都是以某种范畴或概念体系为中介的,而对于信息处理设备来说,这种范畴或概念体系就是他(或它)的世界模型(认知模型)。”其中信息处理设备可以是人也可以是机器。
  在信息查寻与检索领域重要的是要关注认知观的五个相互关联的核心观点:①信息处理发生于讯息(message)发送者与接收者之间;②信息处理发生在不同层次;③在信息传播期间,任何一个行动者都会受其过去和现在的经验(时间)及其社会、组织和文化环境的影响;④每个行动者都会影响其周围环境或领域;⑤信息是处于情景和情境中的信息。
  认知观为情报检索提供了清晰的思路,并为瓜中尚未解决的问题指出了解决方案。特别是整体主义的认知观为IS和瓜这两个以往被视为互不相同、相互隔绝的研究领域建立了沟通和对话的桥梁,奠定了互动和整合的基础。
  
  2.2 信息的认知概念
  信息是情报学中最重要的现象之一。只有理解了这一现象,才能确立其它核心现象的概念,如信息需求的形成与发展、相关性,或知识的表示、获取与利用等概念。Ingwersen在参考了他人研究成果的基础上,基于认知的观点,提出了遵循情报学和IS&R的认知观的条件信息(ConditionalInformation)的概念:“…根据情报学的观点,信息的概念必须满足两个必要条件:一方面,信息是生产者的认知结构(包括意图、接受者的模型、知识状态,以符号的形式表示)发生变化的结果;另一方面,它是指可以意识到的、影响和改变接受者的知识状态的某些事情。信息被视为一个概念系统的补充或者互补,该概念系统表现了信息处理系统对周围世界的知识。如果只满足了第一个条件,我们谈论的是潜在的信息,即类似储存在信息源中的数据或实体,它们对接受者(不管是人还是机器)具有潜在价值。如果只满足第二个条件,我们谈论到是觉察到的感知数据或者是来自自然界的信号,而不是信息。”认知信息的概念为IS&R集成研究提供了一个可用框架和概念基础。
  
  2.3 情境观
  情境(Context),即认知行动者在信息行为过程(例如信息的查寻与检索)中所处的特定环境和状态。信息查寻与信息检索的理论和实践方面的研究都表明,瓜仅仅是信息查寻的一种方式,它们都发生于情境之中,该情境取决于诸如任务、状态和情景等方面。
  按照认知观的观点,在Is&R框架中,与每一个组件(组成要素)相关的行动者和对象就成为他们自身的基本认知结构的情境(即对象内部情境),并成为彼此之间的情境(对象之间情境)。而在框架各个组件之间的相互作用过程中,这些框架组件自身又成为彼此的情境。而所有的Is&R组件和相关活动都处于公共的社会、物理和技术基础结构以及它们的历史的情境中。
  任何信息行为都是发生在一定的情境中,情境是所有信息行为的出发点和落脚点,也是其信息行为的依据和指南。对于传统的IR研究而言,需要在关注技术的同时,更多地关注检索者或用户、任务情境、信息交互和信息利用,使之朝着结构化、情境化和认知的方向发展;对于传统的IS研究而言,也需要向信息采集技术和任务情境扩展。因此,正是在情境之中,IS与IR才有了整合和集成的可能。
  
  3、集成的IS & R研究框架
  
  3.1 IS&R研究框架的概念认知模型
  基于对不同时间和空间的认知行动者的理解,Ingwersen等提出了一个适用于任何认知行动者的概念认知模型作为IS&R集成研究框架。如图1所示,它有5个核心组件:认知行动者(特别是信息查寻者);界面;社会一组织的情境;IT;信息对象及信息空间。他们之间通过信息交互联系在一起。
  
  该模型突出强调了处于情境中的IS&R过程中的信息交互。首先,社会交互过程(1)存在于行动者和他们所处的过去及当前的社会文化和组织情境之间;其次,借助于界面,信息交互过程也存在于认知行动者和嵌入在IT和既有信息对象之中的认知表现之间(2-3);再次,个人行动者需求会导致潜在信息的产生及认知和情感的转化(5-7),社会、文化和组织情境的需求也会导致IT和信息对象的产生和变化(6-8)。
  该模型也强调了所有参与的认知结构都同时处于模型中其它认知结构所共同构成的情境之中。因此,情境、行动者和各个组件以及各组件的内部结构之间存在一种相互依赖的关系。
  在这个通用模型中,行动者可以是作者、标引员、算法和界面的设计者、编辑者、信息查寻者等多种不同的类型。可见,该通用模型的研究意图并不是仅限于IS与IR的,而是通过模型在不同角色行动者上的应用,力图对信息的生产、组织、加工、检索和传播这一“信息链”进行整体上的认知化改造,从而使认知观真正地渗透到情报学主要研究体系的各个方面。该模型尽管比较简洁和抽象,但有很强的解释力、应用性和可扩展性。
  3.2 IS&R研究框架
  Ingwersen提出了主要针对信息查寻者的细化模型。如图2所示,在这个细化模型中,每一个核心组件都被进一步细化,而信息查寻者的核心位置得以凸显。
  在该模型中,不只是信息查寻者才具有认知结构,而是信息对象、IT、界面都具有认知结构,是一种“嵌入的认知结构”,组织文化社会情境则成为集体认知结构的体现,这些无疑将认知观在模型中的地位推到了极致。模型中不同要素的交互完全也可以看作是不同认知结构在时空变换中的交互,由此,情报学的认知观得到了全面的展示。
  
  3.3 IS&R认知框架的主要特征
  图2具有以下几个主要特征:
  
  
  IS&R框架是独立于媒介而存在的,它包含5个核心组件,每个组件都由描述行动者认知结构的数据结构组成,认知行动者都参与过这些数据的创建、保存或修改。
  情境具有历史性(累积性),它是由认知行动者在和“使用团体”及其同行长期接触过程中获得的知识和经验组成。此外,情境和IS&R框架的其它要素互相嵌套。因此,情境具有社会、文化或组织特征,和对象、系统、领域以及检索者的工作和日常任务、情感、动机、喜好等密切相关。历史情境和实时交互情境(会话)共同构成了当前情境,并直接影响认知行动者对当前状态的认识和理解。而在每一个组件内部,其构成元素之间(包括最小的符号元素)又互为情境。
  认知和社会影响互补原理以及个体行动者成为决定性因素也是认知整体论框架的一个核心特征。反之,这个特征又使认知整体论框架遵从这样一个概念,即该框架的每一个组成要素都处于其他要素构成的情境当中。
  该图所示的理论框架也有意涵盖一些信息查寻以外的信息行为。这些行为包括信息对象的利用、创建、交流、选择、人工标引等活动。通过关注理论框架的每一个组件以及他们之间的直接关系和交互作用,展示了其作为模型工具的强大功能。
  IS&R框架指出,IS&R核心变量之问的概念关系可能一直被人们所忽视。例如,在给定工作任务条件下,人工等级相关评价模式与相应的IT情境中相关性反馈算法适用性之间的关系。该框架灵活性很强,可以对三个或更多要素中的变量之间的关系进行研究。
  理论框架可以对组件中认知(和社会)元素之间的详细关系进行研究。例如,利用该框架可以对进行IS&R所需的知识类型(如描述性以及过程性的IS&R知识、领域知识、社会知识)进行建模。同其它模型相比,该框架能够对IS&R中的核心问题进行更为结构化、更为详尽的研究。
  
  4、对 IS&R 研究框架的评价
  
  4.1 实现了信息查寻与信息检索的整合与集成
  既然是一个集成的IS&R研究框架,就应该整合信息查寻与信息检索。可以认为,Ingwersen提出的框架实现了这种集成和整合。如果将图2所示的细化模型中信息查寻者的认知空间单独抽取出来,这就是信息查寻行为研究;如果把该模型的左侧部分沿“提问式(Query)”垂直切分,不考虑界面和右侧部分,余下部分就会形成一个由信息对象、IT情境、提问式所构成的简单的三角交互模型,这就是系统导向的信息检索;如果将右侧部分的界面和信息检索者考虑进来,就形成了较为复杂的研究模型,并构成了以查寻者为中心的研究模式,这就是认知与用户导向的信息检索;如果继续将边界向右推,进一步将研究重点放在图2所示模型的最右侧部分的社会、组织和文化情境上,这将形成信息管理和知识管理研究领域以及信息查寻过程的社会构成主义观、社会现实主义的领域分析方法、文献表示的社会认知观。根据这些观点,社会情境、领域、认识论或文化与组织结构是认知和表示过程的决定因素。由此可见,该模型的确能够将社会科学导向的信息查寻、系统导向的信息检索和用户与认知导向的信息检索有机地整合在一起,从而形成了一个在整体主义认知观统领下的IS&R集成框架,这样就连通了长期以来相互对立和隔离的信息查寻与信息检索领域,使之具有了互动和整合的可能。
  
  4.2 为信息查寻与信息检索提出了新的研究方向
  IS&R框架不仅为集成现有的信息查寻与信息检索提供了概念模型,也为两者的未来发展提出了一些启示和研究方向。
  IS&R框架对以下四个要素进行了合并,提出了一些新的研究思路:①将信息查寻者置于和正式IR系统直接相关的动态情境中;②如何开展研究或进行性能测试取决于研究的目的;③将最佳匹配算法置于和其他非正式知识源(如人类)相一致的信息查寻活动中;④在多变量情境中开展研究的方法。
  IS&R框架提出了全新的研究问题,即对与框架要素相关或框架要素之间的因变量(自变量)、受控变量以及隐藏变量的分布进行研究。由此可以得出更多的研究发现。
  Is&R的研发工作可以采取两条行动路线:一方面,扩展瓜研究以捕捉更多的情境,但是不放弃实验室试验方法;只有沿着这条行动路线,才能接近真正的瓜工程学(ITengineeing);另一方面,则是把目前的IS研究向任务情境和技术方面扩展,即从行动者出发向左、右两个方向扩展(见图2)。
  
  5、结 语
  
  Ingwefsen和JarveIin提出的IS&R集成框架对现有的各种知识进行了系统集成。它将主流的系统导向的实验室信息检索、用户与认知导向的信息检索以及信息查寻进行了有机的集成和融合,从而形成了整体主义认知模型。该研究框架是真实世界中人类信息行为的全面概括与抽象,它所指出的研究方向也是目前最具前景的研究路径。它标志着在信息检索发展过程中开创了一个崭新的领域和路径,从而在认知观的统领下,将图书馆人文传统的信息查寻与情报学技术传统的信息检索由以往的相对隔离走向互动与整合。