基于科学知识图谱的交叉学科同行评议专家遴选方法研究|同行评议

  [摘要]交叉学科是原始创新的发源地,其科学评价问题倍受关注。针对交叉学科同行评议专家选择的难点问题,提出利用科学知识图谱来判定交叉学科相近研究领域及热点研究主题,并据此确定合适交叉学科同行评议专家遴选的方法,为同行评议专家的遴选提供科学合理的凭据。
  [关键词]知识图谱 同行评议 交叉学科 专家遴选
  [分类号]C931
  
  1 引言
  
  创新是科学评价工作的灵魂,是遴选科研项目的基本着眼点,即科学评价工作的本质是对科学项目创新性的评审。学科交叉的实质是知识体系的渗透和多学科思想精华的融合,具有浓烈原创思想的科研项目,一般都来自于交叉学科领域,因此,交叉学科的科学评价问题倍受社会各界和科研管理者的重视。发现和支持原始创新是一项非常艰巨的工作,具有原创思想的科学评价项目怎样能够得到同行评议专家的共识,怎样进行有效评估和遴选创新项目,如何选择交叉学科同行评议专家成为科研管理工作中一个极为重要的核心问题。
  
  2 交叉学科同行评议的难点
  
  原始性创新的交叉学科研究项目对同行评议提出了挑战。首先这个挑战就来自于同行评议专家的选择上。常规学科的研究内容是严格收敛在某一科学范式所规定的狭小范围内的,这样做的好处是能够对某一科学问题进行仔细而深入的研究。但交叉学科的研究内容往往不在范式规定的研究框架内,这样会使从事常规科学研究的同行评议专家对交叉学科的研究成果或科学评价项目的创新内容视而不见,并且又因为这些交叉学科的创新性科研项目成果对同行评议专家所持的范式构成了威胁,这种状况常常使交叉学科科学评价问题成为同行评议方法的盲区和难点。
  
  3 解决方案:交叉融合的科学知识图谱
  
  同行评议专家的遴选问题与图书情报领域中专家检索和专长识别问题相近。专家检索和专长识别的目的是为了快速准确地找到某领域或组织内的专家,以获取帮助,共享其掌握的隐性专长知识等,主要利用组织和领域内外部能够表征专家专长的各种文档和资源,识别专家在某给定查询主题(领域)的专长(相关性)程度,并按程度高低排序显示专家结果列表的过程。虽然专家检索与专长识别的研究可以为科研管理中同行评议专家的选择提供相应的理论支撑,但在专家检索中,前人很少将科学知识图谱作为识别工具并应用于科研管理之中,因此,本文希冀借用科学知识图谱来解决交叉学科同行评议专家遴选问题。
  
  3.1科学知识图谱的概念
  科学知识图谱是显示科学知识的发展进程与结构关系的一种图形。由于它是以科学知识为计量研究对象的,所以属于科学计量学(scientometrics)的范畴。刘则渊、陈悦等学者将知识图谱定义为可视化地描述人类随时间拥有的知识资源及其载体,绘制、挖掘、分析和显示科学技术知识以及它们之间的相互联系,在组织内创造知识共享的环境以促进科学技术研究的合作和深入。
  在知识图谱中,学科前沿之间的交互关系是以空间的形式展现出来的。研究发现,科学引文与被引文之间往往有着学科内容上的联系。通过引文聚类分析,特别是从引文间的网状关系进行研究,能够探明有关学科之间的亲缘关系和结构,划定某学科的作者集体,分析推测学科间的交叉、渗透和衍生趋势,还能对某一学科的产生背景、发展概貌、突破性成就、相互渗透和今后发展方向进行分析,从而揭示科学的动态结构和某些发展规律。
  
  3.2科学知识图谱所用理论与方法
  3.2.1 文献同引 文献同引分析是最基本的同引关系,它反映了同被引论文之间的结构关系,进而揭示学科之间的某些联系。通过文献同引分析,可以了解:①同被引文献簇的特征结构;②不同理论纲领、学派的汇集过程;③学科、文献类型、语种等的分布形式;④科学文献体系中互相引用的规律性。通过分析同被引文献群网络结构及其变化趋势,可进行科学学和科技管理方面的分析,研究学科之间或整个科学体系中相互联系、相互作用的发展变化状况及其不同理论纲领、学派的发展趋势。
  3.2.2领域本体 所谓的领域本体(domain-speeific ontology)就是对某一特定学科概念的一种描述,包括学科中的概念、概念的属性、概念问的关系以及属性和关系的约束。领域概念(或称为类)是对领域知识清晰而规范的描述。领域本体针对特定的应用领域,抽象领域知识的结构和内容,包括各种领域知识的类型、术语和概念,并对领域知识的结构和内容加以约束,形成描述特定领域中具体知识的基础。
  3.2.3多元统计分析方法 相关分析、多维尺度分析、主成分分析、因子分析和聚类分析是常用的多元统计分析方法。它们的主要目的都是从反映事物的多个变量中,抓住主要因素,舍弃次要因素,以简化系统的结构,认识系统的内核。通过这些方法,对有多个变量的数据进行分析处理,化繁为简,以期能从看似杂乱无章的数据中发现和提炼出直观的、概要性的结果或结论。
  3.2.4信息可视化技术 信息可视化(Information Vi-sualization)的宗旨是在计算机协助下,通过对数据可见的、交互的表示,洞察数据、发现信息。具体而言,就是把文献、数据、信息等不可见的内部语义关系转换成图形,将高维性的数据库,在一个二维或三维的可视化空间中显示出来,使得不可见的关系用可见的方式表达出来。可视化空间中的普通对象表现为空间中的点,对象间的关系则表现为点间连线。可视化的关键是降低高维向量空间的维数。
  
  4 实验、利用科学知识图谱选择交叉学科同行评议专家
  
  确定一个交叉学科研究对象――水,有关水的研究是一个跨物理、化学、生物等多学科融合的研究领域。通过科学知识图谱的绘制,构建有关水的主要研究内容的主题概念网络和学科领域网络,并找寻到与水相关的某一领域(如环境科学)中某一热点研究主题(如废水)合适的同行评议专家。
  
  4.1数据源说明
  以世界比较权威的有关水科学研究的期刊Water Research为计量数据依据,从SCI数据库中查到2005至2007年Water Research一共有1063篇论文被其他期刊论文所引用,由被引论文可追溯到来自其他期刊的3386篇引用论文,并下载这些论文相应的数据信息,包括著者姓名(Author(s))、标题(Titie)、关键词(Key-words)或关键词附加(Keywords-plus)以及学科类别(subject category)。
  
  4.2过程说明
  把所有引用论文的作者视为同行评议专家的候选人,遴选的思路如下:①通过对与水研究有关的重要数据单元――学科类别进行分析,确定与水密切相关的学科,绘制出水研究相关学科的可视化图谱,并确定相关学科的亲疏远近;②利用下载引用期刊论文数据单元中的关键词信息,确定水研究中经常出现的高频科 学词汇,绘制水研究相关高频词汇的可视化图谱,确定词汇之间语义远近关系;③在与水研究最近的学科类别中,找到与水研究最相关的几个高频科学词汇,并通过这些高频词汇确定相应的论文著者,即为同行评议专家的最佳人选。
  
  4.3结果分析
  表1是与水研究密切相关的高频引用主题研究领域:
  
  表1显示环境科学、环境工程、水资源、化学工程与生物技术与应用微生物五个主题研究领域与水研究有非常密切的学术关联,提示科学评价管理者从以上学科中挑选能够对水研究项目进行科学评价的同行评议专家。
  图1是水研究相关研究领域三维关联图,图中圆点表示与水研究相关的学科:
  表2显示了引用Water Research论文的高频关键词排序情况:
  关键词揭示论文研究的主题内容,因此,关键词频次越高,代表的交叉学科的某方面主题内容越被关注,并逐渐成为交叉学科所研究的焦点或热点问题。
  图2是水研究相关学科热点研究主题三维网络图:
  在与水研究最为相关的学科中,选择Environmen-tal Sciences,观察Environmemal Sciences中的研究热点以及这些研究热点领域的专家学者,这些学者即为交叉学科中最为适合的同行评议专家的候选人。
  表3是经过处理后部分引用Water Research的期刊论文AU、DE和sc字段的数据信息,其中,AU代表作者,DE代表所发文章的关键词,SC代表发表论文所属的相关学科。然后,在SC字段中查找与水研究最为相关的学科领域Environmemal Science(已用深色底纹标示出)。在所有sc中有EnvironmentM Sciences的行里,记录下DE包含的关键词,并将所有符合条件的关键词进行统计,统计出高频关键词,这些高频关键词就是Environmental Sciences学科与水研究相关的研究热点方向,见表4。
  选取wastewater作为水研究与Environmental SCI-ences共同研究热点问题,找寻合适的科学家作为交叉学科的同行评议专家。在表3中找寻所属学科sc中有Environmental Sciences、关键词DE中有wastewater的行,统计作者字段AU中的高频作者,这些高频作者即为交叉学科某一领域中最适合的同行评议专家。这种遴选可以科学地得到在水研究相关学科Environ-mental Sciences中以wastewater作为研究重点的学者群,作为交叉学科同行评议专家最为合适的候选人名单,如表5所示:
  
  通过对表5中候选专家进行调查,发现这些专家都是在水环境治污研究方面非常活跃的一线专家,对此领域颇有研究,非常合适做同行评议专家。
  
  5 结语:给同学评议专家遴选系统的启示
  
  5.1能够准确判定交叉学科相近研究领域
  采用科学知识图谱方法,通过确定某交叉学科期刊被引用的情况,尤其是引用论文的所属学科等信息,反映此交叉学科涉及的学科研究领域。根据真实、可靠的数据和绘制的科学知识图谱来描绘交叉学科的学科结构以及交叉学科中相关学科的学术关联,为科研管理者提供同行评议专家相关学科背景知识的信息;同时也为科研管理者把握交叉学科发展方向、规律提供可靠的数据支持。
  
  5.2能够准确判定交叉学科热点研究主题
  交叉学科是由多学科相互作用、融合而成的具有很强创新特点的学科。不同学科相互交融的基本原因在于不同学科所使用的科学语言和科学词汇的共同理解。科学知识图谱的方法给科学评价管理者提供了交叉学科热点研究的主题信息。从交叉学科研究热点问题中,判断被评审项目的新颖性、创新性,同时,还可以找到某个研究主题所涉及的不同学科领域。
  
  5.3能够准确判定交叉学科最合适的同行评议专家
  通过确定同行评议专家在核心期刊上发表论文所使用的关键词、附加关键词、主题词等反映科学论文实质内容的词汇使用频次情况,掌握同行评议专家所研究的真实科研内容及其研究的发展动态。这样,从真实的、客观的科学研究论文内容的视角出发,挖掘同行评议专家真正熟悉的学科研究领域。采用科学知识图谱方法,能够帮助科研管理者准确判定同行评议专家所擅长的研究领域和主题,还能够帮助科研管理者了解同行评议专家的真实科研情况以及科研水平,选择真正的同行专家去评议他们所熟知的科学领域内的科学研究项目,并为挑选适合交叉学科同行评议专家,及其科研方向、能力等信息提供准确的佐证资料。