知识图谱可视化_基于可视化知识图谱的合著网络研究

  [摘要]以《图书情报工作》为例,运用可视化技术,绘制并分析该刊2000―2009年发表学术论文的作者合著网络、机构合著网络及区域合著网络的知识图谱,认为该刊已拥有一定数量和规模的核心作者团队,形成一个以中国科学院、北京大学和武汉大学为核心的庞大机构合著网络体系,北京在区域合著网络中处于核心地位。最后总结该刊在合著网络方面的优势与不足之处。
  [关键词]合著网络 《图书情报工作》 知识图谱 可视化
  [分类号]G350
  
  1 引言
  
  随着大科学时代的来临,科学技术不断发展,学科交叉渗透程度日益扩大,使得科研人员很难单独完成某项课题或论文。通过分工和协作,在一定程度上可以提高科研水平和效率,因此,合作研究已越来越成为学术研究的发展趋势……科研人员开展合作研究,并以合著的方式发表学术论文是体现学术合作的一种重要形式。近若干年以来,随着一些跨地域、跨行业的大型科研项目申报和研究以及各种学术会议和学术报告的举办,为科研人员之间提供了更大的合作空间和更多的合作机会。通过文献计量学研究合著网络,可以有效地反映地域之间、学科领域之间、科研人员之间的相互联系与区别,从而可以对一个国家或地区内的组织机构或个人科研能力和水平等方面进行评价。本文试图通过基于可视化知识图谱的合著网络进行研究,分析和评价某种刊物的作者、地区和机构的合著水平和能力。
  以期刊为研究对象的合著网络研究,国内学者已进行了一定的探索。李亮和朱庆华选择了《情报学报》的合著作者为对象,对国内情报学领域的合著网络进行了实证研究;通过实证研究,评价了学者在合著网络中的地位,发现了合著网络中联系紧密的团体,指出了合著网络中核心作者的数量和所属机构。孟微和庞景安以《情报理论与实践》合著网络为例,系统地阐述了网络的建立、网络图的绘制以及导出过程,在此基础上对其中有代表性的子网络进行了具体的分析,说明了期刊的合著情况,并通过这一具有代表性的期刊反映出情报学学科整体的科研合作情况。
  上述文献在一定程度上论述了研究某期刊合著网络的技术和方法,但仅止步于对该刊作者本身合著现象的研究,而对作者所在机构、所在地区的合著网络研究较少涉及。本文将在该方面进行一定的探讨,选用的研究对象为《图书情报工作》,主要有以下几方面的考虑:①以该刊作为研究对象的合著网络研究学术成果稀少;②该刊的载文来源地区所占比例较为均衡,更容易反映地区合著情况;③该刊每年面向作者的课题申报和学术会议等活动为合著创造了一定的条件;④数据易获取,该刊所有的学术论文题录数据均可以从CNKI中国学术期刊全文数据库中下载,而且字段比较全面;⑤该刊著录规范,从创刊至今坚持著录作者的出生年月、工作单位等内容,便于核对同姓同名作者的身份。
  
  2 数据的获取与筛选
  
  本文选取的数据是2000―2009年《图书情报工作》发表的所有学术论文(包括增刊),经过筛选,去掉了通知、介绍、文摘、公告、编者的话等若干非学术性文章,共获得有效论文4 791篇。对这4 791篇论文的作者、所属单位、所属地区等信息进行全面的核查和分析,核对同姓同名作者的身份,在不同身份的姓名后加“1”、“2”等后缀加以区分;统一同一单位的不同名称,包括有些单位的改名、合并等;分析出各作者单位所在的省份、国家或地区等信息,同一作者如有两个及以上单位的,则一律取其第一单位。
  本文的研究内容包括作者的合著网络、作者机构的合著网络及作者机构所在区域的合著网络三方面,通过一些自编的应用小程序及社会网络分析软件Pajek完成对该三种合著网络知识图谱的绘制。
  
  3 研究结果
  
  3.1 作者合著网络
  《图书情报工作》2000~2009各年的文章篇数、合著篇数及合著率如表1所示:
  由表1可以看出,各年的合著率基本上是呈逐年上升的趋势(2002年合著率比较突出,其原因有待进一步研究),2009年的合著率几乎是2000年的两倍,达到51.5%。根据钟旭等人的文献计量研究,1997年的图书馆学和情报学的合著率分别为17.6%和23.4%,同时用模型预测了2000年两学科的合著率分别为24.1%和48.7%;杨彩霞的研究表明,1994―2003年情报学的平均合著率为37.21%。研究表明,情报学的合著率要比图书馆学高。根据《图书情报工作》10年来的平均合著率,在一定程度上可以发现,该刊学科性质是相对偏向于情报学的。经统计,所有4791篇学术论文共有作者4738位,合作度(篇均作者数)约为1,低于1994―2003年情报学的合作度1.51。
  在表1中,所有合著的1973篇学术论文中,共有3259位作者,本文选取了其中发表论文在3篇及以上的作者346位,合著次数≥2,绘制出了作者合著网络图,如图1所示:
  
  在图1中,顶点大小表示发表论文数量的多少,连线粗细表示合著次数的多少,与某作者连线越多,达到一定值时,该作者即为某团队中的核心作者。这样,就可以非常直观地发现,图巾有连线的约160位作者的合著次数均在2次及以上,其中6人及以上形成的合作团队有5个,如表2所示:
  如果把《图书情报工作》的刊稿栏目与表2中所列的团队研究领域进行比较,可以发现两者非常接近。因此,可以说近10年来《图书情报工作》已形成了一支在“知识管理”、“竞争情报”、“文献计量”及“电子商务”等研究领域相对稳定的合著队伍。同时,对图1中的合作团队分析,笔者发现:多数团队都是比较开放的(图形呈放射状而非环状),其发展前景是巨大的;另外,还应重视6位以下作者组成的一些团队,如刘则渊、陈维军、张新民等所在的团队,他们是《图书情报工作》作者合著网络中的后起之秀,在科学计量学、竞争情报及情报检索技术等方面有一定的合著研究。
  
  
  3.2 机构合著网络
  作者合著网络反映的是个体之间的学术合作,但作者往往会随着时间的推移而去不同的单位任职,其学术成果也是有阶段性的。机构合著网络能直观地反映出单位之间的合著关系,而不受到作者工作单位变迁的影响(机构合著网络研究的是作者发表论文时的署名单位)。为了便于统计,本文把作者所在单位统一列入一级机构,如中国科学院文献情报中心、中国科学院理化技术研究所等统一列入“中国科学院”。同时,为了便于图谱的显示,对机构名称进行了人为缩写,以尽可能短的词来表示。所有4791篇学术论文共有作者机构(一级机构)983个,发表论文最多的25个机构如表3所示:
  经统计,所有论文中,共有468家合著机构。发表论文在2篇及以上、合著次数≥2的机构合著网络知识图谱,如图2所示:
  
  在图2中可以发现,《图书情报工作》10年来已形 成了一个以中国科学院、北京大学和武汉大学为核心机构,以中山大学和华中师范大学等为分中心机构的庞大机构合著网络,各个核心机构之间又互有合著,而且其合著次数均在4次及以上。另外,从机构的性质上看,除中国科学院、中国科学技术信息研究所等专业机构外,其余大多为高校机构,高校图书馆的研究力量不容小觑,但从具体的合著论文看,高校图情院系及相关研究机构的合著力量更加强大。
  
  
  
  更进一步,可以把三家核心机构的合著网络单独提取出来(见图3、图4、图5)。从图3、图4、图5中可以发现:与中国科学院合著的机构遍及全国各地,其合著范围是最广的,因为中国科学院文献情报中心作为国家最高级别的专业图书馆,其在图情领域的研究力量是公认的,而作为《图书情报工作》研究会的会长单位,其成员也可能会更倾向于向该刊投稿;相对来说,武汉大学的合著伙伴大部分限于湖广地区,有明显的地域性;而合著机构在3家及以上的论文,北京大学明显要比中国科学院和武汉大学多,已形成了两个颇具规模的子网络(见图4)。
  
  3.3 区域合著网络
  我国有34个行政区(23个省、5个自治区、4个直辖市、2个特别行政区),幅员辽阔,科技的发展极不平衡,主要原因在于某些省区科学研究经费投入不足,难以形成一支稳定的科技队伍,在科学产出上成果(沧文)就表现为数量较少、质量不高。因此,跨省区合作,甚至寻求海外的学术合作成为科技欠发达地区科学研究的重要组成部分。本文把《图书情报工作》lO年来发表的学术论文按作者署名所在省区分类,国外的直接按国家或地区名称划分。《图书情报工作》各省区的发文量排名与梁立明等人的研究结果非常接近,这在一定程度上表明了图书情报学科领域各省区科研的产出能力。各区域发表论文数量(以第一作者单位所在地区统计),如表4所示:
  图6包含了各区域的所有合著关系,为了更直观地表现出区域之间的合著关系,图谱把每个区域的结点大致按中国地图的行政区划放置。北京的第一作者发文量遥遥领先,国内几乎所有的省区都与北京有着或多或少的合著关系,合著次数在6次及以上的有四川、上海、广东、湖北、江苏、吉林、浙江、天津、山东9个省区;北京与美国、韩国、新加坡、瑞典等国家也有着国际合著关系。这与北京作为中国的科技和文化中心是相适应的,基本印证了梁立明等人提出的跨省区科学合作中的马太效应。但是梁立明等人提出的另一个结论,即认为省区间的合作强度随省区间直线距离的增大而降低,在这里不能明显地表现出来,如四川与重庆之间、湖南与湖北之间、浙江与上海之间的合著关系都不是很密切。
  
  除北京外,广东、湖北、上海、浙江、江苏、吉林和天津等省区也与其他多个省区有着合著关系,这与该些省区内高等院校图书情报学专业及相关研究机构的发展不无关系。值得指出的是,湖北省与北京、广东、江苏、浙江的合著关系较为密切,表现出了较强的与外省区合著的势头。在国际合著方面,北京、上海、湖北和广东都有一定的合著关系,但由于海外论文刊发总量不多,这种合著关系仅是凤毛麟角。
  
  4 结论
  
  合著网络中的核心结点反映了所对应的个体在实际网络中所处的地位以及影响力。因此,对某种期刊的合著网络中的核心结点分析可以了解该刊某个作者、某个机构或某个地区的影响力,同时可以找出合著网络的优势和不足,为今后改进其合著关系提供借鉴。通过对《图书情报工作》近10年的合著网络分析,笔者可以大致得出以下结论:
  
  4.1 优势
  在作者合著网络中,来自中国科学院的作者组成的两个核心团队具有较大的影响力,但相对来说以孙坦等作者组成的团队比较开放,具有相当大的发展潜力;分别由邱均平、毕强、谢新洲等核心作者组成的三个团队虽然在作者人数上不及中国科学院的两个团队,但其作者都是来自不同的机构,有更多的合著机会,他们的发展潜力是巨大的。
  在机构合著网络中,《图书情报工作》已形成了一个庞大的网络体系,呈现出“三主两副”型结构,合著次数在2次及以上的机构大部分都被纳入到了这个网络体系中,而中国科学院、北京大学和武汉大学在这个网络体系中扮演着核心与桥梁的作用(两副为“中山大学”与“华中师大”)。而且,从另一方面来说,《图书情报工作》的机构合著网络恰恰印证了当前我国图书情报研究领域的格局,是国内图书情报研究领域的三面旗帜,不管是在图情专业人才的培养机制及长效性方面,还是国家级重大科研项目的攻关上,都引领着国内图书情报领域研究的发展方向。
  在区域合著网络中,湖北、广东、江苏、上海、浙江等多个省区成为除北京以外被其他地区争相寻求合作的对象,表现出了较强的合著势头。这些地区与机构合著网络中的主要节点是对应的,如湖北省的武汉大学和华中师范大学、广东省的中山大学等,是“三主两副”型结构中的“副中心”(武汉大学是“主中心”),他们也是国内图情领域研究机构中的佼佼者。
  另外,从合著论文的主题分布看,《图书情报工作》刊稿的栏目设置和每年的课题申报对合著论文的主题具有导向性,可以引导相关研究人员对当前热点领域进行合作研究,而且,从以上的分析看,它也正在对国内图情研究领域的格局起着一定的引导作用。
  
  4.2 不足与建议
  在作者合著网络中核心团队总的数量不多,4人及以上组成的团队仅8个,人数仅占所有合著作者的15%,而且,各团队相互之间的合著关系甚少。各地区的科研发展水平极不平衡,马太效应表现明显――各地区都争着和科研能力最强的北京合作。《图书情报工作》应更多注重培育科技欠发达地区的产出成果,特别是这些地区与其他地区的合著成果,同时在杂志社科研申请和学术会议投稿等方面能适当向这些地区倾斜,为推动欠发达地区的科学研究水平做出贡献。