图书情报学_用h指数对我国图书情报学界作者进行评价

  〔摘要〕介绍一种新的评价科学工作者综合影响力的方法――h指数,以国内90位图书情报学界学者的作品在8年间被引用情况为依据,分别计算出他们各自的h指数,用h指数对他们进行评价,并将结果与一些主要的传统标准进行比较,描述使用不同方法评价时出现的差别,分析产生差别的原因,指出h指数在进行著者评价时所具有的优势和局限,总结h指数的适用范围。
  〔关键词〕h指数作品总数总被引次数平均被引率图书情报学
  〔分类号〕G253
  
  Measure the Researchers of the Library and Information Science in China with H Index
  Zhang Xuemei
  International Business and Administration College of Shanghai University, Shanghai201800
  
  〔Abstract〕This paper introduces a new way to measure the scientific output of a researcher with h index. The author computes the h indices of the 90 well-known researchers of the library and information science in China based on the citations of their works, and evaluates them with h index. Then after comparing the results with some other major criteria, the authorpointes out the reasons for these difference, indicates its advantages and limitations, and gives the range of its application.
  〔Keywords〕h indextotal number of workerstotal citationsaverage cited numberlibrary and information science
  
  1 引言
  
  在决定人员的聘任、晋升以及奖金和科研经费等的归属时,往往需要对候选人进行评价和比较,科学研究领域的评价更是随处可见,于是就出现各种不同类型的评价标准。传统评价科学工作者个人影响力的指标主要有:作品(包括论文和专著)总数、总被引次数、平均被引率等,每种方法均有着独特优势,但也有其不可避免的缺陷。
  为克服这些评价标准的缺陷,Hirsch提出一种新标准,即h指数,其定义为:一位科学家的h指数为h,若他的Np篇论文中有h篇论文,其中每一篇论文的被引次数至少为h,其他(Np-h)篇论文中每一篇的被引次数都≤h[1]。Hirsch认为,两个有着相似h指数的人,即使他们的作品总数或是总被引次数相差悬殊,他们在整体科学影响力方面也是可比的。Hirsch还用h指数对物理学和生物医学领域的专家们进行分析和评价,并得到较理想的结果。h指数引起许多学者的兴趣,但我国使用这种标准来评价科学工作者的尝试还非常罕见。本文采用h指数方法,以一种全新的视角和标准,对我国图书馆学情报学领域的研究人员进行评价,并将结果同几种主要的传统评价标准之异同加以分析比较。
  
  2 数据来源
  
  本文使用中文社会科学引文索引(CSSCI)为工具,统计了我国图书情报学界的90位知名作者从1998年(CSSCI数据累积起始年)至2005年这8年间的作品(包括论文和专著)被引用情况,对由于著录时使用关键词不同或是输入错误等原因而被分散的同一作品,使用中国期刊网(镜像站)查找出原文并进行合并,累计得到各作者每一篇作品的被引用次数,最后计算出他们各自的h指数。
  
  3 数据分析
  
  从统计结果看,我国图书情报学界h指数最高的作者是邱均平,其h指数为16,也就是说,邱均平所发表的作品中,有16篇至少每篇的被引用次数不小于16。这给出对邱均平的总被引次数的最低估计:h2 = 256。当然,实际的总被引次数通常会远大于h2,这是因为h2既低估了这h篇高被引作品的实际被引次数,又忽略了那些被引次数少于h的作品的被引次数。通过检索发现,邱均平的实际总被引次数是955。其他h指数在10以上的图书馆学情报学专家有张晓林(h指数=15)、吴慰慈(h指数=14)、马费成(h指数=13)、黄宗忠(h指数=13)、吴建中(h指数=13)、胡昌平(h指数=12)、张琪玉(h指数=12)、黄俊贵(h指数=11)、蒋永福(h指数=11)、霍国庆(h指数=11)、肖希明(h指数=10)、彭斐章(h指数=10)、王世伟(h指数=10)。
  3.1h指数与总被引次数
  作者发表作品的总被引次数(Nc,tot)能够衡量其总的影响力,但缺点是难于计算出其精确值,并且可能因为一篇或几篇作品得到了特别多的引用而过分扩大这个数值,而且如果论文中有很多合著者,这个数字将不具有代表性。另外,相对于普通研究性作品来说,Nc,tot给一些被高度引用的评论性文章过高的评价。
  总被引次数Nc,tot与h指数之间的关系取决于方程
  Nc,tot=ah2
  其中a是系数。根据Hirsch在对物理学和生物医学的实际观察中得到的经验值,a界于3和5之间。从本文的统计数据中可以看出,在我国图书情报学界,当h指数≥10时,a值的情况能够很好地符合这个观察(只有霍国庆的a=2.84,也较为接近这个观察)。
  而在h指数<10的76名作者当中,只有44名的a值介于3和5之间,也就是说,有将近一半的作者,a值小于3或者大于5,例如a值最大的是徐引篪(h指数=4),她的a值相对较大,为16.29,这是因为她的一部专著《现代图书馆学理论》的被引用数高达169次,占到了其总被引次数228次的70%以上,而其它作品的被引用次数除了两篇分别为30和12之外,都在10以内,所以导致总被引数与h2之比很大。另一个a值较大的作者是谢灼华(h指数=3),他的a值为12.67,这是由于他的一部专著《中国图书和图书馆史》的被引用次数为55,约占其总被引次数114次的一半,而其他作品的被引次数除了两篇分别为10和9之外,都在3次以内,结果导致a值较大。通过分析发现a值较大的情况一般都是由于作者的某一篇或几篇作品得到了比大多数其他作品非常高的引用而导致的。这种情况也证实了h指数在评价作者的科学影响力方面比总被引次数更优越的特点,后者通常会由于作者的某一篇或几篇作品得到了比大多数作品非常高的引用而给予其过高的评价,而这对于那些虽然总被引次数比他们少,但是其作品总体被引情况更稳定的作者来说是非常不公平的,h指数克服了这种不公平的缺点。
  从统计数据看,h指数越大,相应的a值越满足属于(3,5)区间,反之,h指数越小,a值变化的范围也越大,越不稳定。说明h指数高的作者的作品总体被引情况比h指数低的作者的被引情况更稳定。
  h指数在10以上的各值相对应的作者数开始减少,说明在总体上作者还是存在高作品数低被引的特点。这种情况也在一定程度上表明,当h指数比较高(如在本领域为10以上),则这些作者的科学产出质量都比较稳定,他们的h指数与总被引次数之间有着较为稳定的关系;而当h指数较小时,作者可能正处在本人学术研究过程中的上升期,还没有达到稳定的程度,所以h指数与总被引次数的关系动荡较大。
  a值较小的情况通常是作者所发表的作品比较少(当然其 指数也较小);或是作者发表的作品中得到h次以上引用的作品占作品总量的比例较大,当然后者是我们所期望见到的。
  表1中第6列的排名变化情况表示从以总被引次数排名到以h指数排名名次的变化情况,负数表示名次下降。从表1中看出,下降最大的是6名,上升高最多的为5名。前十名在两种指标下名次都没有变化或变化很小,表明这些学者的学术影响力能够经受这两种不同评价指标的测度。
  
  从表2的第1、2、3列中数据可看出,h指数=1的作者最低被引数只有3,最高为7;而h指数=5时,最低被引数就达到了58,最高被引数达到214,都超过了前者的10倍以上; 指数超过10的总被引数,总体上也呈上升趋势,且上升的速度远远超过h2增加的速度。
  
  3.2h指数与作品总数
  作品总数(Np)能够衡量一名作者的科学产出能力,但却不能评价这些科学产品的质量。从理论上来说,一名作者的h指数为h,他最少只需发表h篇作品。但实际上这种情况几乎是不可能出现的,这是因为在一名作者的h篇作品中的每一篇都同时能得到恰好h次引用的情况是不大会出现的,特别是当h指数较高时。而且由于h指数是一个动态变化的指数,作者最近发表的文章由于其被引用情况还没有达到某个值,所以可能不会对目前的h指数有所贡献。实际上,只有当h很小,例如1或2时,才可能出现作品数与h相等。
  从表2中第1、4、5列的数据中看出,随着h指数的增加,作者发表的作品总数(由于数据主要来源于CSSCI,所以这里的作品只包含至少得到过一次引用的作品)在总体上是呈现出上升趋势的,但作品总数多,并不一定h指数就大。当h指数=1时,作品总数最小的只有2篇,当h指数=5时,作品总数最少的已经是15篇了,而最多的达到了105篇;当h指数=10时,作品总数在70左右。作品总数的增加远远超过了h指数增加的速度。当以作品总数为依据来评价作者时得到高分的作者,在用h指数来评价时,可能只会得到较低的分数。
  h指数与作品总数并不存在着严格的正比关系,即作品数目大,相应的h指数不一定就高,这也表明了h指数在进行评价时的严格性:只有作品数和得到较高被引用数的作品都较高时,才能得到较高的h指数。这是h指数对作品质和量都有高要求的体现。从表中还发现,当h指数超过10以后,作品总数的最大值和最小值比较接近,这一方面是由于h指数超过10的作者人数相对较少;另一方面也证实了Hirsch的“具有相似h指数的作者之间具有可比性”的这一论断。
  从表3中的排名情况看,以作品总数为标准的名次在以 指数为标准排名的次序中,名次上升最多的是8名,下降最多的是13名,变动比较大,这是因为作品总数只考虑作品的数量而不考虑其质量,而h指数两方面都考虑造成的。
  
  3.3h指数与平均被引率
  平均被引率是总被引次数(Nc, tot)和作品总数(Np)的比值,由于削弱了作品总数的影响,使得能够在不同科学年龄的学者之间进行评价,但是它的缺陷也明显,最严重的就是它极可能会奖励低产作者而惩罚高产作者。而h指数则可以克服这个缺陷:如果作品总数很少,即使某一篇或几篇的被引率很高,h指数也不可能会高;如果作品总数很多,只要其中被引次数达到某个值的作品足够多,h指数就会相应较高,而不会像平均被引率那样,作品总数很多可能会导致平均被引率受那些被引次数较小的作品影响而变得很小。
  从表2中的第1、6、7列中的数据看出,h指数相同,平均被引率却可能相差悬殊。一些平均被引率很高的作者和一些平均被引率比自己低的作者,当以h指数进行评价时,可能只会得到相同甚至更低的分数。要想提高自己的h指数,除了需要保证作品的质量之外 ,还需要在数量上达到一定数目。 指数正是通过这一点来克服平均被引率有时会奖励低产作者而惩罚高产作者的缺点的。
  表4是以两种标准进行排名的结果,名次上升最多的是7名,下降最多的是15名。
  
  4 结语
  
  本文使用一种新的评价标准――h指数,对我国图书情报学界的部分作者进行了一项关于个人科学影响力的评价,并且得到了理想的效果。这种评价标准克服了一些传统标准的缺点,更加严格、客观、公平、简单,因此,很有希望能在更大范围内,更多学科中得到应用。
  h指数与总被引次数不同的一个特点是:一位作者的任何一篇作品只要被引用过,都会对总被引次数有贡献,而只有那些被引次数超过h的作品,才会对这位作者的h指数有贡献。也就是说,一篇作品从发表到对h指数产生贡献,要有一个时间差,并且这个时间差往往会比这篇作品从发表到对作者总被引次数产生贡献的时间差更长。有些甚至是大量的被引次数较低的作品永远也不会对h指数产生贡献。这也是h指数在评价作者时严格性的表现之一。
  由于这种特点,产生的一种后果是:此学科内年龄较长或是涉足此学科领域年代较长的作者,比那些年龄较轻或是涉足此学科领域年代较短的作者更容易得到更高的h指数。从统计结果中可以看到,h指数最高的前10名作者,都是图书情报学界的专家元老级人物,年龄大多在50-60岁以上,在本学科中已工作几十年。而年龄在40岁左右的中青年学者,h指数最高的是蒋永福(h指数=11)和霍国庆(h指数=11)。这种情况一方面说明那些年纪较长的专家的学术水平相当高;另一方面也反射出在领域中“马太效应”非常严重:那些年青有才华的学者可能由于名气、资历等方面的欠缺,而影响到其作品的被引用和受重视的程度。
  至于h指数用于度量一个团队科学产出的情况,由于图书情报学科本身的特殊性,本学科中团队不是很多,即使有,在作品中也多是导师和其研究生,而研究生的被引用数绝大多数都非常低,h指数几乎都为0或1,所以本文暂且对此情况不做讨论。
  通过使用h指数对图书情报学界学者进行的分析研究,笔者发现,h指数有着自己适用的范围,即主要适用于对学术研究级别较高的研究人员之间的评价;当用于评价那些科学年龄较青,作品被引用情况相对较低的研究人员,则需要辅之以其他评价指标(如总被引次数、发表作品总数,等等),方能得到理想的结果。
  参考文献:
  [1]Horsch J. An index to quantify an individual? scientifie research output.[2006-10-17].http://www.省略/cgi/doi/10.1073/pnas.0507655102.