期刊论文发表修改实证数据_单篇期刊论文h指数的实证研究

　　摘要　综述单篇论著学术质量评价的研究现状，并对其中由Schubert于2009年提出的单篇论著h指数方法进行实证研究。以图书情报学为例，首先基于2000－2005年的CSSCI数据计算出2000-2005年每年的图书情报学单篇论文的被引次数和h指数值，对两者之间的关系进行对比分析，并对论文被引次数相对较高、h指数相对较低的原因进行分析。
　　关键词　学术质量　学术评价　引文分析　h指数　CSSCI
　　分类号　G350
　　
　　1　引言
　　
　　单篇论著的质量评价是科研管理中的一个重点和难点。评价方法目前主要有两类：一类是同行评议，属于定性分析方法，被评价论著的公开发表时间与评价时间跨度通常较小，评价结果具有一定的主观性，有时缺乏公正性；另一类是文献计量法，属于定量分析方法，通常被评价论著的公开发表时间与评价时间跨度较大，评价结果相对客观，但是其指标选取、权重赋值、评价结果等方面的争论较多。两类评价方法各有优势与不足，通常需要根据实际情况合理选用。
　　在对单篇论著的学术质量进行评价时，人们常常使用发文期刊的影响因子、论著的被引次数、论著的他引次数等文献计量学指标。例如，2005年，郭丽芳基于期刊影响因子、论文总被引次数和论文他引次数三项指标给出了一个评价单篇论文学术质量的计算公式，单篇论文的学术质量值为各个文献计量学指标的权重及对应数值的乘积之和。2007年，龙莎等人给出了一个包含发表论文的期刊水平、论文基金资助情况、论文被引用情况、论文获奖情况、论文被收录情况等5项一级指标和19项二级指标的指标体系用于评价科技论文学术水平。同年，邱均平教授提出了论文质量指数(Paper Quality Index，PQI)这一概念，其数学表达式为：
　　
　　其中，IFij表示刊登i论文期刊在j年的影响因子；IF表示i论文所在期刊所归属学科的所有期刊j年的平均影响因子；TCij表示i论文在j年的被引次数，TC表示i论文所在期刊所归属学科的所有论文在j年的平均被引次数。
　　上述评价方法或多或少存在一些先天性的局限，例如：①论文他引次数的多寡体现了论文的研究深度，但是在人文社会科学领域存在引文数据著录不规范现象，论文他引数据缺失现象比较严重；②发表论文的期刊水平反映的是期刊论文的整体水平，通常发表在高质量期刊上的高质量论文相对较多，但是高质量期刊也载有不少低质量论文，使用发表论文的期刊水平评价单篇论文的学术质量时评价结果可能会出现较大的偏差；③总被引次数在一定程度上反映了论著的学术影响力，但是人们一般认为总被引次数中包含的自引次数数据易受作者或期刊编辑的主观操纵。2007年，吴勤提出引证强度概念，在评价论文学术质量时不仅考虑了论文被他引次数在该论文质量量化中的正面效应，而且考虑了“故意自引”有可能带来的引证强度放大的负面影响。但是，自引量与论文学术水平呈现一定的正相关性，这表明，评价论文学术质量时简单剔除自引数据显得不太合理。
　　
　　2009年，匈牙利学者A.Schubert将Hitch h指数用于定量评估单篇论著的质量，该方法被其他学者称为Schubert h指数(以下简称h指数)法。其计算方法为：如果引用论著P的所有论著中有n篇论著每篇至少被引用了n次，那么论著P的h指数就是n。与前几种方法相比，h指数的优势表现在以下4个方面：①h指数的定义综合考虑了单篇论著的被引用次数以及所有引用该论著的其他论著的被引用次数两项指标，因而既能体现单篇论著的直接影响，也能反映单篇论著的间接影响；②计算方法简单，基于引文数据库时可以比较方便地计算出每篇期刊论文的h指数；③计算不依赖发文期刊的影响因子、论文的他引次数等文献计量学指标；④h指数与论文被引次数之间具有幂律(Power law)关系。但是，Schube指出，单篇论著的h指数只适用于评价高被引论文的学术质量。
　　本文将引入h指数方法对我国人文社会科学领域的期刊论文进行评价，并对计算结果进行深入分析，以考察该方法是否适用于我国人文社会科学期刊论文的学术质量评价。本文以图书情报学为例，使用2000－2005年的CSSCI数据分析计算出2000－2005年每年的图书情报学单篇论文的被引次数以及h指数值，对两者进行了对比，并对被引次数相对较高、h指数相对较低的论文进行了分析，从中概括出导致这种现象的原因。
　　
　　2　图书情报学期刊论文的h指数分析
　　
　　由于论著的被引次数随时间(年数)单调递增，因此，每篇论著的h指数随时间单调递增。本文以2000－2005年的CSSCI数据为基础，分别计算出图书情报学2000-2005每年的期刊论文的h指数，并对计算结果进行分类汇总，如图1－6所示：
　　?h≤2的论文数量在发文总量中占绝大多数。这说明图书情报学领域内大多数期刊论文的间接影响力比较弱。
　　
　　?随着时间窗口的不断缩小，h≤2的论文在发文总量中所占的比例不断增加。这表明，只有当时间窗口足够大时，使用h指数方法才能有效地从期刊论文中筛选出直接影响力与间接影响力均比较大的论文。由于人文社会科学期刊论文的引文峰值区域一般较长，可能会延至第三年、第四年或更久，因此，h指数方法不能有效评价近期发表的人文社会科学期刊论文的学术质量。
　　?论文篇数随h值的增加迅速降低。以2000年度图书情报学期刊论文的h指数(基于2000-2005年数据)为例，可以使用指数函数(公式1)近似描述两者之间的关系：
　　论文篇数=3801e-0.8786　(1)
　　这表明，图书情报学领域内只有极少数期刊论文具有较强的间接影响力。
　　?h值分布过于集中。以2000年度图书情报学期刊论文的h指数为例(基于2000－2005年CSSCI数据)，h指数的分布区间为[0，10]。然而h值的微弱差异不能有效区分论文的学术质量。这表明，在使用h指数评价单篇论文的学术质量时应该参考其他指标，避免评价的片面性。
　　下面验证图书情报学期刊论文的被引次数与h指数之间是否具有某种线性关系或者幂律。首先求出发表于2000年度的所有图书情报学期刊论文的被引次数与h指数，然后从中筛选出被引次数大于等于20的期刊论文，并将它们的被引次数与h指数进行对比，如表1所示：
　　由表1数据可以看出，在图书情报学领域：①高被引期刊论文的h指数明显小于它的被引次数。这表明，h指数适用于高被引期刊论文的学术质量评价，低被引期刊论文的h指数由于过低而不易区分；②相对于被引次数，高被引期刊论文的h指数值分布过于集中。表1中28篇论文的被引次数分布区间为[20，87]，而h指数的分布区间为
　　 [3，10]；③期刊论文的被引次数与h指数之间呈现一定的正相关性，即被引次数较高的期刊论文通常具有较高的h指数，但是期刊论文的被引次数与h指数之间没有表现出明显的线性关系或幂律。表1中28篇论文的h指数在6附近波动。
　　有些期刊论文具有较高的被引次数，但是h指数却偏低，见表2。
　　通过查阅表2所列论文，发现：①大部分论文的作者来自图书馆，论文内容大多实践性强、理论性弱，论文选题往往不能作为长期的研究对象；②部分论文较早涉及一些研究热点，如数字图书馆、资源描述框架、XML，但是内容大多属于概念引入，自身创新不足；③部分论文讨论信息技术，但是图书情报学领域研究信息技术的人员相对较少且对信息技术的认知不够透彻，引用这些论文的论文往往缺乏深度，等等。
　　上述各种原因导致表2中所列论文获得较高的被引次数，引用它们的论文却很少被其他论文引用，因而尽管它们的被引次数较高，h指数却很低。当然，有些论文直接影响力高、间接影响力低，原因是多方面的，不同学科、不同论文存在差异，有待进一步研究。
　　
　　3　Schubert h指数的性能评价
　　
　　h指数是评价单篇论著学术质量的一种方式，它既能体现论著的直接影响，又能体现论文的间接影响。利用它评价高被引论文的学术质量，可以有效消除研究热点对学术质量判断的不良影响以及作者或研究团体故意自引对学术质量判断的不良影响，可以有效筛选出一批高质量的期刊论文。但是，为了防止评价结果的片面性，在使用h指数时应参考其他指标。
　　单篇论著h指数也可用于对学界比较有影响的学者的科研绩效进行评价，而且简单有效。步骤是：①计算学者每篇论著的h指数；②利用学者每篇论著的h指数度量学者的间接学术影响力：如果所有论著中至少有n篇论著的h指数大于等于n，那么该学者的间接影响力指数为n。显然，该方法适用于评价在学界具有较高学术影响力的学者，不能有效区分一般学者的学术能力。
　　
　　4　结论
　　
　　研究表明：①人文社科领域内大多数期刊论文的间接影响力比较弱，对应的h指数较低；②由于人文社会科学期刊论文的引文峰值区域一般较长，可能会延至第三年、第四年或更久，因此，h指数方法不能有效评价近期发表的人文社会科学期刊论文的学术质量；③h值分布过于集中，在使用h指数评价单篇论文的学术质量时应该参考其他指标，避免评价的片面性；④期刊论文的被引次数与h指数之间呈现一定的正相关性，即被引次数较高的期刊论文通常具有较高的h指数，但是期刊论文的被引次数与h指数之间没有表现出明显的线性关系或幂律；⑤多种原因导致部分论文被引次数较高，h指数却很低。