基于PageRank算法的期刊影响力研究
马 凤
【摘 要】摘 要 在分析传统期刊影响力评价指标缺陷的基础上,引入一种新的期刊影响力评价指标——基于PageRank算法的期刊影响力权值。首先详细阐述其思想、计算过程和影响因素等,然后以国外图书情报类期刊为例,计算图书情报领域期刊的影响力权值,分析这些期刊的学术影响力,并将其与期刊影响因子、期刊自引率、总被引次数等指标进行对比分析。 【期刊名称】情报杂志 【年(卷),期】2014(000)012 【总页数】6
【关键词】关键词 PageRank算法 期刊影响力 图书情报学 期刊评价
0 引 言
在以往的期刊评价中,测度期刊影响力的文献计量指标主要有:载文量、下载量、总被引次数、被引率、自引率、他引率、平均被引次数、影响因子、即时指数、引用半衰期等。其中,总被引次数和影响因子是最普遍使用的衡量期刊影响力的两种指标。对期刊评价感兴趣的研究者大致可以分为两个阵营。一个阵营认为期刊影响因子用来评价期刊影响力是合适的,他们分析其他文献计量指标与期刊影响因子的关系,探讨期刊影响因子的影响因素,提出一些提高期刊影响力的措施。如W. Yue等 [1] 分析得出即时指数和期刊影响因子具有高度相关性。Leydesdorff(2009)[2]选取了Scopus和Google的数据进行分析,认为影响因子、即年指标和h指数之间具有高度相关性。Bollen等[3]认为总被引次数、即年指标、影响因子、h指数等指标之间均具有显著相关性。李建辉
等[4]以中国科技论文统计源数据库收录的70种中华医学会系列期刊为样本,分析自引对期刊影响因子的影响。于挨福和马虎兆[5]利用期刊的相关引证指标,以9种科学学领域期刊建立固定效应变截距函数模型,对科学、科学研究类期刊影响因子及其影响因素进行分析。俞立平等[6]利用分位数回归模型,分析平均引文数、平均作者数、地区分布数、海外论文比、基金论文比、期刊时效性对期刊影响因子的影响。黄贺方等[7]选取常用的15个定量的期刊评价指标,以图情领域的40种期刊为例,详细分析了这些指标之间的相关性。安梅[8]以WOS中的工程技术综合类期刊群中的高影响因子期刊为例研究论文数、特征因子与综合影响因子之间的关系,等等。
另一阵营的学者关注期刊影响子的测度方法,他们对影响因子衡量期刊影响力的作用提出质疑,分析期刊影响因子的缺陷,有的提出一些新的或者改进指标等。如M. Amin & M. Mabe[9] 分析了影响因子的影响因素,以及影响因子用于评价期刊的适用范围和局限性。Andrew P. Kurmis [10] 分析了期刊影响因子的局限性,提出期刊影响因子不适合用来评价期刊质量或者个体研究人员,也不适合用于评价跨学科期刊。D.Colquhoun [11]认为期刊影响因子指标的设计存在很大缺陷,他认为用期刊影响因子并不能够反映实际的期刊质量。J.J. Ramsden [12] 认为期刊中单篇文献的被引次数的分布是很广泛,因此被引次数的均值几乎没有意义。任胜利等[13]通过分析ISI数据库中科技期刊和论文的被引情况,认为期刊影响因子受时间、研究领域、SCI源期刊及参考统计的引文条目等因素的制约。王文兵等[14]以1999~2007年SCI和SSCI各学科影响因子排名前50的735种期刊为例,发现被引次数 、是否英文与期刊影响因子正相关,而载文量、自引次数、自引比例、半衰期与之负相关,且不同学科
的期刊影响因子差异很大。王金玲和张燕蕾[15]介绍了三种新的期刊影响力评价指标:特征因子、SJR(SCImago Journal & Country Rank)、论文-计数影响因子(Article- count impact factor)。许海云等[16]提出了基于特征响亮中心度加权的期刊影响因子。
现有期刊影响力的评价指标的衡量作用、适用范围、评价意义等方面受到质疑的原因主要来自于其前提假设、计算方法和影响因素等方面。上述的以往的期刊影响力评价指标均基于传统的引文分析。而传统的引文分析仅以引用次数的多少来衡量影响力,忽略了不同引文带来的差异。被引次数是一种粗略的衡量期刊(文献)被利用程度、重要程度和影响力大小的指标。通常认为一种期刊(一篇文献)的被引次数越多,该期刊(该篇文献)被利用得越多、影响力越大。但是实际上单纯的被引次数多少并不能反映一种期刊(一篇文献)的利用程度和影响力大小,因为仅采用被引次数时,是孤立地看待每一篇文献的被引情况,忽略了一个学科领域的文献因为各种关系,彼此是互相关联的。一个学科的期刊、文献和作者形成的是一个整体,引用和被引都是发生在这个整体内的,互相交叉,相互影响,单纯分析被引次数作为重要程度和影响力大小忽略了整体的作用和相互之间的作用。例如,文献A被引用了10次,文献B被引了8次,通常的做法即认为文献A比文献B重要、影响力更大,但是这并不一定符合实际,因为一篇文献如果被知名作者或者重要文献引用与被普通作者或文献引用有所不同。而且当一篇文献引用的文献数量较多时,其中的某一篇文献对于引用文献来讲,贡献率和作用可能并不相等。对于期刊而言,其重要性和影响力的影响因素更多,而影响因子仅考虑期刊论文在一定年份内的平均被引次数。期刊论文平均被引次数多并不一定说明该期刊的影响力大或者在世界中位置重要,