570 likes | 724 Views
h 指数及其最新研究进展. 金碧辉. H 指数. 定义. J. E. Hirsch 加州大学圣迭哥大学物理系. An index to quantify an individual’s scientific research output Proc Natl Acad Sci USA, 2005, 102(46): 16569―16572. h-index. 我提出了一个能用于衡量科研人员个人科研成就的有效指标 —— h 指数。其定义为:引文数大于等于 h 的 h 篇论文数量。. H 指数. J. E. Hirsch 加州大学圣迭哥大学物理系. 定义.
E N D
h指数及其最新研究进展 金碧辉
H指数 定义 J. E. Hirsch 加州大学圣迭哥大学物理系 An index to quantify an individual’s scientific research output Proc Natl Acad Sci USA, 2005, 102(46): 16569―16572 h-index 我提出了一个能用于衡量科研人员个人科研成就的有效指标——h 指数。其定义为:引文数大于等于h的h 篇论文数量。
H指数 J. E. Hirsch 加州大学圣迭哥大学物理系 定义 一个科学家的分值为h,当且仅当在他/ 她发表的Np 篇论文中有h 篇论文每篇获得了不少于h 次的引文数,剩下的(Np - h)论文中每篇论文的引文数都小于h 次。 我认为h 指数优于其他一般用于评价研究人员科研产出的单项指标。
H指数 J. E. Hirsch 加州大学圣迭哥大学物理系 单项指标 一般用于评价研究人员科研绩效的单项指标 论文总数(Np) 优点:可以直接测度科学生产力。 缺点:不能测度论文的重要性和影响力。
H指数 J. E. Hirsch 加州大学圣迭哥大学物理系 单项指标 一般用于评价研究人员科研绩效的单项指标 引文总数(Nc,tot) 优点:可以测度论文的总体影响力。 缺点:论文的引文数不太容易找到;作者的影响力会被少数重要的合作论文夸大,这些合作论文有可能是与许多其他作者共同完成的,因此并不代表作者的实际影响力。引文总数往往不能恰当分配被引次数较高的评论性文章与原创性研究成果的权重
H指数 J. E. Hirsch 加州大学圣迭哥大学物理系 单项指标 一般用于评价研究人员科研绩效的单项指标 篇均引文数即引文总数与论文总数的比值。 优点:可以比较不同时代科学家的影响力。 缺点:数据不容易获得;容易造成奖少惩多。
H指数 J. E. Hirsch 加州大学圣迭哥大学物理系 单项指标 一般用于评价研究人员科研绩效的单项指标 重要论文的数量 通常被定义为引文数超过某一特定值y 的论文的数量,例如取y=50。 优点:提出了一个普遍性和可续久性的思路,消除了 (1)、(2)、(3)指标中的缺点。 缺点:y 值的选取是任意的,无意中就会得罪或取悦某 些人;y 值的选取需要随科学家群体资历水平的 不同进行调整。
H指数 J. E. Hirsch 加州大学圣迭哥大学物理系 单项指标 一般用于评价研究人员科研绩效的单项指标 被引前q 名论文的引文数 例如q =5 表示被引最多的前五篇论文的引文数。 优点:克服了上述指标中的很多缺点。 缺点:因为该项指标不是一项数据,因此数据的获取和 比较显得较为困难;另外,q值的选取也是任意 的,无意中会得罪或取悦某些人。
H指数 J. E. Hirsch 加州大学圣迭哥大学物理系 单项指标 一般用于评价研究人员科研绩效的单项指标 期刊影响因子(中国流行的指标) 优点:可以引导科研人员向影响力大的期刊投稿。 缺点:不能真实地反映论文的学术水平,甚至抬高了低 水平论文的水平,而降低了高水平论文的水平。
H指数 J. E. Hirsch 加州大学圣迭哥大学物理系 定义 定义 H-指数示意图 论文按被引频次降序排列后,第h篇论文被引用h次以上
H指数 J. E. Hirsch 加州大学圣迭哥大学物理系 定义 H-指数示意图 h-核 论文按被引频次降序排列后,第h篇论文被引用h次以上
H指数 J. E. Hirsch 加州大学圣迭哥大学物理系 计算 h核内引文= 46 h 指数计算 h核内引文= 25 h指数= 4
H指数 J. E. Hirsch 加州大学圣迭哥大学物理系 特点 特点 H-指数特点 在现实情况中,并非所有的论文最终对h 指数的计算都是有贡献的。那些引文数较少的论文对研究人员的h 指数始终没有任何影响,尤其是那些在h 值已经计算出来后作者后期发表的论文。
H指数 J. E. Hirsch 加州大学圣迭哥大学物理系 特点 H-指数特点 即使科学家很长时间都不再发表论文,h 指数还有可能随着时间的推移而增加。一段时间后就变成常数,因为此时h 指数中的论文数量只是一个不变的量。
H指数 J. E. Hirsch 加州大学圣迭哥大学物理系 特点 H-指数特点 h-核中的论文是动态变化的。 h-核内的论文随着被引频次的变化而出入h-核,但是,h 指数不会随着时间的变化而降低。那些在任何时间都只有h次引文数的论文将可能被具有较高被引速度的论文淘汰出局,不再对个人h 指数的计算起作用。那些最开始被排除在h 指数计算范围外的论文有可能重新对h 指数的计算做出贡献,这种情况通常发生在那些被称为“睡美人”的论文上。
H指数 J. E. Hirsch 加州大学圣迭哥大学物理系 应用 应用 物理学家h-指数与m值
H指数 J. E. Hirsch 加州大学圣迭哥大学物理系 应用 h-指数与m值 根据对许多物理学家引文记录的观察结果,可以得出以下结论: (1) m≈1 时,则经过20 年的科研活动,科学家的h指数为20,此时可以认为该科学家是一个成功的科学家。 (2) m≈ 2 时,则经过20 年的科研活动以后科学家的h 指数为40,此时可以认为该科学家是一个成绩卓越的科学家。这些科学家很可能只是那些在顶级大学或重点实验室中工作的科学家。 (3) m ≈3 或者更大时,则经过20 年或30 年的科研活动以后科学家的h 指数分别为60-90,可以认为该科学家是真正的科学精英。
H指数 J. E. Hirsch 加州大学圣迭哥大学物理系 应用 h-指数与m值 根据典型的h值和m值,作者认为(可能不很准确),对 于研究型大学的教师,h值约为12应该是晋升副教授的标 准,h值约为18应该是教授任职的标准。想要成为被美国 物理学会会员,其h值应该在15~20之间。除了非常特殊的情况,美国国家科学院院士的h值应该大于等于45
H指数 J. E. Hirsch 加州大学圣迭哥大学物理系 应用 诺贝尔奖得主的h-指数 计算结果显示,h 指数的取值范围在22~79 之间,m 的取值范围为0.47~2.19。非常有趣的是,诺贝尔获奖者普遍具有较高的h 指数 (84%的科学家的h指数至少为30)。从中可以看出,诺贝尔奖不是由于获奖者的一时幸运,而是源于获奖者重要的科学工作。
H指数 J. E. Hirsch 加州大学圣迭哥大学物理系 应用 美国科学院院士测算 生物学领域科学家的h指数通常要大于物理学领域科学家的h 指数。另外,在两个领域科学家的h指数分布中,高端h值的差异要大于整体均值的差异。显然,对不同学科领域h指数分布差异性和相似性的比较将成为今后研究的一个热点。
H指数 J. E. Hirsch 加州大学圣迭哥大学物理系 应用 GARFIELD h-指数30,h-核内论文的年代分布 2006年h-指数30 1955年264次 1972年646次 1983年208次 1980年232次
H指数 J. E. Hirsch 加州大学圣迭哥大学物理系 应用 SMALL h-核内论文的年代分布 2006年h-指数18 1973年328次 1974年248次
H指数 J. E. Hirsch 加州大学圣迭哥大学物理系 应用 h-核内论文与引文
H指数 J. E. Hirsch 加州大学圣迭哥大学物理系 应用 范围扩大 期刊h-指数 机构h-指数 图书馆文献借阅h-指数
H指数 J. E. Hirsch 加州大学圣迭哥大学物理系 优点 ● h指数是一个非常简单并且易于理解的复合指标,它可以用在任何层面的评价研究中,尤其适合对科学家个人科研成就作评估。 ● 这个指标是引文影响力和论文产出力二者相结合的测度指标。 ● h 指数是一个稳健的累积指标。单纯论文数量的增长对该指标不会产生直接的影响。 ● h 指数能够测度科学家的持久绩效,而不仅仅是测量其科学成就的峰值。 ● h 指数与其他“有意义”的文献计量学指标有显著相关性。
H指数 J. E. Hirsch 加州大学圣迭哥大学物理系 缺点 ● h 指数对于那些刚开始从事科学研究的人员而言是不利的,因为他们的论文产出和引文率相对较低。 ● 这项指标有可能造成科学家们躺在原来的成就上睡大觉,因为科学家们即使没有新的论文产生,以往的论文仍然有可能获得被引数量,进而引起h指数的增加。 ● 这项指标是基于长期的观察。因此,由于上述同样的原因有可能导致我们看不到科学家研究活力的衰退情况。
H指数 J. E. Hirsch 加州大学圣迭哥大学物理系 缺陷 ● h 指数的一个问题是即便在相同学科领域进行比较都很难找到一个适当的参考标准。 ● h 指数在微观层面上是比较适合的。但是在更高的集总水平上,会有更多不同的指标。利用多种合适的指标集而不是单一指标进行测度能够提供一幅充分反映现实情况的多维度画面。 ● 根据h指数的定义,它不能超越论文数量的界限,因此它不利于那些论文数量少而被引频次高的科学家(“小而不美”)。 ● h 指数在鉴定杰出成就时毫无疑问是有效的,但是对于评价较为优秀的研究工作并不合适。原因可以从偏斜的排序分布中寻找,这种偏斜分布的特征是有一条很长的由很多相同数值组成的尾巴。
H指数 J. E. Hirsch 加州大学圣迭哥大学物理系 局限性 缺乏灵敏度 h-指数的变化动力仅来自绩效核外部,绩效核内部的任何绩效变化对h-指数不起作用。这就形成了h-指数变化动力源的部分缺失问题,导致h-指数对绩效变化不敏感。 绩效核阈值随绩效核的增大而增大。由于h-指数阈值的这种水涨船高的特点,决定了绩效核以外的论文随着阈值的增大,所需要积累的引文也越多,因此所需要的时间也越长。换句话说,h-指数越大,h-指数上升所需要的时间也越长。
H指数 J. E. Hirsch 加州大学圣迭哥大学物理系 局限性 缺乏区分度 从h-值的分布来看,h-值越大, h值相同的几率就越小,而h-值越小,h值相同的几率就越大。
H指数 J. E. Hirsch 加州大学圣迭哥大学物理系 局限性 缺乏波动性 只能上升,不能下降。
H指数家族 g指数 g指数定义 一个科学家的分值为g,当且仅当在他/她发表的N篇论文中有g篇论文总共获得了不少于g2次的引文总数,而(g+1)篇论文总共获得了少于(g+1)2次的引文总数。
H指数 J. E. Hirsch 加州大学圣迭哥大学物理系 g指数 g指数计算 g指数考虑了论文被引频次的数量 g = 5
R指数 定义 h-核内被引频次总数的平方根 不打破h-核,对相同h-指数具有区分度
R指数 h-核内外引文频次
R指数 h-指数与R-指数 h-指数只给出了论文数量与被引频次数量相交叉的阈值,而没有对阈值内绩效核的不同强度作进一步的测定。R-指数对h-指数无力染指的h-核进行了强度的测量,解决了h-指数对绩效核内的变化缺乏灵敏度的问题。 h-指数的主要功能是根据科研人员的论文总量和被引频次总量来划定绩效核的界面或大小。h-指数上升的主要动力来自绩效核外部论文影响力的变化。 R-指数的主要功能是测度绩效核内论文影响力的变化。R-指数在不改变h-核形态的前提下,通过对绩效核内部每篇论文被引频次总量平方根的计算,可以对同值h-指数且不同强度的绩效核进行测度,其测度结果是区分同值h-指数的主要依据。
R指数 h-指数与R-指数
R指数 计算结果 GARFIELD的h-指数和R-指数
R指数 计算结果 Small 10年
R指数 双因素复合 (h,R)复合指标 标准化
R指数 双因素复合 (h,R)复合指标
R指数 10年期观测窗
R指数 10年期观测窗 (h,R)复合指标 等效 标准化
R指数 终身数据计算结果 GARFIELD的h-指数和R-指数
R指数 10年期观测窗 GARFIELD的h-指数和等效(h,R)指数
AR指数 定义 h-核内论文被引频次总数/论文出版年龄的商的平方根 对h-指数的走向具有调节作用。如果h-核内的论文不再得到新的被引频次,则AR-指数将随着时间的推移而下降
AR指数 模拟
AR指数 计算实例 A-index=被引频次/(统计年-出版年-0.5) 对A-index总和计算平方根 106.61034的平方根为10.3252 AR指数=10.3252
AR指数 计算结果 Garfield
AR指数 普赖斯奖得主的AR指数