340 likes | 513 Views
《 中国医疗机构科技文献统计报告( 2008 版) 》 的研制. 张林林 中国学术期刊(光盘版)电子杂志社 电话: 62977792 , 62969002-6145 Email : zll@cnki.net. 《 中国医疗机构科技文献统计报告( 2008 版) 》 编制单位. 中国医院协会医院情报图书管理专业委员会 中国学术期刊(光盘版)电子杂志社 中国科学文献计量评价研究中心. 《 中国医疗机构科技文献统计报告( 2008 版) 》 研制特点. 1. 海量统计源 2. 跨库被引统计 3. 规范化的加工方法 4. 多医疗机构参与评价 5. 多作者原则
E N D
《中国医疗机构科技文献统计报告(2008版)》的研制 张林林 中国学术期刊(光盘版)电子杂志社 电话:62977792,62969002-6145 Email:zll@cnki.net
《中国医疗机构科技文献统计报告(2008版)》编制单位《中国医疗机构科技文献统计报告(2008版)》编制单位 • 中国医院协会医院情报图书管理专业委员会 • 中国学术期刊(光盘版)电子杂志社 • 中国科学文献计量评价研究中心
《中国医疗机构科技文献统计报告(2008版)》研制特点《中国医疗机构科技文献统计报告(2008版)》研制特点 • 1.海量统计源 • 2.跨库被引统计 • 3.规范化的加工方法 • 4.多医疗机构参与评价 • 5.多作者原则 • 6.多指标评价原则 • 7.H指数
特点1:海量统计源 • 以CNKI2001-2007年‘中国期刊全文数据库》’和‘中国学术期刊综合引证数据库’为发文统计源,共涉及到8600多种期刊 • 收录数据1400万条,由于此报告跨年度较长,我们在此次加工时将某些部分年有缺刊的期刊进行了补录,充分保证了重要期刊的收全率。
特点2:跨库被引统计 • 《中国引文数据库》于2001年5月推出 ,至今已建设7年;2001-2007年为统计源,有386.8万数据 ,在统计被引总频次时,不但有被期刊引用,还有被会议论文引用和被学位论文引用 • 目前跨库,跨学科交叉引用日益广泛。
1275家医疗机构文献被引情况分布 576038篇文献被引用
特点3:规范化的加工方法 • 《中国学术期刊网络出版总库》系列标准(10项标准组成)。 • 《中国学术期刊(光盘版)检索与评价数据规范》
Q/CNKI 100-2006 《中国学术期刊网络出版总库》 总则 • Q/CNKI 101-2006 《中国学术期刊网络出版总库》 术语 • Q/CNKI 102.1-2006 《中国学术期刊网络出版总库》 期刊收录与编辑出版 第1部分 期刊收录原则与范围 • Q/CNKI 102.2-2006 《中国学术期刊网络出版总库》 期刊收录与编辑出版 第2部分 编辑出版 • Q/CNKI 103-2006 《中国学术期刊网络出版总库》 元数据结构及数据质量 • Q/CNKI 104-2006 《中国学术期刊网络出版总库》 全文数据质量 • Q/CNKI 105-2006 《中国学术期刊网络出版总库》 规范文档 • Q/CNKI 106-2006 《中国学术期刊网络出版总库》 数据库检索与管理系统 • Q/CNKI 107.1-2006 《中国学术期刊网络出版总库》 增值应用系统第1部分 文献评价统计分析系统 • Q/CNKI 107.2-2006 《中国学术期刊网络出版总库》 增值应用系统第2部分 学习与研究系统 • Q/CNKI 108-2006 《中国学术期刊网络出版总库》 技术服务 • Q/CNKI 109.1-2006 《中国学术期刊网络出版总库》 索引数据库第1部分 引文索引 数据库 • Q/CNKI 109.2-2006 《中国学术期刊网络出版总库》 索引数据库第2部分 作者索引数据库 • Q/CNKI 109.3-2006 《中国学术期刊网络出版总库》 索引数据库第3部分 机构索引数据库 • Q/CNKI 109.4-2006 《中国学术期刊网络出版总库》 索引数据库
《中国学术期刊(光盘版)检索与评价数据规范》《中国学术期刊(光盘版)检索与评价数据规范》 • 规范从1999年开始执行。 • 2003年国内已有5000家期刊执行了本规范 • 2005年10月国家标准修改时,本规范95%的内容被列为国家标准。
特点4:多医疗机构参与评价 • 本报告所称的医疗机构主要包括:医院、妇幼保健院、康复医疗机构、专科疾病防治院和对外开展医疗服务的研究机构,不包括疾控中心,采供血中心等卫生机构。根据我国卫生部官方网站公布,截至2007年我国3级医疗机构数为1182所,此次在2008版我们暂定将2001-2007年发文总数大于300篇的1275所医疗机构收录其中,其中3级医院964家,2级医院285家,一级医院14家,无级别医院12家;
多医疗机构参与评价 • 在本次规范过程中,工作量巨大,仅这1275家医疗机构的不规范名称写法就有30万种情况。 • 在医疗机构名称规范过程中,我们尽量将每个医疗机构的标准名称、曾用名、共用名等现象查询完备,并将其所包含的下属分院,研究所及所属其他部门均归并如本院。基本按照该机构2007年最新的名称为标准名称。 • 如北京协和医院,他现有,‘北京协和医院(东院区)’和‘北京协和医院(西院区)’,北京协和医院(西院区)的前身为邮电总医院,在这里我们将这3个名称均认为是北京协和医院;但也有某些典型单位结合实际情况进行界定,比如中国人民解放军总医院(原301医院)、中国人民解放军总医院第一附属医院(原304医院)和中国人民解放军总医院第二附属医院(原309医院),经过和此3所医院的相关人员沟通,在本报告中是分为3个医疗机构进行统计的
特点5:多作者原则 • 随着科学活动的急剧增加,跨单位,跨学科的合作越来越多,并逐渐成为当今科学研究方式的发展方向,美国信息学家尤金·加菲尔德(EugeneGarfield,1925~)早在1978年就曾证明合著文献的被引率高的特点,中信所研制的《中国科技论文统计与分析》2001-2006年度也证明中国的合著论文数量和其在全部论文中所占的比例都在逐年上升,并已经形成今后持续增长的趋势。 • 故本报告在多数指标统计时,均采用多作者原则,试图将每个作者的贡献都尽可能的体现出来。 • 即本报告在统计各医疗机构各项发文指标时,除了第一作者发文指标按照第一作者单位统计外,其他指标均为多作者统计,即某篇文献为多作者同一单位发表时,则本单位发文数为1;如某篇文献有多单位合作时,则各单位发文数均为1。本报告中的被引指标也是遵从多作者原则,即某篇文献只要有某单位人员参与,则此篇文献的被引频次将计入该单位被引频次。
特点5:多作者原则 • 本报告中合著作者最多的是有20所单位的43位作者在《中华心血管病杂志》2001年第二期发表的‘我国中年人群心血管病主要危险因素流行现状及从80年代初至90年代末的变化趋势’,该文发表至今已被引用93次。文章署名及所在单位情况如下: • 中国医学科学院中国协和医科大学阜外心血管病医院心血管病研究所(武阳丰、周北凡、李莹、赵连成、杨军、匡山、李贤、谢高强、张红叶、吴锡桂、陶寿淇);广东省心血管病研究所(李义和、刘小清);首都钢铁公司总医院(于学海);北京市石景山区慢性病防治所(田秀珍);浙江医科大学附属第二医院(刘利民、夏舜英);江苏省人民医院(王海燕、钱卫冲);广西医科大学附属医院(朱立光);山西省盂县人民医院(杨瑞祥、郭东双);陕西省汉中市心血管病研究所(付西汉、杨军);浙江省舟山市普陀区心血管病研究所(阮连生);江苏省金坛市卫生防疫站(张文生、郭剑涛);北京市心肺血管疾病研究所(吴兆苏、吴桂贤);上海医科大学附属华山医院(洪震、黄茂盛);华西医科大学附属第一医院(袁光固);四川省德阳市卫生防疫站(尹红、王安兵);山东省长岛县人民医院砣矶分院(褚长军、顾吉达);河北迁安首都钢铁公司矿山医院(张玉琢、尹其云);河北省医学科学院(张鸿修、吕建波);牡丹江市第一人民医院(杨毅、于洪);全国心血管病防治办公室(陈捷)。
特点6:多指标评价原则 • 发文总数 • 第一作者发文 • 核心期刊发文 • 基金发文
第一作者 • 第一作者往往担负课题最主要的工作,对论文做出最大贡献。
基金发文 • 科学基金是世界各国采用的一种资助和扶持重点领域或研究项目的方式。科学基金项目的认定须经过专家严格评审并由管理机构审批,它在各个学科领域里具有技术先进、研究深入等特点,多年以来,科研基金对于推动我国自然科学、社会科学和文化事业的发展发挥了重要的作用,在发现和培养优秀科技人才等方面也有着巨大的意义。因此科学基金资助文献的学术水平大都相对较高,基金论文的多少,从一个侧面反映了机构论文的学术质量。 • 在统计过程中,我们所指的基金发文主要是指:国家自然科学基金、其他国家级基金、部级基金、其他基金(包括省级、厅级、市级、部队、国外基金等)。如果一篇文献收多个基金支持,在统计基金篇数时还是按照1篇计算。 • 此1275家医疗机构发文中有193356篇文献有基金支持,占总发文1588619篇的12.17%
核心期刊发文 • 《中文核心期刊要目总览》已于1992、1996、2000、2004年出版过四版,在社会上引起了较大反响,图书情报界、学术界、出版界和科研管理部门对该项研究成果都给予了较高评价。本次我们选取核心期刊是参考了他的2004版,该版核心期刊的定量评价采用了被索量、被摘量、被引量、它引量、被摘率、影响因子、获国家奖或被国内外重要检索工具收录等7个评价指标,同时选作评价指标统计源的数据库达51种,其中就包含《中国期刊全文数据库》和《中国引文数据库》;同时2004版还加大了专家评审力度,有1873位学科专家参加了核心期刊评审工作。这种定量评价加定性评审的原则得到了广大期刊界的认可,核心期刊发文指标的选取是对发文总数和第一作者发文数的一个补充指标,他有自己的独立存在价值,可以帮助用户能从多角度、多方向来了解医疗机构的科技论文数量和质量之间的关系。
特点7:H指数 • h指数(high citations)是美国加州大学圣地亚哥分校物理学家乔治·赫希(Jorge E.Hirsch)于2005年8月提出的一种定量评价科研人员或机构学术成就的方法。一个机构的h指数是指他至多有h篇论文分别被引用了至少h次。赫希认为h指数能够比较准确地反映一个人或机构的学术成就。一个人或机构的h指数越高,则表明他的论文影响力越大。
H指数 • 美国isi于2006年以sci为基础在web of science平台上开辟了‘h指数’的计量分析窗口, • 目前国内的中国科学文献计量评价研究中心已于2006年将h指数作为评价期刊影响力的一项新指标应用于其编制出版的《中国学术期刊综合引证报告(2006版)》,并取得了比较好的效果。 • 我杂志社于2007年3月和7月分别于太原和北京清华大学开展了‘评价科研人员学术成就的最新文献计量指标-h指数’专题学术报告会。 • 开展学术交流,与2001年“普赖斯”获得者、国际科学计量和信息计量学会(ISSI)会长、国家科学图书馆客座教授,比利时工业科技学院教授鲁索博士(R.Rousseau)合作发表论文。
H指数 • h指数的优势在于他是钝感的,他不容易受到意外过多的未被引论文或显著高被引论文的影响;他通过特定的平衡方法将‘数量’(发文数)和‘质量’(引用率)结合起来,因此通过h指数的评价医疗机构时,可将那些贡献较大的论文凸现出来,把那些贡献不大的论文隐蔽起来。
H指数最高的医疗机构top10 从本报告统计的h指数可以看出,对某些‘学术有专攻’的医疗机构来说,h指数可以将他们凸显出来,例如中国医学科学院阜外心血管病医院,虽然按照总发文排名他们为73名,但h指数可以排到第6名,这说明该医院的高被引论文数排名靠前
不同统计样本下指标的简单比较 • 在我国关于医疗机构的文献计量指标统计已有多年的历史,基本经历了从小样本,单一学科的统计逐步扩大到大样本,多学科的综合统计研究过程,现将我们的统计结果和我国其他两家主要评价研究单位的结果进行简单对比,进而说明大样本统计与中小样本统计之间的区别和统一。
不同统计样本下指标的简单比较 • 由于我们此次统计源期刊约有8600种,其中医学期刊约为1600种,故称我们为大样本,其发文数我们简称为CNKI总发文,鉴于其他两家单位在统计过程中采用的是第一作者原则,我们将第一作者发文数也引入比较,将其简称为CNKI第一作者发文;中国科学技术信息研究所发布的《中国科技论文统计与分析》(2001-2006)[6~11] 平均每年收录期刊均值为1617种,其中医学期刊均值为452种,详见表1,我们称之为中样本,其发文数我们简称CSTPCD总发文;中国科学院文献情报中心发布的《中国科学计量指标:论文与引文统计》(2002-2007版)[15~19]每年收录期刊均值为662种,其中医学期刊均值为135种,详见表1,我们称之为小样本,其发文数我们简称CSCD总发文;我们选取2001-2006年连续在这三家统计报告中均有发文的30家医疗机构作为研究对象,他们在每个统计源中的发文总数见下表2,趋势图见图1。
不同统计样本下指标的简单比较 • 由以上图表可以看出这30家医疗机构均为优秀医疗机构,在CNKI中的总发文和第一作者发文较大,这30家医疗机构在大中小样本中的第一作者发文排名的趋势是一致的;不论是第一作者原则还是多作者原则,基本不影响各个医疗机构的总排名;小样本的情况下各家医疗机构之间的差距变化不大;大样本统计情况下,各医疗机构之间差距趋势较明显。
结语 • 海量数据原则、多作者原则和跨库被引原则是数据查全的保障;多指标原则是评价结果全面性的保障,这些原则的选取可以最大化的将每个医疗机构在科技方面的贡献显现出来,并且最终能得到全面完善的评价。这样的评价结果具有充分的客观性和全面性。
结语 • 发布的1275家医疗机构覆盖面较广,基本涵盖了我国主要的3级医院,和一些重要的2级医院,在整个医疗行业中具有充分的权威性;多项评价指标的选取可以从多方面为用户提供信息支持,并可以形成各指标之间的互补,特别是h指数的选取,具有创新性,为我们今后的医疗机构评价带来新的评价方法和途径,更有利于对某个医疗机构的全面评价。
结语 • 通过大中小样本的统计结果对比可以看出,大样本的统计结果能更好的反映医疗机构之间的现状,通过海量数据的统计,可以使《报告》的计量结果更全面、更准确,更可靠,作为各医疗机构考核、评价的依据更客观。