小编: 【目的】本文以基本科学指标(ESI)Top1%高被引论文为对象,研究中国国家自然科学基金资助论文的高被引率变化情况。【方法】对比分析中国国家自然科学基金与美国主要基金、国内
我国主要通过中国国家自然科学基金(NSFC)、国家重点基础研究发展计划(973计划)等对基础研究提供资金支持[1],除此之外,企业以及非营利机构中都有较为卓越的科学研究活动和大额资金支持。其中,国家自然科学基金资助包含医学在内的所有自然科学领域[2],资助力度也逐年增强,是我国支持基础科学研究最主要的渠道之一。
美国支持基础研究的主要是美国国家科学基金(NSF)和美国国立卫生研究院(NIH)这两个基金机构[3]。其中NSF主要资助除医学以外的基础研究[4];而NIH是美国主要的医学与行为学研究和资助机构。由此可见,我国NSFC的资助领域与美国的NSF及NIH资助领域大致相对应。
论文是基础科学研究的主要产出形式之一,过去经常将基金论文数量及质量情况作为基金绩效的一个评估指标[5,6,7]。2018年,中共中央办公厅、国务院办公厅发布《关于深化项目评审、人才评价、机构评估改革的意见》,要求“克服唯论文、唯职称、唯学历、唯奖项倾向,注重标志性成果的质量、贡献、影响”。基于此,本文不凭借论文数量和引用频次评估基金资助绩效,仅代表一种科研成果的产出情况。
对比我国NSFC资助论文与美国NSF+NIH资助论文,可以了解NSFC在促进我国基础研究论文产出方面的成效。ESITOP1%高被引论文是指某学科领域中发表于十年内、被引次数排名在前1%以内的论文[8],被认为是在学术共同体中有较高“认可程度”的科研成果[9,10]。但被引高的论文是否就是具有高影响力的论文,一直在学界中存在不同的看法。一方面部分突破性论文发表初期可能很少被引,有一段时间的沉睡期。综述型论文比研究型论文更易获得较高的被引次数,论文中包含特殊参数、工具、公式等论文也会更容易被引用,从而在不知不觉中累计成为高被引论文。但另一方面,已有研究表明在统计学层面而言,被引次数与影响力密切相关。RadicchiFilippo对来自多个领域超过2000名通讯作者的约2万篇科学论文进行成对影响力评估,确定自己认为影响力大的论文。结果显示当科学家们掌握足够信息且做出无偏选择时,专家对影响力的评价与引用数相一致[11]。VanRann在一项评估文献计量方法的研究中总结,在高聚集层面,引文数和其它科学影响评估——同行评议、引用行为理论的实证检验等结果高度相关[12]。此外,汤森路透每年通过分析生理学或医学、物理学、化学及经济学领域论文的引用情况发布“引文桂冠奖”,被认为是“诺奖风向标”。
本文通过分析ESITOP1%高被引论文,分别从世界和国内两个角度分析中国国家自然科学基金资助的论文产出成就。首先对比分析中国NSFC与美国NSF+NIH的高被引论文在整体发文量、引用情况等多个维度上的表现,描绘我国国家自然科学基金论文在世界高被引论文中的表现和影响。其次将我国ESITOP1%高被引论文分为三组:受NSFC资助的论文组、受其它基金资助(没有NSFC资助)的论文组以及没有基金资助的论文组。从三组高被引论文数量占比、引用情况分析等多个角度展示国家自然科学基金在资助我国高水平基础研究论文成果产出方面的地位和贡献。最后分析不同学科高被引论文中NSFC占比演变情况,展示自然科学基金资助的领域特点。
2相关研究
目前,学界对基金论文产出和影响的研究主要集中在两大方面,一是根据基金论文数量、被引频次、学科以及期刊等分布情况探究基金的资助成效。如刘多等分析由科学基金资助的ESI高被引论文,探究被引频次、期刊分区以及机构等指标的分布情况[13]。俞征鹿等从机构、地区、学科等角度对基金项目论文产出和影响力水平进行统计和分析[14];二是对比不同基金在同一领域的资助产出情况。季子翔分别从基金论文产出数量、期刊分布、引用影响、活跃机构以及合作情况等角度,对比分析了NSFC和NSF在化学领域的资助产出情况[15]。马涛等分别从资助规模、资助强度以及资助领域等方面对比NSFC与NIH在消化内科领域的资助状况,为国家自然科学基金优化资源效率提供借鉴意见[16]。
总体来看,当前研究仍存在一些不足。大多研究都是基于同一领域对比不同基金的资助效应,通过基金号检索项目成果,可能导致所获得数据不完整、样本数据量较小等问题。在研究方法上,因为被引频次与时间累计密切相关,将出版年不同的论文放在一起比较,得到的结论可能会偏离事实真相。
3研究思路
本文以全球ESI高被引论文为对比数据源,主要从三个方面展开研究:对比近十年内中美主要基金论文在数量和被引频次的整体变化趋势;对比国内高被引论文分别受自然科学基金、其他基金和无基金资助论文,在数量、被引频次方面的变化趋势;分析近十年NSFC中高被引占比变化情况,以及ESI学科高被引论文中NSFC资助占比演变情况。研究思路如图1所示。 图1国家自然科学基金资助论文的高被引率变化研究思路 下载原图 Fig.1ResearchStrategyofPerformanceAnalysisofNationalNaturalScienceFoundationofChinaBasedonthePercentageofESIHighlyCitedPapers
3.1数据来源与预处理
在WebofScience平台检索出版年为2009-2018年的高被引论文(如无特殊说明,下文“高被引论文”均指ESITOP1%高被引论文),将文章类型限定为Article和Review,去除没有地址的论文后,最终用于统计的文章数量为13.69万篇,检索时间为2019年10月。
自2008年9月起,WebofScience核心合集开始提供“基金资助机构(FO)”、“授权号(FG)”、“基金资助信息(FT)”等字段,使研究基金论文产出成为可能[10]。因此本文数据集选取出版年为2009年以后的论文,是目前为止研究此类问题时间跨度最大的数据集。不同作者对基金资助的标注可能不同,例如中国国家自然科学基金的标注有:NationalNaturalScienceFoundationofChina,NSFofChina,NSFC,KeyProjectofNSFC等多种形式。利用技术手段对基金的多种不同写法进行统一合并,并加上人工判定保证准确性。
一篇论文可能会受到多个不同基金的资助,在我们统计的数据集中同时受NSF、NIH及NSFC三个基金资助的论文共有2042篇,而其它基金的资助会影响探究NSFC基金的资助效果。为了使对比的数据之间更独立,根据学者们普遍认为的文章第一作者或通讯作者对论文的贡献最大[17],本文将第一研究地址或通讯地址为我国地址的论文视为我国主导论文,美国主导论文同理。2009年-2018年期间,中国主导的高被引论文为23069篇,美国主导的高被引论文为49674篇。其中,中国主导的高被引论文受NSFC基金资助(下文简称“NSFC论文组”)的共有18326篇,占中国主导论文的79.4%;美国主导的高被引论文受NSF或NIH基金资助(下文简称“NSF+NIH论文组”)的共有28758篇,占美国主导论文的57.9%。NSFC论文组和NSF+NIH论文组重合部分减少到365篇。
在对比国内高被引论文的基金资助情况时,将受NSFC资助的论文归为I组,共有18326篇;未受到NSFC基金资助但受其它基金资助的论文归为II组,共有3591篇;将无基金资助的论文归为III组,共1152篇。
3.2分析方法
本文研究对象为2009-2018年ESITop1%高被引论文,采用计量统计方法分别从世界视角(NSFC论文组、NSF+NIH论文组与全球总体高被引论文平均值对比)和国内视角(我国NSFC高被引论文与其它基金高被引论文、无基金高被引论文对比),以及从学科占比情况分析国家自然科学基金资助的高被引论文产出成果。
考虑到论文被引频次与时间累计密切相关[18],另外不同学科领域间的引用行为差异较大[19],本文借鉴InCites数据库常用指标“学科规范化的引文影响力(CategoryNormalizedCitationImpact,CNCI)”对被引频次做规范化处理。以同出版年、同领域的全球总体高被引出版物的均值为基线值,计算无偏的相对影响力指标,以排除出版年和学科领域对被引频次的干扰。例如,一篇2010年化学学科的ESITop1%高被引论文的总被引频次为1005,2010年化学学科全球ESITop1%高被引论文被引频次的均值为480.03,则该篇论文的学科规范化被引频次为1005/480.03=2.09。表明该篇论文的平均被引表现为全球高被引平均水平的2.09倍。那么,2010年NSFC论文组的平均学科规范化被引频次,即为该组所有论文的学科规范化被引频次的均值。
本文进一步采用独立样本的非参数检验:Kruskal-WallisH检验来验证NSFC论文组与NSF+NIH论文组引用影响力的差异。其原理是将数据转为秩统计量,而秩统计量分布与总体分布无关,可以摆脱总体分布束缚[20,21]。另外,该检验过程涉及将K个样本混合成为一个单样本从而获得每一个观测值的秩,因此要保证所有数据之间具有可比性。本文用于分析引用影响力的数据都通过规范化的方法消除了时间因素的影响,从而使各个数据之间可比,满足使用该检验方法的前提条件。
4结果与分析
4.1中美主要基金论文对比
根据NSF官网发布的年度报告,2009年共拨款646.7亿元($9492million,依同年年中汇率计算),2018年有所下降,拨款534.0亿元($7784million,依同年年中汇率计算)。我国NSFC基金2009年拨款72.2亿元,随后逐渐加大投入力度,并在近几年趋于稳定,至2018年共拨款266.7亿元。可以看出,仅对比我国NSFC和美国NSF的总资助金额时,2009年NSF资助金额约为NSFC的9倍,至2018年二者的资助总额差距已大幅缩小,但NSF的资助总额还是NSFC的2倍,反映了美国在科研经费投入方面仍领先于我国。
图2中红色表示NSFC论文组,黑色表示NSF+NIH论文组,节点符号是实心方块的实线表示ESI被引频次前1%论文数量增长情况,节点符号是空心圆圈的短划线表示ESI被引频次前0.1%论文数量增长情况。可以看出,在2009年中国NSFC资助论文与美国NSF+NIH资助论文数量相差巨大,但随后NSFC资助论文数量增长迅速,于2017年,ESITop1%、Top0.1%论文数量均超过NSF+NIH总和。
中国科学论文数量增长成就早已得到文献计量学家的公认[22],但不同于一般SCI论文,ESITop1%论文是指在22个学科领域中近10年被引频次排在前1%的论文,代表各个领域受“认可程度”较高的研究。也从一个角度反映出中国科学论文近几年在引用影响力方面不断提升,逐渐跻身世界前列。 图2中(NSFC)美(NSF+NIH)基金高被引论文和极高被引论文数量年度变化情况 下载原图 Fig.2ThevariationinquantityofESITop1%&0.1%basedonNSFCandNSF+NIH
图3展示了2009-2018年期间,NSFC论文组和NSF+NIH论文组平均学科规范化被引频次的变化趋势。红色实线表示NSFC论文组,黑色短划线表示NSF+NIH论文组。从图3可以看出近十年间,NSF论文组基本保持在全球高被引平均水平1.1-1.2倍,无明显增长或下降趋势。而NSFC论文组的平均学科规范化被引频次始终低于全球高被引论文平均水平,但也呈现上升趋势,并在2018年基本与全球平均水平相当。 图3中(NSFC)美(NSF+NIH)基金高被引论文的平均学科规范化被引频次变化趋势 下载原图 Fig.3AverageCategoryNormalizedCitationImpactTrendofESITop1%basedonNSFCandNSF+NIH
因为规范化后的被引频次不服从正态分布,且两组数据方差不等,因此采用独立样本的非参数检验方法:Kruskal-WallisH检验来验证两个独立样本是否取自同一总体。结果显示检验统计量为14.286,渐进显著性为P=0.000,即两组论文的平均学科规范化被引频次总体差异具有极其显著的统计学意义。
上述结论表明,在2009-2018年期间我国NSFC资助的高被引论文在数量上增幅显著,于2017年超过美国NSF或NIH资助的高被引论文。NSFC论文组的平均学科规范化被引频次十年间一直低于全球高被引平均水平,并与NSF+NIH论文组有一定差距。
4.2国内高被引论文基金资助效应对比研究
我国中央政府主要通过国家自然科学基金、国家重点研发计划等对基础研究提供经费支持。其中国家自然科学基金资助学科范围广,受资助的单位和项目数量众多,是推进我国基础科学研究快速发展的重要因素。
在我国ESITop1%论文中,受NSFC资助的论文数量占比由2009年61.6%,增长至2018年的82.0%。从2012年起至今,三组占比趋于稳定,NSFC资助论文约占80%左右,其它基金资助论文约占15%(图4)。 图4我国高被引论文中受NSFC、其它基金以及无基金资助的论文数量占比变化情况 下载原图 Fig.4ThevariationinquantityofESITop1%basedonNSFC,OtherFundsandNoFunds
图5展示了I组(NSFC基金论文组)、II组(其它基金论文组)和III组(无基金论文组)间引用情况变化趋势比较。I组用红色实线表示,II组用绿色双点线表示,III组用蓝色短点线表示。I组NSFC基金论文组呈现较为稳定的增长趋势,II组其它基金论文组表现为波动较大的增长趋势,III组无基金论文组则呈不规则波动状态。因为平均学科规范化被引频次指标是一个平均值,易受极值的影响,II组在2012和2017年平均学科规范化被引频次高于全球高被引平均水平1.2倍左右。也从一个角度说明,在自由探索的情况下也可能产生引用影响力极高的科研成果。 图5NSFC高被引论文、其它基金高被引论文和无基金高被引论文的平均学科规范化被引频次变化趋势 下载原图 Fig.5AverageCategoryNormalizedCitationImpactTrendofESITop1%basedonNSFC,OtherFundsandNoFunds
总的来说,在国内高被引论文中,NSFC基金论文在数量占比上有显著优势。但就平均学科规范化被引频次而言,NSFC基金论文并不比其它基金论文和无基金论文具有明显优势,说明其它基金在高引用论文的产出方面也发挥着不可替代的作用。
4.3NSFC高被引论文占比情况
图6A展示了近十年中国主导高被引论文数量和NSFC资助的高被引论文数量变化情况,发现近十年我国发表的高被引论文数量逐年增加,并且其中受NSFC资助的数量一直占较大的比例。B中红色实线表示NSFC高被引论文占NSFC资助的SCI论文的比例,黑色划线表示中国高被引论文占中国SCI论文的比例。发现NSFC论文中高被引的占比始终高于中国高被引占比,且逐年增大。并且根据曲线斜率,发现近十年NSFC论文中高被引占比的增幅快于中国高被引的占比增幅。 图6中国高被引论文、NSFC高被引论文数量变化和占比变化 下载原图 Fig.6TheVariationinQuantityandPerceptionTrendofESITop1%basedonChinaandNSFC
接下来从学科角度更细化地展示国家自然科学基金的资助特点。因为NSFC主要以资助自然科学为主,去掉ESI学科中的社会科学、经济学和商学。另外,我国近十年内在精神病学/心理学、空间科学发表的高被引论文数量较少,且在某一发表年未出版任何论文,为方便绘制占比趋势图,未将这两个领域纳入表格中。
表1展示了2009-2013年、2014-2018年各学科中受NSFC资助的高被引论文数量,以及其在全国高被引论文所占比例和五年内的变化趋势图。发现2014-2018年期间,受NSFC资助占比最大的学科分别是化学、计算机科学、材料科学、物理、工程和数学,并且在2009-2013年期间这些学科都呈上升趋势。 表1各学科高被引论文数量占比变化趋势导出到EXCEL Table1ESITop1%PerceptionTrendinSomeCategories 学科2009年-2013年2014年-2018年NSFC高被引论文数量NSFC高被引在全国高被引占比 趋势图NSFC高被引论文数量NSFC高被引在全国高被引占比 趋势图化学13130.8628490.88计算机科学1710.729420.88材料科学6480.8520560.87物理3570.848230.83工程7980.6729080.83数学2500.688260.83多学科2200.767490.81分子生物与遗传学360.841300.77生物与生物化学740.673080.76环境/生态学900.743910.76地球科学1490.833900.76神经系统科学与行为180.64580.74微生物学120.63370.73植物与动物科学1210.693410.67农业科学660.432910.59免疫学130.76210.57临床医学1140.423490.56
图7展示了13个ESI学科(为保证河流图清晰,去掉了包括社会科学、经济学和商学、精神病学/心理学、空间科学以及其它论文数量较少的5个学科)中受NSFC资助的论文占比演变情况。2009-2018年期间,化学和材料科学高被引论文中受NSFC资助占比一直较多;计算机科学受NSFC资助占比变化幅度最大,从2011年开始显著增加,2015和2017年成为占比最大的学科;工程学科在这十年间的占比情况也呈现稳定地增加趋势;数学、环境/生态学、生物学与生物化学表现出不断振荡的演变情况;而在这十年期间,地球科学受NSFC资助占比不断下降。 图72009-2018年13个ESI学科受NSFC资助占比的演变 下载原图 Fig.7PerceptionTrendof13ESICategoriesFundedbyNSFCin2009-2018
5结论与建议
随着我国财政支出对基础研究投入不断加大,中国国家自然科学基金的资助项目在数量和强度方面都有了极大的提高,科研产出迅速增加。通过与美国的基础研究主要资助机构美国国家自然科学基金和国立卫生研究院的对比来看,2009-2018年十年期间NSFC资助的ESI高被引论文数量呈快速增长趋势,平均学科规范化被引频次也逐年增加,2018年基本与世界高被引平均水平相当,说明我国NSFC资助的高被引论文的国际被引影响力在不断扩大。
在我国主导的ESI高被引论文中,NSFC资助占比近80%左右,其它基金占15%左右,没有基金支持的论文数量占5%左右,可见国家自然科学基金是推动我国基础研究高被引论文产出最主要的力量之一。在平均学科规范化被引频次方面,NSFC论文组的变化较为稳定,而其它基金论文组和无基金论文组的波动较大。另外,我们发现其它基金高被引论文的平均规范化被引频次也可能出现较高值,说明其它基金也在我国科研活动中也发挥着不可替代的作用。近十年内在化学、材料科学、计算机科学和物理领域中NSFC资助占比较大,计算机科学上升幅度最大,地球科学则呈下降趋势。
目前,我国NSFC资助的高被引论文虽然数量上已超过美国NSF+NIH,但引用影响力仍落后于美国的主要基金论文。从国内对比情况来看,虽然我国高被引论文中受NSFC资助的比例高达80%,但其整体研究的引用影响仍有待进一步提升。基金委应进一步把握和判断科研项目的广泛社会影响,制定相关政策激励研究人员产出更多在全球有影响力的研究成果,不断提升我国基础研究的科研实力与世界影响力。
本文主要基于ESI高被引论文,通过与国内外主要基金的对比分析研究国家自然科学基金的论文产出情况,没有考虑中文文献和其它类型的科研产出。未来可进一步基于更多科研产出数据,从人才培养、学科建设、原创进展等角度全面地分析国家自然科学基金的资助成效。
作者贡献声明
禾雪瑶:数据预处理,分析数据,撰写论文;
马廷灿:拟定研究命题和思路,最终版本修订;
岳名亮:数据收集,论文修改;
欧桂燕:数据收集,论文修改。
利益冲突声明:
所有作者声明不存在利益冲突关系。
支撑数据:
支撑数据由作者自存储E-mail:hexy@mail.las.ac.cn
[1]马廷灿,禾雪瑶.ESITop1%dataset.csv.2009-2018ESItop1%论文原始数据集.
[2]禾雪瑶.graph.opj.数据处理分析与绘图.
当前网址:http://www.paperaa.com/newss/12715.html