大数据环境下人文社会科学学术创新力多层评价

降重资讯 admin 浏览

小编: 本文剖析了目前人文社会科学学术创新力测度存在的问题,提出了人文社会科学学术创新力测度的基本内容、基本原则。基于大数据环境角度提出了人文社会科学学术创新力具体的测度



我国人文社会科学学术评价一直受到自然科学评价的影响,导致我国的人文社会科学学术评估和创新探索研究过于侧重量化指标、片面强调产出指标和各类排行榜。习近平总书记在2016年的哲学社会科学工作座谈会上指出,我国哲学社会科学类学科的“学术评价体系不够科学”。今年教育部、科技部联合印发了《关于规范高等院校SCI论文相关指标使用树立正确评价导向的若干意见》的通知,提倡和鼓励探索建立科学的评价体系。学术创新效应评估的目标不能仅仅为了“排行榜”,尤其是人文社会科学学术成果更不可能通过仅仅通过引文等量化指标的排行榜展示其多维度、复杂性的学术价值和社会价值。评估的目的也不能仅仅停留在结果展示,而是通过评估过程的分析和深度挖掘,为学术研究者和科研管理者提供知识服务和策略支持[1]。

当前的大数据环境对人文社会科学领域的学术行为、学术研究规律以及学术扩散等方面都产生了巨大的影响。在大数据环境的思路下,需要以多元融合的要素,多层结构的评价思路构建人文社会科学的学术创新评价体系:从基于论文、专著等数据静态阶段性的成果评价向动态全过程的学术生涯评价转变,从单维的指标分析向复杂的社会网络分析转变,从注重以影响力等外围指标为主拓展到行为、内容、社会价值等深层次指标,从而更加深刻而全面地揭示不同学科领域,不同维度的学术创新效应表现。有益于科研机构把握学术创新规律、创新动态和趋势,动态的评价分析则可以为决策部门提供更有效的参考意见[2]。

一、学术创新力测度和评价的研究现状及存在问题

(一)国内外相关问题研究现状

1.学术创新理论研究

早期研究角度是学术创新相关理论的概念和描述研究,HeatonJPW(2005)提出科学研究中学术创新力的重要性以及应该重视对其的评价和测度,将有助于挖掘出学术价值更高、有较大影响力的论文,从而推动科研人员和学科的发展。E.L.Grigorenko(2008)等对学术创新力的概念进行了说明,并且提出可以通过学习和训练提高这种能力。国内主要以研究高校知识创造、知识整合和创新绩效居多,如高校跨学科的团队知识整合机制以及创新能力是如何影响到创新绩效的(樊飞月,2014),高校团队特征和个体创造力模型研究(王磊,2016)等。陈云伟等(2016)以人才计划、SCI论文数、发明专利数等六项指标构建了科学家创新力评价的综合性模型。

2.学术创新评价的指标研究

除了部分同行评议研究外,多数学者基于文献关键词特征、引文、知识网络构造评价指标,评价方法从传统计量学到复杂统计方法。UzziB(2013)等人利用“共被引”来构造文献对,如果在引文文献中出现了较多的之前未被引用过的文献则认为该篇论文做出了一定程度上的创新。FosterJG(2015)等人使用复杂网络描绘出论文中知识的演化;FunkRJ(2016)将引文网络结构作为测度研究成果与技术改革创新程度的指标。国内一些学者基于文献特征如关键词、作者合作等来构建学术成果的创新度量指标,如杨建林等(2013)通过对关键词的词频计算来衡量学术成果的重复程度和引文率。一些学者则侧重于研究由学术成果所构建的知识网络中提取指标。如宋歌(2016)引入结构洞理论用于评价学科创新力,并将其与引文网络结构以及媒介角色分析三者结合起来,预测学科发展的创新潜力。

3.学术创新影响因素研究

量化指标研究后期的重点放在对创新产出和扩散的影响因素分析。BornmannL(2006)认为影响期刊文献质量的重要因素包括时间、文献、论文、作者、期刊、学科以及文献获取难易程度。GazniA,DidegahF(2011),OnoderaN等人(2015)通过对不同学科进行统计模拟,提出合著数量、机构数量、参考文献分析均能够影响到论文的创新质量。国内以影响论文质量因素分析为主的,包括合作数量、论文可见度、可获得性、作者影响力等都对论文质量有着较大的影响(袭继红,2015;温芳芳,2016)。以影响科研团队创新活动因素为主的,如赵丽梅(2018)指出非对称性和知识势差导致了主体间际网络的诞生,而高校科研团队的知识创新活动就处于这个网络间,也受到一定程度的影响。

4.大数据视角下的学术评价

随着大数据时代的到来,大数据与学术创新评估相结合的论题刚刚进入探索阶段,还没形成较为成熟的理论和方法体系。国际上的研究有比如Ramosa等(2015)利用大数据和云分析在教育领域展开案例研究,并归纳了结合大数据进行评价的经验和教训;Khan等(2015)将大数据方法与医学研究项目相结合,以此分析医学学科领域极大的投入与产出的比较和分析;JuanPablo(2017)等人提出了利用大数据工具对高校学术数据进行采集分析处理。国内学者对大数据在学术评价中的推进作用越来越重视。包括大数据对学术评价的影响机制研究(马力,2018;杨英伦,2019);大数据在学术评价中的作用,如大数据在同行评议中为专家提供重复性检测、创新点分析和引证动机挖掘(伍军红,2015),大数据时代对计量学应用于学科评价的影响(邱均平,2017)。再者探讨了大数据环境下新的学术评价模式,如基础数据、网络平台、技术方法、评价应用和推进机制(杨红艳,2018)以及大数据时代哲学社会科学以多维度内容与行为、学术全过程动态评价以及学术价值为评价体系(杨建林,2018)。

(二)存在问题

目前有关人文社会学科学术创新力测度的相关研究为我国学科的繁荣与健康发展做出了极大的贡献,但同时也存在一些问题。

1.传统的同行评议和科学计量学方法已经不足以全面客观地应对目前的学科发展规律。

大数据环境下,学术研究内容、交流方式、科研成果等数据分散于各类平台,来源更广泛,粒度更微小,结构更复杂,形式更多样[3]。以大数据分析为目标的评估可以拓展定量分析的数据类型和研究范畴,使海量的因果分析和高效的价值判断成为可能。但目前国内还只是停留在有限的理论探讨阶段,具体如评估框架构建、评估指标数据的获取以及大数据分析还没有涉及[4]。

2.学术创新评估研究多从静态视角对学术成果进行量化研究,存在片面性。

人文社会科学“沉淀性”的学术研究性质,无法仅仅用固态的历史成果进行分析和表达。大数据思维下学术创新效应的评估分析,不仅需要对大量各类静态数据整合性分析,还包括实时分析学术科研动态行为数据。从创新全过程角度,结合时空维度剖析科研人员学术创新规律、偏好和行为习惯等,才能发现人才、培养人才,进而产生更多的优秀学术成果[5]。

3.指标体系偏于绝对数量,忽略了相对效率

目前测评指标大部分侧重于考虑学术创新的投入和产出,譬如重点研究基地、基金项目数、科研人员数、论文数等来作为评价的一级指标体系,包括目前的学科评估和专业评估也是基于此种思路。这类评价方法忽视了指标的相对关系,未能考虑到评价对象的客观规模、政策投入、地理位置所带来的影响,忽视了创新产出的相对效率和规模效应问题。用此类评价方法会造成不良的循环,不利于合理的资源配置,也影响到不同地域和学科的健康发展。

4.评价更偏向于静态的表层指标

目前的评价方法能够反映出创新主体的静态的、表层的指标,是较为粗放和宏观的量化方法。作为评价体系研究机构较少地考虑到创新系统的复杂性、干扰性因素[6]。无法反映出创新主体在创新活动过程中的所体现出来的层次性、各部分间的不确定性、多维性和周期性。缺乏动态的分析和深层次的探究。

虽然目前的学术评估量化方法在一定程度上能够反映一部分的创新力,但也只是将系统中出现的各个因素排列后做线性分析,继而进行粗放的量化统计。我们认为学术创新力存在于一个生态创新系统内部。因此学术创新力的测度是去评估整个系统在产生创新行为的活动时所体现出的创新素质,深入考虑创新系统的层次性及整个系统的复杂性。

二、人文社会科学的学术创新生态系统

(一)人文社会科学学术创新系统

任何一个科研机构或是学科领域都是一个由不同个体以一定结构关系组成的,为了实现知识创新和学术研究,持续发展的学术创新生态系统。人文社会科学领域的学术创新系统完整的反映了学术创新的生态体系,在这个生态体系中创新主体自身完成了汲取积累知识、内化吸收再到产出成果以及外在影响力的扩散整个过程。同时整个体系也是可以视作创新主体在各种环境因素影响下,彼此之间完成的知识交流过程[7],如图1所示。这个系统包括创新环境、创新主体和创新客体,系统外圈是学术创新环境,包括人才环境、政策环境、科研经费、合作交流等;系统中圈是则是创新动态过程的体现;内圈则是体现了创新个体之间,微观层面上知识流动和集聚状态。 图1学术创新系统  下载原图

(二)人文社会科学学术创新内涵

1.学术创新力是学术研究的能力和效率

科研产出的量化指标是目前通用的评估学科或者高校科研机构的方法。但这种粗放式的评估难以解决本文中提出的学术创新能力的评估。学术创新力第一要素就是创新能力,而能力的评估需要结合投入因素进行分析,以产出和投入的相对效果进行创新绩效的评估和测度,以此比较和分析出真正影响影响学术创新力的因素。如图2所示。 图2宏观绩效角度分析  下载原图

2.学术创新力体现在动态的创新过程中

学术创新力不仅需要考虑静态的能力,更需要考量动态过程中体现出的素质和能量。对创新主体科研活动全过程的行为特征进行挖掘,能够有效把握学术创新过程中的行为效应以及学术研究的关键影响因素。本文将科研过程大致可以分为三个阶段:学术积累阶段,学术创新阶段,创新传播阶段,如图3所示。不同的阶段将会呈现出不同的创新能力和素质,如知识采集和吸收水平、积累的广泛程度,学术研究产出的力度和稳定程度,知识扩散的广度和深度等等。 图3中观过程角度分析  下载原图

3.学术创新力需要微观视角的考量

著名的科学社会学家史蒂芬·科尔认为科学评价过程中特殊主义原则得以运行的微观社会基础乃是科学家个人的社会网络[8]。本文将这一观点继续深入,科学评价需要深入研究学者在学术创新中的知识交流和学术合作中所体现出的知识的流动性和持续性,即在微观视角下衡量创新主体之间知识流动频率、流动速度和流动强度。因此除了需要考虑创新环境影响以及创新过程中体现出的创新素质,还需要从微观的角度研究学者在学术创新中内在的动力和活力,如图4所示。 图4微观网络角度分析  下载原图

三、大数据环境下人文社会科学学术创新力多层测度体系构建

(一)人文社会科学学术创新力测度体系构建基本原则

基于对学术创新内涵的分析本文以大数据方法和技术为支撑,构建多元分层评估模型框架,把握学术群体创新规律;揭示学术创新的社会推进效应和影响力;为了更为科学和合理的构建和细化指标,需要遵循以下三个原则[9]。

1.静态指标与动态指标相结合:

要紧紧把握人文社会科学学科发展以及学术研究的特点和规律,提取静态指标反映学术创新的现状和当前实力,挖掘动态指标探究创新实力的稳定程度和发展趋势。

2.结果指标与过程指标相结合:

学术创新力的评估既需要审视结果,更需要分析过程。本文提出基于创新过程来研究人文社会科学的学术创新力,关注创新活动的过程和创新的活跃程度[10],剖析创新力的动因和制约因素

3.数量指标与质量指标相结合:

创新的规模和力度需要一定的绝对量化指标,但同时更需要注重结合投入来衡量相对效率,同时更要兼顾人文社会科学学术创新的社会价值和效应。

(二)测度体系模型

本文希望通过整合各类科研数据,以科研活动全过程中多维数据为学术评价的重要组成部分,结合大数据的分析方法和技术,构建多元分层评估体系,精确刻画我国哲社科科研的人员静态属性特征、动态行为特征、科研社群特征、社会价值特征;探析学者个体、团队和学科之间的推进效应以及制约因素。有助于把握不同学科领域的学术创新动态、发展规律和趋势。由此本文创建了人文社会科学学术创新力评价的三层模型体系EPN(Efficiency-Process-Network),旨在能够多方位,立体化、系统性地展示测评对象学术创新力现状和动态趋势。如图5所示。 图5人文社会科学学术创新力三层评估模型  下载原图

1.宏观绩效视角(创新能力)—E(efficiency)

最高层的的宏观绩效的角度可以避免绝对量所带来的评估偏颇,从相对创新效率的角度反映创新主体创新能力。本视角是借用黑箱理论的视角[11],将创新体系视作一个宏观的系统,通过考虑系统的输入参数和输出来观测系统创新力的结构和参数。因此可以剖析出创新主体对投入的吸收和消化程度,内化为学术成果的效率。绩效角度的分析可以识别出创新能力较高的创新主体,回避投入过量产出冗余的机构。

2.中观过程视角(创新力度)—P(process)

过程视角能是基于白箱理论,通过研究创新主体在学术创新各个阶段过程中所表现出的力度和素质[12],结合多个维度分析创新活动中主体吸收采纳学术知识的力度、学术创新产出的力度以及学术产出对其他主体以及社会的影响程度。全方位立体式展现学术活动中的各个动态和能力体现。

3.微观知识网络视角(创新活力)—N(network)

从创新客体的内涵角度,即知识的共享、交叉和流动角度,深入研究学术创新中的知识交流和学术合作中所体现出的知识的流动性和持续性。根据社会网络的结构理论框架,构建学术创新知识网络的相应模型[13],用抽取相应指标来表征学术创新知识网络之间节点的交流频率、采纳和集聚程度。

因此学术创新力不仅体现在学术创新系统的创新效率上,也反映在整个学术创新过程中的创新力度上,更可以从创新主体之间的知识网络中探寻出创新的活跃程度。从这三个角度描述学术创新力可以真实、全面反映出创新力水平。

四、大数据环境下人文社会科学学术创新力测度框架构建

(一)整体框架设计

上述测度模型提出基于宏观绩效角度的创新效率分析、基于中观角度的创新过程分析以及从微观角度的知识网络创新活力分析三个层次。从“质”的角度强调学术投入“转化”的速度、“转化”的相对量比和相对质比,反映创新主体外在的创新效率,从行为过程分析创新主体在学术创新行为过程中所体现出的内在的力度,从主体间知识交流,研究创新在学科内外知识网络中的创新流动、采纳情况。基于此,本文构建出了人文社会科学学术创新力多层测度与评估研究的基本实施框架。基于大数据采集和抽取技术挖掘科研数据,建立学术资源库[14]。继而通过语义分析、数据抽取、指标选取、模型构建等手段,构建适应不同层次评价对象的动态评价框架,解决框架实施的具体方法和关键技术问题,可以得出各层评估结果以及层间交互效应的影响要素分析。如图6所示。 图6框架图  下载原图

(二)指标体系设计思路

评估设计中最重要的部分将整合各类科研数据,以科研活动全过程中多维数据为学术评价的重要组成部分,结合大数据的分析方法和技术,构建多元分层评估体系,探析学者个体、团队和学科之间的推进效应以及制约因素;把握不同学科领域的学术创新规律,创新动态和趋势。

1.宏观绩效视角的指标设计

绩效视角的指标体系设计主要考虑的是创新的投入和产出率。一级指标包括学术创新投入指标和学术产出指标。投入指标涵盖了创新活动所需要的各种客观需求,如人力、物力、财力等;学术产出则除了需要考虑传统评价体系中的学术成果、学术奖励等,还需要考虑到学术社会影响。具体指标的细化可以参考各高校和科研究季候的科研奖励措施以及《中国重点大学创新力评价报告》,同时通过问卷调查和调研学科专家,制定出合适的学术创新投入-产出的指标。

2.中观过程视角的设计

中观过程的视角本文提出了三段四维的理念,提出了将主体的学术创新过程中的采纳、产出和扩散三个不同的活动状态分别从数量维、质量维、时间维、空间维四个维度进行诠释,“数量维”反映了创新力的规模化效果,“质量维”体现了创新力的根本价值,既包含学术价值也包含社会价值;“时间维”则衡量了学术创新过程中所体现的速率和发展的持续稳定程度,“空间维”反映了创新过程中的行为及其结果的覆盖和影响程度、全面性和深度。分别拟定具体的指标体系后,对各个创新主体的创新动态进行深入的剖析,探究过程力和创新素质。

3.微观视角的设计

根据社会网络的结构理论框架,抽取出互引文献中的主题词,基于文献的引证关系,构建出以主题词为节点,主题词所在文献的引证关系为边的学术创新知识网络的相应模型,以网络关系强度、网络结构位置以及网络规模三个为一级指标,并结合时间维度,抽取链引主题词群、互引率等二级指标表征学术创新知识网络之间节点的交流频率和集聚程度。结合采集的数据,分析高校科研院所学术创新知识网络所表现的状态,得出创新主体的采纳情况、平均创新知识水平以及创新知识水平均匀分布等情况。从而可以分析创新主体的创新活跃程度、创新的稳定程度以及创新的核心程度。

(三)学术评估资源库构建

通过实时爬取各平台学术数据,结合已有的开放数据集,采集学术创新力测度模型中所涉及的数据,采集对象为同一学科领域下各高校的院系、研究机构。通过抽取学者科研数据,创新我国各学科学术资源库,用于多维度学术大数据分析与评估。

需要采集的数据对象一是宏观层面评估数据,包含学科和机构层面的投入产出数据,如科研基地、重点学科、经费投入、人才比率、学术影响、社会价值等用于创新绩效的评估;政府、媒体等网站的学术报道、转载、引用等数据,用于评估社会影响力和社会效应。第二部分用于,用于学术创新过程研究,主要涉及到学者基本属性数据和科研行为数据和学术成果数据;第三部分数据用于微观评估学者间关系数据包括学术图谱、非正式交流、科研合作、引文等,用于建立学术创新网络,分析知识的创新流、采纳情况和集聚程度;

数据采集后需要数据清洗、匹配和融合,特别需要注意多源异构的数据处理以及实体甄别,需要根据多种数据源设计数据采集和整合模块,将数据融合存储到统一的数据仓库,建立数据的多维联系。为后续特征提取提供可靠的数据支持。其中的难点则是如何指标特征入手,从非结构化文本准确地抽取数值特征、主题特征、文本特征以及社交网络实体关系等数据。

(四)各层次评价方法

1.宏观视角下学术创新能力评价方法研究

本文考虑引入企业中绩效评价数据包络分析法来构建学术创新力的宏观指标体系,构建学术创新能力BCC模型,如下所示。则有矩形式。

xij—第j单元的第i项投入,yrj—第j单元的第r项产出,即:效率指标hk等于产出加权之和除以投入加权之和,模型中xik,yrk为已知数,vi,ui为变量。模型的含义是以权系数vj,uj为变量,以h0所有决策单元的效率指标为约束,以第k0个决策单元的效率指数为目标。即评价第k0个单元的生产效率是否有效,是相对于其他所有单元而言的。在进行数据采集后结合主成分分析法对指标体系进行降维处理,理清指标之间逻辑关系。通过各类指标如综合效率、技术效率、规模效率来进行评估宏观创新绩效。通过规模报酬、投入不足、投入冗余以及产出不足、产出冗余等指标来判断指标数据变化对学术创新绩效的敏感度,剖析宏观视角下学术创新力的推动要素和制约因素。

2.中观视角下学术创新过程力度的评价方法研究

3.微观视角下基于知识网络的创新活力评价方法研究

本层次所采用的方法包括抽取出互引文献中的主题词,再基于文献的引证关系,构建出以主题词为节点,主题词所在文献的引证关系为边的有向加权网。采用Ucinet工具,结合时间维度,抽取链引主题词群、互引率等指标,结合采集的数据,分析高校科研院所学术创新知识网络所表现的状态,得出创新主体的采纳情况、平均创新知识水平以及创新知识水平均匀分布等情况。从而可以分析创新主体的创新活跃程度、创新的稳定程度以及创新的核心程度。

结语

本文针对当前人文社会科学学术评价中现存问题进行总结和分析,借助大数据新技术与新方法,构建多维度、多层面的立体评价大数据知识库,以探究哲学社会科学学术创新规律、学术贡献、社会价值为目标,提出完整的学术创新力评价方案。从宏观宏观绩效、中观过程以及微观知识网络三个层次全面体现学术创新系统所“具有的创新能力”、“表现出的创新力度”以及“创新力的活跃程度”,构建出我国学术创新水平评价模型EPN。将科研活动全过程、全方位数据作为学术评价的重要组成部分,结合大数据的分析方法和技术,希望精确刻画我国人文社会科学学科领域学术创新的静态属性特征、动态行为特征、科研社群特征、社会价值特征;有助于把握学者的学术创新规律,创新动态和趋势,探索学术创新力测度方案,为我国高校创新发展和学科建设中的决策提供理论支持。

后续的工作将分为两个部分:一是细化指标。根据上述研究框架,细化各个层次的评价指标,构建多维度、多层面的立体评价大数据知识库,以探究人文社会科学学术创新规律、学术贡献、社会价值为目标,为科研管理和评价提供科学导向。二是基于“现状”,探讨“趋势”。人文社会科学研究不同于经济生产领域,学术研究的投入-产出-扩散时滞较长,因此后续工作将基于高校学术创新力现状的测度数据,以评估结果作为状态变量,评估指标数据作为特征变量,探讨出不同层次下的学术创新力的预测方法,以学术创新力现状的评估结果为样本数据,预测创新能力下的创新持续状态,学术创新力度随时间变化的规律以及学术创新主体间知识流动的趋势和走向,并进一步进行可视化处理。从而更好地为科学研究者提供多维度评估结果展示、分析服务以及学术精准推荐,迅速准确地捕捉学科领域研究前沿和热点,为制定学科发展决策提供强有力的依据。

当前网址:http://www.paperaa.com/newss/12759.html

 
你可能喜欢的: