科技成果评价中学术造假问题的混合策略博弈分析

引用本文 [复制中英文]

孙萍 , 丁华 . 2016. 科技成果评价中学术造假问题的混合策略博弈分析[J]. 东北大学学报(社会科学版), 18(4): 400-404.

SUN Ping , DING Hua . 2016. Mixed-strategy Game Analysis of Academic Fraud in Sci-tech Achievement Evaluation[J]. Chinese Journal of Sociology(in Chinese Version), 18(4): 400-404. DOI: 10.15936/j.cnki.1008-3758.2016.04.012.

[复制英文]

基金项目

辽宁省科学技术厅软科学规划课题资助项目(2013401031)。

作者简介

孙萍(1962-),女,辽宁庄河人,东北大学教授,博士生导师,主要从事公共政策与科技政策研究;
丁华(1975-),男,吉林省吉林市人,东北大学博士研究生,沈阳化工大学副教授,主要从事科技政策与科技管理研究。

文章历史

收稿日期: 2016-02-01

Contents Abstract Full text Figures/Tables PDF

科技成果评价中学术造假问题的混合策略博弈分析

孙萍¹, 丁华^1,2

1. 东北大学文法学院, 辽宁沈阳 110819；
2. 沈阳化工大学教务处, 辽宁沈阳 110142

收稿日期: 2016-02-01

基金项目: 辽宁省科学技术厅软科学规划课题资助项目(2013401031)。

作者简介: 孙萍(1962-),女,辽宁庄河人,东北大学教授,博士生导师,主要从事公共政策与科技政策研究;
丁华(1975-),男,吉林省吉林市人,东北大学博士研究生,沈阳化工大学副教授,主要从事科技政策与科技管理研究。

摘要: 科技成果评价中的学术造假问题,从博弈论的角度看,其实就是科技工作者和评审专家之间的一场博弈。通过建立科技成果评价中学术造假问题的混合策略博弈模型,计算出博弈的混合纳什均衡解,并从评审专家的信息甄别成本、评审专家发现学术造假的奖励因子、科技工作者被发现造假后受到惩罚的概率及惩罚程度等方面对模型均衡解进行深入分析,结果发现提高惩罚的严厉性与确定性、提高评审专家的奖励因子和降低评审专家的信息甄别成本能有效抑制科技成果评价中的学术造假问题。

关键词: 科技成果评价学术造假混合策略博弈

Mixed-strategy Game Analysis of Academic Fraud in Sci-tech Achievement Evaluation

SUN Ping¹, DING Hua^1,2

1. School of Humanities & Law, Northeastern University, Shenyang 110819, China;
2. Academic Affairs Office, Shenyang University of Chemical Technology, Shenyang 110142, China

Abstract: From the perspective of game theory, academic fraud in the evaluation of scientific and technological achievements is in fact a game between sci-tech staff and evaluation experts. By establishing the mixed-strategy game model of academic fraud in sci-tech achievement evaluation, the mixed Nash equilibrium solution was calculated, and the equilibrium solution based on such aspects as evaluation experts’ information screening cost, evaluation experts' reward for discovering academic fraud, and the penalty probability as well as punishment degree was analyzed thoroughly. The results indicated that improving the severity and certainty of punishment, increasing evaluation experts' reward, and reducing evaluation experts' information screening cost could effectively inhibit academic fraud in sci-tech academic evaluation.

Key words: sci-tech achievement evaluation academic fraud mixed-strategy game

“重数量轻质量、重形式轻内容”是现阶段我国科技成果评价的主要特点,这种评价方式虽然对调动科技工作者的工作积极性具有一定的作用,但却很容易诱发科技工作者的浮躁情绪,使他们无法沉下心来做踏实深入的研究,学术造假和学术腐败也因此而产生^[1]。

虽然社会各界普遍遣责学术造假和学术腐败问题,但该问题却屡禁不止,反而有愈演愈烈之势,说明仅靠道德谴责并不能从根本上解决该问题。从博弈论的视角来看,学术造假可以被视为一种特殊的“经济活动”,是科技工作者在特定情境中多重利益考量下利益博弈选择的结果^[2]。因此,本文尝试利用混合策略博弈理论对科技成果评价中的学术造假问题进行分析,并对如何抑制科技成果评价中的学术造假问题提出对策。

一、科技成果评价中学术造假问题博弈模型构建

假设博弈参与人是科技工作者和评审专家,科技工作者有真或假两个战略选择,概率分别为p和(1-p);评审专家有发现造假行为和不发现造假行为两个战略选择,概率分别为q和(1-q);m为科技工作者不造假时的收益;n为评审专家的正常报酬;M为科技工作者造假且不被发现时的收益;c为评审专家的信息甄别成本。假设科技工作者造假且评审专家认真,评审专家发现科技工作者造假行为后,科技工作者受到惩罚的概率为β,不受惩罚的概率为(1-β),科技工作者受到的惩罚为x,评审专家发现造假得到的奖励为θx,其中θ为奖励因子,对评审专家的奖励一般情况下小于对科技工作者造假的惩罚,因此θ的取值范围一般情况下在0和1之间,但也不排除θ>1的情况,形成如表 1所示的科技工作者与评审专家的混合策略博弈矩阵。

表 1 科技工作者与评审专家的混合策略博弈矩阵

科技工作者的预期总收益为E₁,则

$\begin{align} & {{E}_{1}}=pqm+p\left( 1-q \right)m+\left( 1-p \right)q\beta \left( -x \right)+ \\ & \left( 1-p \right)q\left( 1-\beta \right)M+\left( 1-p \right)\left( 1-q \right)M= \\ & \left[ \left( \beta M\text{ }+\beta x \right)q+m-M \right]p- \\ & \left( \beta M\text{ }+\beta x \right)q+M\text{ } \\ \end{align}$

(1)

因为科技工作者所能选择的变量只能是p,所以当(βM +βx)q+m-M=0时,科技工作者的战略p为[0, 1],即科技工作者选择从0到1之间的任何概率收益都相同,此时q为:

$q=\frac{M-m}{\left( M+x \right)\beta }$

(2)

于是:

$p=\left\{ \begin{matrix} 1 & q>\frac{M-m}{\left( M+x \right)\beta } \\ \left[ 0,\text{ }1 \right] & q=\frac{M-m}{\left( M+x \right)\beta } \\ 0 & q<\frac{M-m}{\left( M+x \right)\beta } \\ \end{matrix} \right.\text{ }$

(3)

评审专家的预期总收益为E₂,则

$\begin{align} & {{E}_{2}}=pq\left( n-c \right)+p\left( 1-q \right)n+ \\ & \left( 1-p \right)q\beta \left( \theta x+n-c \right)+ \\ & \left( 1-p \right)q\left( 1-\beta \right)\left( n-c \right)+ \\ & \text{ }\left( 1-p \right)\left( 1-q \right)n= \\ & \left[ \left( -\beta \theta x \right)p+\beta \theta x-c \right]q+n \\ \end{align}$

(4)

因为评审专家所能选择的变量只能是q,所以当(-βθx)p+βθx-c=0时,评审专家的战略q为[0, 1],即评审专家选择从0到1之间的任何概率收益都相同,此时p为:

$p=\frac{\beta \theta x-c}{\beta \theta x}=1-\frac{c}{\beta \theta x}$

(5)

于是:

$q=\left\{ \begin{matrix} 1 & p<1-\frac{c}{\beta \theta x} \\ \left[ 0,\text{ }1 \right] & p=1-\frac{c}{\beta \theta x} \\ 0 & p>1-\frac{c}{\beta \theta x} \\ \end{matrix} \right.\text{ }$

(6)

由此可得到此博弈的混合纳什均衡为:

$\left( {{p}^{*}},{{q}^{*}} \right)=\left( 1-\frac{c}{\beta \theta x},\frac{M-m}{\left( M+x \right)\beta } \right)$

(7)

式(7)中,p^*,q^*分别为科技工作者不造假的概率和评审专家发现造假行为的概率。在该均衡处,科技工作者和评审专家都不愿意偏离均衡结果,任何一方偏离这个均衡都会使自己处于不利地位。

二、科技成果评价中学术造假混合策略博弈的影响因素分析

通过表 1可知,影响博弈矩阵的因素有7个,分别是评审专家的信息甄别成本c、评审专家正常报酬n、评审专家发现学术造假的奖励因子θ、科技工作者不造假时的收益m、科技工作者造假且不被发现时的收益M、科技工作者被发现造假后受到惩罚的概率β,以及科技工作者受到的惩罚x。其中科技工作者不造假时的收益m,评审专家的正常报酬n,科技工作者造假且不被发现时的收益M三个因素为常数,下面只讨论其余4个因素β、x、θ、c对博弈均衡的影响。

1. 惩罚的确定性β和惩罚的严厉性x对科技工作者造假行为的影响

由前面的博弈均衡结果可知,

${{p}^{*}}=1-\frac{c}{\beta \theta x}$

(8)

p^*与评审专家的信息甄别成本c、科技工作者被发现造假后受到惩罚的概率β(即惩罚的确定性)、科技工作者被发现造假后受到的惩罚x(即惩罚的严厉性)及评审专家发现造假后得到的奖励因子θ有关。在这4个因素中,属于政府可以控制的内生变量有3个,即β、θ、x。由于p^*是科技工作者不造假的概率,所以βθx≥c,βθx越大,p^*越大,如果βθx=c,p^*=0,即科技工作者会完全造假,其中θ是与评审专家利益相关的一个大于0的常数。

惩罚的严厉性x与惩罚的确定性β形成一个威慑组合(x,β),这个威慑组合形成等威慑曲线L₁,如图 1所示。

图 1 惩罚严厉性与确定性的等威慑曲线组合

在图 1中,位于等威慑曲线L₁上的任意一点,满足βx等于常数a,β与x成反比关系。此时,${{p}_{1}}^{*}=1-\frac{c}{\theta a}$,这说明在这条等威慑曲线上任意一点科技工作者的战略选择p₁^*和预期总收益E₁都不变,即在曲线L₁上,(x,β)的任意变化不影响科技工作者造假的概率,由此可以得出,等威慑曲线上惩罚的确定性β和惩罚的严厉性x之间具有可替换性。

曲线L₁既是一条等威慑曲线,也是科技工作者的等收益曲线。将均衡结果代入科技工作者和评审专家的预期总收益E₁、E₂中,可得到E₁=m,E₂=n。m为科技工作者不造假时的收益。在均衡情况下,科技工作者的预期总收益不会超过m,因为科技工作者通过造假获得的收益会被造假受到的惩罚所抵消。

当惩罚严厉性和确定性都增加时,会导致βx等于常数b。此时,${{p}_{2}}^{*}=1-\frac{c}{\theta b}$,由于b>a,可得出,p₂^*> p₁^*。

等威慑曲线向右上方移动时,形成一条新的等威慑曲线L₂。在等威慑曲线L₂上任意一点的威慑组合,威慑力都比等威慑曲线L₁上的组合大,更高的等威慑线L₂表示预期惩罚成本的增加,预期惩罚成本上升时,造假数量减少。更高的等威慑线导致较低的造假率,故L₁线上的惩罚确定性和惩罚严厉程度的组合所威慑的犯罪总数小于L₂等威慑线的数量。图 1中的箭头表示威慑能力加大的方向。L₁左下方是威慑能力减小的方向,但威慑能力不能无限减小,当威慑能力减小到图 1中虚线L₀的位置时,达到威慑能力的最下限。在L₀上的每一个威慑组合满足:

$\beta x=\frac{c}{\theta }$

(9)

此时,p₀^*=0,科技工作者造假的概率为100%。位于L₀左下方的阴影区域形成一个等威慑面,在该区域,任意威慑组合的威慑效果都相同,即造假都是100%。

虽然等威慑曲线上任意预期惩罚确定性和严厉性组合所达到的威慑犯罪的效果相同,但不同的组合所需花费的成本却并不相同,图中A点表示高惩罚确定性和低惩罚严厉性的组合,B点表示低惩罚确定性和高惩罚严厉性的组合。虽然A点与B点威慑效果相同,但B点处,政府付出的成本明显低于A点。因为,从被发现存在造假行为到最后被惩罚,这中间还有很长的距离,信息搜集、调查取证、司法程序等都需要政府花费很大的成本支出。以惩罚严厉性x的增加换取惩罚确定性β的减少可以有效降低政府的成本。所以,B点的威慑组合优于A点的威慑组合。

2. 评审专家发现造假后得到的奖励因子θ对均衡结果的影响

在式(8)中,当$\frac{c}{\beta x}$为常数时,θ越大,p^*越大,由0≤p^*≤1可得(p^*,θ)的函数关系如下:

${{p}^{*}}=\left\{ \begin{matrix} 1-\frac{c}{\beta x\theta } & \theta \in \left[ \frac{c}{\beta x},\infty \right) \\ 0 & \theta \in \left[ 0,\frac{c}{\beta x} \right) \\ \end{matrix} \right.\text{ }$

(10)

绘制出函数曲线,如图 2所示,该函数曲线L是一个分段函数曲线,在A点右侧随着θ的增加,曲线L逐渐趋向于水平渐近线1,即θ作为评审专家发现造假行为的奖励因子,是政府支付给评审专家正常报酬n之外的奖金,增加这个奖金,可以有效遏制造假行为的产生,当θ趋于无穷大时,造假的概率趋于0。

图 2 给评审专家的奖励因子对均衡结果的影响

3. 评审专家的信息甄别成本c对均衡结果的影响

在式(8)中,当βθx都为常数时,c越小,p^*越大。由0≤p^*≤1,可得到(p^*,c)的函数关系如下:

${{p}^{*}}=\left\{ \begin{matrix} 1-\frac{c}{\beta \theta x} & c\in \left[ 0,\beta \theta x \right) \\ 0 & c\in [\beta \theta x,\infty ) \\ \end{matrix} \right.\text{ }$

(11)

绘制出函数曲线,如图 3所示,该函数曲线L也是一个分段函数曲线,在A点左侧随着c的增加,是一条下降的直线,也就是说随着评审专家信息甄别成本c的增加,科技工作者的造假概率((1-p)^*)会直线上升,当c达到A点时,科技工作者造假的概率为100%。在A点右侧,随着c的继续增加,函数曲线L是与横轴重合的直线,科技工作者造假的概率都是100%。临界点A(βθx,0)的含义是评审专家的信息甄别成本与政府给予评审专家的奖励正好相互抵消,在政府支付的奖金βθx不变的情况下,要想抑制学术造假行为,只能降低评审专家的信息甄别成本。

图 3 信息甄别成本对均衡结果的影响

三、科技成果评价中学术造假问题的解决对策

由前面的分析可知,学术造假问题与惩罚的确定性、惩罚的严厉性、评审专家的信息甄别成本和评审专家发现造假后得到的奖励因子有关,因此治理科技成果评价中的学术造假问题必须从这几个方面入手,使学术造假成为科技工作者的非理性选择,使揭露学术造假成为评审专家的理性选择。

1. 对学术造假行为给予严厉的惩罚

由图 1等威慑曲线分析可知,增加对科技工作者造假行为的预期惩罚成本,即增加惩罚的确定性和严厉性可以有效降低造假行为的出现。从惩罚的效果来看,惩罚的严厉性与确定性具有可替代性;从实施成本角度看,高惩罚严厉性与低惩罚确定性组合要比低惩罚严厉性与高惩罚确定性组合成本更低。我国当前科技成果评价中学术造假问题层出不穷,究其原因就在于我国对科技成果评价中的学术造假行为几乎没有任何惩罚,导致造假有利可图^［3]。目前政府对科技成果评价中造假问题的惩罚威慑水平几乎处于图 1中阴影区域靠近原点的位置,所以,增加对科技工作者造假行为的预期惩罚成本对解决科技成果评价中的造假问题还有很大的政策空间。增加惩罚的严厉性不仅要从经济和法律两个方面增加造假者的预期惩罚成本,还可以考虑建立设立学术诚信档案制度^[4],使学术造假的惩罚对科技工作者未来的职业生涯产生深远的影响,从而使那些精于算计的“理性经济人”感到预期惩罚成本太大而不敢越雷池一步。

2. 成立负责惩处学术造假行为的专门机构

仅仅增加对学术造假行为惩罚的严厉性并不能完全起到威慑和遏制学术造假行为的效果,因为,即使在理论上或法律上规定再严厉的惩罚措施,但是在现实中如果不能把这种惩罚真正实施开来,那么也是没有任何意义的。因此,必须在增加对学术造假惩罚严厉性的同时,增加对学术造假行为惩罚的必然性。为此有必要成立专门的机构,这个机构的职责就是负责调查和处置各类学术造假行为,同时规定该机构对学术造假处理实行公开监督制度,它要随时向社会公布违规者的姓名、单位、违规情节和处置决定^[5]。公开监督制度既确保学术造假者得到应有的惩处,也能起到监督监督者的作用,以此来增加惩罚的确定性。

3. 建立学术造假举报奖励制度

学术造假对诚实守信之优良社会风气的伤害和破坏力无疑是巨大的,但是它又不像普通的民事或刑事侵权行为那样,被侵害人为维护自己的权益会奋起反击。学术造假行为给社会带来的伤害由于没有直接的受害者及伤害的无形性,从而不会引起人们足够的重视,或者说,人们没有必要为了一件和自己切身利益并不那么直接相关的违法行为去“较真儿”,因为这么做是不经济的,这也是经济学上所说的“外部性”或者“搭便车”问题。要克服这种“外部性”,把对学术造假行为的抵制和惩罚落到实处,除了上面提到的成立负责惩处学术造假行为的专门机构以外,就是要引入社会监督机制,建立学术造假举报奖励制度,对那些勇于揭发学术造假和学术腐败的人给予奖励,此举既有助于增强对学术造假行为惩罚的确定性,又有助于降低查处学术造假行为的信息成本^[6]。

4. 降低评审专家的信息甄别成本

根据式(11),科技工作者的造假概率与评审专家的信息甄别成本成正比,现行科技成果评价中只要是能降低评审专家信息甄别成本的做法都会起到抑制学术造假行为的效果。按照这个思路分析,会发现依靠信息技术来发现学术造假将是降低信息甄别成本最有效的方式之一。信息检索技术使学术造假行为更容易被发现,从而能够有效降低评审专家的信息甄别成本。

“代表作制”也可以有效降低评审专家的信息甄别成本。“代表作制”是指对一至几个可以代表评价对象最高水平或最能体现评价对象风格和行为风范的科技成果进行评价的相关规则。英国的大学科研评价体系(the research assessment exercise)采用的就是这种做法^[7]。由于其数量要求是所有科技成果中的一小部分,所以此法不仅对遏制当前科技成果评价中过分数量化有明显作用,更重要的是将相当一部分信息甄别成本转移给被评价者,由被评价者首先在自己众多的科技成果中筛选出最能代表其科研水平的成果,从而省却了评审专家的信息甄别成本。

5. 提高对评审专家发现学术造假行为的奖励

在均衡情况下,评审专家的预期总收益不会超过评审专家的正常报酬n,因为评审专家通过发现造假行为获得的奖励会被评审专家本身的信息甄别成本所抵消,更何况当前科技成果评价中对评审专家发现造假行为根本没有给予奖励的明确规定,而评审专家的信息甄别成本却依然存在,所以评审专家没有动力去揭露科技造假行为,这也是目前科技成果鉴定会、评奖会流于形式的重要原因。很多人将评审专家的敷衍了事归于评审专家个人的道德问题,实际上是制度设计上存在缺陷。要想打击和杜绝科技成果评价中的学术造假问题,就必须对评审专家识别和揭露学术造假问题的行为给予充分的激励,必要的时候还应在查处学术造假时实行“连带责任制”,对学术造假行为涉及到的评审专家追究连带责任,从而有效解决评审专家揭露学术造假动力不足的问题。

参考文献

[1]	张萌物, 薛斌. 我国高校教师科研评价研究综述[J]. 西安石油大学学报(社会科学版),2012, 21 (6) : 94 –99. (0)
[2]	徐小龙. 基于经济理性的学术造假治理探析[J]. 社会科学管理与评论,2008 (2) : 14 –17. (0)
[3]	屈燕妮. 学术不端行为及其监管的博弈分析[J]. 经济论坛,2011 (6) : 160 –163. (0)
[4]	张保伟. 科研不端行为治理的博弈论思考[J]. 科技管理研究,2009 (11) : 447 –449. (0)
[5]	叶素文, 张朝阳. 学术不良行为的风险博弈分析及制度对策[J]. 浙江万里学院学报,2005, 18 (2) : 90 –93. (0)
[6]	张建华. 学术腐败研究综述及经济学分析[J]. 北京社会科学,2006 (3) : 105 –109. (0)
[7]	杜德斌, 张仁开, 李鹏飞. 英国大学REF评估制度及其启示[J]. 中国高校科技,2014 (3) : 36 –38. (0)