陈海贝:动态惩罚机制下智库行为及其监管策略的演化博弈分析论文

陈海贝:动态惩罚机制下智库行为及其监管策略的演化博弈分析论文

摘 要:智库服务政府决策,有利于完善我国决策咨询制度,推动国家治理体系和治理能力现代化.为了得到及时、准确、全面的信息,政府有必要对智库进行监管.在动态惩罚机制下,构建政府和智库的行为演化博弈模型,探讨智库行为和政府监管策略的演化情况.仿真结果表明,智库的危机意识更强,责任意识更明显,故偏向于采取积极、自律的行为;政府的监管意识也随之增强,且能够根据智库的行为活动灵活选择监管策略.关键词:智库;动态惩罚;演化博弈

0 引言

2012年的中央经济工作会议上,习近平指出:要健全决策咨询机制,按照服务决策、适度超前的原则,建设高质量智库.智库服务政府决策,有利于完善我国决策咨询制度,推动国家治理体系和治理能力现代化.

Mcgann根据智库的主要性质将智库划分为:自主独立型智库、半独立型智库、政府智库、半政府型智库、大学附属智库、政党智库及营利型企业智库[1].不同智库研究的领域不同,有的研究单一的政治、经济或环境等领域,有的则涉及各个领域,有的研究国外政策,有的研究国内策略等.无论哪一种智库,其存在的意义都是为政府、为国家服务.政府缺乏专业人才、缺乏实战经验、缺乏创造性以及涉及到的利益群体较多,过多的干扰因素使得政府自身无法在短时间内完成一些具有突破性、远瞻性的项目.而智库的出现可谓解救政府于水火之中,利益网络关系简单清晰的智库可以快速、高效地完成政府委托的任务.因此,政府和智库之间的协同合作已经成为一种必然的选择.在政府的委托下,资源充足、经验丰富的智库可以进行实地考察,形成报告,为政府提供实质性的建议.故智库成为政府的“理性外脑”和“点子工厂”[2].

然而,在政府和智库的互动过程中,政府和智库之间的信息不对称以及智库的责任意识、使命意识较淡使得双方的委托关系名存实亡.这种参与程度、主体地位和角色担当的明显差异降低智库的效率和研究的质量,而智库提交信息的范围、数量、质量等都将直接影响到政府决策制定的效果[3].因此,政府有必要改善监管策略,采取积极有效的激励措施来提高智库的工作效率以及研究质量.在智库激励方面,武慧娟等[4]提出可以从决策需求、协同合作和制度创新3个方面对智库作出制约;王文[5]认为要注重文化创新,充分尊重研究人员的成果;唐平秋等[6]提出智库激励的根本在人才,而人才的激励需要研究环境、研究成果、绩效考核多方面的改进;杜鹏等[7]指出要重视智库人员的付出,优化考核制度.已有的智库激励研究多是关注智库内部因素,从智库人员的利益、智库环境的改善、智库机制的提升等方面考虑,进而提高智库的综合质量.然而,绩效考核、人员晋升、科研氛围等内部因素带来的影响是暂时的,也是有限制的.所以,现有的激励手段只能让智库在短期内保持高效率,长期来看效果甚微.此外,已有的激励模型多从奖励的角度,赋予智库直接或间接的利益,以此来约束智库的行为.故本文以政府和智库的委托关系为依托,通过外部激励来探讨其对智库行为的影响.

本文拟从惩罚的角度来监督和规范智库的行为,惩罚机制已被应用于很多领域,如:张会平等[8]针对网络谣言识别行为,构建惩罚机制下的结构方程模型,指出惩罚机制对网民分辨信息的能力有一定的影响;付秋芳等[9]针对供应链企业的碳减排投入策略,建立演化博弈模型,指出惩罚机制可以降低“搭便车”行为的概率;包兴[10]针对突发事件中的应急能力,构建惩罚援助机制模型,指出管理者决策行为的重要性;王小杨等[11]针对产学研合作行为,构建基于各方收益下的惩罚机制,提出惩罚机制可以提高合作绩效和控制突变等;刘舰等[12]针对公路、铁路运输企业的行为,提出第三方惩罚可以约束企业的行为;郑延斌等[13]针对多智能系统的协作问题,引入惩罚机制,发现该方法能有效提高协作效率和协作稳定性;徐士琴等[14]针对供应链网络,构建惩罚机制模型,发现在政府的预期回收率较低的情况下,惩罚机制的效果较明显.已有研究表明惩罚机制产生的激励效果明显且应用领域较广泛,但现有的惩罚机制多从静态视角来探讨问题,即研究主体行为的不自律程度不会影响最终的惩罚结果.故静态惩罚机制没有考虑到实际情况中的主体行为对最终结果造成的影响,激励的效果没能达到最佳.因此,本文拟从动态惩罚机制的视角,来探讨政府对智库不正当行为的惩罚力度,以达到最佳的激励效果.

1 模型构建

1.1 问题描述

在政府和智库的合作进程中,智库是思想产品的生产者,政府是产品的需求者、消费者和监管者等.政府既是任务的发布方,又是规则的制定者.政府可以采取合适的策略来监督智库的行为,以保证研究过程的合法性、研究成果的高质量和研究进度的快速性等.但监管需要付出高额的成本代价,并且监管能力有所限制,故多数情况下,政府的监管策略实施不到位,从而造成智库的消极、投机行为.为了更好地约束智库的行为,政府拟根据智库每一阶段的行为及成果来对其进行动态惩罚,以减少智库的消极行为.

1.2 变量及参数设置

H4:根据威慑理论,政府惩罚的确定性、严厉性和敏捷性对智库的行为有一定影响.

S:监管机构(政府);

T1:智库采取的“自律”策略集合;

在自然条件下,风速具有波动性和间歇性,而风速与风功率直接相关,因此风功率也存在较大的不确定性和随机性。当前,在众多文献的研究中,采取的策略是将风电当作一种“负的负荷”与实际负荷形成“等效负荷”进行处理,因此等效负荷具有较大的波动性,系统为应对这种波动性的影响,需要增加备用容量以消纳风电、平衡波动[1-5]。

T2:智库采取的“不自律”策略集合;

S1:监管机构采取的“积极监管”策略集合;S2:监管机构采取的“消极监管”策略集合;

根据现有资料分析,研究区具有良好的成矿条件和成矿环境,找矿条件较好,如果善于对矿区进行深入的研究,总结矿区的控矿因素、成矿机制、找矿标志等,以正确的找矿思路指导下一步工作,因地制宜采用合理的工作方法,扎扎实实地进行地质勘查工作,该区找矿工作必将取得重大突破。

综上所述,加味桂枝茯苓丸在促进急性脑梗死患者功能恢复中具有明显疗效,且未发现明显副作用,具有临床推广意义。

x:智库选择“自律”行为的概率(0≤x≤1);

比如《变色龙》一课介绍变色龙外形,作者是怎么写清楚的呢?我把原文中的修饰性词语去掉,把长句子变成短句子,让学生辨析压缩后的句段与原文的区别。当学生说出“去掉修饰性词语后句子不具体了”,说明他们明白了句子写具体要有修饰性词语。但是原文的写作密码还没有完全破解——作者是如何写具体的呢?接下来引导学生分析压缩掉的那些修饰词语:“椭圆形”“三角形”“长筒状”是写形状的;“翠绿”是描写颜色的;“凸起”“隆起”“尖细”“短脚”是描摹形象的;“四只”是写数量的;“酷似龟背”是运用了比较的方法……

1-x:智库选择“不自律”行为的概率;

y:政府选择“积极监管”策略的概率(0≤y≤1);

1-y:政府选择“消极监管”策略的概率;

W1:智库采取“自律”行为时获得的收益(W1>0);

W2:智库采取“不自律”行为时获得的收益(W2>0且W2>W1);

ΔW:智库采取“不自律”行为时获得的超额收益,其中ΔW=W2-W1;

L1:智库采取“自律”行为时付出的成本(人工成本、时间成本、设备成本、考察成本等)(L1>0);

L2:智库采取“不自律”行为时付出的成本(L2>0且L2<L1);

ΔL:智库采取“不自律”行为时少付出的成本,其中ΔL=L1-L2;

C1:政府进行“积极监管”时付出的成本(设施成本、设备成本、信息成本、人工成本等)(C1>0);C2:政府进行“消极监管”时付出的成本(C2>0且C2<C1);

R:智库采取“不自律”行为时,政府进行“消极监管”时的损失;

V:静态惩罚机制下,政府采取“积极监管”策略时,对智库的“不自律”行为收取的罚金;动态惩罚机制下,政府采取“积极监管”策略时,对智库的“不自律”行为收取的罚金;

Ex:智库采取“自律”行为时获得收益的期望值;

以减少信息交互量为出发点,文献[10]基于信噪比阈值建立离散反馈的Q学习博弈模型.文献[11]综合考虑信道编码与干扰,针对MIMO系统提出了随机学习的信道分配算法.文献[12]基于用户需求建立随机博弈模型进行信道选择.几种算法进一步简化了问题求解难度,从不同角度提升网络性能.然而,上述学习模型均是基于用户干扰范围大小固定的假设,忽略了传输功率与用户干扰之间的内在联系,最终限制了频谱的使用效率.

E1-x:智库采取“不自律”行为时获得收益的期望值;

EˉT:智库的平均期望收益;

Ey:政府进行“积极监管”时获得收益的期望值;

E1-y:政府进行“消极监管”时获得收益的期望值;

科研经费管理方面,2016年6月中办、国办出台《关于进一步完善中央财政科研项目资金管理等政策的若干意见》(中办发[2016]50号)(以下简称《意见》),提出不限制科研劳务费比例,提高科研人员绩效支出比例;简化预算编制,下放预算调节权等旨在激发高校科研人员积极性的举措。9月,陕西省科技厅出台《陕西省促进科技成果转化若干规定》,明确提高高校科研人员科技成果转化收益比例、缓缴科研人员成果转化收益的个人所得税等九条“硬措施”。一系列“松绑+激励”的新政策,明确下放预算调剂权限、加大绩效激励力度、不设劳务费比例限制等更加灵活的科研经费管理模式,进一步激发高校科研人员积极性。

EˉS:政府的平均期望收益.

1.3 相关假设

H1:模型中的参与主体是智库和政府;

①若ΔW+ΔL-Vy>0,恒有,此时.故x=0是演化稳定策略,此时智库选择的是“不自律”策略.

英格曼神甫说:“还有坏下去的余地吗?”他绝不会放这群穿黄军服的疯狗们从正门进来。让他们从正门进来,就把他们抬举成人类了。

T:智库;

1.4 模型构建

根据参数设置和相关假设可得静态惩罚机制下智库和政府的收益博弈,见表1.

表1 静态惩罚机制下智库和政府的收益博弈

智库(政府)自律不自律W1-L1,-C1(积极监管( )W1-L1,-C2(消极监管( )W2-L2-V,V-C1)W2-L2,-R-C2)

1)当智库采取“自律”和“不自律”行为时,获得的期望收益分别为:

近年来,随着欧洲空间数据基础设施(ESDI)等重大工作计划的开展,CEN标准的重要性和权威性越来越突显,促使CEN/TC 287开展了大量的地理信息标准工作,许多CEN文件因领先于ISO,被作为ISO标准草案使用,最后发展为ISO标准。CEN/TC 287现行的地理信息标准见表3。

智库的平均期望收益为:

则智库的演化博弈复制动态方程为:

2)当政府采取“积极监管”和“消极监管”策略时,获得的期望收益分别为:

政府的平均期望收益为:

则政府的演化博弈复制动态方程为:

综上,可以得到该模型动态系统的总复制动态方程组为:

2 静态惩罚机制下智库行为及其监管策略的演化博弈分析

1)对(4)式进行一阶分析:

H2:智库和政府在博弈的过程中存在诸多不确定的因素,故考虑智库和监管机构是有限理性的;

将代入复制动态方程组(9),则得到新的复制动态方程组:

①若,恒 有 ,此时有.故y=0是演化稳定策略,此时政府采取的是“消极监管”策略.

②若,恒 有,此时有.故y=1是演化稳定策略,此时政府采取的是“积极监管”策略.

同理,可求得动态惩罚机制下均衡点的稳定性,详见表6.

通过上述分析可知,智库策略和政府策略组成的动态演化系统的平衡点有

3)令当且仅当0≤x≤1,0≤y≤1时,(x,y)也是该动态演0000化系统的均衡点.

综合上述分析,智库和政府策略构成的动态演化系统共有5个均衡点,分别为(0,0)、(0,1)、(1,0)、(1,1)、

4)动态演化系统的雅可比矩阵为:

其中:

当均衡点满足时,均衡点为演化动态过程中的局部渐进稳定不动点,此时均衡点对应演化稳定策略.对已有的均衡点进行稳定性分析,分析过程和分析结果见表2、表3和表4.

患儿治疗前后的睡眠打鼾评分和症状评分对比有统计学意义,P<0.05,见表1;对术后发生憋气和打鼾的患儿进行分析,发现影响手术治疗效果的因素主要有肥胖(5例)、变应性鼻炎(4例)、慢性扁桃体发炎复发(3例)、鼻咽粘连(3例)。

表2 动态系统的平衡点分析(1)

tr()J平衡点( )0,0( )-( )0,1( )1,1( )1,0( )x0,y0ΔW+ΔL+C1-C2-V-R C1-C2-R-ΔW-ΔLΔW+ΔL-C1+C2ΔW+ΔL-V+C1-C20

表3 动态系统的平衡点分析(2)

平衡点( )0,0 det()J( )ΔW+ΔL( )C1-C2-V-R( )0,1-( )ΔW+ΔL-V( )C1-C2-V-R( )1,0-( )ΔW+ΔL( )C1-C2[1,1]( )( )ΔW+ΔL( )C1-C2x0,y0V( )C1-C2-V-R( )C1-C2( )ΔW+ΔL-V V2( )V+RΔW+ΔL( )

根据表2和表3可分析出均衡点的稳定性结果,见表4.

表4 均衡点的稳定性

均衡点( )tr()Jdet()J 0,0( )不确定-0,1( )1,1( )1,0( )x0,y0不确定不确定不确定不确定0-++结论鞍点-鞍点-中心点

根据表4,该动态演化模型在静态惩罚机制下有两个鞍点和一个中心点,其中鞍点分别是(0,0)、(0,1),,中心点是

3 动态惩罚机制下智库行为及其与政府间博弈的演化稳定性分析

3.1 动态惩罚机制策略分析

所谓动态惩罚机制指的是针对智库的“不自律”行为,政府视其行为的具体情况来决定惩罚的力度,不同于静态惩罚机制下的固定惩罚值.假设政府的惩罚力度与智库的“不自律”行为呈正比例关系,则设定,此时双方的博弈较静态惩罚机制下的博弈有了一些变化,详见表5.

表5 动态惩罚机制下智库和政府的收益博弈

政府(智库)自律不自律积极监管( )W1-L1,-C1消极监管( )W1-L1,-C2(W2-L2-V()x,C-C1)(W2-L2,-R-C2)

②若ΔW+ΔL-Vy<0,恒有,此时.故x=1是演化稳定策略,此时智库选择的是“自律”策略.2)对(8)式进行一阶分析:

1) 对整个淮海经济区而言,全区的国内旅游收入与建成区绿化覆盖率和人均公园绿地面积的回归系数分别为0.708 8和2.548 6,表明建成区绿化覆盖率和人均公园绿地面积每变动1%,分别带动国内旅游收入同向变动0.708 8%和2.548 6%.可见,城市绿化建设对旅游经济的增长存在拉动作用,同时人均公园绿地面积对旅游经济的影响要远高于建成区绿化覆盖率.

此时系统的5个均衡点分别为

根据复制动态方程组(13)可得此时动态系统的雅可比矩阵为:

其中:

由于车站与区间隧道结构修补难度极大,一旦被腐蚀将造成较严重的后果,因此不能将车站与区间隧道钢筋作为排流网。

H3:在模型中考虑智库可能采取“自律”和“不自律”两种策略,政府可能采取“积极监管”和“消极监管”两种策略;

表6 均衡点的稳定性

均衡点( )tr()J′det()J′0,0( )-0,1( )不确定不确定不确定不确定1,1( )1,0( )x0,y0+0-++结论鞍点-鞍点-中心点

根据表6,该演化模型在动态惩罚机制下有两个鞍点和一个中心点,其中鞍点分别是(0,0)、(1,0),中心点是

3.2 动态惩罚机制下的博弈过程均衡点分析

由上述分析可知,(x0,y0)是该动态演化系统的稳定均衡点,将组成方程组.

求解方程组15得:

对x*进行一阶分析,可得:.当智库采取“不自律”行为时,政府采取“消极监管”策略时的损失越大,那么政府就会加大监管力度,智库采取“自律”行为的概率就会增加;当智

1)对x*进行一阶分析.

对y*进行一阶分析,可得:当智库采取“不自律”行为获得的收益比其采取“自律”行为获得的收益多时,智库就会倾向于采取“不自律”行为,那么政府为了确保最终的研究质量,进行“积极监管”的概率就会增加.当智库采取“自律”行为付出的代价比其采取“不自律”行为付出的代价高时,智库依然会倾向于采取“不自律”行为,那么政府就会对其加强监管.当智库采取“不自律”行为,政府采取“积极监管”策略时,政府对智库的惩罚程度越大,智库就会倾向于采取“自律”行为,此时政府进行“消极监管”的概率就会增加.当政府进行“积极监管”时付出的代价较大时,政府就会更加注重监管的效果,其“积极监管”的概率就会提高.当政府采取“消极监管”策略时付出的代价较大时,就会转换监管策略,进而导致“积极监管”策略的概率增加.库采取“不自律”行为,政府采取“积极监管”策略时,政府对智库的惩罚程度越大,损害智库的利益,智库就会消极怠工,采取“消极”行为的概率就会增加.当政府进行“积极监管”时的成本增加时,政府就会加大监管力度,严惩不贷,此时智库采取“积极”行为的概率就会增加;当政府进行“消极监管”时的成本增加时,政府就会转换策略,对智库进行“积极监管”,从而导致智库采取“积极”行为的概率增加.

在内阁首辅中,加官低于正二品的只有正统年间的曹鼐和天顺年间的许彬,都是以侍郎衔入阁。以翰林学士衔成为首辅的有正统年间的曹鼐、陈循,天顺年间的徐有贞、许彬、李贤,成化年间的陈文、商辂。后来,除曹鼐、许彬之外的人在任首辅期间都提升为大学士。以后,内阁首辅加官为正二品及以上,本官为殿阁大学士,这标志着阁臣地位的提升。

2)对y*进行一阶分析

4 仿真分析

4.1 智库和政府策略的演化

图1静态惩罚机制下智库和政府策略的演化

图2动态惩罚机制下智库和政府策略的演化

静态惩罚机制下,智库采取“自律”行为的概率低于采取“不自律”行为的概率,即智库的自律性较低;动态惩罚机制下,智库采取“自律”行为的概率高于采取“不自律”行为的概率,即智库的自律性较高.可见,动态惩罚机制优于静态惩罚机制.当政府采取动态惩罚手段时,智库会更加关注自身的行为,受到的制约作用更加明显.

静态惩罚机制下,政府既可能采取“积极监管”的策略,也可能采取“消极监管”的策略;动态惩罚机制下,政府采取“消极监管”策略的概率明显偏低.可见,动态惩罚机制不仅影响智库的行为,也在一定程度上影响政府的行为.故动态惩罚机制对政府和智库双方都有制约作用,能够全面提升双方的合作质量.

4.2 系统稳定性及混合策略分析

图3 静态惩罚机制下系统稳定性分析

图4 动态惩罚机制下系统稳定性分析

从图3可以看出:(1)当x的取值范围是(0,0.17)时,y的取值范围是(0.5,1).即当智库采取“不自律”行为的概率较大时,政府会偏向于采取“积极监管”的策略.也可以看到,同一个x值对应着两个不同的y值,说明虽然政府采取的是“积极监管”的策略,但政府监管的力度是可调节的.根据智库具体的行为情况,政府会相应地采取不同的措施.(2)当x的取值范围是(0.5,0.78)时,y的取值范围是(0,0.14).说明当智库采取“自律”行为的概率较大时,政府则会倾向于采取“消极监管”的策略,以降低监管的成本.

从图4可以看出:(1)当x的取值范围是(0,0.24)时,y的取值范围是(0,0.5)或(0.75,1).此时,同一个x值对应着两个不同的y值,说明智库在采取“不自律”行为时,政府会采取“积极监管”和“消极监管”两种策略.在某些情况下,智库的“不自律”行为对最终的成果影响较小,可忽略不计,此时政府不会增强监管的力度;如果智库的“不自律”行为会影响整个项目的质量,则政府会加大监管力度.(2)当x的取值范围是(0.5,0.68)时,y的取值范围是(0.93,1).此时智库采取“自律”行为的概率较大,但政府的监管力度也较大.说明在项目的关键环节,即使智库没有懈怠,政府也会采取“强监督”的手段.(3)当x的取值范围是(0.68,1)时,y的取值范围是(0,0.5).说明当智库长期采取“自律”行为时,就会赢得政府的信任,政府会降低监管力度,采取“消极监管”的策略.

5 结论

新时代,政府的责任日益增加,承担的任务日益增多.故政府迫切地希望智库可以有所为,又能有所不为.政府委托给智库的项目,大多关乎国家的政策方针,关系到人民的切身利益.但并非每个智库都能认识到国家所赋予的使命感、荣辱感和责任感,多数情况下智库的抉择关系着智库自身的利益.故政府采取一定的监督措施是非常有必要的.

通过政府与智库之间博弈模型的建立、分析、仿真等,发现动态惩罚机制比静态惩罚机制的效果更明显,主要体现在:(1)智库的危机意识得到提升,更加严格规范行为,保证成果的高质量、高效率;(2)政府的监督意识得到增强,积极监管,防患于未然;(3)智库和政府的收益明显增加,间接地激励双方的行为;(4)政府和智库之间的委托关系、合作关系进一步得到巩固、增强,有利于后期的合作交流;(5)高水平、高质量的成果不断推动社会的进步、国家的发展,造福于人民.

新时代,政府和智库之间的合作将会更加频繁.一流智库的打造需要借力于每一个卓越的项目和优异的成果.因此,智库不能仅仅依靠政府的强监督来约束行为,而是要有责任意识、自主意识、奋发意识,借助于政府给予的平台向人们展示中国智库的实力和潜力,向世界发出响亮的中国声音,发挥强劲有力的中国作用.

(1) 基于流体力学理论及宾汉流体本构方程,建立了倾斜裂隙注浆扩散理论模型,并推导了浆液扩散区内的黏度及压力时空分布方程。理论和数值分析表明,注浆压力和浆液压力最大误差均不超过10%,表明理论计算值与数值模拟结果吻合较好,进一步论证了理论模型的有效性。

参考文献:

[1]MCGANN J G.2015 global go to think tank index report[R].University Pennsylvania,2016.

[2]张新培,赵文华.研究型大学与高水平智库协同发展及启示[J].中国高教研究,2014(8):6-10.

[3]吴育良.国外智库决策信息支持研究及启示[J].图书馆理论与实践,2015(10):31-35.

[4]武慧娟,秦雯,孙鸿飞.激励视角下高校智库协同决策机制研究——以吉林省高校智库建设为例[J].现代情报,2017,37(3):8-12.

[5]王文.中国应培育浓厚的智库文化——兼谈对智库学者的激励机制[J].对外传播,2015(9):43-44.

[6]唐平秋,蒋晓飞.基于期望理论的高校智库研究人员激励:困境与对策[J].中国行政管理,2017(1):63-66.

[7]杜鹏,孔德岩,李玉明.统一战线智库人员的激励策略研究[J].福建质量管理,2015(8):219.

[8]张会平,郭昕昊,汤志伟.惩罚机制对网络谣言识别行为的影响研究[J].情报杂志,2016,35(12):47-51.

[9]付秋芳,忻莉燕,马士华.惩罚机制下供应链企业碳减排投入的演化博弈[J].管理科学学报,2016,19(4):56-70.

[10]包兴.过度自信行为影响下的应急决策偏差和惩罚援助机制研究[J].管理工程学报,2017,31(3):37-44.

[11]王小杨,张雷,杜晓荣.基于惩罚机制的产学研合作演化博弈分析[J].科技管理研究,2017,37(9):118-124.

[12]刘舰,李引珍.基于惩罚机制的公-铁联运企业行为的协调[J].中国管理科学,2016,24(4):167-176.

[13]郑延斌,段领玉,李波,等.基于演化博弈惩罚机制的多智能体协作稳定性研究[J].计算机工程与科学,2015,37(9):1682-1687.

[14]徐士琴,刘国山.政府奖励与惩罚机制下闭环供应链网络均衡的互补模型[J].数学的实践与认识,2012,42(16):87-102.

Evolutionary Game Analysis of Think Tank Behavior and Its Supervision Strategy under Dynamic Punishment Mechanism

CHEN Haibei,ZHUO Xiangzhi

(School of Management,Huaibei Normal University,235000,Huaibei,Anhui,China)

Abstract:The think tank serves the government′s decision-making,which is conducive to perfecting China′s decision-making consultation system and promoting the modernization of the national governance system and governance capacity.Timely,accurate and comprehensive information directly affects the quality of government decision-making,so it is necessary for the government to supervise think tanks.Under the dynamic penalty mechanism,this paper constructs a behavioral game evolution model of government and think tanks,and discusses the evolution of think tank behavior and government supervision strategies.The simulation results show that under the dynamic penalty mechanism,the think tank has a stronger sense of crisis and a more obvious sense of responsibility,so it tends to adopt positive and self-discipline behavior;the government′s regulatory awareness is also enhanced,and it can flexibly select regulatory strategy according to the behavior of the think tank.

Key words:think tank;dynamic punishment;evolutionary game

中图分类号:G 647

文献标识码:A

文章编号:2095-0691(2019)02-0060-09

收稿日期:2018-09-10

基金项目:国家社会科学基金项目(15BTQ048)

作者简介:陈海贝(1993— ),女,江苏泰州人,硕士生,研究方向为智库管理.

通信作者:卓翔芝(1970—),男,安徽灵璧人,教授,研究方向为信息资源管理.

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

陈海贝:动态惩罚机制下智库行为及其监管策略的演化博弈分析论文
下载Doc文档

猜你喜欢