李红艳:基于大数据挖掘的精准扶贫工作第三方评估——以武汉市为例论文

李红艳:基于大数据挖掘的精准扶贫工作第三方评估——以武汉市为例论文

摘 要 与目前主流以数量资料作为主要来源的精准扶贫第三方评估体系不同,根据大数据“第四范式”发现理论,提出了一个全新的基于互联网文本信息挖掘的第三方评估方法,给出了9步骤分析架构:建立基于文本的三级评估指标体系,利用爬虫技术从网上收集有关文本资料,结合分词技术和tf-idf统计方法,通过对评估指标所对应特征词的频度统计分析,得到评价得分,实现对精准扶贫工作评估;再结合社会网络分析原理,利用共现频率权重统计方法和可视化技术,对评估结果进行深入分析。以武汉市为例,实证发现武汉精准扶贫工作,无论是设计方面、实施方面、还是效果方面,都被高度重视,并取得了良好成效。下一步围绕激发贫困人口内生动力、打赢打好脱贫攻坚战,需要在提升精准扶贫工作质量上下功夫。

关键词精准扶贫;第三方评估;文本挖掘;社会网络分析

1 研究背景

党的十八大以来,在以习近平同志为核心的党中央坚强领导下,一场前所未有的精准扶贫攻坚战在全国范围全面打响。对精准扶贫开展评估,尤其是借助第三方开展评估,是精准扶贫工作的重要环节,既可以及时把握精准扶贫的进展,还可以有效发现问题,为各级政府今后的扶贫工作提供科学依据和建设性意见。2016年2月,中共中央办公厅、国务院办公厅印发《省级党委和政府扶贫开发工作成效考核办法》[1],要求有关的科研机构在国务院扶贫开发领导小组指导下,从2016年到2020年,针对精准扶贫工作成效,每年对其进行一次独立的第三方评估。2016年6月,中国科学院地理科学与资源研究所围绕精准识别与精准帮扶“两个方面,三项内容”(贫困人口识别准确率、贫困人口退出准确率和到村到户帮扶工作群众满意度评估三项总体指标),进行了首次全国精准扶贫绩效的第三方评估。从2016年以来,精准扶贫第三方评估引起了国内学术界的关注,评估内容涉及精准扶贫的绩效、工作、项目、政策等方面,主要研究可以分为三个方面:一是关于评估的理论依据,代表性的如惠梦倩(2017)[2]、孟志华和李晓冬(2017)[3]。二是关于评估的作用和评估制度构建,代表性的如祁中山(2017)[4]、闫妍(2018)[5]。三是关于具体评估方式和方法,代表性的如姜涛(2016)[6],对当前研究中常使用的四种较为典型的精准扶贫绩效评价方法,即因子分析法、回归分析、数据包络分析法(DEA)、评估指标体系法进行了比较分析;胡善平、杭琍(2017)[7]构建了包括资源投入、过程管理和绩效考核在内的精准扶贫绩效考核指标体系;朱晨源、李淼(2017)[8]基于河北省精准扶贫的实践,构建了基于扶贫项目投入、管理、产出和效果四个方面的过程评价绩效评估体系;田晋、熊哲欣、向华(2017)[9]确立了涵盖精准帮扶情况、精准脱贫情况、经济子系统、社会子系统、生态子系统和政治子系统等六个方面26个指标的评价体系;杨希(2017)[10]使用AHP的方法构建了递阶层次结构绩效评价模型,从经济发展、社会发展、生产生活、可持续性和效率五方面进行评价;陈爱雪、刘艳(2017)[11]构建了以精准识别、精准帮扶、经济社会发展、基础设施建设和减贫成效5个维度15个指标在内的精准扶贫绩效评价指标;王建兵和胡苗(2017)[12]以甘肃省东乡县毛沟村为例,从政策设计、实施和效果等三方面构建36个指标对精准扶贫政策实施绩效进行评估;黄海棠和李永坤(2018)[13]以三明国家扶贫改革试验区为例,结合贫困人口识别准确率、贫困人口退出准确率和到村到户帮扶工作群众满意度评估三项总体指标,多视角地评价扶贫开发工作成效。石晶(2018)[14]从政策落实精准性、教育扶贫完成度、基础设施建设完成度、大扶贫格局建构度、脱贫攻坚责任制建立等5个方面构建精准扶贫成效评价指标体系。总的来看,现有的评价方法主要基于传统统计思维和方法,已经有学者,代表性的如杜永红(2018)[15]认识到利用互联网、大数据等开展精准扶贫评估的作用和价值,但目前尚没有从理论和评价方法上对利用互联网和大数据开展精准扶贫进行研究,更无实际应用范例。

现在的祝国寺是1993年异地重建,距老祝国寺遗址8公里。经过20多年的发展,新祝国寺已形成五进五院的建筑群落,成为集佛教文化、园林艺术和休闲于一体的揽胜之地。

为了保证二期厂房及停车场的正常修建,在勘察的基础上进行有针对性地开展边坡治理工作十分必要且非常紧迫,并根据业主一致讨论,把整个边坡范围作为本次治理范围。

本研究的主要贡献在于构建基于互联网文本信息挖掘的精准扶贫工作第三方评估方法,以武汉市精准扶贫为例,根据文本挖掘原理,从相关网站抓取武汉精准扶贫有关文本,利用建立的基于文本评估指标体系①,开展评估指标所对应特征词的频度统计分析,得到评价结果。并利用社会网络分析方法,揭示评估指标所对应特征词之间及其与精准扶贫之间的关系,对精准扶贫工作进行深入分析,查找问题,提出对策建议。

本文以下分为四个部分:第二部分介绍研究使用的理论、分析架构和评价指标体系;第三部分,是利用文本挖掘和文本评价指标体系对武汉精准扶贫工作进行评估;第四部分利用社会网络分析方法对武汉精准扶贫工作进行分析,第五部分是结论。

2 使用理论和方法

2.1精准扶贫第三方评估理论

目前,理论界比较一致的看法是,委托—代理理论、综合评价理论和公共治理理论分别从契约制度建立、专业评估操作和治理体系构建三个角度为精准扶贫第三方评估提供了理论支撑[2-3]。这些理论都是工业化或者后工业化的发展产物,应该说它们从理论上对于精准扶贫第三方评估具有一定的指导意义,但不能回答如何实现精准评估。结合精准扶贫的当今时代背景——互联网、大数据、云计算、人工智能等新技术的广泛应用,本研究提出基于大数据的精准扶贫第三方评估理论——大数据发现理论。

心理过程是关于我们自身意识的世界经验,是表示感知的小句,该类过程建构的是事件流动中发生在我们自身意识上的系列变化。心理过程主要涉及两个参与者,一个为参与心理体验的人或者人格化的物,即“感受者”(Senser,此处为所有心理过程参与主体的总称)[13]。例如:

图灵奖得主吉姆·格雷(Jim Dray)将历史上的“科学研究范式”总结为三类,即“实验归纳”、“模型推演”和“仿真模拟”,并认为大数据时代科学研究应是“第四范式:数据密集型科学发现”。所谓大数据发现理论,就是将“第四范式”思想应用到精准扶贫第三方评估上,运用依托互联网的大数据,结合各种信息技术和评价方法,综合定性与定量分析,及时有效地发现精准扶贫工作中存在的问题和不足,强化评估的灵活性、针对性、时效性、准确性,实现精准评估。

随着社会经济的快速发展,人们的生活方式发生了改变,不良生活方式如嗜酒、高糖、高脂、高盐饮食和缺乏运动等越来越普遍,肥胖、糖尿病、代谢综合征和心血管疾病等已属高发疾病,而这些患者是代谢性高血压的高发人群。如今,代谢性高血压患者已成为高血压病患者的主体。代谢性高血压的治疗目标不应再是过去单纯的控制血压,而是在降压的同时改善糖脂代谢紊乱。胃肠道不仅是食物消化吸收的主要场所,而且是重要的分泌器官。胃肠激素的变化在代谢性高血压的调节中起着重要作用。因此,基于调节胃肠激素的治疗将是今后代谢性高血压治疗的新方向。

2.2分析架构

利用上述大数据发现理论,构建9个步骤的分析架构:

(1)寻找文本源。利用确定的搜索关键词,从网上搜索包含关键词的网站(网址),从中筛选出一些主要网站,并利用爬虫技术对这些网站上有关关键词的页面(文本)进行抓取,形成评估使用的文本源。

(2)建立分词集。利用文本分析,结合分词技术,对文本进行分词,并对同类词进行归并(也称指代消解)。

(8)将上述(5)—(7)进行结合,对精准扶贫工作进行深入分析,查找问题和短板。

(4)利用分词集,计算每个特征词的tf-idf权重值。

胃癌作为我国临床常见肿瘤之一,其发病率位居各类肿瘤的首位,死亡率也极高,调查显示腺癌占胃恶性肿瘤的95%,是最常见的消化道肿瘤[1]。而胃癌早期通常无症状或者症状较轻,未引起相应的重视而延误诊治,一旦发展为晚期的胃癌,将对患者的生命健康造成严重的威胁。目前临床对于晚期胃癌的治疗大多采用手术治疗或者化疗的方式,而术后化疗给患者带来的痛苦加剧了本身病痛的折磨,对患者的身心健康造成严重影响,容易出现焦虑等消极情绪,对疾病治疗具有负面的影响。本文选取我院于2015年3月至2017年1月收治的118例胃癌术后化疗患者作为研究对象,探究针对性护理对胃癌术后化疗患者焦虑的影响效果,现报告如下。

(6)分析各类指标中特征词之间的关系。利用社会网络分析方法,通过分析每个特征词与其它特征词之间在文中的位置关系,寻找特征词之间的关联性,并用社会关系网络图揭示这种关系。

(7)分析各类指标中特征词与精准、扶贫、脱贫等特征词的关系。同样是利用社会网络分析,分析一些主要特征词与精准、扶贫、脱贫等特征词之间的关系。

基于Mie散射理论由式(5)和(6)计算得出雾滴粒子的消光效率因子和消光截面,如图2.其中雾滴粒子对于1.064 μm、3.8 μm和10.6 μm波长的复折射率分别取1.320+i1.259×10-6、1.347+i3.402×10-3和1.178+i0.071.

(3)将评价指标体系文本化。利用建立的评价指标体系,结合文本出现的词汇,对每个评价指标构建对应的特征词(集)。

(9)围绕精准扶贫的目标,针对突出问题和短板,提出对策建议。

2.3评价体系

考虑到利用文本挖掘作为评价体系的主要来源和依据,本研究采用三级指标结合“特征词”方式建立评价指标体系,见表1。将精准扶贫工作从设计、实施和效果三个方面进行评价,在每个方面建立相应的子方面:在设计方面,包括深入调研、方案制定、精准识别、上级要求等4个子方面②;在实施方面,包括工作力度、项目投入、产业发展等7个子方面;在效果方面,包括经济效果、社会效果、能力提升、主观效果等4个子方面。三级指标共计15个。每个三级指标是通过一些体现其指标含义的文本形式的特征词来表达。

3 武汉精准扶贫工作评估

3.1武汉精准扶贫工作简要回顾

2015年10月以召开精准扶贫现场推进会、出台“1+N”文件(即《市委市政府关于全力打赢精准扶贫攻坚战的决定》和帮扶、投入保障、区级资金整合、激励、考核、问责、约束、精神支撑等8个配套机制文件)等为标志,武汉精准扶贫攻坚战正式拉开,提出了打好(产业、技能、智力、卫生扶贫、救助、安居)“六大攻坚战”,到2018年实现全市所有贫困人口全部脱贫销号、271个贫困村全部脱贫出列。

两年多来,武汉聚焦扶贫重点,精准发力脱贫攻坚,积极推动“五个一批”、“六大工程”等扶贫政策和项目的落地生根,开展“三乡工程”,实施精神扶贫“六子”行动,构建大扶贫格局,着力解决贫困村、贫困户存在的根本问题,增强贫困群众的获得感和幸福感。2016年投入各类扶贫资金40多亿元,市、区两级3万多名党员干部参与贫困户对口帮扶,投入8.3亿元专项资金,实施144个扶贫项目,减少贫困人口45739人,77个贫困村实现脱贫。2017年全市投入农村的社会资金160.1亿元,全市共安排财政扶贫专项资金17.08亿元,脱贫的107个贫困村实施扶贫项目305个,47528名贫困人口脱贫。初步探索出具有武汉特色的精准扶贫“双十”模式,即市民下乡、能人回乡、企业兴乡、生态旅游、新型主体、订单农业、资产租赁、岗位薪金、特色电商、金融信贷带动等产业扶贫“十带动”模式;健康扶贫、教育扶智、低保兜底、慈善救助、危房改造、交通设施、安全饮水、电网改造、公共文化、财政化债保障等政策支持“十保障”模式[17]。

3.2武汉精准扶贫的文本分析和评估结果

按照9步骤分析架构,以“武汉”、“精准扶贫”或者“精准脱贫”等为关键词,通过在网上搜索,并进行比较分析,确定武汉扶贫办、荆楚网、新华网、人民网等网站作为文本的来源网址。借助Scrapy编制爬虫程序,下载有关文本,并剔除掉重复的文本,共收集从2015年10月到2018年3月的有关文本467篇。

近年来,广西越来越重视健身休闲产业的发展,其产业规模也逐年扩大。2015年广西体育健身休闲活动总产出和增加值分别为7.5亿元和3.5亿元,占全区体育总产出和增加值的比重分别为4.8%和4.9%①资料来源:《广西壮族自治区体育局发布2015年全区体育产业规模及增加值的公告》(桂体经〔2017〕19号)。。综观整个体育服务业(除体育用品和相关产品制造业、体育场地设施建设外的其他9大类),经济规模较大的是体育场馆服务,总产出和增加值分别为21.2亿元和14.0亿元,占比分别为13.6%和19.5%。由此可见,传统体育产业的发展,体育场馆服务依旧是主要创收来源,健身休闲产业尚有较大提升空间。

恰如一柄双刃剑,自媒体舆论监督权在对审判权运行施以规约作用时,时常逾越应然边界,甚至暴露出盲目及非理性的一面。鉴于自媒体舆论监督权与审判权在运行规律、价值取向等层面的巨大差异,二者之间的摩擦碰撞不可避免。如何确保审判权既不至于因缺乏自媒体舆论的规约而恣意妄为,又不至于因陷入“舆论审判”[7]的泥沼而束手束脚?唯有在把握自媒体舆论监督权与审判权内在运行机理的前提下,将其限定在合理的幅度内方可达致。

用单标线吸管移取适量(见表2)钴产品生产过程CoCl2净化液和Co(NO3)2净化液(Co质量浓度为100~150g/L)于100mL容量瓶中,加入1.00mL Y内标溶液、4.0mL硝酸(1+1)后用水稀释至刻线,混合均匀后制备成待测溶液(保证Co量小于30g/L),此时样品溶液中Y质量浓度为1.00mg/L。

借助jieba分词模块,将这些文本进行分词,并对同类词,如贫困户、贫困人口、贫困家庭等进行归并,借助scikit-learn机器学习工具包计算这些分词的tf-idf权重值,选择tf-idf权重值大于0.01的285个分词作为特征词备选。再结合精准扶贫三级评价指标体系,从这些分词中甄选出每个指标所对应的特征词,计算每个特征词的权重值,将每个指标所包含的特征词的权重值和个数分别进行汇总,得到具体得分和特征词数量,将这些指标得分和特征值数量再逐级汇总,得到评价总得分和特征词总数量,见表1。

表1 武汉精准扶贫工作评价指标体系得分表

一级指标二级指标三级指标特征词数量(个)tf-idf权重值(得分)精准扶贫设计实施效果深入调研150.3361方案制定100.2192精准识别90.1299上级要求80.1074工作力度341.2002项目投入100.3704产业发展220.4591组织体系380.9861扶持政策40.1024领导行为210.5461落实机制420.8537经济效果80.1800社会效果140.2091能力提升60.1363主观效果120.2135

总的来看,武汉精准扶贫所涉及到的特征词有253个,总的权重值达到了6.0495。

(1)从二级指标层面来看,实施方面的特征词数量最多,有171个,其得分也最大,为4.5180;其次是设计方面,其特征词的个数和得分分别为42、0.7926;效果方面特征词的个数和得分均为最小,分别为40、0.7388。

仍利用社会网络分析方法,结合共现频率权重和Gephi可视化,反映不同方面特征行为与精准扶贫、精准脱贫的关系:即刻画设计、实施、效果等方面主要特征词①与“精准扶贫脱贫”①、“贫困”②等关键词之间的关系。

在设计方面,调研的特征词数量和得分均最高,这从一定意义上说明调研在设计中得到了重视,相比而言,方案制定、精准识别和上级要求的有关特征词出现的次数(重视程度)不够。这表明设计方面的质量有待进一步提升。

在实施方面,落实机制的特征词数量最多,工作力度的得分最高,组织体系的特征值数量和得分均比较高,而项目投入、产业发展、扶贫政策和领导行为的特征词数量和得分相对较弱,这表明精准扶贫工作无论是组织架构、还是工作力度和落实表现都很突出,项目、产业、政策、领导等有待进一步加强。

在效果方面,主观、经济、社会等三个方面的特征词数量和得分表现较好,差距不大,主要是能力效果方面,与其它三个方面相比,在特征词数量和得分方面还有一定的差距。这表明对于贫困人口的能力提升需要给予更多关注。

4 武汉精准扶贫的社会网络分析

社会网络分析方法作为一种刻画社会网络中行动者位置及其关系的方法被广泛应用[18]。本研究将利用社会网络分析方法,通过分析精准扶贫评价指标体系中所涉及到的主要特征词在文本中的位置关系,也称共现,把握精准扶贫的特征行为之间以及与精准扶贫工作之间的关系,进而找出精准扶贫工作中存在的问题。

4.1基本原理

4.2.1 设计方面

结合官方的文档,在测试阶段,调节区块难度的值为一个较低的值,让登录认证的交易尽快被矿工打包,避免用户长时间等待,同时方便调试和使用。难度设定需基于创世区块(创世区块是指区块链的第1个区块,它是构建整个区块链系统的基础)。

4.2不同方面特征行为之间的关系分析

利用Gephi工具软件将设计、实施、效果等三个不同方面各自内部特征词之间关系矩阵进行可视化处理,得到关系图。

在一篇文章中同一段出现的两个特征词之间,表现为一定具有某种关联,因此可以以段落为单位,借助jieba工具软件,统计467篇文本中这两个特征词同时出现的出现次数(也称共现频率权重)以及每个特征词出现的词频权重。依照同样原理,将所有考察特征词之间的这种关系找出来,就形成了特征词关系矩阵。

基于共现频率权重和词频权重,利用深入调研、方案制定、精准识别、上级要求中的特征词,建立它们之间的关系矩阵和关系图,见图1。

图1 精准扶贫设计方面特征词关系图

整个关系图将这些特征词分成四类,分别用不同颜色表示。其中三类聚集特征明显,一类以“情况”为中心,一类以“标准”为中心,一类以“目标”为中心,尤其是“目标”作为整个关系图的主中心。这说明精准扶贫在设计方面围绕目标比较重视情况调研和有关标准,但从整个关系图中的一些边缘特征词,包括“识别、需求、困难、实地、研究、优势、原因”等来看,从一个侧面也证实上述在评估分析中的观点——设计质量有待进一步提升,需要开展深度调研,对贫困村的优势、困难和需求做到更为精准把握。

4.2.2 实施方面

图2 精准扶贫实施方面特征词关系图

同样基于共现频率权重和词频权重,利用工作力度、项目投入、产业发展、组织体系、扶贫政策、领导行为、落实机制的特征词,建立它们之间的关系矩阵和关系图,见图2。整个关系图将这些特征词分成七类,分别用不同颜色表示。其中5类聚集特征明显,一类以“项目、建设”为中心,一类以“帮扶”为中心,一类以“攻坚”为中心,一类以“资金”为中心,一类是“发展”为中心,尤其是“发展”作为整个关系图的主中心。这表明精准扶贫在实施过程中,确实做到以发展为中心,以项目建设、资金政策、落实攻坚、帮扶为抓手。但从整个关系图中一些边缘特征词来看,还存在以下三个有待加强,一是利用科技和投资力度还有待加强,二是市场在精准扶贫中作用还有待加强,三是监督和问责等还有待加强。

仍然基于共现频率权重和词频权重,利用经济效果、社会效果、能力提升、主观效果中的特征词,建立它们之间的关系矩阵和关系图,见图3。

4.2.3 效果方面

图3 精准扶贫效果方面特征词关系图

整个关系图将这些特征词分成四类,分别用不同颜色表示。其中三类聚集特征明显,一类以“教育”为中心,一类以“生活”为中心,一类以“培训”为中心,尤其是“培训”作为整个关系图的主中心。这表明在精准扶贫中高度重视培训、就业、创业、生活、教育、保障等,但是从整个关系图中一些边缘特征词来看,提升扶贫实际效果还有空间,比如在基础设施、医疗、生态和贫困群众主观获得感等。

4.3不同方面特征行为与精准扶贫工作的关系分析

(2)从三级指标层面来看,

4.3.1 设计方面主要特征词与精准扶贫工作的关系分析

(5)计算评价得分。将每个指标所包括的特征词的权重值进行累积,分别得到每个指标的评价值(评价得分),然后逐级汇总,得到总的评价得分。

图4显示,“精准扶贫脱贫”和“贫困”两者作为主、次中心,所选择主要特征词的表现主要分三类,一类包括目标、标准,与“精准扶贫脱贫”和“贫困”均密切联系,一类包括调研、情况、制定、制度、规划、优先、全省等,仅与“精准扶贫脱贫”联系,还有一类包括走访、学习、条件、特色、信息、动态、计划,与两者均没有联系。

在饮食上,应合理调整蛋白质、脂肪、糖的比例,适当食用含维生素多的水果、蔬菜。加工上,应多采用煮、炖、熬、蒸等方法。每日应保证一定数量的优质蛋白质的摄入,可食瘦肉、牛奶、蛋、鱼等食品以及各种大豆制品。每日膳食中蔬菜及水果不能缺少,保证维生素及无机盐、微量元素的供给,提供膳食纤维。还可适度应用人参、黄芪、桂圆、山药等有抗衰老作用的药物、食物,制成药膳食用。对于年老的患者,原本身体虚弱,营养不够,不需忌口太严,以顺其自然为宜。

图4 设计方面主要特征词与精准扶贫关键词关系图

4.3.2 实施方面主要特征词与精准扶贫工作的关系分析

腌制好的肉以及大豆组织蛋白、玉米变性淀粉、色素、孜然粉、冰糖、水放入搅拌机中进行搅拌,搅拌时间15min。

图5显示,“精准扶贫脱贫”和“贫困”两者作为主、次中心,所选择主要特征词的表现主要分四类,一类包括帮扶、攻坚、建设、发展,项目、资金,产业、开发,组织、部门,政策,落实、确保与“精准扶贫脱贫”和“贫困”均密切联系;一类包括资源、救助,企业,工作队、驻村,群众,管理,领导、市委,责任等,仅与“精准扶贫脱贫”联系;一类仅包括重点与“贫困”联系;还有一类包括服务、活动,投入,农业、旅游,村民,农民,带动,措施等,与两者均没有联系。

图5 实施方面主要特征词与精准扶贫关键词关系图

4.3.3 效果方面主要特征词与精准扶贫工作的关系分析

图6显示,“精准扶贫脱贫”和“贫困”两者作为主、次中心,所选择主要特征词的表现主要分三类,一类包括生活、收入,教育,创业、就业、培训,与“精准扶贫脱贫”和“贫困”均密切联系;一类包括致富,保障、文化、低保,能力,精神、覆盖等,仅与“精准扶贫脱贫”联系;还有一类包括技能,劳动力等,与两者均没有联系。

图6 效果方面主要特征词与精准扶贫关键词关系图

4.3.4 三个方面主要特征词与精准扶贫工作的关系分析

图7显示,“精准扶贫脱贫”和“贫困”两者作为主、次中心。通过与两者的距离以及与两者的联系,可以将特征词分为“四类”,特征词的四类分布状况进一步验证了前面有关这些特征词在精准扶贫中作用的分析判断。

图7 三个方面主要特征词与精准扶贫关键词关系图

第一类是关系密切的,包括建设、发展、产业、确保、项目、帮扶、攻坚、政策、落实、开发、推进、部门、资金、机制、实施、标准、组织等;

第二类是关系比较密切的,包括社会、目标、企业、收入、农业、驻村、工作队、情况、领导、群众、生活、责任、规划、创业、教育、统筹、重点、培训、救助、资源、就业等;

苏轼年轻时便熟读诗书,他曾有“腹有诗书气自华”的诗句,其中“诗”指《诗经》,“书”就指的是《尚书》。对出自《尚书》的《五子之歌》进行深入的研究和专门的解释就成为一种必然。以儒学为基础的苏轼,深受其影响,“民为邦本”的思想遂成为他一生为人、为官、为文的航标。

第三类是关系不够密切的,包括服务、致富、旅游、农民、村民、解决、文化、调研、对口、优先、医疗、制度、投入、纳入、覆盖、低保、能力等;

第四类是基本没有关系,包括特色、信息、计划、原因、识别、基础设施、集体经济、学习、实地、走访、座谈会、现场、详细、增加、困难、探索、研究、优势、统一、动态、危房改造、小康社会、助学、改善、扶智、提升、给予、生态、需求、中心、生态、方案、劳动力等。

5 结论

本文根据大数据“第四范式”发现理论,构建了一个全新的基于互联网文本信息挖掘的精准扶贫第三方评估方法——9步骤分析架构。在这个架构中,与目前主流以数量资料作为主要来源的(第三方)评估体系不同,建立了基于文本的三级评估指标体系,利用爬虫技术从网上收集有关文本资料,结合分词技术和tf-idf统计方法,通过对评估指标所对应特征词的频度统计分析,得到评价得分,实现对精准扶贫工作的评估,并结合社会网络分析原理,利用共现频率权重统计方法和可视化技术,对评估结果进行深入分析。文中以武汉市为例,进行实证分析。分析发现①:武汉市的精准扶贫工作,无论是设计方面、实施方面,还是效果方面,都被高度重视,并取得了良好成效。下一步应围绕激发贫困人口内生动力、打赢打好脱贫攻坚战,突出问题导向,在提升精准扶贫工作质量上下功夫:一是设计方面在调研深度上下功夫,二是实施方面在利用科技、市场和社会力量等上下功夫,三是效果方面在贫困群众能力提升、基础设施建设、生态建设、增强贫困群众主观获得感等上下功夫,实现高质量的设计、高质量的实施、高质量的效果协同推进。

参考文献

[1] 中共中央办公厅,国务院办公厅.《省级党委和政府扶贫开发工作成效考核办法》[EB/OL].(2016-02-16).http://www.gov.cn/xinwen/2016-02/16/content_5041672.htm

[2] 刘建生,惠梦倩.精准扶贫第三方评估:理论溯源与双SMART框架[J].南昌大学学报(人文社会科学版),2017,48(2):69-75.

[3] 孟志华,李晓冬.精准扶贫绩效的第三方评估:理论溯源、作用机理与优化路径[J].当代经济管理,2018,40(3):46-52.

[4] 祁中山.扶贫绩效第三方评估:价值与限度——以2016年国家精准扶贫工作成效考核第三方评估为参照[J].信阳师范学院学报(哲学社会科学版),2017,37(6):38-44.

[5] 闫妍.精准扶贫绩效第三方评估研究:技术特征、实施困境与路径优化[J].四川行政学院学报,2018,(1):22-26.

[6] 姜涛.精准扶贫项目绩效评估方法研究[J].宝鸡文理学院学报(社会科学版),2016,36(1):51-54.

[7] 胡善平,杭琍.中国特色社会主义精准扶贫绩效考核指标体系构建研究[J].牡丹江师范学院学报(哲学社会科学版),2017,(2):64-73.

[8] 朱晨源,李淼.河北省精准扶贫绩效评估探讨[J].合作经济与科技,2017,(6):182-183.

[9] 田晋,熊哲欣,向华.民族地区村级精准扶贫绩效评价指标体系构建研究[J].经济研究导刊,2017,(1):38-40+104.

[10] 杨希.精准视角下扶贫项目绩效评估研究[J].金融经济,2017,(4):23-25.

[11] 陈爱雪,刘艳.层次分析法的我国精准扶贫实施绩效评价研究[J].华侨大学学报(哲学社会科学版),2017,(1):116-129.

[12] 王建兵,胡苗.基于第三方评估的精准扶贫绩效分析——以甘肃省东乡县毛沟村为例[J].经济动态与评论,2017,(1):149-159+253.

[13] 黄海棠,李永坤.基于第三方评估的精准扶贫跨越发展研究——以三明国家扶贫改革试验区为例[J].佳木斯大学社会科学学报,2018,36(1):50-53+57.

[14] 石晶,李思琪.建立科学成效评估体系助力各方资源精准扶贫——精准扶贫成效评价指标体系的构建[J].人民论坛,2018,(3):36-38.

[15] 杜永红.大数据背景下精准扶贫绩效评估研究[J].求实,2018,(2):87-96+112.

[16] 耿冰,付梅臣.基于科技文本挖掘的宜居城市评价体系研究[J].技术经济与管理研究,2016,(12):30-34.

[17] 武汉市扶贫攻坚领导小组办公室.2017年武汉市脱贫攻坚发展报告[R].2018.

[18] 沃瑟曼等著.社会网络分析:方法与应用(经济科学译库)[M].陈禹等译.中国人民大学出版社出版时间.2012年04月.

Third-partyEvaluationofPrecisePovertyAlleviationbasedonBigDataMining——TakingWuhanasanExample

Li Hongyan1 Wang Tao2

(1.Wuhan Vocational College of Software and Engineering, Wuhan 430205, Hubei; 2.Wuhan Academy of Social Sciences, Wuhan 430019, Hubei)

Abstract:Based on the discovery theory of big data “fourth paradigm”, a new third-party evaluation of precision poverty alleviation based on Internet text information mining is proposed, providing 9 steps analysis frame. In this framework, the three-level evaluation index system based on text is set up. We Use the crawler technology to collect the relevant text information from the Internet, combine the participle technology and the TF-IDF statistical method through the statistical analysis of the frequency of the characteristic words corresponding to the evaluation indexes, and obtain the evaluation scores.Combing with the principle of social network analysis, we use the co occurrence frequency weight statistics method and visualization technology to conduct in-depth analysis of the evaluation results.Taking Wuhan as an example, we find that the precision poverty alleviation work has been highly valued in terms of design, implementation and effectiveness, and it has achieved good results. The next stepof precision poverty alleviation is to improve the quality of precision poverty alleviation in order to stimulate the internal motivation of the poor and win the fight against poverty.

Keywords:precise poverty alleviation; third-party evaluation; text mining;social network analysis

中图分类号:F327

文献标识码:A

文章编号:1671-3524(2019)03-0046-07

收稿日期:2019-03-13

基金项目:本文系武汉市教育局产学研课题《基于大数据的武汉精准扶贫第三方评估》(课题编号:CXY201624)研究成果

作者简介:李红艳(1968~),女,学士,教授.E-mail:524749542@qq.com

(责任编辑:游 涛)

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

李红艳:基于大数据挖掘的精准扶贫工作第三方评估——以武汉市为例论文
下载Doc文档

猜你喜欢