孙博:网络大数据下的社会工作量化评估方法——以2016—2018年全国政务网站社会稳定风险评估工作信息为例论文

孙博:网络大数据下的社会工作量化评估方法——以2016—2018年全国政务网站社会稳定风险评估工作信息为例论文

[摘 要]网络大数据为社会工作分析提供了数据支撑和新的研究思路,但社会工作复杂多样,单一的数据罗列并非完善的量化评估体系,不能很好地评估工作开展的实际情况。依托网络大数据平台,对社会工作的不同领域和类型进行分类,结合统计学知识,引入工作成效指标体系,无疑会使社会工作的量化评估更具可靠性和操作性。社会稳定风险评估情况则是一项可用于有效检验这项工作成效指标的对象。

[关键词]网络大数据;量化评估;工作成效;社会稳定风险评估

一、研究概述

互联网的迅速发展,对我国社会工作、生活的各个领域都产生了重要影响。这些领域在应用信息技术时产生的大量数据,为人们了解、分析相关工作提供了数据支撑[1]。一些学者也有意识运用网络大数据对某些社会问题和现象进行研究,并取得了一定成果。如《从网络大数据视角探寻失独群体的社会服务需求》[2]《智慧传承——基于网络大数据的历史地区可持续性保护》[3]等均是对此的尝试。

(一)研究目的

尽管网络大数据为相关研究提供了信息,但由于社会领域和工作的复杂性,仅通过数据的罗列,不足以全面说明社会工作的情况——数据本身,并非完善的量化评估体系,尤其在涉及到拥有不同领域以及完整工作阶段的具体情况时更是如此。本研究之目的,在于依托网络大数据,根据工作实际情况,设计一种具体的量化评估方法,用以观察某项工作的发展成效,考评该工作执行情况,衡量各机构对其的重视程度,以期为社会工作的量化评估提供一个新的参考。

(二)研究对象

本文的研究对象为宏观层面上(不包括具体的项目、工程、建设的招投标、征询、批示、回复等)2016-2018年我国各地政府机关社会稳定风险评估工作的整体情况,包含不同领域内社会稳定风险评估工作的完整工作阶段(工作前—工作中—工作后)。之所以选择如上研究对象,一是因为社会稳定风险评估是我国目前社会治理工作中的重要组成部分,对于促进国家社会经济发展、维护国家繁荣稳定具有积极意义[4];二是因为行政层面上的数据信息随意变体较少,来源稳定,信息可靠程度高;三是由于社会稳定风险评估工作涉及领域多样,层次复杂,可以在实践中说明并检验我们的分析程序和方法。

(三)数据来源

为尽量保证数据的全面性和可靠性,本文数据来源主要包括以下4项:

1.互联网大数据平台系统集中抓取到的政务网站相关信息;

2.中共中央人民政府网站、各省级政府门户网站[注]不包括港、澳、台地区的政务网站;根据国家相关政策与法律法规,新疆维吾尔族自治区人民政府网站受到一定限制。及其次级栏目作为定向信息源公开发布、可查询且未失效的社会稳定风险评估相关信息;

3.网络搜索引擎(如百度、360搜索等)以关键词“社会稳定风险评估”或满足搜索条件“社会稳定&风险评估”得到的政务信息;

资料来源 以 “唑来膦酸”和 “急性葡萄膜炎”为中文关键词,检索中国学术期刊全文数据库、维普中文科技期刊数据库和万方数据库;以“zoledronic acid”和 “acute uveitis”为英文关键词,检索PubMed数据库,收集唑来膦酸相关性急性葡萄膜炎的病例。检索时间:2000年10月至2018年3月。纳入标准:国内外公开发表的相关原始临床试验研究或病例报道。剔除标准:综述性文献和重复发表文献。

通过对满足条件的原始信息进行搜集、筛选、去重、分类、定性、整合等工作后,共得到有效信息数据2231条。

二、研究方法与分析程序

本文研究方法主要为比较研究。以大数据平台可搜集到的信息为研究分析对象,根据有效数据情况,对其进行多维度、多层次划分,参照这些划分,对各地社会稳定风险评估工作的情况进行比较,最终通过量化评估得出结论。本文的分析程序包括以下4项:

(一)数据标签分类

涉及领域——社会稳定风险评估工作所涉及到的相关领域。根据实际情况,得到综治维稳、行政司法、城建房屋、经税投资、科教文体、农林牧渔、食药医疗、水电交通,环境保护等9项[5]。

“哪能由着你?”赛十娘又笑出声,“还是顺着他们,少吃点儿亏。莫像河浦那个女孩儿,烈得很。越烈越吃亏。”

省市所属与行政层级——指社会稳定风险评估工作发布执行的行政区归属与行政层级。包括中央人民政府,省(自治区、直辖市),市(自治州),县(区、自治县/旗)以及乡镇(街道)等5级[注]这里采用的是一种通俗的行政区层级划分法。由于行政区与行政管理区之差异,国家级新区、各级开发区、高新区等园区划归为其所属省级或市级行政区内;由省直管或市代管的县级市划归为县级。。

3.变量权重定比

地域分布——东北、华北、华中、华东、华南、西北、西南等7个地理分区[注]有划分方法将内蒙古自治区东部部分地区归为东北地区,本文统一归为华北地区;广西地区亦有划分法将其划为西南地区,本文将其归为华南地区。。

SCV水浴加热装置是由燃烧室和水浴的管程壳程组成的控制对象。水浴的温度为T 1,作为被控对象,要求保持T 1相对稳定,燃烧室气泡输出到水浴的热量为Q 1,在运行中,燃烧室不断给水浴加热,水浴不断传递热量Q 2给管程内的LNG。当Q 1=Q 2时,水浴输入和输出的热量相当,水浴温度T 1不变。当某一时刻由于燃料气流量增大,那么燃烧室传给水浴的热量Q 1增加时,随着水浴温度T 1的升高使得Q 2也增大,最后Q 1又等于Q 2,热量平衡再次建立,水浴温度T 1保持不变。

对信息数据进行基本的标签分类。依据网络特点和其自身属性,划分出发布时间、发布平台、发布机构、文本标题、内容摘要、有效连接、省市所属、地域分布、行政层级、涉及领域、工作类型等11项标签。同时对所需的关键标签进行进一步划分,主要如下:

(3)产能过剩,内部竞争严重。在湖北省加速发展汽车零部件产业的过程中,各地均将汽车零部件产业作为支柱产业进行重点发展,但行业整体缺乏统筹协调和超前统一规划,因此各自为战现象较为明显,未形成错位竞争格局,在招商、融资、销售等各方面形成严重的内部消耗与内部竞争状态,也造成了产能过剩现象。

工作类型——社会稳定风险评估工作呈现的形式。包括办法规定、执行推进、报告总结、会议讲话、规划建议、监督调研、文件资料等7类。

“咱们村,老头子媳妇去世后都愿意重新再找一个老伴,但是很多老太太老头去世以后,不愿意再找。咱们村好几个50多岁的寡妇,都不愿意重新找。”(C5,女,59岁)

(二)关键维度定性

在初步分类后,对标签下属维度进行定性。关键定性目标为“涉及领域”和“工作类型”两个直接与社会稳定风险评估工作且与量化评估方法相关的维度。

其次,要完善社会工作者和志愿服务者联动合作的考核监督制度,明确规定社会工作者和志愿服务者的职责范围和责任要求,组织相关专家为两者的联动合作项目制定统一的考核标准,并且定期来进行考核和评估,达到两者的合作联动不仅仅是停留在表面,而是真真落实到实处,把合作服务的成果作为考核的标准之一,既是两者联动合作的加油剂,也是两者良性运转的保险锁。

1.“涉及领域”各项维度定性

综治维稳——社会综合治理、社会稳定维护、公共安全打造、突发事件应急且未涉及到其他领域的综合性工作;

文中在研究常用的人眼瞳孔定位方法基础上,重点研究了基于边缘检测和椭圆拟合的瞳孔定位方法,该方法定位速度快,对变形瞳孔有很好适应性,但是容易受到眼睑遮挡,光斑、阴影等干扰。针对这些问题提出一种改进的适合红外条件下的基于椭圆拟合的瞳孔定位算法。实验结果表明,本文提出的瞳孔定位改进算法有效减少反射光斑及睫毛等对定位的影响,并且弥补了固定阈值分割的不足。

行政司法——政府以及公检法等司法行政系统的行政、司法工作,包括但不限于法治建设、行政规范、审批、程序、举措、司法案件、法律服务等;

城建房屋——城镇工程建设、土地征收、拆迁补偿、房屋改造、移民安置等;

经税投资——经济体制、金融贸易、投资融资、税务审计、资产交易、所有制改革等;

执行推进——除会议讲话、报告总结和监督调研之外,各级政府、机关机构在社会稳定风险评估工作中的执行情况,包括但不限于对办法规定、规划建议的具体执行、贯彻、落实、学习、推进、实施、强化、构建、信息解读、要点分解等工作行为和成果;

有一天,我和爸爸妈妈在奶奶家吃过晚饭回家。在回来的路上,不知怎么的,爸爸换上了一件黑色的衣服。这半路换衣服倒没什么,可是,“哈哈……”可是那衣服后背上却画上了一头肥嘟嘟的小胖猪。跟在爸爸身后的我,不禁哈哈大笑。

食药医疗——食品、药品、卫生计生、人口疾控、医疗医保等;

水电交通——水利工程、电力工程、路政建设、交通运输等;

农林牧渔——农业、林业、矿业、畜牧业、渔业与海洋产业等;

环境保护——环境污染、环境保护、生态环境建设等。

2.“工作类型”各项维度定性

办法规定——政府机关发布的关于社会稳定风险评估工作的办法、条例、制度、规则、规定、细则等;

规划建议——专门提及或关于社会稳定风险评估工作的纲要、计划、规划、建议、意见、方案、预算、期望、前瞻等;

报告总结——包括但不限于专门提及社会稳定风险评估工作的人代会、党代会工作报告及各级政府机关等机构的工作报告、总结、部门决算、综述回顾、自查报告、荣誉成果等;

文件资料——包括但不限于社会稳定风险评估工作的工作表格、流程介绍、图示名单、年鉴条目、服务指南、事项目录等。

监督调研——关于或提及社会稳定风险评估工作所进行的巡视、调查、调研、走访、督导、考察、考核、理论研究等;

科教文体——科技国防、学校教育、新闻传播、文化艺术、宗教、体育等;

会议讲话——除人代会、党代会讲话之外,未专门强调工作报告的常委、常务会议讲话,以及其他工作会议、例会、宣传会、研讨会、培训会、论坛、讲座讲话等及领导指示、讲话、言论、采访、署名文章等;

(三)数据占比观察

观察数据其在各自标签和维度下占据的百分比,统计占比情况,计算平均值。根据各地区占比分布,将各类信息占比相较平均占比上下浮动不超过15%的视为常规状态,上下浮动超过15%(含)的视为非常规状态,对处于非常规状态的地区进行解释。

(四)指标量化计算

从工作情况出发,依据统计学与概率学相关知识,结合数据标签和维度分类,经过分析,设计量化评估方案,对所得信息进行标准化计算(详见下文第五部分)。

三、全国政务数据观察

(一)近三年趋势

2016—2018年,网络平台上全国社会稳定风险评估工作的数据量逐年增加,2018年达到新高。一方面是因为失效信息率降低,有效数据提升;另一方面则由于2017年十九大召开,对社会治理与国家发展提出了新的要求和规划,受此影响,社会稳定风险评估工作数据量出现叠加式增长。具体到月份,每年3月全国“两会”召开,月度数据均达到该年峰值,至9月数据稳步回落;9至10月,全国党代会召开,信息缓慢回升;12月,中央经济工作会议召开,出现年度又一小高峰(见图1)。此外,不定期召开的“全国教育会议”“全国司法会议”及其它工作会议等,亦对走势产生一定影响。

图1社会稳定风险评估相关信息量走势图

(二)地域分布情况

在地域分布上,华东、西南、西北地区分居三甲,华北、华中、华南处于中游,东北地区位列末位,占比为:华东27%,西南20%,西北16%,华北12%,华中9%,华南9%,东北7%,这也与各地区所辖省份数量和经济发展相关。由于“一带一路”概念提出,及2015年国家发改委、外交部、商务部联合发布的《推动共建丝绸之路经济带和21世纪海上丝绸之路的愿景与行动》,处于古丝绸之路范畴内的西南、西北地区省市在此期间内的建设工作,相应提升了社会稳定风险评估工作的信息量。

模块化侧重于部件级标准化,进而达到设备系统的多样化.通过对某一类设备系统的分析研究,将其中含有相同或相似的功能单元分解出来,用标准化原理进行统一、归并和简化,以通用单元的形式独立存在,然后用不同的模块组合来构成多种新设备.

图2社会稳定风险评估相关信息量地域分布

(三)行政层级分布

从相关工作分布的行政层级看,中央级数据分布占比最小,为2%;省、市、县级数据占比依次增加,分别为19%、31%、40%,乡镇级占比处于次低,为8%。数据量大体以行政区数量为依据递增,市、县级数据占据7成以上,充分说明在此行政层级上社会稳定风险评估工作的情况。乡镇级数据占比减少,有可能是由于网络平台的限制性等原因,如乡镇级政务网站建设不完善,媒体与自媒体宣传的缺失等[6]。

图3社会稳定风险评估相关信息量行政层级分布

(四)涉及领域分布

在本文设计的9项领域标签中,综治维稳与行政司法领域占比达到8成以上,可见党及政府对于社会维稳的重视,说明了社会治理的复杂性和社会稳定风险评估的行政属性[7]。

图4社会稳定风险评估相关信息量领域分布

(五)工作类型分布

本文对社会稳定风险评估工作类型的划分基本符合“工作前(办法规定、规划建议)—工作中(执行推进、会议讲话、监督调研)—工作后(报告总结、文件资料)”的阶段情况。其中,执行推进类信息占据明显优势,报告总结类次之,会议讲话类再次,办法规定类与规划建议类信息基本持平,文件资料类信息最少。趋势为:工作中>工作前>工作后。此外,在不同工作领域内,执行推进信息均占据重要比例;而在综治维稳、行政司法领域中,报告总结比例明显高于其他。

为什么而读书?应该说大部分人读书是为了谋生的,是通过读书获得生存的本领和技能。但是,最高的读书境界不是谋生,而是谋心,是通过读书让自己进入澄明的精神之域。

图5社会稳定风险评估相关信息量类型分布

四、各地政务数据观察

(一)地区发布信息量分析

从地区信息量热力图[注]地区信息量热力图根据地区发布的相关信息总量制作而成,颜色越深代表所发信息越多,反之则越少。来看,四川、安徽、陕西、甘肃、江苏、浙江为第一梯队,信息发布量均在百条以上,四川最为突出,发布量达到221条,也是唯一一个突破两百条信息总量的地区;湖南、内蒙古、广东、辽宁、云南、河北、贵州、山东、江西、广西、湖北、河南、福建为第二梯队,信息量在50至100条之间;北京、重庆、黑龙江、山西、吉林、海南、青海、宁夏、天津、上海、新疆、西藏为第三梯队,信息发布量少于50条。

图6地区社会稳定风险评估信息量热力图

(二)地区发布信息行政层级分析

在地区发布信息行政层级占比方面,平均占比为:省占19%、市占31%、县占39%、乡镇占8%。对比平均占比发现,西藏、新疆、上海、天津等地不同行政层级发布信息的占比处于非常规状态。其中,北京、上海、天津作为直辖市,自身发布信息占比高于50%,而重庆下辖区、县发布信息占比高于50%;西藏、新疆、海南体现为省级发布信息偏高,处于30%以上,市级、县级、乡镇级发布信息整体低于平均水平;宁夏、内蒙古、湖南、陕西体现为省级发布信息占比低于19%,除宁夏自治区下辖市级发布信息占比超过50%外,其它地区的县级发布信息占比超过50%,高于平均水平,侧面反映了这些地区行政贯彻执行力度较强,上下级地区形成了积极响应配合的关系。

图7地区发布信息行政层级占比

(三)地区发布信息涉及领域分析

在地区发布信息领域占比方面,平均占比为:城建房屋占5%、行政司法占27%、环境保护占3%、经税投资占4%、科教文体占3%、农林牧渔占2%、食药医疗占4%、水电交通占3%、综治维稳占57%。

图8地区发布信息领域分类占比

对比发现,吉林、黑龙江、重庆、北京和辽宁处于非常规状态。其中,重庆、北京和辽宁在综治维稳方面超过平均水平,处于70%以上,其它细分领域压缩到比较小的区间;吉林和黑龙江在行政司法领域占比超过平均水平,处于40%以上,同时这两省在农林牧渔和食药医疗方面高出平均占比4%;其它地区基本与平均水平贴合。

最后,在师资队伍建设方面也存在很大的局限性。校内的电子信息科学与技术专业教师目前在知识结构、学术水平、实践经历等多方面存在诸多不足,阻碍了创新型人才的培养。另外,没有积极引进其他高校、科研院所及公司企业的优秀人才作为电子信息科学与技术专业人才培养的兼职教师,从而缺乏对电子信息科学与技术专业创新型人才培养的现实可行的专业指导。

(四)地区发布信息工作类型分析

在工作类型占比上,平均占比为:办法规定占13%、报告总结占19%、规划建议占11%、会议讲话占16%、监督调研占4%、文件资料占3%、执行推进占39%。新疆、天津、宁夏、青海等地处于非常规状态。其中,新疆和内蒙古地区报告总结类信息占比突出,超过30%;北京在规划建议方面占比突出,达到43%;青海在执行推进方面占比突出,达到58%;天津、宁夏和吉林在办法规定方面占比突出,超过25%。

图9地区发布信息工作类型占比

(五)市级地区发布信息分析

市级行政区对政务工作的执行有着承上启下的作用,通过对全国范围内发布信息量排名前10的地级市进行梳理发现,贵州铜仁市位列第一,有26条,主要源于铜仁市是社会稳定风险评估发源地,是首批国家智慧城市试点市,对社会稳定风险评估工作的开展力度一直较大。四川、安徽和陕西发布信息量之所以位居前三,此三省的下辖地级市起到了重要作用,从市级发布信息量前10的榜单中可看出,这三个省均有4个市上榜,四川有成都(22条)、南充(20条)、内江(14条)、雅安(13条);安徽有合肥(17条)、阜阳(13条)、安庆(12条)、滁州(12条);陕西有宝鸡(24条)、西安(16条)、安康(14条)、商洛(14条)。

图10发布信息量排名前10的市级地区统计

五、各地政务数据量化评估结果

(一)工作成效指标体系

为了能够更科学地评估各省、市开展社会稳定风险评估工作的整体情况,我们设计了“工作成效”指数体系,综合该项工作在行政层级上的贯彻力度和执行力度,综合评估各地区工作的执行成效。该指标体系包括:

4.其他网络平台(如政府、机关、部门的官方微信公众号等)及权威媒体(如人民网、新华网等)记录、发布的来源可靠、信息明确的相关信息。

1.有效数据采纳

有效数据包括信息发布总量、省级信息发布量、市级信息发布量、县级信息发布量、乡镇级信息发布量、执行推进类信息量、报告总结类信息量、会议讲话类信息量、办法规定类信息量、规划建议类信息量、监督调研类信息量、文件资料类信息量。

2.工作成效确定

工作成效指数主要由行政贯彻力度和执行力度两个指标组成。任何工作成效均应以贯彻和执行为主要考评标准。贯彻指在各个区域以及各个层级上工作的扩散提及程度,反映为社会稳定风险评估工作相关的信息发布量;执行指信息所涉及到的各种工作的类型呈现。二者作为综合变量出现,影响其结果的各项数据为初始变量,两者结合起来即为工作成效指数。

图11工作成效指数

糟糕的事情远没有结束,自从失去雨果,洛丽塔性情大变。有一天,洛丽塔像往常一样表演,可是表演中它突然对着离它最近的小女孩凶悍龇牙。工作人员呵斥着洛丽塔,可根本没起到作用,洛丽塔接着朝小女孩喷水。

由于信息所处的行政层级不同,同时工作类型亦存在差异,不能简单用原始数据进行比对,需要采取一种标准化的量化计算方法[注]这是由于各项指标的数值相差较大,直接数据对比缺少科学性。而对数函数在其定义域内是单调增函数,数值越大越趋近于平稳,取对数之后不会改变数据的性质和相关关系,能够压缩变量尺度,还能削弱模型的共线性、异方差性等,因此在本报告中运用对数函数来计算工作成效指数,使得多维度指标之间的运算结果更能反映实际情况。[8]。例如,就贯彻力而言,省级行政单位的影响力应当大于市级行政单位的影响力;就执行力而言,作为“工作中”阶段的“执行推进”,其重要性应该大于“工作后”阶段的“文件资料”等,依此类推。本文在经过分析后,结合实际工作情况,确定各项变量的权重定比如下:

表1各项变量权重定比

综合变量初始变量综合变量初始变量贯彻力(y1,40%)发布量(x1,30%)省级(x2,25%)市级(x3,20%)县级(x4,15%)乡镇级(x5,10%)执行力(y2,60%)执行推进(x6,30%)报告总结(x7,15%)会议讲话(x8,10%)办法规定(x9,15%)规划建议(x10,15%)监督调研(x11,10%)文件资料(x12,5%)标准化:x'=ln(x+1)

4.综合计算公式

经过上述分析,确定工作成效指标计算公式如下:

克鲁勃润滑剂为风电行业提供全面的润滑产品,涵盖发电机轴承、主轴轴承、偏航变桨轴承、开式齿轮、齿轮箱、滑环等主要部件。

Y=(40%*ln(y1+1)+60%*ln(y2+1))*100

y1=30%*ln(x1+1)+25%*ln(x2+1)+20%*ln(x3+1)+15%*ln(x4+1)+10%*ln(x5+1)

y2=30%*ln(x6+1)+15%*ln(x7+1)+10%*ln(x8+1)+15%*ln(x9+1)+15%*ln(x10+1)+10%*ln(x11+1)+5%*ln(x12+1)

(二)省级行政区工作成效排名

根据工作成效指数体系与公式计算,全国各省级行政区指数排名如下:四川、安徽、陕西位列三甲;甘肃、江苏、浙江紧随其后;湖南、广东、云南、内蒙古分别位列6~10名,其他名次如表2所示。

(三)市级行政区工作成效排名

本文亦计算出2016—2018年在社会稳定风险评估工作成效上指数最高的30个市级行政区。结果见表3。

表2省级行政区工作成效指数排名表

排名地区发布总量行政层级工作类型省级市级县级乡镇级执行推进报告总结会议讲话办法规定规划建议监督调研文件资料成效指数1四川22129739227823739382131156.312安徽15012387723612114222552148.783陕西144103987859272291377146.674甘肃129254351105126308950144.585江苏1232340461462162271411143.166浙江1041930469481613151011140.477湖南94142348931141816942139.038广东911437261429142313543137.909云南9083146541201111520135.3110内蒙古9217155732837681111135.2511辽宁9117323843420266320134.5812河北77223124025121117642134.0913山东74141925163187141112133.5814贵州74102732528171310132130.8215广西6311262152665131021129.8416江西672116264329147500128.6217湖北57925212291175500124.2718河南511123161241045521124.0019福建50911273181257701122.3420重庆4212226219669200117.1721北京443162564661921116.7822黑龙江3812121049973910116.3223山西381013141119112311114.4724吉林3491312098210410112.5225海南311411607484620110.3926青海3110515118561100106.1927天津2111622630660098.5928宁夏2141142601950095.3629上海1811601722340094.6630新疆145630352121087.4431西藏125340342210082.92

表3市级行政区工作成效指数排名表

排名地区发布总量行政层级工作类型市级县级乡镇级执行推进报告总结会议讲话办法规定规划建议监督调研文件资料成效指数1宝鸡245172944032296.292铜仁26111411435002295.053成都229121555700091.874南充204610480530090.405合肥1741031112012086.116内江14473612311084.717西安16961433110484.338石家庄15870830301083.739商洛14491721210183.6710永州152130333321083.2311杭州151122830310082.8212渭南153102315141082.8013张掖14653813200081.9114安康142120831110081.0715阜阳13490340330079.7416滁州12372620310079.5217苏州13373811020179.5018百色12642631101079.4219雅安13292223420078.8720安庆12183711210078.1621眉山11470431210077.1222张家界12570404211076.7223酒泉12381830100076.4924遂宁11830522020075.7925宣城11191421210175.4926鄂尔多斯10361521110075.2827淄博11164621011075.2828金昌11263233210074.8629常德12372124220174.5930南通10361341110073.90

六、研究结论和不足

综上所述,工作成效指标体系的量化计算和直观的数据观察相比,所得结果存在差异。相较于直接罗列数据而言,我们认为,引入工作成效指数体系,对社会工作进行量化分析,可以得到更细致、更合理的评估结果,有效表现工作在各个阶段中的实际成效。本次研究工作的主要不足在于:

一是信息时效性。由于网络平台信息更新迅速,随时间推进与信息量级增长,越向前回溯,信息失效率越高,具体可能表现为相关信息湮没,相关链接失效等;与之相应,越贴近当前时间,数据越全面详尽,有效信息量随时间走势亦会与工作推进呈叠加式递增趋势。

二是数据重复性。网络信息数据具有爆炸式传播特点,除传统门户网站外,伴随着“两微一端”等自媒体的发展,信息呈现重复性传播,产生针对同一工作同样工作内容的不同变体,因此查重、去重是利用大数据分析的重要工作步骤。本文通过对逾4万条相关信息进行人工筛选去重后,仅得到有效信息两千余条。如何更有效地甄别信息,亟待进一步研究。

三是平台限制性。作为网络信息的载体,网络平台亦受限于自身技术与平台建设限制。由于各地区、各机构等对平台建设的重视和投入程度差异,可能导致数据信息与分析对象的实际工作并不完全等同,仅能在一定程度和视角上反映出相关周期内的工作内容、成效和发展趋势,以供观察参考,需要结合其他研究视角和方法论进行进一步详尽处理。

四是范畴交叉性。由于社会工作的特殊性与复杂性,需要定性与定量研究结合[9]。本文的定性,主要是针对社会稳定风险评估分类标签与维度的定性,有少数信息的界定存在交叉,或信息划归到不同维度中。经反复验证,其没有对结论产生偏离性影响。但在针对其它社会工作的研究中,尽可能清晰地界定相关范畴,无疑会使结论更准确可靠。

参考文献:

[1]谢亚雷.网络大数据的现状与展望[J].电子技术与软件工程,2018,(09).

[2]赵晓蕾,陈贵斌,等.从网络大数据视角探寻失独群体的社会服务需求——基于新浪微博数据的分析硏究[J].劳动保障世界,2018,(02).

[3]夏丝颸,刘博敏.智慧传承——基于网络大数据的历史地区可持续性保护[C]//共享与品质——2018中国城市规划年会论文集(05城市规划新技术应用).中国城市规划学会,2018,(11).

[4]张旭辉.社会治理视野下重大事项社会稳定风险评估研究[D].内蒙古大学,2017.

[5]张玉磊.重大决策的社会稳定风险及其形成机理:研究重大决策的新视角[J].中共宁波市委党校学报,2018,(06).

[6]斯琴.重大决策社会稳定风险评估机制[J].现代交际,2017,(10).

[7]梅扬.论重大行政决策风险评估制度[J].甘肃政法学院学报,2018,(07).

[8][美]David Knoke,Peter J.Burke.对数线性模型[M].盛智明,译.上海:格致出版社,2012.

[9]刘彬.重大决策社会稳定风险评估的思考[J].中共珠海市委党校珠海市行政学院学报,2018,(12).

[收稿日期]2019-03-14

[作者简介]孙博(1986—),黑龙江大庆人,云南大学文学院茶马古道研究所研究员,硕士,主要从事社会调查、文化传播研究;孔唯鉴(1990—),云南昆明人,黑龙江科技大学经济管理学院讲师,硕士,主要从事舆情分析、数据分析研究。

[中图分类号]C91-03

[文献标识码]A

[文章编号]1003-4307(2019)03-0113-09

[责任编辑:栗晖]

标签:;  ;  ;  ;  ;  ;  ;  ;  

孙博:网络大数据下的社会工作量化评估方法——以2016—2018年全国政务网站社会稳定风险评估工作信息为例论文
下载Doc文档

猜你喜欢