谢振东:对恐怖袭击事件的多元统计分析论文

谢振东:对恐怖袭击事件的多元统计分析论文

摘 要恐怖袭击威胁人类社会安全.选取全球恐怖主义数据库(Global Terrorism Database,GTD)中2015-2017年世界上发生的恐怖袭击事件的记录,根据相关性对2015-2016年未知作案组织或个人对应的事件数据进行整合简化,使用二阶聚类得到最大分类数,根据危害性从大到小选出前5个犯罪嫌疑人,利用判别分析对2017年未知作案组织或个人对应的事件进行概率预测,得出嫌疑人的嫌疑程度.选取影响恐怖袭击的重要指标,应用因子分析研究2015-2017年恐怖袭击事件发生规律,得到恐怖事件地域发展趋势.

关键词社会统计学;趋势预测;多元分析;恐怖袭击

1 引 言

恐怖主义是人类的共同威胁,对恐怖袭击事件相关数据的深入分析有助于加深人们对恐怖主义的认识,为反恐防恐提供有价值的信息支持.Sofia(2016)[1]探索了40多年来全球恐怖主义在地理和时间上的集中性与持续性,说明恐怖袭击事件非随机,具有可研究性.Thomas(2016)[2]提出了对欧洲圣战主义十年的预测,未来10年,圣战分子在欧洲发动袭击的频率可能会呈现波动曲线,峰值将逐渐升高.李益斌(2018)[3]利用聚类分析法,以GTD中恐怖袭击的频率和烈度为依据,对2001-2010年和2011-2016年两阶段的欧洲恐怖袭击按国家进行分类,根据实验结果中的异同来分析当前欧洲恐怖袭击的新态势.杨振柳等(2019)[4]对GTD进行数据挖掘,利用主成分分析方法建立了K-means算法的聚类模型.通过该聚类模型,将相似特征的事件进行归纳处理,为侦破恐怖袭击事件提供信息支撑.华雅伦和王奇(2018)[5]通过使用GTD数据对2001-2015年间欧洲恐怖主义活动进行统计分析,发现呈现出以热点地区为中心的扩散辐射圈,恐怖分子袭击日趋专业化和技术化的特点,总结了欧洲国家的反恐经验.彭如香等(2019)[6]以2001-2016年的GTD数据,对全球恐怖主义活动进行定量分析与可视化分析,得出近些年全球恐怖主义活动的发展态势.结合近几年全球恐怖事件的特点,总结出全球恐怖主义活动的特征和发展趋势是有价值的.

一是大力开展农田水利建设。按照“四化同步”的要求,切实加强农田水利基本建设,为农业现代化提供有力的水利保障。大力抓好农业“两区”水利设施、“百万亩圩区整治工程”“百万亩喷微灌工程”“中央财政小农水项目”“大中型灌区节水配套改造”等项目建设,前三季度全省完成农田水利基本建设投资近197亿元,已超过2007年全省水利总投资。在财政部、水利部组织的全国年度评价中,浙江省重点县综合绩效获得第一名。

数据均来自于GTD或公开发表及出版的文献,其中的缺失部分采用期望值最大化方法即EM算法估计所得.采用二阶聚类的方法,可对含有类别变量和连续变量的大型数据集进行分析,并自动确定最终的分类个数.采用的贝叶斯判别法不仅能够考虑到各个总体出现的先验概率,又能考虑到错判造成的损失,且其判别效果相比于其他几种判别方法更加理想.

2分析方法

2.1统计分析步骤

1.对2015-2016年发生的、尚未有组织或个人宣称负责的恐怖袭击事件进行分析,找出主导某恐怖袭击事件最有可能的嫌疑人.第一步将相关联的事件根据相关性进行整合.第二步利用二阶聚类模型对2015-2016年处理过的数据进行二阶聚类分析,将数据进行分类并按照危害性从大到小选出前五个犯罪嫌疑人.第三步依据判别分析法中的贝叶斯方法对数据进行建模与分析,得出嫌疑人的嫌疑程度.

2.研究近三年来恐怖袭击事件发生规律.选取恐怖袭击发生在城市中心的次数、疑似恐怖袭击的次数、恐怖袭击成功的次数、恐怖袭击造成的死亡总人数、亡人事件百分比、平均每起事件死亡人数、恐怖袭击造成的受伤总人数、人质遭受绑架的次数等8个指标以区域为分类变量进行分析,研究下一年全球或某些重点地区的恐怖袭击态势.

恐怖主义指数受许多因素的影响.依据世界经济与和平研究所发布的156个国家的恐怖主义风险指数报告,选取了其中的总起数、总亡数、总受伤人数和财产损失等四个指标,通过计算四个指标分值再合并得到综合分值.考虑到目前财产损失的价格数值估计并不十分准确且获取较为困难,而中心城市是一个国家的经济政治中心,尤为重要,所以加入“恐怖袭击发生在城市中心的次数”这个指标.人质的绑架会给人们带来巨大的心理压力,造成社会一定程度的动荡不安.对于国家面对恐怖袭击的风险既要考虑直接恐怖袭击风险,还要考虑国家面对恐怖袭击的脆弱性,脆弱性低意味着同类别的恐怖袭击可能会造成更大的人员伤亡和财产损失,所以加入“亡人事件百分比、平均每起事件死亡人数这两个指标”.

2.2统计模型

1.二阶聚类模型

第一步为准聚类过程(Pre-cluster Step),采用专门应用于巨型数据的BIRCH(Balanced Iterative Reducing and Clustering using Hierarchies)聚类算法.建构一个多水平结构的聚类特征树(Cluster Feature Tree,CF-tree),其特点在于它是一种高度平衡的树(height-balanced tree).—般用CF-Vectors建立CF-tree.

这里的CF-Veclors为其中,

然而,设计理念的应用无处不在,工业设计不仅在引领着制造业在改革的春风里腾飞,同时也开始根植在中国文化领域的沃土上,滋养一方天地。全聚德的真空烤鸭、稻香村的糕点礼盒、工美花丝的春碗、非遗密云三烧等设计作品,无不诉说着设计曾在传统文化中着墨留痕的故事。

在这步过程中算法以“树”的结构来进行聚类.先是最大数值的进入,再依次一个个处理样本选择接近它保留在它的枝节或是节点上,否则就形成新的枝节.距离变化的衡量方式采用对数似然函数:

d(j,s)=ξi+ξj-ξ(j,s),

(1)

(2)

(3)

即ε的各分量之间是相互独立的.

2.错判损失的贝叶斯判别分析模型

若总体G1,G2,…,Gk的先验概率为{qi,i=1,2,3,…,k}且相应的密度函数{fi(x)},损失为{C(j/i)}时,划分的贝叶斯解如式(4)所示.

河流水质表达的本质是关于“污染物量”与“水量”的二元函数,河流天然“水量”的年际变化影响,远远大于人类的排放活动对河流水质的影响,需要约束的是“污染物量”的排放。

i=1,2,3,…,k

(4)

其中hj(X)为k个按先验概率加权的误判平均损失,

当抽取了一个未知总体的样品值X,先计算hj(X),然后比较其大小,选取其中最小的,则判定属于该总体.

基于贝叶斯判别分析模型来进行判断组织或个人嫌疑程度的大小,根据14个指标变量提取4个特征变量,以某组织或个人对做了该恐怖袭击事件的概率大小作为衡量标准,列出分类函数系数如表1所示.

为便于研究并消除由于观测量纲的差异及数量级不同所造成的影响,将原始变量进行0-1标准化,将原始变量及标准化后的变量向量均用X表示,用F1,F2,…,Fm(m<p)表示标准化后的公共因子模型,如式(5)所示.

(5)

模型的矩阵形式为:

X=AF+ε

(6)

并满足以下条件:

(1)X=(X1,X2,…,XP)'是可观测的随机变量,且均值向量E(X)=0,协方差矩阵cov (X)=Σ,协方差矩阵Σ与相关阵R相等.

(2)F=(F1,F2,…,Fm)'(m<p)是不可观测的变量,其均值向量E(F)=0,协方差矩阵cov (F)=I,即向量F的各分量是相互独立的.

(3)ε=(ε1,ε2,…,εP)'与F相互独立,E(ε)=0,ε的协方差矩阵Στ是对角方阵:

在“互联网 +”背景下,还应充分重视如何有效开展服务体系的创新活动,主要涉及两方面的内容。一是积极开展对外服务体系的创新活动,完善用户咨询区域的设置。二是进一步有效提升对内服务体系的创新水平。应从服务创新的制度入手,增强馆员的工作积极性,从而有利于实现良好的服务环境以及氛围,保证服务创新奖罚制度的完善,并开展有效的全面综合性评价。

乙型肝炎病毒(hepatitis B virus,HBV)简称乙肝病毒,是病毒性肝炎中危害最重、最广的传染性疾病,与肝硬化、肝癌等关系密切,居全球致死原因第10位。血液传播、母婴垂直传播及性传播是乙肝病毒最常见的传播方式,其中母婴垂直传播是最主要的。

(三)缺乏系统化的理论知识与技能;由于管理会计在我国的发展时间短,还没能形成一种较系统化的理论体系。理论不能正确的运用与实践、缺乏健全的制度使得管理会计的发展受到阻碍。企业内部控制的管理目标受到管理会计理论的缺失而无法得到实现,不能达到实时监控与内部控制的目的。

(7)

KA表示所用的连续变量,KB是所用的定类变量,Lk是定类变量的个数,Nv是在第v组中的样本个数.是第k个连续变量的方差.是在v组中的第k个连续变量的方差.Nvkl是从第v组中第k个定类变量的取出第l个分类的个数.采用对数似然函数作为距离的测量公式利用前一步的结果对每一个样本进行聚类分析.

其四,动态性。动态是指事物作为系统存在的运动、发展和变化。社会治理是多元主体合作共治管理社会事务的活动,系统内部各要素之间的相互作用和外部环境变化的影响,决定了社会治理系统必须根据变化及时作出相应调整,这就使得社会治理系统具有了动态性特征。研究社会治理,必须关注社会治理的动态变化。随着我国改革开放的不断深化,社会的开放性加剧了社会治理生态的复杂性[4],而社会治理外部环境的变化,尤其是各类社会组织和社会自治力量的快速兴起,加快了治理格局从政府一元主导的社会管理模式向多元主体共建的社会治理模式的转变。社会治理格局的变动,体现了社会治理的动态变化,同时也是发展的观点在社会治理领域的生动体现。

(4)cov (F,ε)=0,即F和ε是不相关的.

表2即事件201701090031为一号嫌疑人所为的概率是0.79001,四号嫌疑人所为的概率是0.20999.201702210037为一号嫌疑人所为的概率是0.00002,二号嫌疑人所为的概率是0.99997,四号嫌疑人所为的概率是0.00001.

Xi=ai1F1+ai2F2+…+apiFi+εi,

i=1,2,…,p

(8)

公共因子是无法观测的隐变量且其数量少于原始变量的数量.载荷矩阵是不可逆的,无法直接求得公共因子在原始变量表现的精确线性组合,所以运用回归的思想求出线性组合系数的估计值.

Fj=βj1X1+βj2X2+…+βjpXp,

j=1,2,…,m

(9)

图2可清晰看出危险度排序的前五位以及其组质心,可以通过概率大小判别2017年各个事件是这五个危险度最高的个人或组织所为的可能性大小.

3依据事件特征发现恐怖袭击事件制造者

对2015-2016年发生的、尚未有组织或个人宣称负责的恐怖袭击事件,运用二阶聚类的方法将可能是同一个恐怖组织或个人在不同时间、不同地点多次作案的若干案件归为一类,并选出前五个犯罪嫌疑人,依据贝叶斯判别分析的方法对2017年所发生事件的犯罪嫌疑人可能性大小进行归类,判别2017年中主导某恐怖袭击事件最有可能的嫌疑人.

由于数据的复杂性以及海量性,先将相关联的事件进行整合,整合规则由下列指标决定:eventid、extended、region、vicinity、doubtterr、success、suicide、attacktype1、targtype1、weaptype1、nkill、nwound、property、ishostkid、INT_ANY.接着利用二阶聚类模型对2015-2016年处理过的数据进行二阶聚类分析,结果如图1所示,考虑到恐怖组织与个人的种类复杂性与多样性,在满足分类数据差异性的前提下,将2015-2016年处理过的数据分为250类.

3.因子分析模型

综上所述,通过对基于需求的酒店管理系统的建模与实现,可以看出在实际实践期间必须做好对其各专业节点的实时把控,明确系统建模及最终实现必须是建立在顾客需求的根本上,以此使我国酒店管理水平能够得到有效提高进步,最大限度促进我国酒店行业的综合发展。

图1 二阶聚类结果

图2 典则判别函数图

表1 分类函数系数

危险度排序12345vincinity-0.145-0.1235.048-.1290.000targ type17.1590.51010.2317.1609.714nkill2.7062.292-0.0302.409-0.003nwound2.0621.9180.0021.5570.000(常量)-60.934-9.661-104.032-57.830-94.407

费希尔线性判别函数:

f1=-0.145vincinity+7.159targtype1+

2.706nkill+2.062nwound-60.934

f2=-0.123vincinity+0.510targtype1+

2.292nkill+1.918nwound-9.661

f3=5.048vincinity+10.231targtype1-

0.030nkill+0.002nwound-104.032

f4=0.000vincinity+9.714targtype1-

一首歌,每天都会产生新的旋律,每天都会谱写新的篇章,这首歌拥有永恒的主题,那就是——家;有这样一种人,走近时,你不会引起注意,远离时,你不会产生记忆。然而,正是因为他们默默无闻地辛勤工作,唱着一首首关于“家”的平凡而又温馨的歌,才使得我们的国家、我们的企业有了勃勃生机。

2015年张兰花从连队住进了团部的楼房,她不仅拥有了农用汽车、小汽车,还在库尔勒市购置了一套100余平米的楼房。“农忙时节种地住团部、节假日住城市,冬闲时节到内地旅游观光,观赏名山大川。”张兰花说,“这些年来,是团场这片热土滋养了我,给了我那么多的惊喜、感动和荣誉,我将一辈子报答团场,以一名党员的模范作用,带动和帮助更多的职工群众一起致富奔小康”。

0.003nkill+0.000nwound-94.407

βjp表示因子Fj在Xp上的得分,用每个主因子的贡献率作为权重进行加权汇总,得到各综合因子得分.

例如:选取201701090031、201702210037.

表2 事件概率

事件一号概率二号概率三号概率四号概率五号概率2017010900310.790010.000000.000000.209990.000002017022100370.000020.999970.000000.000010.00000

因子分析的数学模型是将样本表示为公共因子的线性组合:

4对未来恐怖袭击态势的分析

对近三年即2015-2017年的恐怖袭击事件分别分析并进行横向和纵向的对比找出规律,研究下一年全球或某些重点地区的恐怖袭击态势.

表3 KMO和巴特利检验

KMO取样适切性量数0.632巴特利特球形度检验近似卡方自由度显著性208.754280.000

经过KMO和巴特利检验(表3)显示KMO取样适切性量数为0.632大于0.5,所以该数据适合做因子分析.根据表4采用主成分分析集中了8个原始变量信息的96.176%.

表4 旋转后的成分矩阵

成分12袭击城市中心的次数0.9640.216疑似恐怖袭击的次数0.9390.234袭击成功的次数0.9600.243死亡总人数0.8790.438亡人事件百分比0.4170.866平均每起事件死亡人数0.1630.967受伤总人数0.9630.254人质遭受绑架的次数0.8810.427

以各因子的方差贡献率占两个因子总方差贡献率的比重作为权重进行加权且汇总,基于因子分析模型得出各城市的综合得分,其表达式为:

F=(67.615×F1+28.561×F2)÷96.176

剧场里变得静悄悄的,没有人理睬我,我恐惧地发现,有几个人已经悄悄地拿起了匕首,不知是谁先踏出第一步,这些人已经慢慢地向坐在座位上的人围了起来。

(10)

由表4可知,公共因子1在“袭击城市中心的次数”、“疑似恐怖袭击的次数”、“袭击成功的次数”、“死亡总人数”、“受伤总人数”、“人质遭受绑架的次数”上的载荷值都很大,主要反映整体遭受恐怖袭击的风险,命名为基本风险因子.而公共因子2在“亡人事件百分比”、“平均每起事件死亡人数”的载荷值较高,主要反映应对恐怖袭击的能力,命名为脆弱性因子.

对2015年1月—2017年12月江苏省如皋市育龄妇女死亡状况进行分析,选取606例育龄期死亡妇女的临床资料进行回顾性分析。育龄死亡妇女年龄为17~49岁。纳入标准:调查育龄死亡妇女,年龄处于15~50岁。排除标准:其他年龄段死亡女性;资料不全女性。

得出2015-2017年的F1(基本风险因子)、F2(脆弱性因子)两个主要因子,对比如表5和表6所示.

表5 基本风险因子得分

2015年2016年2017年区域1-0.54-0.36-0.69区域2-0.3-1.04-1.04区域3-0.47-0.33-0.54区域4-1.14-0.97-0.84区域5-0.080.050.17区域61.381.21.87区域7-0.66-0.67-0.5区域8-0.27-0.210.31区域9-0.15-0.4-0.52区域102.562.562.06区域110.020.290.01区域12-0.35-0.11-0.29

基本风险因子得分反映该地区遭受恐怖袭击的风险程度.经过纵向对比可知,区域10(中东和北非)近三年的基本风险因子得分均最高,是最需要加强防范恐怖袭击事件的地区.区域4(东亚)风险性最低,安全性最高.横向比较可知,区域10(中东和北非)尽管三年期间的风险性有所下降,但依然位于12个地区的首位,所以仍是反恐的重点地区.区域6(南亚)风险性还在提高,所以该地区下一年为反恐的重点地区.

表6 脆弱因子得分

2015年2016年2017年区域1-0.24-0.730.08区域2-1.161.470.61区域3-0.18-0.61-0.13区域41.571.180.32区域5-0.31-0.52-0.22区域6-0.190.19-0.04区域70.130.29-0.44区域8-0.9-1-1.85区域9-0.33-0.49-0.29区域100.350.470.45区域112.231.42.4区域12-0.97-1.65-0.88

脆弱性因子得分反映该地区应对恐怖袭击事件的能力.经过纵向对比可知,区域11(撒哈拉以南的非洲)近三年的脆弱性因子得分均最高,是最需要提高其应对能力的地区.相对来说区域12(澳大利亚和大洋洲)的应对能力最强.横向比较可知区域11(撒哈拉以南的非洲)三年间应对处理恐怖袭击的能力还在下降,值得一提的是,区域4(东亚)的应对能力在不断提高.

图3 近三年恐怖事件综合得分对比图

结合基本风险因子和脆弱性因子得到综合得分,由图3可知区域10(中东和北非)及区域6(南亚)恐怖袭击事态较为严重,不仅遭受恐怖袭击的风险性高,而且其应对处理恐怖袭击的能力也较低.另外区域5(东南亚)的综合得分不断提高,可知恐怖袭击事件有向东南亚区域转移的趋势.

5 结 论

通过灵活应用二阶聚类、判别分析、因子分析来对恐怖袭击事件记录数据进行量化分析.考虑到事件的相关性,对2015-2016年的未知作案组织或个人对应的事件数据进行整合简化.应用二阶聚类,充分利用数据差异性,选取最大分类数为250类.因为恐怖组织与个人的种类繁多且具有多样性,在这250类中每类所包含的事件数的多少来从大到小选出其中的前5个.对于恐怖事件的嫌疑程度,基于贝叶斯判别分析模型来进行判断组织或个人嫌疑程度的大小,根据14个指标变量提取4个主要特征,计算出某组织或个人实施该恐怖袭击事件的概率,根据其大小作为衡量标准.

根据主要原因、时空特性、蔓延特性、级别分布等规律,进而分析总结近三年来恐怖袭击事件发生规律和并预测下一年全球某些重点地区的恐怖袭击态势.选取了8个指标以区域为分类变量进行因子分析,最后得到2015-2017年关于12个地区在两个公共因子上的得分和总得分,经过横向和纵向的对比,可知区域10(中东和北非)恐怖袭击事态较为严重,不仅体现在遭受恐怖袭击的风险性高,而且其应对处理恐怖袭击的能力也较低,为下一年反恐的重点地区.同时区域10(中东和北非)与区域11(撒哈拉以南的非洲)也是需要加强反恐的地区.另外根据区域5(东南亚)的综合得分不断提高,可知恐怖袭击事件有向东南亚区域转移的趋势,总体来说,近三年的恐怖事件发生的区域及其风险性较为稳定.

听障学生通过依赖于除了声音外的各种感官进行学习,视频媒体作为聋人进行远距离学习的重要载体,能发挥重要作用。通过观看外界的视频,可以加强学习者与外界的沟通,从而加强协作交流。美国EDR(Educational Design Resources)以视频为基础,提供的教学及媒体服务,如向听障学生提供专家视频、视频聊天、视频作业、视频邮件以及桌面操作记录等来满足听障学生的学习需求。

参考文献

[1] SOFIA P K. The non-random nature of terrorism: An exploration of where and how global trends of terrorism have developed over 40 years[J].Studies in Conflict Terrorism,2016,39(12):1031-1049.

[2] THOMAS H. The future of jihadism in Europe: A pessimistic view [J] .Perspectives on Terrorism,2016,10(6):156-170.

[3] 李益斌.欧洲恐怖主义的新态势及原因分析——基于聚类分析法[J].情报杂志,2018,37(3):55-63.

[4] 杨振柳,李颖,钟子森.基于数据挖掘的恐怖袭击嫌疑对象判断研究[J].情报探索,2019(4):35-40.

[5] 华雅伦,王奇.基于GTD数据库的欧洲反恐形势分析及对我国的启示[J].犯罪研究,2018(5):91-105.

[6] 彭如香,张奥博,杨涛,孔华锋.基于GTD的全球恐怖主义活动现状与发展趋势研究[J].计算机应用与软件,2019,36(1):1-5+21.

MultipleStatisticalAnalysesforTerroristAttacks

XIE Zhendong,WEN Fan,ZHOU Ziya,OU Hui

(SchoolofMathematicsandStatistics,HunanNormalUniversity,Changsha,Hunan410081,China)

AbstractTerrorist attacks threaten the security of human society and cause social unrest to a certain extent. Selection of Global Terrorism Database (Global Terrorism Database, GTD) in 2015~2017 terrorist attacks in the world record of events, from 2015 to 2016 unknown crime organization or individual corresponding event data integration based on association simplified second order clustering are used to get the maximum number of classification, and according to the harm from big to small chosen five suspects, using discriminate analysis for 2017 unknown crime organization or individual corresponding event probability prediction, it is concluded that the suspect's degree of suspicion; After that, important indicators affecting terrorist attacks were selected to apply factor analysis to study the occurrence law of terrorist attacks in 2015~2017, and the regional development trend of terrorist incidents was obtained.

KeywordsSocial statistics; Trend prediction; Multivariate analysis; Terrorist attacks

收稿日期:2019-05-12

基金项目: 湖南省哲学社会科学基金一般项目(17YBA291),湖南省教育厅项目 (16C0952)

作者简介:欧 辉(1978—),女,湖南宁乡人,理学博士,副教授,硕士生导师,研究方向:应用统计.E-mail:343985382@qq.com

中图分类号C812

文献标识码A

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

谢振东:对恐怖袭击事件的多元统计分析论文
下载Doc文档

猜你喜欢