王向爱:对恐怖袭击事件记录数据的量化分析与研究论文

王向爱:对恐怖袭击事件记录数据的量化分析与研究论文

摘 要恐怖主义是人类的共同威胁,利用数据挖掘可以为反恐防恐提供有价值的信息支持.基于数据挖掘的思路,从恐怖袭击事件中提取能描述危险程度的特征属性,构建量化分级模型,并考虑准确率评价指标进行优化.通过组内平方和法分析改进高斯混合模型(GMM),对恐怖组织进行聚类分析,侦查出潜在最相关的嫌疑人.建立相关模型结合统计分析,得到恐怖袭击发生的主要原因、时空特性和蔓延特性,并对未来全球反恐态势进行预测,帮助反恐组织提高反恐的精准性和打击能力.

关键词应用统计数学; 恐怖袭击事件; 数据挖掘; GMM聚类分析

1 引 言

恐怖袭击具有明显的破坏性和暴力型.极端组织及极端分子的恐怖袭击极大威胁了社会的正常发展和工作,同时对人民的生活和经济财产造成了损害,对社会和经济都产生了重大的影响.近几十年来,全球各个国家都已经遭遇过很多不同程度的恐怖主义袭击事件.比如,当时震惊世界的“911”事件,事件的爆发不仅给美国带来了惨重的人员伤亡和经济损失,而且对全球的影响也是巨大的.2014年发生在中国昆明火车站的恐怖袭击事件,都说明了恐怖袭击事件就在我们身边,我们必须提高反恐意识,从这些发生的恐怖袭击事件中总结经验,认真做好反恐准备工作.

自从“911”事件发生后,国内外学者极大的重视恐怖袭击事件的研究.王前钱和宋明爽(2017)[1]对近几十年来研究恐怖袭击事件的文献进行分析,发现研究恐怖袭击事件的文献可以从1986年开始,而且2001年是恐怖袭击事件文献显著增加的一个转折点,由此可见,“911”事件为所有人敲响了警钟.但是恐怖袭击活动依旧频频发生.反对恐怖主义是世界各国都必须承担的责任和使命,深入挖掘恐怖袭击事件的相关数据对人们认识恐怖主义有很大的帮助,同时也能有效帮助提高反恐防恐的效率和效益.因此,如何根据历史数据准确地预测出未来的恐怖袭击事件,并对反恐提供相应的建议成为亟需解决的问题.

近年来,学者们越来越倾向于用大数据和统计分析的方法来研究恐怖袭击事件.例如,龚伟志等(2015)[2]针对传统算法在建立恐怖袭击风险预测模型时存在的缺陷,提出了大数据分析的模型,利用恐怖袭击事件的历史数据对未来进行预测,并做了仿真分析,大数据建模得出的结果具有比较高的准确率和效率.刘明辉(2018)[3]利用K-means聚类分析的方法,对1992年至2015年发生的民航系统恐怖袭击案件进行分析,预测2016年民航系统的恐怖袭击风险.结果发现,该方法能够智能地对统计数据进行分类,可以推广使用.另外,李永群等(2019)[4]利用数据挖掘的方法,分析了全球恐怖主义数据库中的数据,并对某些地区的反恐态势作出了预测,提出了相应的建议.目前,利用数据挖掘的方式进行恐怖袭击事件分析研究尚处于不成熟时期,大多数研究仅限对恐怖袭击事件的数据进行统计分析,还存在着巨大的潜在价值可被进一步挖掘.

喉源性咳嗽的病因病机相对特殊、复杂,如何准确诊断是其临床诊治方面的难点[13-15],本研究针对不同中医辨证分型喉源性咳嗽患者的各项临床检查结果进行分析后发现,不同中医辨证分型患者的嗜酸性粒细胞浓度、中性粒细胞浓度、血清C反应蛋白差异比较具有统计学意义(P<0.05),其局部病理改变以鼻中隔偏曲、鼻炎、咽喉炎、咽喉部滤泡增生为主,所有入组的证型患者的胸部X线片中未见肺部异常改变征象。卫表不固型患者的吸入性变应原检测为阳性,而经皮尔逊相关系数分析,喉源性咳嗽的局部病理改变与其中医辨证分型有关,这提示我们可根据临床检查项目对喉源性咳嗽的中医辨证分型进行进一步明确,以对其实施辨证论治。

在改革开放第一阶段,城市经济的高速发展对劳动力的需求不断增加,乡村劳动力大规模涌入城市,居民从村落向集镇和城镇转移,传统的以村落为基础的基层组织不断弱化和瓦解。在此过程中,城乡之间的流动处于严重不均衡的状态,乡村空心化随之出现。

本文基于美国马里兰大学搜集并构建的全球恐怖主义数据库[5] (Global Terrorism Database,GTD),以及2018年全国研究生数学建模竞赛C题的背景,首先通过数据挖掘思路,从恐怖袭击事件的变量中提取能描述危险程度的特征属性,考虑准确率评价指标优化构建的量化分级模型;通过组内平方和法(WSS)对聚类数进行参数敏感性分析,改进GMM聚类算法,实现对尚未被宣称负责的恐怖袭击事件进行潜在最相关的嫌疑人侦别;最后分析了近三年恐怖袭击事件的原因、时空和蔓延等特性,为下一年防控反恐提供有效的建议.

根据本次红外相机的调查数据,初步获得广东省青云山森林动态监测样地地面活动兽类和林下活动鸟类的物种名录,对部分鸟兽(如白鹇、野猪等)种类的种群状况也有所了解,为调查广东省青云山自然保护区现有的陆生脊椎动物多样性资源积累了基础数据。目前,已确认的鸟类和兽类共计18种,隶属于5目9科。

2模型的建立与求解

2.1危险性评价模型的建立与求解

(1) 数据处理

首先对数据进行预处理,去掉空值过多的属性和案件,通过方差分析计算得到各个属性的方差,初步筛选得到国家、目标、武器、财产、连环相关性、受伤亡和死亡人数这七个主要属性.针对国家属性,考虑到越少发生恐袭的国家,一般发生恐怖袭击的事件都比较严重将各个国家的恐怖袭击案件数分为五个等级.针对目标属性和武器属性,将这两个指标和伤亡人数联系起来,得到每个武器的在案件中的平均伤亡人数,进而得到武器的类型的危险性进行排名,并大规模杀伤性武器给较高危险性评分.针对财产损失,选property、extend的水平,构建财产损失分数.针对realate1的属性也通过五分位法处理.对于恐怖袭击造成的伤亡数目,即数据中的n_kill和n_wound这两个属性,进行归一化处理.

(2)模型的构建

首先,根据通过分析得到能描述危险程度的主要特征属性构建如下量化分级模型:

F=K+W+P+C+T+w+r,

(1)

式中:F为评定事件严重程度的分数,K为死亡人数,W是受伤人数,P代表财产损失.frank是量化分析所得到的分数,T是目标对象,w是武器类型,r是是否具有相关事件.

最后,把分数F归到0-5分的区间中,其中4-5分,定为一级事件;3-4分,定为二级事件;2-3分,定为三级事件;1-2分定为四级事件;而0-1分,定为五级事件.

(3)模型的优化针对以上式(1)所示的模型,通过在数据集中随机选取的1000个点,得到各个变量之间的余弦相似度,发现kill和wound两者的相关程度非常高,如果直接加入,可能会间接提高kill的权重.因此对通过准确率评价指标来对模型的权重参数进行调整.

准确率评价指标具体根据模型推荐的事件对应真实事件命中程度,来评价危害等级评定的准确性,准确率公式如下:

(2)

式中,P是事件准确率,Nm是模型推荐的事件,是抽样的事件数,通过此模型来优化模型.

(4)模型结果通过python编程得到最优值,此时恐怖袭击测试集样本的分级准确率达到94.32%,从而使得分级模型具分级效果最佳,与恐怖事件的真实的危险性以及所造成危害的严重性相匹配.通过模型(1)对任务中的事件进行分级,具体见表1.

表1 典型事件危害级别

事件编号危害级别200108110012一级事件200511180002二级事件200901170021一级事件201402110015五级事件201405010071四级事件201411070002三级事件201412160041五级事件201508010015五级事件201705080012五级事件

2.2恐怖袭击事件模型的建立与求解

(1) 数据预处理

首先对2015和2016年的数据进行数据预处理,筛选出能较好地描述恐怖袭击行为的特征属性,剔除不需要的数列,减少不必要的处理量.该组织或个人的危害性从大到小选出前5,同时在已处理的数据集中,增加了问题1中得出的分数和事件类型这两个特征属性,通过机器学习对文字型数据的特征属性重新编码,删除有缺失值的数据,最终得到10140个案件.

(2) 模型建立

高斯混合模型(GMM)算法是数据挖掘中,聚类分析常用而且较为成熟的算法,GMM的概率密度函数如下:

(3)

采用统计学SPSS22.0软件进行数据处理。卡方用以检验计数资料,t值用以检验计量资料,经P值判定组间差异,以P<0.05具有统计学意义。

P=Nm/Nt,

(4)

式中,N为数据点的个数,似然函数通常采用求导并令导数为零后解方程的形式求解,得到合适的参数,完成参数估计的过程.

图2为2015和2016年未知组织恐怖主义发起恐怖袭击的空间分布情况.根据前面筛选的特征属性对这些未知组织的恐怖组织进行聚类分析,将聚类得到的结果见图3(x坐标是事件的发生的经度,y坐标是事件发生的维度).此外,还考虑了运用K-means聚类的方法[6],但是得到聚类的结果不好,因此不再做具体分析.

在2015-2016年所有署名的14917个恐怖袭击案件,总共有457个组织有过声明,得到每个组织平均作案案件数为323,因此通过对未署名恐怖袭击案件聚类的聚类数目取为323.首先对所有的2015年和2016年的有组织宣称负责的暴恐事件的地区分布进行观察,根据式(3)计算得出概率密度,迭代直到(4)所得的似然函数收敛为止,根据恐怖组织的名称进行可视化分析以数据中的经纬度分别作为x,y轴,不同颜色代表不同的恐怖组织.得到图1(a)的结果恐怖组织恐怖袭击地区分布图.然后将各个事件的编号属性添加进去,得到图1(b).

(a) 恐怖袭击地区分布图

(b) 地区分布局部放大图

图1

式中,c是当年的某组织的活动城市数目;cl是去年某组织的活动城市数目;n是当年的某组织的活动国家数目;nl是去年某组织的活动国家数目.

究其原因,恐怖组织倾向于在势力范围进行恐怖袭击.所以从地理层面分析可见,相同区域的恐怖袭击事件为相同团伙及个人作案的概率极高,即空间分布是侦查犯罪嫌疑团伙极大的考虑因素.

图2 空间分布情况

图3 恐怖组织聚类分析结果

(3) GMM聚类结果

(4) 模型改进

聚类的数目会对聚类的效果有较大的影响,会影响结果的可靠性.对模型改进进行参数敏感性分析,对于最佳的聚类数目,根据组内平方和(WSS)来确定最佳聚类数目的方法,得到了聚类数目与WSS的关系图见图4.

由图4可得,从聚类数目从1到60,WSS下降得较快,之后下降速度平缓趋于稳定,聚类数目达到200后,发现已趋于平衡,所以聚类数目的范围选在60~200之间,做一个敏感性分析.分析结果发现,随着聚类数目增多,类也会随之变小,但是过多的类别,会导致某些案件附近会没有某种类别的点,从而导致结果的不准确性.因此,为使得聚类相对集中,且目标点周边有足够的类,取聚类数目为150.

羊肚菌作为近年来开发栽培成功的集食用、药用于一体的珍惜真菌新品种,已备受国内外学者的广泛关注[6-10]。其子实体含丰富的膳食纤维[11,12],便于开发功能性新型食品,增加羊肚菌残品的利用率。然而,现有报道鲜见从羊肚菌中提取可溶性膳食纤维的研究。目前, SDF提取方法主要有化学法[13]、发酵法[14]、超声波提取法等[15],其中化学法应用较为成熟,具有成本低、易操作、适应性强的优点。本试验以羊肚菌为原料,采用化学法提取羊肚菌可溶性膳食纤维,利 用单因素和响应面设计优化最佳提取工艺,为羊肚菌的综合利用提供了理论基础。

聚类数目

图4 聚类数目与WSS的关系图

(5) 改进后的结果分析

根据建立的危险性评价模型通过计算如上每个聚类中的frank危险性分数的总值,然后进行排序,从结果中取前五个最大案件,得到危险性评分前五的聚类号分别为132,145,61,117和78的聚类类型,如图5为目标点的聚类命中情况.然后,对这五个组织的行为特征和恐怖袭击事件特征构建特征向量,用余弦相似度进行关联度判定,最相关的则排在最前面,可以得到表2的排序

他将撕下来的纸摊开,铺平,然后他的铅笔在这张纸上慢慢地蠕动,再蠕动。过了一会儿,常爱兰发现纸上出现了一辆歪歪扭扭的独轮车,还有一个胡子拉碴的老男人。常爱兰的眼睛里就放出光来,但这种光却是凶光。常爱兰说,你在画什么,乱七八糟的东西,小心麻糍回来揍你。

对于我国社会发展而言,其拥有全球最广阔的工业机器人应用市场,并且随着我国工业产业结构的转型升级和人口红利的退减,导致的中国机器人应用市场的快速发展。并且可以预见在未来我国工业机器人的范围和使用将会呈现出柔性化、智能化等方向发展。

图5 目标点的聚类命中情况

2.3下一年反恐态势预测分析

(1) 背景分析

为了验证直观判断的偏差性,对两个组织当年案件中心到3年中心的距离做方差分析,同时界定方向,如果与前两年相比,2017年是远离中心的,记为正,否则为负,最终得到表10的结果.

(2) 统计分析

为了研究恐怖袭击事件发生的主要原因,从世界银行网站上获取了从1998年至2017年的相关经济数据,与附件中给出的恐怖袭击的次数进行了皮尔逊相关系数计算,得到的计算结果见表3.

表2 恐怖分子关于典型事件的嫌疑度

典型事件1号嫌疑人2号嫌疑人3号嫌疑人4号嫌疑人5号嫌疑人201701090031532412017022100371352201703120023243520170505000924352017050500102435201707010028531242017070200062435201708110018153242017110100061532420171201000353241

从表3中可知,上述中相关的经济指标和恐怖袭击事件最相关的是按图表集法衡量的GNI(现价美元)国民总收入,和汇款与职工报酬也有较高的相关性.通过上表可得,基于经济的因素恐袭的次数呈一定的相关关系,恐怖袭击次数和人口增长成负相关关系.所以在对反恐态势进行预测的时候必须从根源,如宗教、经济发展和人口分布等因素进行分析.

表3 袭击次数与相关经济指标的皮尔逊相关系数

经济指标相关系数经济指标相关系数次数1国土面积(平方千米)0.7936按图表集法衡量的 GNI(现价美元)0.8813外国直接投资净流入(BoP,现价美元)0.5358人口,总数0.8806商品贸易(GDP的百分比)0.4881已付劳工汇款和职工报酬(按现值美元计)0.8772Market capitalization of listed domestic companies 0.0036年份0.8764GDP 增长率(年百分比)-0.1323按图表集法衡量的人均国民总收入(GNI)(现价美元)0.8552军费支出(占GDP的百分比)-0.2202GDP(现价美元)0.8527按 GDP 平减指数衡量的通货膨胀(年通胀率)-0.6171人均 GDP(现价美元)0.8187人口增长(年度百分比)-0.72079

(3) 时空特性

a. 趋势分析

从图6中可以看出恐怖袭击次数,伤亡人数的趋势基本一致,都是从1998年到2014年之间不断增长,但是从2014年开始呈现下降趋势,由于全球反恐意识的增强,以及各国反恐措施的增加.

再对2015到2017三年的数据进行分析,发现恐怖袭击事件在不同的月份有波动趋势,因此统计了每年所有月份恐怖袭击事件发生的规律,同时得到了每个月平均恐怖袭击事件的危害程度,依据案发次数得到表4和表5.如表4为近三年每个月平均恐怖袭击事件的危害程度,可以发现,基本上每年的12月,是恐怖袭击事件的低发时段,而每年的5月份和8月份都是恐袭事件的高发时段.再结合表5中统计得到的数据,可以发现这一结果可能和伊斯兰教的传统节日有关系.

从时间分布来看,12月份发生恐怖袭击的概率较低于其他月份,而5月和8月发生的概率较高,而且恐袭的严重程度更高,这也是需要重点防范的时间段.根据上面分析,发现恐怖袭击的发生与节日有关联.因此,做了进一步探索,分析了近三年的节日趋势(见表6),从表中数据分析,对于节日来说,每年的恐怖袭击数目逐年减少,有时甚至会低于平均值,可能的解释是反恐组织或者相关政府已经注意到此规律,在节日时加强了戒备,而在未过节时则没有这种关系.结果说明,目前这些恐怖分子越来越不容易在节日时发起恐怖袭击,却容易在普通日子发起恐怖袭击,此发现也是防范恐怖袭击需要注意的地方.

图5 恐怖袭击次数,死亡和受伤人数

表4 近三年每个月平均恐怖袭击事件的危害程度

月份2017年2016年2015年单件案件严重程度方差91.15641.15431.12231.14430.0002111.05291.14661.03141.07700.002541.03501.15231.06171.08300.002531.08001.04771.16801.09860.0025121.06390.96581.08951.03980.0028101.11050.95131.03421.03200.004271.15910.97361.15121.09460.007361.07970.91511.11821.03770.007781.11680.96501.18791.08990.008610.98771.12041.23821.11540.010451.12400.88231.13891.04840.013820.87541.02381.23031.04310.0211

表5 近三年来所有月份恐怖袭击事件发生的规律

月份案件月份案件月份案件201501143620160512682017051021201502123120160111072017061010201508122720160811032017079452015051226201602110120170890920150101204201603108420170390020150412032016010107820170483020150711992016061077201702822201503112420160710652017018192015061109201604105320170980120150111098201601110322017011774201509105520160998220170107512015012104620160128592017012703

表6 2015年至2017的节日趋势

圣纪节事件数当年平均随机日子事件数当年平均2015.12.244238.78902015.3.123338.78902016.12.122935.09312016,3,124335.09312017.12.12528.17812017.3.122628.1781圣诞节随机日子2015,12,253338.78902015.4.64638.78902016.12.254235.09312016.4.63635.09312017.12.252428.17812017.4.63228.1781独立日随机日子2015.7.45438.78902015.9.194038.78902016.7.44135.09312016.9.194235.09312017.7.42528.17812017.9.192528.1781复活节随机日子2017.4.164938.78902015.11.154138.78902016.3.273035.09312016.11.154135.09312015.4.52728.17812017.11.152828.17801

b. 空间特性

在分析近三年来恐怖袭击事件发生的空间特性时,得到表7,即2015年至2017年不同地区恐怖袭击次数的分布情况.根据表7,可以得到恐怖袭击主要集中在撒哈拉以南的非洲、中东和北非、南亚等地区,结果表明这些地区的恐怖袭击风险依然较高,反恐态势仍然十分严峻.

表7 2015-2017年恐怖袭击次数不同地区分布比例

地区次数比例地区次数比例澳大利亚和大洋洲360.0009北美2340.00599中美洲和加勒比海地区80.0002南美5070.0128中亚340.0008南亚116540.2954东亚430.0010东南亚31690.0803东欧9270.0234撒哈拉以南的非洲60110.1523中东和北非159300.4038西欧8970.0227

在分析了恐怖袭击频发的地区后,对近三年来恐怖袭击次数在不同国家的分布情况也进行了研究,发现主要集中在伊拉克、阿富汗、印度、巴基斯坦、菲律宾、尼日利亚、也门、埃及、叙利亚等国,他们的总占比就达到了72%.其实,通过新闻等有效信息,不难理解他们是恐怖袭击的高发区,因为这些国家经常发生战争,而且受宗教等影响较大,导致了国家局势动荡,因而恐怖袭击不断,由此可见,这些国家反恐形势十分严峻.

(4) 蔓延特性

a. 模型建立

在解决蔓延特性问题时,是从城市和国家两个层面来考虑恐怖袭击的蔓延特性,因此,分别建立了年度城市蔓延分数和年度国家蔓延分数两个模型,具体公式如下:

通过似然函数度量用恐怖袭击事件与嫌疑恐怖组织之间特征相似程度,取为这些数据点的概率乘积取,为了方便计算取对数得到似然函数累加和的形式,计算方式如下式所示:

(5)

(6)

根据图1(b)中的各恐怖组织恐怖袭击事件地区分布情况,得到大部分的恐怖组织的活动都呈现集中分布的现象.

微通道要保持内部多相流的流动状态为层流,实现细胞在微通道中的有序排布。在粘性力远大于惯性力,或者雷诺数Re≤2 300时处于层流状态。在微通道中处于层流状态下的流体可以借助N-S方程得知流体压力损失情况。雷诺数方程和N-S方程具体公式为:

b. 结果分析

根据以上式(5)和式(6),分别获取了表8和表9所示2015至2017年十大作案次数最高的恐怖组织.分析表8得到,城市蔓延分数越高,则恐怖组织活跃的城市相比去年越多,说明该恐怖组织正在发展壮大,需要引起国际反恐组织的警惕.

表8 2015至2017年十大在城市

作案次数最高的恐怖组织

恐怖组织活动城市次数蔓延城市分数20152016201720162017ISIL230.00274.00295.0019.137.66Taliban57.00386.00329.00-15.54-14.77Al-Shabaab101.00136.00144.0034.655.88Boko Haram234.00123.00171.00-47.4439.02Kurdistan Workers' Party (PKK)118.00132.0071.0011.86-46.21New People's Army (NPA)237.00131.00253.00-44.7393.13(Ansar Allah)57.0063.0037.0010.53-41.27Maoists161.00158.00150.00-1.86-5.06Sinai Province of the Islamic State20.0018.0025.00-10.0038.89Palestinian Extremists59.0062.0030.005.08-51.61

分析表9,可以发现,2017年ISIL活动的国家减少了23.07%,而SPIS活动的国家增长了200%,说明ISIL恐怖组织的活动可能受到了抑制.因此,国际反恐组织需要警惕SPIS恐怖组织,防止其进一步蔓延.

1.文章老套,难出新意。千篇一律,老生常谈是学生作文的一大问题,学生为此也感到苦恼万分却又无计可施。造成这一问题的原因很多,比如对生活和社会缺少观察、思考和感悟,不能形成自己独特的见解;阅读经典书籍少,没有汲取有深度的思想;写作材料单一陈旧,或是缺少对材料的分析和评论……这里不作详细论述。千古文章,立意为上,缺乏新意的作文犹如身披华美衣裳的模特,让人记住的只有衣服。

综合以上对十大恐怖组织在城市和国家的蔓延分析,可得SPIS恐怖组织在城市和国家层面,都呈现扩大趋势.因此,国际反恐组织需要加强监控,及时控制住该组织势力扩大.同时,需要注意,NPA恐怖组织在国内,其扩展迅速,也需要引起国际反恐组织的警惕.

表9 2015至2017年十大在国家作案次数

最高的恐怖组织

恐怖组织活动国家次数蔓延国家分数20152016201720162017ISIL10.0013.0010.0030.00-23.08Taliban1.002.002.00100.000.00Al-Shabaab3.002.002.00-33.330.00Boko Haram5.004.004.00-20.000.00KurdistanWorkers'Party(PKK)1.004.004.00300.000.00New People's Army (NPA)1.001.001.000.000.00(Ansar Allah)2.002.002.000.000.00Maoists1.001.001.000.000.00Sinai Province of the Islamic State1.001.003.000.00200.00Palestinian Extremists2.002.003.000.0050.00

(5) 方差分析

a. 模型建立

进一步根据经纬度上空间分布来探求恐怖组织的蔓延特性,定义在经纬度上的中心求法,建立如下模型:

(7)

式中,lat代表点的纬度,lon代表点的经度.根据公式(7),进而可以得到描述经纬度的中心坐标arctan 2(y,x)和arctan 2(z,sqrt(x2+y2)).

b. 结果分析

以组织Islamic State of Iraq and the Levant (ISIL),编号238和Taliban组织,编号502为例.针对每年某个组织宣称当年的所有的事件,作为该组织当年的中心,针对三年所有事件的坐标中心,作为该组织三年的中心.通过测算不同年份当年中心和三年中心的距离,来判定该组织当年的活动是否具有蔓延性.图7是238和502组织的各个事件在经纬度上的分布情况,其中黄、绿、红分别代表2015年、2016年和2017年238组织宣称负责的事件;蓝色颜色由浅至深,是2015、2016、2017年502组织宣称负责的事件.由图可得出,238组织的事件分布的更加广泛,而502组织分布得更加集中.

(3)为了降低沥青混合料运输过程中温度的散失,运料车在运输过程中应加盖双层保温防尘的蓬布以及棉被覆盖运料车上。装料结束后,立即用棉被和油布覆盖,并安排专人进行检查和测试出场温度。

将图7(a)进行局部放大得到图图7(b),从图7(c)组织238和图7(d)组织502,可以进一步观察到核心点的蔓延趋势,从图中可以清楚的看到,238组织每年中心都在发生明显变化,而502组织中,当年的偏移相对来讲较小.

恐怖袭击事件的发生的主要原因有极端思想的扩散和侵害,以及不同恐怖组织的浪潮加剧了恐怖事件的连续性,并且由于国际上的反恐合作不够重视,以及地域等因素,使得各个国家之间不合作,互相形成了恐怖气氛.同时根据数据,可以发现大部分恐怖袭击都是以实现政治、经济、宗教或社会目标为目的,同时还具有胁迫、恐吓或煽动更多群众的意图来达到宣传恐怖主义的目的.

图7 238和502组织的各个事件的经纬度上的分布情况

从表10,可以得到,238组织的方向为正,方差比较大,则它的蔓延性和扩散性就越强,换言之,238组织的恐怖袭击事件更分散,而且有向外蔓延的势头.而502组织的方差比较小,则它的蔓延性和扩散性更弱.从事实上来分析,塔利班近年来的活动范围确实比较小而且相对固定,但ISIL不然,它是渗透到很多地区来发动恐怖袭击,所以分析得到的结果也得到了事实的支持.根据此种方法,还可对其他恐怖组织的蔓延性进行计算,再通过方差分析作为来衡量各个恐怖组织蔓延的趋势.从而可以更好的针对蔓延的恐怖组织进行有针对地防范.

(6) 级别分布

纵观我国目前大多数企业的企业市场营销策略,我们不难发现,我国当前所存在的企业市场营销策略都相对较为单一。大多数企业还是采用传统的市场营销模式,例如:电视、杂志、报纸等。这些老旧的市场营销模式普遍存在传播速度慢和传播效果差的特点,并且没有很好地解决信息时效性的特点,以至于最终传输给受众对象的资料都是过时的、失效的信息。

根据BDP数据分析网站,得到图8所示2015年至2017年的全球危险等级分布图.

表10 方差分析结果

组织2015/3年中心2016/3年中心2017/3年中心方差方向2380.85310.26911.11590.1252+5020.02690.09180.11420.0014+

图8 2015-2017年全球危险等级分布图

a. 模型建立

进一步根据经纬度上空间分布来探求恐怖组织的蔓延特性,定义经纬度上的中心求法,建立如下的模型:

(8)

式中:yn是恐怖袭击事件的增长率,np为前一年的恐怖袭击事件数,na为后一年的恐怖袭击事件数.

b. 结果分析

9月27日,巢湖市政府会务中心隆重举行合肥健信云海科技有限公司(筹)新建年产100万只汽车镁轮毂项目投资合作协议签约仪式,这标志着巢湖镁产业再添新丁,未来在延伸巢湖新材料产业链的同时,与周边现有新能源汽车产业紧密衔接,必将有力推动巢湖岸边新能源汽车产业的快速发展、高效发展、集聚发展。该项目位于居巢经开区夏阁园区,规划预计总占地面积约450亩,总投资10.8亿元,固定资产投资约10亿元,建设年产100万只镁轮毂4条生产线厂房、研发大楼及配套设施,项目全部达产后,年产镁汽车轮毂100万只,预计销售收入约20亿元。

根据式(8),对2016年和2017年的恐怖袭击级别变化趋势进行计算,取较有代表性的地区分析,得到如表11.

(2)齐波夫定律虽然在使用上方便、简单,但在数学推导上存在空白区,致使难以对误差大小进行判断[10]。

综上分析可得,对个别区域需要特别重点加防,撒哈拉以南的非洲、中东和北非、南亚等地区是冲突地区,国际组织帮助发展经济,解决地区贫困,宗教、政治冲突等因素是解决恐袭事件的根本措施.北美、西欧国家等发达国家需要注意对极端恐怖主义的防治,而且恐怖组织的蔓延有跨国家跨城市的趋势.因此对恐怖事件降低为零的地区对恐怖主义势力不能掉以轻心.

表11 2016和2017年部分恐怖袭击级别变化趋势表

区域年份一级二级三级四级五级北美20161.2660.1420.166-0.55620170.029-0.3120.8571.750中美洲20160.500-0.889-0.571-0.8572017-0.3333.000-0.667中亚20160.3330.00020171.000-1.000-1.000-0.667中东和北非2016-0.360-0.135-0.0170.0652017-0.096-0.462-0.563-0.423

注:代表恐怖主义在平息后又重新行动.

3 结 论

通过数据挖掘思路,从恐怖袭击事件的变量中提取能描述危险程度的特征属性,考虑准确率评价指标优化构建的量化分级模型,结果表明模型具有较高的准确性,而且较为客观和直观;进一步采用GMM模型聚类,通过组内平方和法对聚类数进行参数敏感性分析,改进聚类算法,可以有效地帮助反恐组织侦查潜在最相关的嫌疑人;最后对近三年的恐怖袭击事件进行挖掘,基于模型分析对下一年反恐态势的预测,帮助反恐组织对恐怖袭击事件原因、时空和蔓延等特性有更为全面地了解,提高反恐的精准性和打击能力.

参考文献

[1] 王前钱, 宋明爽. 恐怖袭击事件之分析与思考[J]. 法制博览, 2017(16): 287-289.

[2] 龚伟志, 刘增良, 王烨等. 基于大数据分析恐怖袭击风险预测研究与仿真[J]. 计算机仿真, 2015, 32 (4): 30-33.

[3] 刘明辉. 基于K-means聚类分析的民航系统恐怖主义风险评估[J]. 数据分析与知识发现, 2018, 2 (10): 21-26.

[4] 李永群, 应万明, 袁飞, 韩玉春. 基于数据挖掘的全球恐怖主义数据库数据分析[J]. 经济数学, 2019(2): 91-94.

[5] Lafree G, Dugan L. Introducing the global terrorism database[J]. Terrorism&Political Violence, 2007, 19(2): 168-173.

[6] Jain A K. Data clustering: 50 years beyond K-means[J]. Pattern recognition letters, 2010, 31(8): 651-666.

QuantitativeAnalysisandResearchontheRecordedDataofTerroristAttacks

WANG Xiang’ai1,ZHUANG Yuanqiang2,XIE Weidun3,ZHOU Jinhua4,WANG Liping4

(1.BusinessSchool,HunanUniversity,Changsha,Hunan410082,China; 2. CollegeofMechanicalandVehicleEngineering,HunanUniversity,Changsha,Hunan410082,China; 3. CollegeofComputerScienceandElectrionicEngineering,HunanUniversity,Changsha,Hunan 410082 , China;4.CollegeofMathematicsandEconometrics,HunanUniversity,Changsha,Hunan 410082 , China)

AbstractTerrorism is a common threat to mankind. The purpose of this paper is using data mining to provide valuable information support for counter-terrorism and terrorism prevention. Based on the idea of data mining, the feature attributes that can describe the degree of danger are extracted from the terrorist attacks, and the quantitative grading model is constructed, and the accuracy rate evaluation index is considered to optimize. Then, the clustering method was optimized by the within-group square method, and the Gaussian mixed model (GMM) model is used to cluster the terrorist organizations to detect the suspects which is the most relevant. In addition, through statistical analysis and established mathematical models, the main causes, spatio-temporal characteristics and spread characteristics of terrorist attacks are obtained, and the future global counter-terrorism situation is predicted to help anti-terrorism organizations improve the accuracy and strike ability of anti-terrorism.

KeywordsSapplied statistical mathematics; Terrorist attack; Data mining; GMM clustering analysis

收稿日期:2018-12-29

基金项目: 湖南大学研究生参加数学建模竞赛资助项目531107040945; 湖南省教改项目531111040163

作者简介:王向爱(1995—),女,甘肃白银人,硕士研究生,主要研究管理统计与计量经济.E-mail:wangxiangai@hnu.edu.cn

中图分类号O213

文献标识码A

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

王向爱:对恐怖袭击事件记录数据的量化分析与研究论文
下载Doc文档

猜你喜欢