陈栾杰:基于时间序列的网格化城市管理案件预测模型研究论文

陈栾杰:基于时间序列的网格化城市管理案件预测模型研究论文

【摘要】针对传统或流行的基于时间序列的预测模型,探索出一种适用于网格化城市管理的成体系的案件预测方法。分别采用博克斯-詹金斯法、Auto-ARIMA以及LSTM模型,对近几年北京市6个城区各站点网格化管理问题案件数量进行预测,通过对比不同模型方法间准确度和实用性,以MAPE为精度评价指标,分析各个模型应用在城市网格化问题预测方面优势与劣势。研究发现,Auto-ARIMA适合进行对网格化管理问题数量趋势预测,博克斯-詹金斯法在解决滞后性问题中预测准确率很高,但由于预测流程烦琐,因此实用性较差,LSTM预测效果相对准确且平稳,可以在样本输入量、参数以及自身架构上进行进一步优化。

【关键词】网格化城市管理;案件数量预测;LSTM;博克斯-詹金斯法;Auto-ARIMA

0 引 言

随着中国城市化进程的加快,暴露垃圾、无照经营游商等一系列城市管理问题也开始逐渐增多。而要解决城市发展过程中的问题,离不开科学、完善的城市管理体制与城市管理手段。网格化城市管理模式由于结合了先进的信息技术与科技手段,已经在城市化进程中逐渐兴起[1]。由于网格化城市管理以高效、敏捷、精确为目的,因此对于网格化城市管理问题预测的研究就显得更加必要。

另一方面,城市管理问题是以案件数量为单位,因此对城市管理问题案件分析成为新的研究方向。由于城市管理问题案件数量需要定期进行总结分析,所以将案件数量按时间顺序排列数据集合符合时间序列方法数据特征。因此,可以将时间序列方法作为一种必要的新思路与网格化城市管理问题相结合,从而高效地进行城市管理问题的解决。

在施工过程中使用先进的信息技术。既能提高施工管理水平,又能提高施工效率。利用统计手段实现信息化。对建筑施工中使用的所有材料、设备和工作人员进行严格核算,从而使工作人员的重新部署合理化,同时避免了设备闲置的可能性。在信息管理方法中,我们还可以利用网络视频监控技术对施工现场进行全面监控。并对多媒体数据传输进行监控,使施工单位管理者能够通过视频问题对施工过程进行监控和查找,并针对这一问题提出相应的解决办法。同时,视频监控技术也可用于严格管理施工现场的材料和设备,避免出现材料流失的现象。

目前,国内少有学者将基于时间序列预测应用到网格化城市管理当中。佘冰[2]等将网格化城市管理问题以空间角度进行可视化分析,为进一步在空间上统计建模分析奠定基础;常燕军等[3]对ARIMA算法在网格化管理预测上的应用进行了初探,但尚未形成体系化方法。本文旨在探究适用于网格化城市管理问题预测模型,根据不同模型优势与劣势,从而研究出一种实用性强、准确率高、成体系的预测方法。

在上述干扰场景和干扰参数下,采用四相位等分分段多相位分段调制干扰,相位值按照从小到大的顺序进行调制,与间歇采样重复转发干扰进行以下3组仿真对比实验,各实验进行100次蒙特卡洛仿真,各组MTD结果取蒙特卡洛仿真结果均值的最大值对应的距离和速度作为目标信息。

1 网格化管理相关的时间序列模型概述

由于网格化城市管理问题的案件发生存在一定随机性,且不存在明显变化规律,不同站点案件数量也并不统一。因此在选择模型时,应当选择适用于非季节性的时间序列模型。针对这一数据特点,本实验采用博克斯-詹金斯法中的ARMA模型、ARIMA模型,以及Auto-ARIMA模型和LSTM模型,它们对于时间序列变化特点没有特别要求。

不过,在笔者看来,正是因为这样的事件发生,才让大家看到这个被称为“地球上最难通过的考试”的公正与公平性。要获得侍酒师大师的称号真的非常难,大多数参加这一考试的学员都做好了奋斗数年甚至十多年的准备去通过这样一场考试。这一称号的背后代表的是国际顶尖的葡萄酒行业专家对个人的认可,这既是一份荣誉,同时也是一份责任。如开篇所提到的,正是每一位“大师”对这一头衔的珍视和维护,才让这个证书有如此高的含金量。

1.1 博克斯-詹金斯法

博克斯-詹金斯法(Box-Jenkins Method)是由乔治·博克斯(George E.P. Box)和格威利姆·詹金斯(Gwilym Jenkins)于20世纪70年代提出的著名时间序列预测方法[4]。该预测方法经历了模式识别、模型参数估计、应用模型预测3个阶段,是一种精度相当高的短期时间序列预测方法[5]。其中在模式识别阶段,根据数据预处理的方式不同,可将预测模型分为自回归移动平均模型(Auto-Regressive Moving Average Model,ARMA)与差分自回归移动平均模型(Autoregressive Integrated Moving Average Model, ARIMA)。在参数估计阶段,ARMA模型所需要确定的参数为p、q,其中p代表自回归项数,它表示样本数据的滞后数,q代表移动平均项数,它表示预测误差的滞后数。ARIMA模型在保留ARMA的参数p、q的基础上,多出了参数d,参数d代表时间序列趋于平稳时所需要的差分次数,而ARMA模型与ARIMA模型的唯一区别在于是否对样本时间序列进行差分处理。

1.2 Auto-ARIMA

博克斯-詹金斯法是一种被证明过的、有一定准确度的时间序列预测方法,但在实际应用中,对于时间序列的平稳化处理和参数调整过程是十分耗时的。在实现博克斯-詹金斯法时,需要让数据保持平稳,同时p和q值的确定过程十分烦琐且不易达到精确值,这会使博克斯-詹金斯法的ARMA或ARIMA模型的使用条件变得十分苛刻。因此,针对博克斯-詹金斯法在实际应用中造成的困扰,而Auto ARIMA[6]能够省去p和q值确定的过程,使模型的数据接受能力更强。Auto-ARIMA采用了Hyndman-Khandakar算法,它最早被封装为R语言的包[6],之后被应用于Python语言的包中。

1.3 LSTM

人工神经网络(Artificial Neural Network,ANN)是人工智能领域的研究热点[7],它对人脑神经元进行抽象化表示,从而形成各类人工神经网络模型。其中,循环神经网络(Recurrent Neural Networks,RNN)作为其中的重要分支,被广泛应用于语音识别领域[8-9]。长短期记忆神经网络(Long Short-Term Memory, LSTM)作为对RNN的改进,解决了RNN存在的梯度爆炸或梯度消失的问题[10]。LSTM由塞普·霍克赖特(Sepp Hochreiter)[10]团队于20世纪90年代提出,并在近期被克亚历山大·格雷夫斯(Alexander Graves)[11]进行了推广和改良。与传统的RNN相比,LSTM使用记忆块(Memory Blocks)替代RNN的隐层单元(Hidden Units),这些记忆块中的记忆单元(Memory Cell)用于存储之前序列的信息。同时为了去除或增加信息到记忆块,LSTM增加了3种“门”(Gate)的结构:输入门(Input Gate)、输出门(Output Gate)、遗忘门(Forget Gate)。它们用于记住重要信息,忘记不重要的信息。LSTM的记忆块结构如图1所示。

图1 LSTM记忆单元结构
Fig.1 LSTM memory cell structure

2 网格化城市管理统计数据实证分析

2.1 数据来源

研究中所用到的实验数据为2015~2018年北京市6个城区各个站点的无照经营游商、乱堆物堆料、暴露垃圾、积存垃圾渣土、非法小广告等5种网格化管理问题的案件数量,其中案件数量的统计以月为单位。数据来源于北京城市系统工程研究中心。本实验将以“无照经营游商”这一种网格化管理问题为例,测试与比较各个时间序列模型的适用性。此外,由于各站点的案件数据有一定的敏感性,故在本文中隐藏真实的站点名。

2.2 评价指标

本文对于各个模型间与模型内部的比较均使用平均绝对百分误差值(Mean Absolute Percentage Error,MAPE)作为评价指标。计算方法如下:

式中,yi*指的是样本实际数据值,yi指的是样本预测数据值,n指的是预测的样本数量。由式(1)可知,MAPE的值越小,表明预测值与实际值之间偏差越小,预测性能越好,反之则预测性能越差。

先说学术权力行政化。我国社会的“官本位”意识浓厚,这种“官本位”观念也渗透到了高校的学术管理中,影响到了学术管理中的行政权力的正当行使。在学术管理中,许多行政人员唯官是从,习惯于按照官的指示办事,而很少考虑学术发展的客观规律。随之而来的是服务意识淡薄,行政人员自身定位不准,对学术管理中学术人员应有的主体地位和学术权力的主导地位认识有限,服务不到位。各种委员会的设置缺乏明确的章程,任务不明,职责不清,这说明我国许多高校的学术机构在人员构成上具有明显的行政化倾向。

2.3 基于时间序列的模型预测

相关系数r的取值范围在(-1~+1)之间,即|r|≤1。|r|越接近于1,则表明x站点与y站点线性相关程度越高。当r=-1时,x站点与y站点之间为完全负线性相关关系;当r=+1,x站点与y站点之间为完全正线性相关关系;当r=0时,x站点与y站点之间不存在线性相关关系。

1)数据平稳性分析与处理

由于博克斯-詹金斯法要求数据序列有较强的平稳性,因此,需要对样本数据序列进行平稳性检验。表1展现了样本数据序列的ADF(Augmented Dickey-Fuller Test)单位根检验[12]结果。由于部分站点的ADF检验结果均大于99%、95%、90%置信区间下临界的ADF检验值,因此样本数据序列不平稳,故需要对样本数据序列进行平稳化处理。本实验将样本数据序列进行对数化,从而提高样本数据序列的平稳性。由表2可知,在对数化后,各站点的ADF检验结果均小于99%、95%、90%置信区间下临界的ADF检验值,且P-value值接近于零,因此数据经过平稳化处理后平稳性达到了ADF根检验的标准。

表1 博克斯-詹金斯法样本数据序列各站点ADF单位根检验表
Tab.1 The ADF test result of each site with Box-Jenkins Method

站点编号 ADF Test Result%1统计值 %5统计值 %10统计值P-value 1-2.44 -3.58 -2.92 -2.60 0.13 2-3.26 -3.58 -2.92 -2.60 0.16 3-3.25 -3.58 -2.92 -2.60 0.01 4-3.58 -3.58 -2.92 -2.60 0.01 5-3.65 -3.58 -2.92 -2.60 0.01 6-2.43 -3.58 -2.92 -2.60 0.13 7-3.34 -3.58 -2.92 -2.60 0.01 8-3.01 -3.58 -2.92 -2.60 0.03 9-2.68 -3.58 -2.92 -2.60 0.07 10 -2.54 -3.58 -2.92 -2.60 0.10 11 -1.59 -3.58 -2.92 -2.60 0.48 12 -2.99 -3.58 -2.92 -2.60 0.03 13 -2.38 -3.58 -2.92 -2.60 0.14 14 -3.88 -3.58 -2.9 -2.60 0.01 15 -3.02 -3.58 -2.92 -2.60 0.03

表2 博克斯-詹金斯法样本数据序列平稳化处理后各站点ADF单位根检验表
Tab.2 The ADF test result of each site with Box-Jenkins Method after stationary processing

站点编号 ADF Test Result%1统计值 %5统计值 %10统计值 P-value 1 -5.04 -3.58 -2.92 -2.60 1.84e-05 2-6.22 -3.58 -2.92 -2.60 5.10e-08 3-5.88 -3.58 -2.92 -2.60 3.02e-07 4-5.76 -3.58 -2.92 -2.60 5.54e-07 5 -6.92 -3.58 -2.92 -2.60 1.11e-09 6 -5.96 -3.58 -2.92 -2.60 2.02e-07 7-5.39 -3.58 -2.92 -2.60 3.54e-06 8-7.06 -3.58 -2.92 -2.60 5.04e-10 9-6.58 -3.58 -2.92 -2.60 7.45e-09 10 -5.07 -3.58 -2.92 -2.60 1.57e-05 11 -6.69 -3.58 -2.92 -2.60 4.09e-09 12 -6.69 -3.58 -2.92 -2.60 3.93e-09 13 -5.78 -3.58 -2.92 -2.60 5.10e-07 14 -5.80 -3.58 -2.92 -2.60 4.64e-07 15 -5.92 -3.58 -2.92 -2.60 2.43e-07

2)构建ARMA模型

1.前提假设手册。首先,建立财务模型之前要将投资领域的各种基础元素进行计算,即在哪些领域需要进行资金投入,投入的依据和金额,通过书面的形式进行说明。最终汇总出财务模型所需要的全部投资要素的信息,以及信息来源和具备说服力的算法。这项工作一般通过建立前提假设手册来实现,使财务模型的基本结构、功能和关键点能够清晰的体现出来。

在建模前,由于神经网络对输入数据十分敏感,同时也由于单个站点内的不同月份中,案件数量可能有很大差别,因此需要对样本数据进行归一化处理。本实验采用的归一化函数如下:

3)预测结果分析

采用博克斯-詹金斯法时,“无照经营游商”网格化管理问题各个站点的MAPE值均小于1。与此同时,以图2的6个站点为例,将预测值与实际值对比分析后可以发现,使用博克斯-詹金斯法预测站点案件数量存在明显的滞后性,且预测值相对实际值滞后一个单位。于是在手动将预测值提前一个单位后,各站点MAPE值下降到0.4以下,预测效果有明显的改观。

图2 博克斯-詹金斯法部分站点预测值与实际值对比图
Fig.2 The comparison of predicted value and actual value in some of sites with Box-Jenkins Method

式中,中Xnorm为归一化后的数据,X为样本数据,Xmax、Xmin分别为样本数据集的最大值和最小值。

采用Auto-ARIMA模型解决数据预处理具有烦琐、滞后性等问题,得到的部分站点预测值与实际值对比数据如图3所示。从图中可以看出,采用Auto-ARIMA模型无准确性可言,仅仅能够预测样本时间序列的趋势。

在全球化的今天,多元化的潮流依然存在,我们无法阻挡任何文化的传播和交流,文化交流不仅是推进世界文化进步的一个重要条件,也是推进世界文化多元性的内在要求。当下,我国民众通过引进剧知晓国外的风俗人情和文化生活,其所带来的外来文化的发展趋势锐不可当。从这方面看,引进剧在中国的发展前景可谓是有大好前途的。众所周知,辩证的看待事物发展的两面性是马克思主义理论的精髓,引进剧在我国发展的光明前途和它或许存在的消极影响正如硬币的正反面,我们不能忽视。因此,从这个角度分析,在现代化与社会主义的双重视野下,理性地审视引进剧与中国文化建设的关联,不只是创新繁荣中国文化的需要,更是兴盛21世纪马克思主义的需要。

在无照经营游商网格化管理问题中,每两个站点间的相关系数值如图4所示。它的纵坐标代表相关系数r的值,横坐标代表站点x,任意站点x对应的散点为站点y。从图中可知,多数站点间呈中度相关或者低度相关,数据间的相关性较弱,因此不适用于LSTM的统一预测,应该采用LTSM的分站点预测。

图3 Auto-ARIMA部分站点预测值与实际值对比图
Fig.3 The comparison of predicted value and actual value in some of sites with Auto-ARIMA model

2.3.3 LSTM

1)数据相关性分析

LSTM支持相关性强的数据间的统一预测,即在各站点数据相关性强的条件下,可以将所有站点的所有数据作为统一的输入进行预测。因此,首先采用皮尔逊相关系数法度量各站点案件量的相关性。皮尔逊相关系数法是一种精确度量两个变量间关系密切程度的统计学方法。

将两个站点定义为x和y,将i定义为第i个月的案件数量,记为(xi,yi)(i=1,2,···,n),则应用皮尔逊相关系数法比较各站点的相关系数r的数学表达式为:

2.3.1 博克斯-詹金斯法

任意两个站点间的相关程度可分为以下几种情况:当|r|≥0.8时,可视为两站点高度相关;当0.5≤|r|<0.8时,可视为两战点中度相关;当0.3≤|r|<0.5时,可视为两站点低度相关;当|r|<0.3时,说明两站点之间的相关程度极弱,可视为非线性相关[14]。

我国设施农业技术推广的另一重要问题是缺乏资金的支持。设施农业技术的推广需要大量资金,设施农业在全国范围内推广效果欠佳,根本原因是农业技术创新度不够以及国内农业全面机械化需要不断的资金支持。由于地方和国家的财政部门对于技术推广没有足够的重视程度,在国家财政预算中未能将设施农业技术推广纳入其中,导致技术推广资金支持不足。

图4 “无照经营游商”网格化管理问题各站点案件量相关性散点图
Fig.4 The correlation scatter plot about grid city management problem of unlicensed business activities

2)模型构建与参数选择

在对样本数据序列进行平稳化处理后,需要进行p、q的参数估计。由于没有进行差分操作数据便已经通过了ADF根检验,因此将采用ARMA模型进行建模。对于p、q的参数估计,采用传统的AIC、BIC统计量自动确定[13],通过借助Python语言的statsmodels包实现对于各个站点阶数的确定。

在人类悠然长久的历史之中,任何一个时代的艺术设计都将会是这个时代的心态写照和情感表达。而不同的设计或是艺术都是从不同的方面进行情感的表达,共同的诠释着这个他们曾经生活过的时代的审美意识和感情。在其中,每个人也都有着属于自己独一无二的气息,当我们处于这片时空中,这个空间里,当气息遇见了“器息”时,又会产生怎样的情感呢?

2.3.2 Auto-ARIMA模型

洞口塌方控制措施包括:(1)采用适宜的地表加固防护措施,施作套拱,确保洞口段施工安全;(2)进、出口端洞口,施工条件复杂,施工扰动易产生落石崩塌,造成施工安全事故,施工中须加强支护措施和地表监测;(3)做好地质超前预报及监控量测工作,根据量测信息及时调整支护参数和施工工序。

在进行输入数据的归一化后,为了使模型具有较强的泛化能力,还需要利用随机函数将样本数据序列完全打乱,从而增强预测的合理性和准确性。实验表明,相比于不打乱样本数据序列,打乱样本数据序列的预测结果的精度要更高。在进行数据打乱后,将整个数据集分为训练集与测试集两部分。其中训练集占所有数据的80%,测试集占所有数据的20%。在模型构建时,本实验的后端采用Google的第二代分布式机器学习系统Tensorflow[15]来实现,前端采用Keras框架来实现。网络的逻辑结构如图5所示。

图5 本实验采用的LSTM网络逻辑结构图
Fig.5 The neural network structure used in the experiment

本模型采用随机梯度下降(Stochastic Gradient Descent, SGD)的方法进行优化,LSTM层包含的节点数为50,时间步长为10,学习率为0.001,批处理大小为16,迭代次数为800,激活函数采用ReLU激活。

3)预测结果分析

采用LSTM进行预测时,“无照经营游商”网格化管理问题中站点12的MAPE值相对最小,预测结果相比其他站点更加准确;而站点5的MAPE值相对最大,预测结果相比其他站点更加不准确。

为了研究生物炭对南疆沙化土壤的盐碱性和土壤水溶性盐的影响,测定了土壤样品的pH值和电导。由图3可以看出,随着生物炭含量的增加,土壤样品的电导增加,这可能是因为棉花秸秆中含有大量的钾、钠、镁、钙等金属元素,在热解过程中,生成相应的氯化物、碳酸盐和碳酸氢盐等可溶性盐,随着生物炭含量的增加,相应的可溶性盐的含量也随之增加,最终导致电导增大。由图3还可看出,土壤pH值随生物炭含量增加出现降低的趋势,这与侯艳艳等[14]研究结果一致。可见生物炭的施入降低了南疆沙化土壤的酸碱度,这可能会提高当地土壤肥力,对当地碱性土壤改良具有重要的作用。至于棉秆基生物炭降低南疆沙化土壤pH值的机制尚需进一步探讨。

在采用“无照经营游商”网格化管理问题站点12的案件量数据进行预测时,其MAPE值如图6所示;在采用“无照经营游商”网格化管理问题站点5的案件量数据进行预测时,其MAPE值如图7所示。

图6 采用LSTM时站点12的MAPE值图
Fig.6 MAPE of Site 12 with LSTM

图7 采用LSTM时站点5的MAPE值图
Fig.7 MAPE of Site 5 with LSTM

可以看出,随着迭代次数的增加,站点12与站点5的MAPE值逐渐趋于平稳。其中,站点12的训练数据的MAPE值最终趋近于0.10,而测试数据的MAPE值最终趋近于0.24。站点5的训练数据的MAPE值最终趋近于0.31,而测试数据的MAPE值最终趋近于0.51。由实验得出,在将“无照经营游商”网格化管理问题的所有站点进行预测后,各站点训练数据的预测结果MAPE值均小于0.4,而测试数据的预测结果MAPE值均小于0.6。

2.3.4 各时间序列模型的对比结果

根据各个模型的运行结果,本文将其MAPE汇总进行对比。“无照经营游商”网格化管理问题中各模型各站点的预测MAPE值如图8所示。从图中可知,若仅考虑预测效果,则在解决滞后性问题后的博克斯-詹金斯法相比于其他方法更加准确;若不解决博克斯-詹金斯法的滞后性,则LSTM相对更加准确。

图8 不同模型之间预测结果MAPE对比图
Fig.8 MAPE comparison of predicted results between different models

3 结束语

本文实现了3种基于时间序列的网格化管理问题预测方法,并对比了这3种模型各自的优势与劣势。对于Auto-ARIMA来说,该模型适合对网格化管理问题数量趋势进行预测,但不适合进行进一步高精度预测。博克斯-詹金斯法虽然最终预测效果相比于其他2种模型更加准确,但在实际应用中,该模型相对烦琐的预测流程限制了其进一步推广。博克斯-詹金斯法烦琐的预测流程主要体现在4个方面:1)在进行预测前,需要对样本数据序列进行如对数化、差分等一系列数据平稳化操作;2)在对样本数据平稳化处理后还需要对数据进行ADF单位根检验,若未通过检验则会使预测结果有很大偏差;3)该模型参数很难定论,本例中参数p和q会被限制在statsmodels包所给定范围内;4)该模型产生的结果可能存在滞后性,人工观察滞后步数减缓了其预测速度。对于LSTM来说,其预测效果相对准确,预测精度较为平稳,且相比博克斯-詹金斯法,没有过多繁琐预测流程。但根据上文提到的LSTM模型理论可知,若要进一步提高该模型精度,则应该增加更多样本数据。此外,LSTM可调整的参数过多,包括其架构本身也可以调整。因此在未来研究中,可尝试进一步优化LSTM参数和其本身架构,从而找到最优参数的LSTM模型。同时,针对网格化城市管理,应当将其案件数量从以月为单位更改为以周为单位,增加LSTM输入样本数量,进一步减少预测误差。

参考文献

[1] 田毅鹏.城市社会管理:网格化模式与基层秩序构建(专题讨论)——城市社会管理网格化模式的定位及其未来[J].学习与探索,2012,(2):28-32.

[2] 佘冰,朱欣焰,呙维,等.基于空间点模式分析的城市管理事件空间分布及演化——以武汉市江汉区为例[J].地理科学进展,2013,32(6):924-931.

[3] 常燕军,周向红.基于ARIMA模型的城市网格化管理预测与仿真[J].统计与决策,2016,(1):54-57.

[4] Box G E P, Jenkins G M.Time Series Analysis:Forecasting and Control[J].Journal of Time Jenkins,1971,31(4): 303-303.

[5] 王晓鹏,曹广超,丁生喜.基于Box-Jenkins方法的青南高原降水量时间序列分析建模与预测[J].数理统计与管理,2008,(4):565-570.

[6] Rob J, Hyndman, Yeasmin Khandakar. Automatic Time Series Forecasting: The forecast Package for R[J].Journal of Statistical Software Khandakar,2008,27(3):1-22.

[7] 朱大奇.人工神经网络研究现状及其展望[J].江南大学学报(自然科学版),2004,3(1):103-110.

[8] Tebelskis J.Speech Recognition Using Neural Networks[D].Siemens AG,1995.

[9] 朱小燕, 王昱, 徐伟.基于循环神经网络的语音识别模型[J].计算机学报,2001,24(2):213-218.

[10] Hochreiter Sepp,Schmidhuber, Jürgen.Long Short-Term Memory[J].Neural Computation,1997,9(8):1 735-1 780.

[11]Graves Alex.Supervised Sequence Labelling with Recurrent Neural Networks[M].Springer Berlin Heidelberg,2012.

[12] 左秀霞.单位根检验的理论及应用研究[D].华中科技大学,2012.

[13] Jie Ding, Vahid Tarokh, Yuhong Yang .Bridging AIC and BIC: A New Criterion for Autoregression[J].IEEE Transactions on Information Theory Yang,2015,PP(99):1-1.

[14] 杨帆,冯翔,阮羚,等.基于皮尔逊相关系数法的水树枝与超低频介损的相关性研究[J].高压电器,2014,50(6):21-25.

[15]Martín Abadi,Ashish Agarwal,Paul Barham.TensorFlow: Large-Scale Machine Learning on Heterogeneous Distributed Systems[J]. arXiv preprint arXiv:1603.04467,2016.

Urban Grid Management Cases Prediction Model Based on Time Series

CHEN Luanjie1,2, WU Tong2, PENG Ling2, ZHENG Jianchun3, YANG Yanying3
(1.Information department, Beijing university of technology, Beijing 100124, China; 2. Aerospace Information Research Institute, Chinese Academy of Sciences, Beijing 100094, China; 3. Beijing Research Center of Urban System Engineering, Beijing 100089, China)

Abstract: In order to improve the traditional or popular predicting model based on time series, this paper explores the predicting method for systematic case suitable for grid city management. The Box-Jenkins method, Auto-ARIMA and LSTM models have been adopted to predict the number of cases of grid management problems in six urban areas of Beijing in recent years, by comparing the accuracy and practicability between different model methods, and taking MAPE as the accuracy evaluation indicator, and analyzing in application of urban grid management. The experiment results indicate that Auto-ARIMA is suitable for predicting the quantitative trend of grid management problems, and Box-Jenkins method has a high prediction accuracy after solving the lag problem,however, with lower practicability, and LSTM prediction effect is relatively accurate and stable and can be further improved on sample input, parameters, and its framework.

Key words: urban grid management; case number prediction; LSTM; Box-Jenkins method; Auto-ARIMA

【中图分类号】TU984

【文献标识码】A

【文章编号】1672-1586(2019)05-0090-06

引文格式:陈栾杰,吴 同,彭 玲,等. 基于时间序列的网格化城市管理案件预测模型研究[J].地理信息世界,2019,26(5):90-95.

基金项目:城市管理智能挖掘(Y9B0130H22)资助

作者简介:陈栾杰(1997-),男,福建泉州人,计算机科学与技术专业本科生,主要研究方向为机器学习。E-mail:793565406@qq.com

通讯作者:杨艳英(1976-),女,山西忻州人,北京城市系统工程研究中心城市运行研究部助理研究员,双硕士,主要从事城市管理、城市领域数据分析、城市公共安全等方面的研究工作。E-mail:yangbaby@126.com

收稿日期:2019-05-11

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

陈栾杰:基于时间序列的网格化城市管理案件预测模型研究论文
下载Doc文档

猜你喜欢