摘 要
由于密集区域人流遮挡严重,传统基于检测的人流统计算法估算挑战较大。同时现有的基于深度学习的人流统计算法结构复杂,训练难度大,计算量较大。基于此,本文提出了一种基于扩张卷积神经网络的人流统计算法,能够保证计算量的同时,进一步挖掘深层特征,提高模型精度。并且通过实验表明具有较高的精度,具有实际应用价值。
【关键词】扩张卷积神经网络 人流密度 估计人数统计
1 引言
当前,密集场所的公共安全问题越来越突出。为了保障公共安全,对公共场所尤其是人口密集区域的人数统计显得尤为重要。同时随着图像采集与图像处理技术的发展,基于视频图像的人数统计方法得以广泛的应用。目前基于视频的人数统计主要有基于检测的人数统计,但是由于人群密集区域,身体头部之间的遮挡非常严重,采用典型的头肩模型和人体模型直接对人流中单个个体进行检测统计导致人数统计精度较低。另外,基于特征的人数统计,但假设前景区域和人流总数近似于线性关系,在密集区域由于遮挡和透视问题也使得其精度较低。
随着深度学习在图像处理和图像识别上的发展应用,使得深度学习算法逐渐引入到人流密度统计上,基于此发展出一些基于深度学习的人流密度统计方法。其中卷积神经网络中其神经元间的非全连接和权值共享的特性,使其网络模型的复杂度明显减低,同时减少了权值的数量,在人数统计处理中优势明显。Zhang[4]等人提出用多任务卷积神经网络估计人群密度概率图以提高精度。Zhang[5]等人提出了用多列卷积神经网络提取不同尺寸的行人特征,增加人群密度估计准确率。但是该结构存在着模型结构复杂,训练难度大,训练时间长,难以实际应用的问题。因此基于此本文提出了基于扩张卷积神经网络的人数统计算法。通过卷积神经网络提取特征,并通过扩张卷积神经网络在保证数据量的基础上,提高模型深度,估计人群人流密度进行人数统计。
2 模型
2.1 模型结构
表1:模型误差表
算法 MAE MSE MCNN 26.4 41.3 CP-CNN 20.1 30.1扩张卷积神经网络 18.1 20.0
图1:基于扩张神经网络的人数统计算法整体结构图
针对人群密集区域的场景特点,本文采用基于神经网络的人数统计方法。该网络前端采用卷积神经网络,后端采用扩张卷积神经网络,以增大感受野,获取更多特征。
在前端网络中选取常用的VGG16神经网络,在传统的VGG16神经网络中去除了用于分类的全连接层,只采用了VGG16中的卷积层和池化层。卷积核的大小为3X3,这使得输出的数据仅仅为输入数据的1/16,一方面减小了数据处理量,另一方面保证了算法的精度。
在后端网络中采用了扩张卷积,其作用在输出分辨率不变的情况下进一步挖掘数据特征。其中扩张卷积系数取2。该算法的整体结构图如图1所示。
2.2 模型调试
从隧道结构裂缝发展形态和规律可以看出,该裂缝为结构型裂缝。根据2013年3月份现场踏勘、钻孔取样和室内试验以及数值分析的结果,初步确定隧道开裂的主要原因如下:
其中N为训练数据中的图像数。Xi为输入图像,Fh为估计的人群密度概率图,Fc为估计的人群数量。
为了对模型的精度进行验证,这里采用ShanghaitechB数据集。该数据集中共700张图像,其中400张图像作为训练数据,余下300张图像作为测试集。将本文的基于卷积神经网络的人流统计算法与其他几种算法的估算误差相比较,结果如表1所示,该模型具有较高的精度,可实际应用。
为了生成用于训练该人数统计模型的真实人群密度概率图,这里采用高斯核密度算法。在训练图像中每个人的头部中心位置坐标,然后通过高斯核模糊行人标点生成人群密度概率图。
N为测试图像总数,Estn和GTn分别为第i张图像所对应的真实值和估计值。平均绝对误差反映了模型结果的准确性,而均方误差反映了模型结果的鲁棒性。
其中,x是人群密度概率图H的像素位置,a是行人标记集中一个标记点,δ是高斯核N的方差。
为了对卷积神经网络模型人数统计的精度进行定量评估,引入了评价指标平均绝对误差(MAE)和均方误差(MSE)。
2.3 模型评估
柑桔红蜘蛛的防治是赣南脐橙病虫害防治中一项很重要的工作。柑桔红蜘蛛一年代数很多,为害大。为提高脐橙的产量与质量,柑桔红蜘蛛防治工作必须持之以恒。
为了评估模型计算值与真实目标值之间的偏差,这里采用欧式距离方程来计算。模型的损失函数由两个部分所组成。其中包括人群密度概率图损失函数和人群人数损失函数。
3 模型验证
图像中的总人数为人群密度概率图中所有点像素和。即
由此看来,技艺只是手段而非本体,与物性展开对话,会使艺术家摆脱因自以为是的独门绝技去以偏概全、一意孤行。我们说艺术是自由的,每个人都能在这片天地里寻找自己、获得自己,但过度强调技艺的作用,往往会增加物我之间、观念与材料之间的更多隔阂。只有尊重对象的存在,通过对话才能激活物性的魅力。这正是海德格尔所赞美的“凝固着人的经历”的物性,不是自我表现,而是人性与物性、技艺与现实的唯一“存在”,不可分离。
美国:自2009年以来,美国住宅市场一直稳步复苏。但是近年来也出现了一些阻碍住宅市场发展的限制因素,包括:经济脆弱,失业率增加,银行贷款新政,越来越多的80后优先选择和父母住在一起。另外,人们对于住宅所有权的态度也发生了变化,越来越多的人选择租房而非买房。这些因素都将对北美未来住宅市场的发展产生影响,减缓住宅市场复苏的步伐。根据美国建筑协会的预测,美国2016年新建独立住宅的销售量为57.4万套,2017年为66.9万套,2018年为70.2万套;而现有住宅的销售量为2016年547.2万套,2017年576.8万套,2018年588.5万套。
图2:密集区域人群人数统计系统效果图
4 基于卷积神经网络的人流监测应用
基于该扩张卷积网络的人群人数统计算法,设计了一款用于实时监测密集区域人数的统计系统。并在武汉市某大型广场进行实时监测和显示,系统输出的图像如图2所示。从图中可以看出,该系统能够较好的反映出人群密度,并统计出人群人数。对公共密集区域的人群起到很好的安全监控作用。
5 结论
本文提出了一种基于扩张卷积网络的人群人数统计算法。该算法由卷积神经网络和扩张卷积神经网络两个部分构成。该算法适用于密集区域人群拥挤场景,能够在扩大感受野的同时保证数据的计算强度。且通过在典型数据集上的分析,验证了其有效性,同时具有较好的精度和鲁棒性。
1.4 统计学方法 采用SPSS 13.0统计学软件进行数据分析,计量资料以表示,治疗前后自身对照均数比较采用配对t检验,2组间均数比较采用独立样本t检验,检验水平α=0.05。
参考文献
[1]Weina Ge and Robert T Collins. Marked point processes for crowd counting[C]. Computer Vision and Pattern Recognition.IEEE,2009:2913-2920.
[2]顾德军,伍铁军.一种基于人头特征的人数统计方法研究[J].机械制造与自动化,2011.
[3]Ke Chen,Chen Change Loy,Shaogang Gong,Tony Xiang.Feature mining for localised crowd counting[J]. in BMVC,2012,1:3.
[4]Zhang C, Li H, Wang X. Cross-scene crowd counting via deep convolutional neural networks[C]. Computer vision and Pattern Recognition. IEEE, 2015:833-841.
[5]Zhang Y, Zhou D, Chen S, et al. Single-image crowd counting via multi-column convolutional neural network[C]. Proceeding of the IEEE Conference on Computer Vision and Pattern Recognition. 2016: 589-597.
作者简介
钱超,男,2003年毕业于合肥工业大学,现任安徽四创电子股份有限公司高级项目经理。多年从事多媒体数字处理技术研究,其中获得市级科技进步奖一项,发明专利3项等。在城市公共安全,应急通信等领域负责多个项目的实施。
李顶根,博士学历。华中科技大学副教授。研究方向为人工智能技术应用。
作者单位
1.安徽四创电子股份有限公司 安徽省合肥市 230001
2.华中科技大学 湖北省武汉市 430074
标签:卷积论文; 神经网络论文; 人数论文; 模型论文; 人群论文; 社会科学总论论文; 统计学论文; 统计方法论文; 《电子技术与软件工程》2019年第4期论文; 安徽四创电子股份有限公司论文; 华中科技大学论文;