论文摘要
针对视频动作识别中数据处理效率不高的问题,建立一种基于视频帧间差分序列的动作识别模型。利用帧间差分检测视频帧中的运动区域,以该区域为中心进行相应的图像剪切和增强处理。整个识别模型采用双流架构,在数据样本制作时通过适当的隔帧差分来扩大样本的时间跨度。采用分阶段逐步增加训练样本量的方法,以提升模型识别性能并解决训练过程中易出现的过拟合问题。实验结果表明,该模型可以在CPU级配置的电脑中完成快速动作识别,且在UCF11和UCF25数据集中的识别准确率均高于85%。
论文目录
文章来源
类型: 期刊论文
作者: 陈晓春,林博溢,孙乾,张坤华
关键词: 帧间差分,动作识别,双流架构,卷积神经网络,运动区域
来源: 计算机工程 2019年12期
年度: 2019
分类: 信息科技
专业: 计算机软件及计算机应用,自动化技术
单位: 深圳清华大学研究院电子设计自动化实验室,鹏城实验室,深圳大学电子与信息工程学院
基金: 广东省科技计划项目(2016B010126003),深圳市基础研究项目(JCYJ20170816151958999)
分类号: TP391.41;TP183
DOI: 10.19678/j.issn.1000-3428.0053623
页码: 274-280+293
总页数: 8
文件大小: 2148K
下载量: 237