一、利用MLP和FFT实现快速脸部检测(论文文献综述)
杜希婷[1](2021)在《基于人脸图像的年龄估计研究》文中认为近些年,与人脸图像相关的自动信息处理技术已经发展为信息技术领域的重要研究课题。人脸年龄估计是根据人脸图像自动估算年龄的技术,属于生物特征与计算机视觉结合的预测任务,它分为生理年龄估计和表观年龄估计。人脸年龄估计研究面临着一定难度和挑战。一方面是人脸衰老变化是无法控制的自然进程,不同的人有不同的老龄化模式。另一方面是年龄估计缺乏数据完整且充足的数据集。从目前的研究现状来看,无论是生理年龄估计还是表观年龄估计都有进一步提升的空间。本文围绕算法和网络的优化展开研究,提出了两种人脸年龄预测模型,具体如下:(1)基于改进分布标记学习的生理年龄估计同一个体相近年龄的脸部年龄特征是相似的,基于标记分布学习的年龄估计就是利用这个特点而设计的一种方法,实现了从年龄单目标预测到年龄标记分布向量预测的学习任务的转变,这一定程度上解决了人脸年龄估计中数据不全面的问题。但现有的基于最大熵回归模型的标记分布学习存在不能构建统一的标记分布预测模型和计算复杂时间长等问题,另一种基于神经网络的算法容易发生过拟合且神经网络的结构不容易被理解。为解决这些问题,提出基于核偏最小二乘回归模型的标记分布学习来解决人脸年龄估计问题。核偏最小二乘回归模型对数据分布没有前提假定,并且可以解决非线性问题。在FG-NET和MORPH II数据集的试验结果表明,相较于其他对比方法,此法有更小的年龄估计误差同时提高了计算效率。(2)基于改进残差网络的表观年龄估计基于深度学习的年龄估计方法被广泛应用,但随着网络深度的增加,会出现梯度不稳、网络退化和参数量越来越大的问题。针对现有的卷积神经网络模型算法对人脸年龄特征表达能力欠缺、识别准确性低、模型参数量大等问题,提出了一种融入注意力的残差网络人脸年龄估计法。该方法首先对原卷积块注意力模块(Convolutional Block Attention Module,CBAM)进行优化改进,采用特征融合再训练的方法获取通道重要度权重,通过网络层混合计算两部分的池化压缩特征互信息,增强重要通道特征表示,从而提高模型的拟合能力。接着将改进后的CBAM与Res Net模型的残差结构融合构建新的残差模块;该模块可以避免CBAM对捷径连接反向传播的影响。最后利用Softmax分类器分类以获得最终估算年龄。在APPA-REAL和LAP2015表观年龄数据集的实验显示,此方法比原Res Net模型方法取得了更好的平均绝对误差和累计误差指标。与其他相关方法的对比也证明了其有效性。
何艳清[2](2021)在《基于深度学习的疲劳检测方法研究》文中认为疲劳是我们日常生活中发生严重交通事故的主要原因之一。根据美国国家公路交通安全管理局的数据,由于驾驶员的疲劳,美国每年发生约100,000起车祸,估计导致1,550人死亡,71,000人受伤和约125亿美元的损失。另一份报告指出,美国政府和企业每年在与疲劳驾驶相关的事故上花费604亿美元,并且由于疲劳而造成的财产损失,健康隐患,时间损失和生产力降低,还使消费者蒙受164亿美元的损失。德国道路安全委员会(DVR)声称,四分之一的高速公路交通事故死亡是驾驶员暂时性疲劳的结果。驾驶员疲劳引发了巨大的人员伤亡和财产损失,由于这些原因,研究者建议使用可以确定疲劳的驾驶员风险预警系统。警报系统可以唤醒昏昏欲睡的驾驶员或将汽车控制权转交高级驾驶辅助系统。随着人们对智能交通系统的兴趣日益浓厚,开发实用的疲劳检测系统是至关重要的一步。丰田,福特,梅赛德斯-奔驰等汽车公司目前也采用汽车安全技术,以防止因驾驶员疲劳引发的交通事故。预计这种趋势将使汽车更智能,并显着减少驾驶员疲劳造成的事故。驾驶环境下的疲劳检测具有光照情况复杂和人脸表情丰富等特点,由于实验对象并不处于实验室单一的环境下,驾驶员面部存在太阳眼镜及饰品的遮挡,所以高级驾驶辅助系统(ADAS)中的驾驶员疲劳检测比单一的实验室环境中的疲劳检测更加复杂。近年来,为了提高疲劳检测的准确度,学者已经提出了各种方法,推动了疲劳检测的发展。尽管正在进行的研究显示出疲劳检测技术的进步,但仍有许多挑战有待解决。基于车辆特征的疲劳检测方法以及基于监视方向盘运动的方法实现了各种最新技术。该组中的某些技术着重于加速或中断时间序列,车道偏离以确定困倦程度。基于生物特征的疲劳检测方法着重于检测电子生物信号,例如EEG(脑电图),ECG(心电图)和EOG(心电图)。但是,前面提到的两个类别中的疲劳检测技术具有严重的局限性。前一类技术只能在特定的驾驶条件下使用,并且本质上并不稳定,而后者则难以实际应用,因为驾驶员在身体上佩戴各种信号测量工具会感到不舒服。因此,基于计算机视觉的驾驶员疲劳检测技术变得越来越流行。计算机视觉技术主要集中在检测眼睛闭合,打哈欠的方式以及面部和头部的整体表情方面。针对驾驶员疲劳检测中的特征提取和疲劳分类器设计等关键问题,本文以人脸物理特征为对象,开展基于卷积神经网络方法的驾驶员疲劳检测研究。本文引入多物理特征融合的疲劳检测方法,获得驾驶员丰富的疲劳特征信息;以驾驶员面部的纹理信息为牵引,建立人脸物理特征检测疲劳的深度学习模型。本文提出的方法在NTHU-DDD数据集和其他两个修改的非公开数据集上进行训练测试。这项工作的主要成果是,疲劳检测的准确率均高于包括原始方法在内的其他方法,准确率超过90%。并且比多物理特征融合的检测方法有更好的泛化能力。同时,本文讨论了基于卷积神经网络的疲劳检测方法完善了高级驾驶辅助系统(ADAS),使其产生更鲁棒性和可靠的决策。
王文博[3](2021)在《视觉和文本的跨模态检索和识别研究》文中研究指明多模态数据是指同一个事物可以有多种表现形式,包括文本、图像、音频等等。同一类的多模态数据虽然表达的事物相同,但它们之间的表达形式完全不同,存在着巨大的语义鸿沟。多模态数据随着信息技术的飞速发展不断增长,在丰富人们的信息生活的同时也带来了很多问题。如何在海量且无序的多模态数据中搜索需要的信息、识别特定的数据等问题都亟待解决。多模态研究通过一定的技术手段分析和研究不同模态之间的内部联系跨越它们之间的语义鸿沟。本文从跨模态检索和跨模态识别两个领域出发,主要做了以下两个方面的工作:(1)信息检索是解决信息爆炸问题的一条重要途径,随着多媒体数据的增长,跨模态检索成为信息检索的一个热门分支。为此,本文提出了一种跨模态哈希检索算法,该算法为不同模态的异构数据找到一个公共的低维语义空间,在公共的低维空间中完成检索任务。最近,很多工作都集中于有监督的跨模态哈希方法,也获得了较高的检索准确率。但是,如何在公共空间中保持数据在原始空间中的局部几何结构和相似性以及如何有效的利用监督信息仍是一个挑战。针对这些问题,本文提出的方法在矩阵分解寻找公共空间时,首先通过建模数据在模态内和模态间相似性得到的其在原始空间中的相似性,然后以相似性关系和监督信息中的类别信息为约束条件,提高了检索效果。通过在两个公开的数据集上的充分实验,本文的方法是有效的且优于最先进的方法。(2)唇语识别又称视觉语音识别,是从连续的嘴唇区域的图像帧中识别出说话人所说的内容,是一个从图像到文本模态的识别任务。本文首先针对句子级别的中文唇语识别数据集稀少的问题,提出了一个收集中文唇语识别数据的过程,并收集了一定的数据进行实验,从而验证了其规范性。目前大部分的唇语识别方法都是通过循环神经网络来捕获时序信息,然而语句中会存在长短不一的多个尺度的关联信息,而RNNs不能对时间序列进行多尺度的挖掘。为此本文提出了一种基于时间卷积网络的句子级别的唇语识别方法,通过多尺度的时间卷积网络挖掘句子序列中不同长度的时序信息,从而提高识别效果。通过与几个基线方法的实验对比,验证了本文提出的方法的有效性。
张东升[4](2020)在《基于人腿检测的近地面移动平台行人检测系统》文中提出随着生活水平以及科技水平逐步提高,移动机器人的使用逐渐渗透到基层生活中来。移动机器人逐渐开始具备感知,规划以及决策能力。其中行人检测的功能是完成其他规划任务的一项十分基础和重要前提。由于行人具有非刚性,并且室内环境不尽相同,行人的高矮胖瘦衣着等都具有很大的不确定性,所以检测算法上需要更加灵活。移动机器人可以依靠搭载的深度相机,较高频率的获取RGBD数据用来进行环境感知工作。对于Kobuki这一类近地面移动平台来说,受传感器视野的影响,普遍的行人检测算法无法在该类平台上使用。所以本文提出一种应用于近地面移动平台的基于人腿检测的行人检测算法。相较于上半身的数据,移动平台应该更加关心行人下半身的位置和动态信息。出于对二维图像和三维点云数据结构特点的考虑,本文针对二维图像和三维点云利用不同的算法进行处理。二维图像信息结构更加全面和完整,所以本文首先利用改进版YOLOv3-tiny对RGB图像中的人腿进行检测,检测得到的包围框的结果和D通道数据的结合可以得到一个锥形视角,锥形视角内的点云数量少但大多是与行人腿部相关,这样既减少了点云分割网络的计算压力,同时也提高了分割网络的精度上限,然后利用Point Net分割网络对锥形视角内的点云进行分割得到行人数据。本文提出的基于人腿检测的行人检测算法在准确度和实时性都具有不错的表现,在本文制作的数据集中,算法实时性可以达到47.89fps,点云分割精度达到70.27%,对比相关的算法性能优越。
殷海兵[5](2019)在《基于门控制循环神经网络的疲劳驾驶检测方法及系统设计》文中进行了进一步梳理近年来,随着汽车数量的不断增加,交通事故频繁发生,这给国家和个人带来了巨大的财产损失。目前,研究表明疲劳驾驶是造成严重交通事故的重要原因之一,世界各国法律法规中都明确禁止驾驶员疲劳驾驶车辆。因此,设计一个能够快速检测疲劳驾驶行为并对驾驶员做出及时预警的系统,对改善交通安全状况具有重要的社会意义。基于驾驶员视觉特征的疲劳检测方法因其检测成本低、实时性、对驾驶人无干扰等优点,并在汽车安全辅助驾驶领域得到了广泛应用。驾驶员脸部的检测是疲劳检测方法中的前提条件。但是,不同类型眼镜的遮挡以及驾驶过程中的光照变化等因素会对驾驶员面部信息的检测产生影响。针对以上问题,本文搭建了一套可靠的红外相机图像采集系统,结合深度学习和人眼视觉特征的思想,提出了一种基于门控循环单元和全卷积网络的疲劳驾驶检测方法。首先,借助红外相机采集系统捕获驾驶员脸部图像;其次通过多任务级联的卷积神经网络(Multitask Cascaded Convolutional Neural Networks,MTCNN)对驾驶员进行人脸检测和特征点定位,根据面部关键点的几何位置关系来获取驾驶员眼睛图像;然后运用卷积神经网络(Convolutional Neural Networks,CNN)的识别算法对提取出的眼睛图像进行睁闭状态的识别,并将结果输出为完整的面部状态序列化数据;最后利用驾驶员疲劳特征的前后关联性,将状态序列化数据作为时间序列传递到含有门控循环单元(Gated Recurrent Unit,GRU)的全卷积网络(Fully Convolutional Networks,FCN)中实现驾驶员疲劳状态的判定。实验结果表明,本文提出的方法在光线条件差以及驾驶员佩戴不同类型眼镜情况下,能够准确地识别驾驶员眼睛的睁闭状态。与基于疲劳参数为基础的检测方法相比较,该方法在疲劳检测任务上展现了良好的疲劳检测性能,其准确率达到了99.12%,并且能够在实验条件下实现对驾驶员驾驶状态的预测。
马金林,陈德光,郭贝贝,周洁[6](2019)在《唇语语料库综述》文中提出优秀的语料库能为唇语识别提供良好的基础保障,但通用语料库的缺乏是导致唇语识别发展缓慢的重要原因之一。较为全面地综述了20多种语料库的相关特性。简单介绍了唇语识别的传统方法和深度学习方法。重点整理了近20多年较有影响力的唇语语料库,从识别对象、语料规模、录制方式与录制环境等12个方面进行比较分析,得出各种语料库的优缺点及适用范围,方便唇读工作者快速找到适合自己研究方向的语料库。比较了各种语料库采用何种算法及其所能达到的性能。对唇读面临的困难进行了剖析,对未来工作进行了展望。
唐美霞,何勇[7](2018)在《基于双眼定位与状态判决疲劳检测算法》文中进行了进一步梳理提出一种基于计算机视觉的驾驶员疲劳状态检测方法,依据驾驶员双眼状态来辨别驾驶员是否疲劳。采用一种时空约束的Adaboost方法,快速检测驾驶员视频中的面部区域;在先验知识确定的可能眼睛区域,采用Haar-like特征和Adaboost分类器快速定位双眼区域;采用卷积神经网络的LeNet5网络架构,训练眼睛状态分类器和检测双眼状态,依据双眼是否闭合的特性判别驾驶员是否疲劳。实验结果表明,该方法能够可靠检测驾驶员的疲劳状态,检测效率高。
张明雅[8](2018)在《跌倒检测系统的设计与实现》文中进行了进一步梳理现今,中国的总人口数大约是十四亿人,在全球排名第一。由于历史原因和社会现实,中国的人口总量大,人口年龄趋老问题十分突出。根据相关信息资料显示,中国的老年人口比例呈现出逐年增长态势,其总量占比也在不断增加,老年人口基数日益庞大。此文将未围绕老人跌倒检测系统展开,通过探究这方面的理论与实践,以鲜明的实例,剖析临界值检测设计是否科学,最后进行更加完善的系统设计。本次研究实践意义在于:目前中国在人体跌倒方面的检测研发还未成功,相关的系统设计都是基于外国技术核心,而研制一款具有现实价值且由中国独立完成的设备,就显得非常必要。基于社会层面而言,该研发也对提高老人的护理效率有积极作用,能够降低各类养老压力。此文主体如下:第一章,就相关问题进行概述分析,简单介绍研究意义、研究方法等等,并就文中提及的各个专业名词进行介绍,梳理这方面的文献资料;第二章,详细介绍模式识别、支持向量机、跌倒等技术。第三章,对主流的人体跌倒检测算法展开了详细的梳理与分析。对不同的阈值检测算法进行了详细的分析试验与验证,并提出了基于自适应阈值的跌倒检测算法。第四章,对系统所需的硬件电路展开详细的设计论述,完成了对位处理器的选型与外围电路设计。第五章,对人体跌倒的行为实施了大量的实验,对数据进行了详细的分析与整理,并依据这些整理的结果完成了对自适应阈值算法各个参数的整定。第六章,对本篇论文的工作做出总结,提出了研究工作的不足之处。除了进行理论分析,此文也结合了实践分析和方法归纳,最后给跌倒检测算法做出概述分析,并得到下面几个要点,首先,主要针对跌倒理论研究和临界值检测进行研究并概述基本内涵;其次,围绕人类跌倒行为,进行剖析目前人类骨骼的系统特点以及跌倒行为特征,奠定设计人类跌倒检测仪的理论基础;另外,利用分析人类跌倒的检测算法和实证对比,概括出人类跌倒检测法,除了涉及模式识别方面以及临界值的判断检测算法,基于测试的数据,以自适应临界值为基础,提出自适应阈值的跌倒检测算法。由此以来,系统就能够对一般行为和跌倒行为作出区分,防止发生错误报警,影响用户的正常生活。
周锐[9](2018)在《基于面部多视觉信息融合的驾驶员疲劳状态的识别》文中进行了进一步梳理当今社会人们的生活日新月异,居民的汽车保有量逐年递增。在汽车驾驶中,除醉酒驾驶外,疲劳驾驶逐渐成为导致交通事故的另一重要因素。因此,对驾驶员采取实时疲劳检测对重大交通事故的预防有着深远的意义。本文通过阅读查阅大量的文献及资料,了解了国内外疲劳状态检测方法现阶段的发展概况,并在此基础上深入研究了基于面部子空间中多特征融合的驾驶员疲劳检测。疲劳状态检测中的关键技术主要包括:驾驶员的面部检测与跟踪、面部子空间疲劳区域的定位、疲劳特征的提取与融合等。本文首先将采集到的视频转换成帧,为了最大可能地降低外界复杂环境对驾驶员的影响,对图像作预处理,主要包括图像的灰度化、均衡化以及自适应光照补偿;通过比对肤色在不同颜色空间中的聚类特性,选取基于YCgCr的肤色阈值分割对图像进行检测,然后将检测到的肤色区域输入到改进之后的Viola-Jones人脸检测框架之中,结合两种算法实现人脸区域的定位。由于单帧的图像并不能反映出驾驶员是否处于疲劳状态,因此采用Camshift算法对人脸视频序列进行跟踪,满足了系统的实时性要求。其次,在检测到人脸的基础上实现面部关键疲劳形变区域的定位,疲劳区域主要包括眼睛和嘴巴。在眼睛的定位中,分别对驾驶员的图像和检测出的人脸区域采用人脸几何分布的先验知识与灰度积分投影相结合的方法,将眉眼分离,实现眼睛的粗定位;然后通过对比几种边缘算子的检测效果,最终选取Sobel边缘算子实现眼睛轮廓的提取,进而实现眼睛区域的精确定位;人脸的分布符合“三庭五眼”这一几何规律,根据人眼与嘴巴的相对位置定位出嘴巴区域。最后,主要实现多特征融合的疲劳状态检测。在已定位出的眼睛区域提取PERCLOS参数、嘴巴区域内提取YawnFreq参数;根据人疲劳时两参数的阈值确定其模糊集、论域并通过计算推导得到隶属度函数的表达式;搭建Fuzzy逻辑推理系统,将两种疲劳算子融合输入到模糊系统中,并输出驾驶员的疲劳状态,通过反模糊化得到疲劳程度FatigueLevel,实现驾驶员疲劳状态的识别。
王浩,孙福明[10](2017)在《基于人脸识别的身份识别系统》文中提出设计了一种基于人脸特征来判断客户真实身份的系统.首先利用第2代居民身份证阅读器自动采集客户所出示身份证的信息.然后通过高清摄像头采集客户人脸图像.最后基于身份证头像照片与摄像头采集图像,利用深度学习方法算法判断二者人脸相似度.由于身份证人脸图像分辨率较低,采用SRCNN算法提高其分辨率,进而提高系统准确度.实验结果表明,该系统可以准确判断客户身份与其出示身份证的一致性。
二、利用MLP和FFT实现快速脸部检测(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、利用MLP和FFT实现快速脸部检测(论文提纲范文)
(1)基于人脸图像的年龄估计研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 研究背景与意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 国内外研究现状 |
1.2.1 人脸图像生理年龄估计 |
1.2.2 人脸图像表观年龄估计 |
1.3 主要研究内容 |
1.4 论文组织结构 |
第2章 人脸年龄估计相关理论 |
2.1 人脸年龄估计流程概述 |
2.2 人脸年龄估计常用数据集 |
2.2.1 生理年龄数据集 |
2.2.2 表观年龄估计数据集 |
2.3 人脸年龄特征提取 |
2.3.1 生物启发模型 |
2.3.2 局部二值模型 |
2.3.3 卷积神经网络提取特征 |
2.3.4 混合模型 |
2.4 主流的年龄估计方法 |
2.5 年龄估计模型评价指标 |
2.6 本章小结 |
第3章 基于改进标记分布学习的生理年龄估计 |
3.1 年龄的标记分布 |
3.1.1 相关研究背景 |
3.1.2 年龄的标记分布基本原理 |
3.1.3 年龄的标记分布算法 |
3.2 核偏最小二乘的基本原理 |
3.2.1 偏最小二乘回归 |
3.2.2 核偏最小二乘回归 |
3.3 结合核偏最小二乘的标记分布学习 |
3.4 实验设置与结果分析 |
3.4.1 实验设置 |
3.4.2 结果比较和分析 |
3.5 本章小结 |
第4章 基于改进残差网络的表观年龄估计 |
4.1 深度学习方法的研究背景 |
4.2 注意力机制 |
4.2.1 CBAM |
4.2.2 CBAM改进 |
4.3 融入注意力机制的残差网络 |
4.3.1 残差学习模块 |
4.3.2 残差学习模型改进 |
4.4 实验设置与结果分析 |
4.4.1 多种网络模型实验结果对比与分析 |
4.4.2 本方法与其他方法对比 |
4.5 本章小结 |
结论 |
参考文献 |
研究生阶段论文发表情况 |
致谢 |
(2)基于深度学习的疲劳检测方法研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景 |
1.2 基本概念 |
1.3 商业驾驶辅助系统 |
1.4 文章组织结构 |
第二章 疲劳检测的相关技术 |
2.1 主观检测 |
2.2 基于车辆特征的疲劳检测方法 |
2.2.1 基于转向的实现 |
2.2.2 基于车道偏差的实现 |
2.2.3 基于多个车辆特征的实现 |
2.3 基于生物特征的疲劳检测方法 |
2.3.1 基于心脏信号的实现 |
2.3.2 基于脑信号的实现 |
2.3.3 基于皮肤信号的实现 |
2.3.4 基于角膜-视网膜信号的实现 |
2.3.5 基于多个生物学特征的实现 |
2.4 基于人脸物理特征的疲劳检测方法 |
2.4.1 眼睛状态分析 |
2.4.2 嘴部状态和打哈欠分析 |
2.4.3 面部表情分析 |
2.5 基于深度学习的疲劳检测 |
2.6 相关研究方法的比较 |
2.7 本章小结 |
第三章 基于多物理特征融合方法的疲劳检测研究 |
3.1 研究背景 |
3.2 基于多物理特征融合方法的疲劳检测 |
3.2.1 眼部特征 |
3.2.2 嘴部特征 |
3.3 实验结果 |
3.3.1 实验平台 |
3.3.2 疲劳评估模型 |
3.3.3 结果分析 |
3.4 本章小结 |
第四章 基于卷积神经网络的疲劳检测研究 |
4.1 问题描述 |
4.2 基于SSD网络的人脸检测 |
4.3 基于VGG16网络的疲劳特征提取 |
4.4 实验结果 |
4.4.1 实验数据集 |
4.4.2 具体实施方法 |
4.4.3 与前沿方法的对比 |
4.5 在ADAS中的应用 |
4.6 本章小结 |
结论 |
5.1 总结 |
5.2 未来工作 |
参考文献 |
致谢 |
攻读学位期间参加的科研项目和成果 |
(3)视觉和文本的跨模态检索和识别研究(论文提纲范文)
致谢 |
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 相关工作的发展和研究现状 |
1.2.1 跨模态检索的研究现状 |
1.2.2 唇语识别的研究现状 |
1.3 本文的主要内容和组织结构 |
1.3.1 本文的主要内容 |
1.3.2 本文的组织结构 |
第二章 跨模态检索和识别理论基础 |
2.1 跨模态哈希检索理论基础 |
2.1.1 近似最近邻检索 |
2.1.2 哈希学习方法 |
2.1.3 矩阵分解 |
2.2 深度学习理论基础 |
2.2.1 感知机 |
2.2.2 多层感知器 |
2.2.3 卷积神经网络 |
2.2.4 循环神经网络 |
2.2.5 损失函数 |
2.2.6 优化方法 |
2.3 小结 |
第三章 融合相似性关系和类别信息的跨模态图文检索 |
3.1 方法概述 |
3.2 本文提出的LCSMFH方法 |
3.2.1 问题描述 |
3.2.2 协同矩阵分解 |
3.2.3 相似度的保持 |
3.2.4 重新考虑监督信息 |
3.2.5 哈希函数的学习 |
3.2.6 模型优化 |
3.2.7 模型复杂度分析 |
3.3 实验结果及分析 |
3.3.1 数据集介绍 |
3.3.2 baseline方法 |
3.3.3 评估方法 |
3.3.4 结果分析 |
3.4 小结 |
第四章 基于时间卷积网络的视频和文本跨模态识别 |
4.1 唇语识别概述 |
4.1.1 数据集介绍 |
4.1.2 唇语识别模型框架 |
4.2 中文唇语数据集收集 |
4.2.1 数据的选择 |
4.2.2 数据处理 |
4.2.3 嘴唇区域提取 |
4.2.4 实验及分析 |
4.3 基于时间卷积网络的唇语识别方法 |
4.3.1 时间卷积网络 |
4.3.2 模型结构 |
4.3.3 实验及分析 |
4.4 小结 |
第五章 总结与展望 |
5.1 工作总结 |
5.2 工作展望 |
参考文献 |
攻读硕士学位期间的学术活动及成果情况 |
(4)基于人腿检测的近地面移动平台行人检测系统(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 国内外文献调研 |
1.2.2 国内外文献综述总结 |
1.3 本文研究内容 |
第2章 二维图像目标检测 |
2.1 目标检测算法概述 |
2.2 Single Shot Muti Box Detector |
2.3 YOLO |
2.3.1YOLO-v1 |
2.3.2YOLO-v2 |
2.3.3YOLO-v3 |
2.4 网络模型改进 |
2.5 制作anchor box |
第3章 三维点云分割 |
3.1 三维点云深度学习现状 |
3.2 Point Net |
3.3 算法比较 |
3.3.1 K-means |
3.3.2 Point Net++ |
3.3.3 基于点云频率的聚类方法 |
第4章 Kinect&Kobuki平台下的行人检测实验 |
4.1 实验平台介绍 |
4.2 数据集制作 |
4.3 YOLOv3-tiny的训练过程 |
4.4 点云数据的合成 |
4.5 点云分割 |
4.6 实验分析 |
结论 |
参考文献 |
攻读硕士学位期间发表的论文及其它成果 |
致谢 |
(5)基于门控制循环神经网络的疲劳驾驶检测方法及系统设计(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 课题研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 基于驾驶员生理特征的疲劳检测方法 |
1.2.2 基于车辆行为特征的疲劳检测方法 |
1.2.3 基于驾驶员视觉特征的疲劳检测方法 |
1.3 论文研究内容 |
1.4 论文组织结构 |
第二章 卷积神经网络与循环神经网络基本原理 |
2.1 卷积神经网络基础知识 |
2.2 卷积神经网络的主要特点 |
2.3 CNN的核心组件 |
2.3.1 卷积层 |
2.3.2 激活函数层 |
2.3.3 池化层 |
2.3.4 全连接层 |
2.3.5 前向传播算法 |
2.3.6 反向传播算法 |
2.4 循环神经网络原理 |
2.5 本章小结 |
第三章 图像采集系统和疲劳检测系统的设计 |
3.1 红外相机采集系统 |
3.2 嵌入式平台开发模块 |
3.2.1 嵌入式系统硬件基本环境 |
3.2.2 嵌入式系统软件设计 |
3.3 算法优化技术 |
3.3.1 NEON优化方法 |
3.3.2 Winograd优化方法 |
3.4 本章小结 |
第四章 驾驶员疲劳检测 |
4.1 PERCLOS检测流程以及评估算法 |
4.1.1 人脸检测及眼睛嘴部区域提取 |
4.1.2 眼睛和嘴部状态识别网络结构 |
4.1.3 基于PERCLOS准则的疲劳检测算法 |
4.2 门控循环神经网络的设计 |
4.2.1 批量归一化操作 |
4.2.2 时间卷积网络 |
4.2.3 门控循环单元 |
4.2.4 FCN-GRU的网络结构 |
4.3 人脸及特征点检测实验结果与分析 |
4.3.1 实验平台和数据集 |
4.3.2 眼睛嘴部区域定位结果 |
4.4 基于CNN的眼睛嘴部状态识别实验结果与分析 |
4.4.1 实验样本 |
4.4.2 眼睛嘴部状态识别网络实验结果 |
4.5 疲劳检测实验结果与分析 |
4.5.1 实验样本与实验平台 |
4.5.2 实验参数设置 |
4.5.3 实验对比与结果分析 |
4.5.4 嵌入式系统测试与分析 |
4.6 本章小结 |
第五章 总结与展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
发表论文和参加科研情况 |
致谢 |
(6)唇语语料库综述(论文提纲范文)
1 引言 |
2 唇语系统 |
3 唇语识别方法 |
3.1 传统唇语识别方法 |
3.2 深度神经网络唇语识别方法 |
4 唇语语料库 |
4.1 语料库详述 |
4.2 语料库性能比较 |
5 唇语识别应用 |
6 难点与发展趋势 |
7 总结与展望 |
(7)基于双眼定位与状态判决疲劳检测算法(论文提纲范文)
0 引言 |
1 面向视频的双眼区域快速定位 |
1.1 面部快速检测 |
1.2 双眼区域定位 |
2 基于卷积神经网络的双眼状态检测 |
3 驾驶员疲劳状态检测 |
4 仿真实验 |
4.1 眼睛定位实验 |
4.2 疲劳状态检测实验 |
5 结束语 |
(8)跌倒检测系统的设计与实现(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 研究背景和意义 |
1.2 国内外研究现状 |
1.2.1 主要检测方法 |
1.2.2 国内外跌倒检测市场产品现状 |
1.3 研究内容和思路 |
1.4 论文组织结构 |
第2章 人体跌倒行为的特点研究 |
2.1 人体骨骼系统及特点 |
2.2 人体跌倒运动模式与行为特点分析 |
2.2.1 人体运动模式分析 |
2.2.2 行为特点分析 |
2.3 人体跌倒的判断条件 |
2.3.1 坐标系分析 |
2.3.2 跌倒模型的建立 |
2.3.3 跌倒判断条件 |
2.4 加速度向量幅值 |
2.4.1 跌倒时方向分析 |
2.4.2 加速度向量幅值SVM |
2.5 本章小结 |
第3章 人体跌倒检测算法及实验研究 |
3.1 人体跌倒检测算法 |
3.1.1 模式识别检测算法 |
3.1.2 阈值判断检测算法 |
3.1.3 两种算法的比较 |
3.2 现有阈值检测算法的研究与分析 |
3.2.1 基本阈值算法 |
3.2.2 微分阈值算法 |
3.2.3 近似长度阈值算法 |
3.2.4 频域阈值算法 |
3.2.5 SMA阈值算法 |
3.3 现有算法实验测试 |
3.3.1 基本阈值算法实验测试 |
3.3.2 微分阈值算法实验测试 |
3.3.3 其他几种阈值算法实验测试 |
3.4 基于自适应阈值的改进型算法 |
3.4.1 公式意义 |
3.4.2 参数意义 |
3.4.3 算法验证 |
3.5 本章小结 |
第4章 跌倒检测设备的设计 |
4.1 系统总体设计 |
4.1.1 跌倒检测设备的设计目标与功能概述 |
4.1.2 跌倒检测设备硬件组成与总体框架 |
4.2 微控制器的选型与外围电路设计 |
4.2.1 微控制器的选型 |
4.2.2 STM32F103芯片外围电路设计 |
4.3 数字运动传感器模块 |
4.3.1 数字运动传感器选型 |
4.3.2 传感器外围电路设计 |
4.4 蓝牙模块 |
4.4.1 蓝牙技术简介 |
4.4.2 蓝牙模块电路设计 |
4.5 供电模块芯片选型及其电路设计 |
4.6 本章小结 |
第5章 参数整定和系统测试 |
5.1 验证D_((x))与差值的正相关性 |
5.2 参数整定 |
5.3 系统测试 |
5.4 本章小结 |
第6章 结论 |
6.1 工作总结 |
6.2 展望 |
参考文献 |
致谢 |
(9)基于面部多视觉信息融合的驾驶员疲劳状态的识别(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 课题的研究背景和意义 |
1.2 疲劳状态识别的研究现状 |
1.3 疲劳状态识别存在的问题 |
1.4 论文章节安排 |
第2章 驾驶员疲劳状态识别系统设计 |
2.1 疲劳状态识别系统的总体方案设计 |
2.1.1 疲劳检测流程设计 |
2.1.2 疲劳检测功能模块 |
2.2 人脸图像的预处理结果及分析 |
2.2.1 人脸图像灰度化处理 |
2.2.2 直方图均衡化处理 |
2.2.3 自适应光照补偿 |
2.3 本章小结 |
第3章 驾驶员脸部的检测 |
3.1 人脸检测方法的对比 |
3.2 基于YCgCr颜色空间的肤色聚类人脸检测 |
3.2.1 色彩空间的选择 |
3.2.2 YCgCr颜色空间上肤色模型的建立 |
3.2.3 肤色阈值分割结果与分析 |
3.3 基于Viola-Jones框架的人脸检测 |
3.3.1 Haar-like特征及积分图 |
3.3.2 AdaBoost算法思想 |
3.3.3 Viola-Jones框架的级联结构 |
3.4 基于肤色聚类和Viola-Jones框架相结合的人脸检测 |
3.4.1 两种检测方法的优缺点 |
3.4.2 改进的Viola-Jones框架的结构 |
3.4.3 人脸检测流程及结果分析 |
3.5 Camshift人脸跟踪算法 |
3.5.1 区域肤色Hue直方图的获取 |
3.5.2 Meanshift迭代过程 |
3.5.3 Camshift算法跟踪结果与分析 |
3.6 本章小结 |
第4章 面部关键部位的定位分割 |
4.1 五官定位分割方法的对比 |
4.2 眼睛区域的定位 |
4.2.1 基于灰度积分投影的人眼粗定位 |
4.2.2 采用Sobel算子提取人眼轮廓 |
4.3 嘴巴区域的定位 |
4.3.1 常用的嘴巴检测算法分析 |
4.3.2 “三庭五眼”实现嘴巴区域的定位 |
4.4 本章小结 |
第5章 信息融合技术在疲劳识别中的应用 |
5.1 疲劳状态分析 |
5.1.1 PERCLOS疲劳检测分析 |
5.1.2 YawnFreq参数的提取 |
5.2 特征融合的方法 |
5.3 基于Fuzzy推理模型的信息融合 |
5.3.1 Fuzzy推理系统结构 |
5.3.2 基于模糊逻辑的疲劳判别系统的设计 |
5.4 驾驶员疲劳状态识别系统的评判结果 |
5.4.1 图像检测结果与分析 |
5.4.2 疲劳状态的识别 |
5.5 本章小结 |
结论 |
参考文献 |
致谢 |
(10)基于人脸识别的身份识别系统(论文提纲范文)
1 系统的设计 |
2 基于深度学习的超分辨率重建技术 |
3 人脸检测与人脸识别模块 |
4 实验 |
四、利用MLP和FFT实现快速脸部检测(论文参考文献)
- [1]基于人脸图像的年龄估计研究[D]. 杜希婷. 北京建筑大学, 2021(01)
- [2]基于深度学习的疲劳检测方法研究[D]. 何艳清. 北京建筑大学, 2021(01)
- [3]视觉和文本的跨模态检索和识别研究[D]. 王文博. 合肥工业大学, 2021
- [4]基于人腿检测的近地面移动平台行人检测系统[D]. 张东升. 哈尔滨工业大学, 2020(02)
- [5]基于门控制循环神经网络的疲劳驾驶检测方法及系统设计[D]. 殷海兵. 天津工业大学, 2019(02)
- [6]唇语语料库综述[J]. 马金林,陈德光,郭贝贝,周洁. 计算机工程与应用, 2019(22)
- [7]基于双眼定位与状态判决疲劳检测算法[J]. 唐美霞,何勇. 计算机工程与设计, 2018(06)
- [8]跌倒检测系统的设计与实现[D]. 张明雅. 河北大学, 2018(01)
- [9]基于面部多视觉信息融合的驾驶员疲劳状态的识别[D]. 周锐. 哈尔滨工程大学, 2018(01)
- [10]基于人脸识别的身份识别系统[J]. 王浩,孙福明. 电脑知识与技术, 2017(33)