导读:本文包含了深度图论文开题报告文献综述、选题提纲参考文献,主要关键词:深度,层析,视图,视差,影像,梯度,薄板。
深度图论文文献综述写法
周洋,吴佳忆,陆宇,殷海兵[1](2019)在《面向叁维高效视频编码的深度图错误隐藏》一文中研究指出基于多视点视频序列视点内、视点间存在的相关性,并结合视点间运动矢量共享技术,该文提出一种面向3维高效视频编码中深度序列传输丢包的错误隐藏算法。首先,根据3D高效视频编码(3D-HEVC)的分层B帧预测(HBP)结构和深度图纹理特征,将深度图丢失块分成运动块和静止块;然后,对于受损运动块,使用结合纹理结构的外边界匹配准则来选择相对最优的运动/视差矢量进行基于位移矢量补偿的错误掩盖,而对受损静止块采用参考帧直接拷贝进行快速错误隐藏;最后,使用参考帧拆分重组来获取新的运动/视差补偿块对修复质量较差的重建块进行质量提升。实验结果表明:相较于近年提出的对比算法,该文算法隐藏后的深度帧平均峰值信噪比(PSNR)能提升0.25~2.03 dB,结构相似度测量值(SSIM)能提升0.001~0.006,且修复区域的主观视觉质量与原始深度图更接近。(本文来源于《电子与信息学报》期刊2019年11期)
付绪文,张旭东,张骏,孙锐[2](2019)在《级联金字塔结构的深度图超分辨率重建》一文中研究指出由于成像设备的限制,深度图往往分辨率较低。对低分辨率深度图进行上采样时,通常会造成深度图的边缘模糊。当上采样因子较大时,这种问题尤为明显。本文提出金字塔密集残差网络,实现深度图超分辨率重建。整个网络以残差网络为主框架,采用级联的金字塔结构对深度图分阶段上采样。在每一阶段,采用简化的密集连接块获取图像的高频残差信息,尤其是底层的边缘信息,同时残差结构中的跳跃连接分支获取图像的低频信息。网络直接以原始低分辨率深度图作为输入,以亚像素卷积层进行上采样操作,减少了运算复杂度。实验结果表明,该方法有效地解决了图像深度边缘的模糊问题,在定性和定量评价上优于现有方法。(本文来源于《光电工程》期刊2019年11期)
冯晶明,苗文娟,畅青[3](2019)在《基于像素值梯度变化的深度图修复算法》一文中研究指出深度图修复是计算机视觉研究领域一项重要研究问题。当前的深度传感器,在采集深度的时候会出现空洞以及物体边缘模糊化问题。为此,提出一种基于像素值梯度变化的深度图修复算法。该算法首先结合灰度图将深度图中含有空洞的区域分为两部分,然后对不同部分的像素点对应的深度值采用不同的方法进行修复:①针对空洞为灰度图像素梯度变化较低的部分直接利用邻域内的有效深度值,计算空洞区域内像素的深度值;②针对空洞为灰度图像素梯度变化较大的部分将像素点邻域内与该像素点权值系数最大的点所对应的深度值作为该点的深度值。(本文来源于《现代计算机》期刊2019年25期)
梁海涛,陈晓冬,徐怀远,任思宇,汪毅[4](2019)在《基于深度图预处理和图像修复的虚拟视点绘制》一文中研究指出基于深度图像的绘制(DIBR)技术是绘制虚拟视点图像的重要方法.针对单视点虚拟视图绘制过程中的空洞、裂缝、重迭问题,提出一种基于深度图预处理和图像修复的绘制算法.首先根据虚拟视点的变换方向对深度图进行预处理,减缓前景到背景的深度突变,将大面积空洞分割为多个较小的空洞;然后结合一投四算法和Z-buffer算法对DIBR过程进行改进,改善裂缝和像素点间的重迭;最后使用深度信息引导图像修复算法,使空洞修复从背景一侧开始且优先选择背景纹理.在Matlab环境下,使用微软研究院提供的3D图像序列进行虚拟视点绘制并比较与真实图像的相似度,实验结果表明,该算法的平均峰值信噪比为27.474 7 dB,比Criminisi算法和递进填充线算法分别高出5.65%和2.97%;结构相似度为0.770 8,比2种已有算法分别高出1.22%和0.80%.(本文来源于《计算机辅助设计与图形学学报》期刊2019年08期)
罗天娇,孙薇薇,谷开慧[5](2019)在《采用层析法对实际叁维数据深度图的全息计算》一文中研究指出提出利用层析法计算实际叁维数据的强度图和深度图生成全息图的方法。根据层析法的原理,把复杂叁维数据按照深度图的灰度值分成多层物面信息,并根据深度图把每层物面的深度转换成菲涅尔衍射距离。采用角谱算法分别对每层物面进行菲涅尔衍射计算,得到叁维物体的全息图。研究结果显示该方法可以快速、准确地对实际复杂的叁维物体进行全息图的记录和再现。(本文来源于《大学物理实验》期刊2019年03期)
冯申申,谭海[6](2019)在《基于深度图的影像密集匹配算法的改进》一文中研究指出针对基于深度图的序列影像在密集匹配过程中存在目标影像选取的准确度低、深度图迭代次数过多的问题,提出了一种基于深度图的序列影像密集匹配算法的改进方法。该方法首先用阶跃函数分别表示参考影像和待选取的目标影像在匹配点处的同名光线的夹角和影像尺度变化的比值,然后以影像上的匹配点为种子点,在影像层面上构建delaunay叁角网,内插出其余像素的深度值和法线方向,初始化参考影像的深度图和法线方向图,最终采用双目视觉立体算法实现影像的密集匹配。实验结果表明:改进后的算法在计算影像深度图时针对不同的场景计算效率分别提高53.08%和25.18%,同时,点云的错误率也分别降低了0.6%和1.3%。(本文来源于《测绘与空间地理信息》期刊2019年06期)
师建伟[7](2019)在《基于双目视觉绿色作物视频流的深度图FPGA实现》一文中研究指出立体视觉是计算机视觉领域的重要研究课题之一。立体视觉的理论基础是对人眼的一个仿生,通过将两台完全相同的摄像头固定在一起,并让它们之间保持一定距离。然后,对同一场景进行拍摄。最后,利用双目立体匹配算法计算出图像的视差值,并结合两个摄像头标定所获得的内外参数和摄像头间的距离,即可提取实际场景的叁维信息与真实形状。相比于其他的叁维信息获取方法,立体视觉具有设备简单、功耗较低与无损测量等优点,因而在机器人自主导航、医学、虚拟现实与场景重建等领域都有重要的应用价值。然而,目前立体视觉技术在实际系统中应用较少,原因是存在实时性和准确性难以同时满足的问题,而通用的处理器面对该问题就会显得相当乏力,并且鲜有基于视频流加速的实现,基于FPGA技术的视频流加速实现更少。本文针对田间实际应用中的实时性和准确性需求,利用FPGA技术作为计算平台,综合考虑软件算法和硬件结构,在FPGA中实现了BM的立体匹配算法和绿色作物区域提取算法。经Middlebury平台实验发现BM立体匹配算法在高纹理图像中有较高的优势。同时,根据算法的特点,在FPGA中设计可使BM算法与绿色作物区域提取算法并行执行的结构,且BM算法的两个步骤与绿色作物区域提取算法的两个步骤均采用流水线结构设计。对于分辨率为1920?1080的图像,算法整体的运行速度达到49.75FPS,其中BM算法的运行速度达到了51.59FPS,满足田间深度信息提取的实时性。(本文来源于《内蒙古大学》期刊2019-06-01)
粘春湄[8](2019)在《3D-HEVC深度图视频快速算法研究》一文中研究指出为了提高3D视频海量数据的压缩效率,MPEG和ITU-T于2013年成立了立体视频编码开发联合专家组(Joint Collaborative Team on 3D Video Coding Extension Development,JCT-3V),制定了以新一代高效视频编码标准HEVC(High Efficiency Video Coding)的3D-HEVC立体视频编码标准。3D-HEVC在基于H.264的多视点编码标准上引入多视点加深度图(Multiview Video Coding plus Depth,MVD)的编码格式,减少直接编码的视点数量,通过基于深度图的图像渲染技术(DIBR,Depth-Image-Based Rendering)获得虚拟视点合成效果,满足人们对叁维空间的感官需求。为了提高深度图序列编码性能,3D-HEVC引入了一些关键的编码技术,这些编码工具提高了编码性能,但大幅度增加了编码的计算复杂度。本文致力于解决在保证3D-HEVC编码性能几乎不变的情况下,降低编码计算复杂度,分别提出了深度图帧内预测和帧间预测的优化算法。在帧内预测方面,本文针对深度图的特点提出结合纹理类型预判的深度图帧内快速编码算法SOG-SDC(Sum-of-Gradient and Segment-Wise DC Coding)。该算法利用梯度检测方法,判别该区域是否平坦,在编码平坦区域时可以跳过一些耗时的不必要的模式预测,并且可以提前终止此区域的块划分进程。除此之外,由于深度图引入SDC工具,所以每种预测模式都要检测是否使用SDC,本文提出在平坦区域跳过某些预测模式检测是否使用SDC。实验结果表明,此算法与原有3D-HEVC相比,在全I帧的情况下,平均减少了26.03%的编码时间,而BDBR仅增加0.14%。在帧间预测方面,本文提出基于贝叶斯决策的深度图帧间快速算法,包括CU快速判决和DIS&&SKIP模式判决。该算法分两步骤,其一,提取当前CU划分和不划分时,DIS(Depth Intra Skip)模式的RDcost作为特征,采用高斯分布建模,计算贝叶斯概率,判断当前CU是否进行划分。其二,提取当前PU最优模式为DIS或SKIP模式时的RDcost作为特征值,通过离线训练,用最小错误率贝叶斯决策判断是否跳过除DIS和SKIP模式之外的预测模式。实验结果表明,此算法与原有3D-HEVC相比,深度图编码时间平均减少了45.7%,而BDBR仅增加0.68%。(本文来源于《华侨大学》期刊2019-05-24)
陈佳瑜[9](2019)在《基于轮廓线与深度图的叁维模型变形技术研究》一文中研究指出近年来,叁维模型的应用广泛,衍生出的相关技术也得到关注,但万宗之源仍是叁维几何模型的获取。网格模型自身又具有的良好灵活性,便于修改和调整,所以充分利用己有的模型资源,经过适度变形,进而获得符合具体应用需求的新模型成为新的研究方向。为了提高既有模型的利用率,同时摆脱现有叁维模型变形技术中对人工选取控制点的依赖,本文基于轮廓线和深度图的叁维模型的变形技术开展研究,主要工作如下:(1)叁维薄板样条变形技术研究。分析了叁维模型变形过程中控制点前后变化趋势,研究了叁维模型变形中的约束函数,把运用在图像变形中的薄板样条函数迁移到叁维模型上,设计了薄板样条函数约束的叁维模型变形方法,通过优化网格表面的能量方程并求解映射函数的系数,再把系数作用于模型的其他网格顶点,实现了薄板样条函数的约束的叁维模型变形。(2)单幅图像驱动的叁维模型变形技术研究。针对在变形过程中依赖人工选取控制点的问题,分析了图像特征点的提取方法,提出了轮廓线指导的叁维薄板样条变形方法,实现了控制点的自动化选取以及图片物体的重建。首先,检索出与图像相似的叁维模型并进行投影,提取输入图像和投影图的轮廓;其次,检测输入图像的特征点为目标控制点,再根据轮廓长度的比例关系,对应出投影图上的源控制点;最后,在叁维模型上索引轮廓点对应的网格顶点作为最终控制点,进行薄板样条变形。(3)深度图像驱动的叁维模型变形技术研究。针对图像驱动变形时第叁维坐标信息不充分的问题,深入研究了深度图像转换点云以及点云特征点提取与匹配等内容,提出了深度图像驱动的叁维模型变形方法,实现了对深度图的叁维重建。首先通过对称检测方法确定起始控制点的对称点,补足深度图像遮挡面的特征点,对目标控制点同样检测对称点;然后确定所有的变形控制点,使用全部的匹配对对模型进行薄板样条变形。(本文来源于《中北大学》期刊2019-05-21)
李瑞[10](2019)在《图像和深度图中的动作识别与手势姿态估计》一文中研究指出让计算机理解人的行为活动是人机交互和人机协作的前提条件。机器学习理论的快速发展使基于视觉的人体活动分析研究日臻成熟。有些领域的发展水平已可以满足实用需求,比如指纹识别与人脸识别。有些领域的发展水平则相对欠成熟,比如动作识别与手势姿态估计。作为人体活动分析的两个重要分支,动作识别与手势姿态估计为人机交互和人机协作有关应用提供了理论解决方案。本文研究了图像和深度图中的动作识别与手势姿态估计:提出了两种由分层表示实现空间建模的静态动作识别方法。第一种方法以SIFT为局部特征描述子,利用Fisher向量编码SIFT,以空间金字塔为分层表示策略。第二种方法采用最新的八种预训练深度网络提取特征,以包含重迭区域的划分为分层表示策略。提出了一种有监督时间序列分割导出的离线动作识别方法。提出的方法构建在结构化时间序列框架下,将叁维骨骼视为多维空间中的一个点,利用动态时间归整(Dynamic Time Warping,DTW)解决动作执行速率变化问题。每个训练序列作为字典中的原子用于岭回归(Ridge)实现的协同表达,根据协同表达得出的重建误差完成动作分类。鉴于重建误差在l2-范数意义下连续地度量了测试序列和训练序列的相似性,进而提出了一种有监督时间序列分割算法。提出的算法除了可以用于离线动作识别,还可以用于运动序列分割和其他一般时间序列分割。提出了两类将深度图和叁维骨骼序列相结合的在线动作识别方法。第一类方法采用叁维骨骼序列中的成对相对关节位置描述人体姿态,采用源于深度图的局部占有模式(Local Occupancy Pattern,LOP)刻画交互物体的形状,通过K-SVD为每个动作从训练序列中学习一个可视为冗余数据紧凑表示的字典,帧层次动作识别由正则化线性回归实现。第二类方法利用深度运动图(Depth Motion Map,DMM)描述动作。为了将传统意义上用于离线动作识别的DMM扩展到在线动作识别,提出了一个离线随机分割算法和一个和在线顺序分割算法来生成DMM所需的子序列。为了增强DMM对静态动作和差异仅在姿态时序的动作的判别能力,引入叁维骨骼位置和速度作为DMM的互补描述子。提出了一种基于深度残差网络的手势姿态估计方法。为了凸显残差模块的改进作用,首先搭建了一种普通深度网络,分析了批次标准化对其产生的影响。在此网络基础上引入了残差模块,从网络宽度和网络深度两个方面对搭建的深度残差网络进行了优化,并且研究了瓶颈层的作用。提出了一种深度相机动态跟踪性能测定方法。传统测定方法重点研究深度相机的静态测量精度,但是动作识别与手势姿态估计更关注深度相机的动态跟踪性能。为了探索深度相机是否已经成为制约动作识别与手势姿态估计发展的硬件瓶颈,以Kinect v2和Intel RealSense SR300为例借助于数控直线滑块导轨机构系统地研究了被跟踪物体相对于深度相机的位置、运动速度、运动方向对深度相机跟踪准确率产生的影响。基准数据集上的评估实验表明,提出的动作识别与手势姿态估计方法几乎均可以与最新的方法相媲美,有的方法甚至打破了现有最佳记录。深度相机的动态跟踪性能测定结果表明,在不考虑人手检测的情形下深度相机即将成为制约手部动作识别与手势姿态估计进步不可忽略的因素。为了适应新方法的提出,有必要采用更高精度的深度相机发布标注更准确的基准数据集。(本文来源于《浙江大学》期刊2019-05-01)
深度图论文开题报告范文
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
由于成像设备的限制,深度图往往分辨率较低。对低分辨率深度图进行上采样时,通常会造成深度图的边缘模糊。当上采样因子较大时,这种问题尤为明显。本文提出金字塔密集残差网络,实现深度图超分辨率重建。整个网络以残差网络为主框架,采用级联的金字塔结构对深度图分阶段上采样。在每一阶段,采用简化的密集连接块获取图像的高频残差信息,尤其是底层的边缘信息,同时残差结构中的跳跃连接分支获取图像的低频信息。网络直接以原始低分辨率深度图作为输入,以亚像素卷积层进行上采样操作,减少了运算复杂度。实验结果表明,该方法有效地解决了图像深度边缘的模糊问题,在定性和定量评价上优于现有方法。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
深度图论文参考文献
[1].周洋,吴佳忆,陆宇,殷海兵.面向叁维高效视频编码的深度图错误隐藏[J].电子与信息学报.2019
[2].付绪文,张旭东,张骏,孙锐.级联金字塔结构的深度图超分辨率重建[J].光电工程.2019
[3].冯晶明,苗文娟,畅青.基于像素值梯度变化的深度图修复算法[J].现代计算机.2019
[4].梁海涛,陈晓冬,徐怀远,任思宇,汪毅.基于深度图预处理和图像修复的虚拟视点绘制[J].计算机辅助设计与图形学学报.2019
[5].罗天娇,孙薇薇,谷开慧.采用层析法对实际叁维数据深度图的全息计算[J].大学物理实验.2019
[6].冯申申,谭海.基于深度图的影像密集匹配算法的改进[J].测绘与空间地理信息.2019
[7].师建伟.基于双目视觉绿色作物视频流的深度图FPGA实现[D].内蒙古大学.2019
[8].粘春湄.3D-HEVC深度图视频快速算法研究[D].华侨大学.2019
[9].陈佳瑜.基于轮廓线与深度图的叁维模型变形技术研究[D].中北大学.2019
[10].李瑞.图像和深度图中的动作识别与手势姿态估计[D].浙江大学.2019