导读:本文包含了计算机立体视觉论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:视觉,双目,计算机,摄像机,图像处理,脚型,晶状体。
计算机立体视觉论文文献综述
查道路[1](2019)在《实时双目计算机立体视觉关键技术研究》一文中研究指出视觉是人类感知世界最重要的手段。长久以来,人们一直希望各种机器设备能够获得人类视觉系统感知环境的功能,从而实现自动化。计算机视觉是使用计算机从数字图像或视频中获得高层次理解的一门科学,与传统数字图像处理领域的不同之处在于,它希望从图像中提取叁维结构,以实现对场景的全面理解。双目计算机立体视觉作为计算机视觉的重要分支,它是当前最接近人类视觉系统的叁维信息获取方式。双目计算机立体视觉通过计算同一物体在不同位置获取的两幅图像中的视差,从而获得该物体的叁维信息。双目计算机立体视觉具有低成本、应用场景广泛和高可靠性等优点,被广泛地应用在自动驾驶、家用智能机器人、工业自动化、自动监视等领域。而这些应用场景需要在极短的时间内获得物体精确的叁维信息,对处理的实时性和精确性要求高,并且希望功耗和体积尽可能地减小;本文针对通用双目计算机立体视觉应用场景对实时性、精确性和小型化的需求,分别对双目计算机立体视觉算法优化、深度提取硬件加速、基于低分辨率采集设备的高分辨率图像重建等关键技术进行研究。本文的主要研究工作和创新点如下:(1)考虑到在边缘计算场景下,处理器需要在具有较强的处理能力的同时保持低功耗和低成本,因此本文提出了一种平衡了计算复杂度、内存开销和匹配精度的新算法:为了选择合适的立体匹配算法,深入研究了当前局部算法和全局算法,发现局部算法匹配精度低而全局算法计算复杂度高,不能满足应用场景对算法实时性和精确性的需求。针对当前算法与应用场景需求的矛盾,提出一种基于tile的固定交叉树算法。将高分辨率图像分割为多个tile使用固定的水平和竖直树结构处理,解决了算法内存开销大的问题;利用二阶梯度识别并通过分段权重的方式处理深度不连续区域,解决了深度不连续区域处理困难的问题。在Middlebury标准立体匹配测试集第二版上,实验结果表明:本文提出的算法平均误差为5.45%。本文提出的算法在匹配精度上接近全局算法,并且计算复杂度和内存开销远远小于全局算法,较好地平衡了计算复杂度、内存开销和匹配精度,提高了算法的可配置性,具有良好的鲁棒性和实时性,是一种适合实际应用的立体匹配算法。(2)新提出了一种可重构的高精度实时立体匹配加速方案:综合分析了当前主流的双目计算机立体视觉加速平台及实际应用场景对功耗和成本的需求,选择FPGA作为立体匹配加速方案的实现平台,利用FPGA高度流水的并行架构加速基于tile的固定交叉树算法,实现分辨率可重构的实时立体匹配系统。针对算法的高复杂度,采用奇偶行列两路并行、水平树和竖直树乒乓操作的设计,并在流水线乒乓操作等方面提出了新的实现方式,使用单个特殊架构RAM完成两路并行的乒乓操作,在不增加内存开销的前提下有效地提升了流水线效率,在两路并行下实现了每个周期2个像素输出。我们在单片Kintex-7 FPGA上实现和验证了该方案,在160MHz系统时钟下对1920X 1680分辨率左右视图进行最大视差60像素的立体匹配,输出深度图帧率达到30fps,处理速度达到5806MDE/s,在Middlebury标准立体匹配测试集第二版上平均误差为5.68%。与现有的实现方案相比,本文提出的立体匹配实现方案具有可配置、高分辨率、深度图像细节丰富等优点,在FPGA上的验证证明本文提出的方案能够提供实时精确的高分辨率深度图像,在自动驾驶等复杂场景下有广阔的应用前景。(3)提出了一种基于FPGA的超分辨率方案,为双目计算机立体视觉系统提供高分辨率输入:针对图像采集设备分辨率低,导致部分细节丢失的问题,本文提出了一种基于FPGA的超分辨率方案,利用基于学习的超分辨率算法,将低分辨率的采集图像重建为高分辨率图像。改进了基于局部线性回归的快速超分辨率算法,使用汉明距离替代欧几里得距离作为匹配函数,将低分辨率图像分为多个tile并行处理,在保证精确性和鲁棒性的前提下,极大地降低了匹配函数的计算量。在单片Xilinx Virtex-7 FPGA上实现了超分辨率系统,提出了一种使用叁块双端口RAM拼接的6读6写RAM架构来实现6X6矩阵的乘累加。在100MHz的系统时钟下,实现了放大系数为2、3840×2160分辨率下85fps的输出,处理速度达到700Mpixel/s,同时在超分辨率标准测试集Set 5、Set 14、Kodak、BSD 100上平均结构相似度达到0.89,满足了快速精确的超分辨率的需求。(4)完成了立体匹配系统的IP设计:基于FPGA上的验证系统,在SMIC 40nm工艺下实现了低功耗、轻量级的实时立体匹配IP,通过左右两路LVDS双像素模式采集视频数据,双目校正后作为立体匹配核心的输入,立体匹配核心计算视差并输出到片外DDR3 SDRAM缓存,最终以LVDS形式输出。IP等效门数总计17867k。(本文来源于《中国科学技术大学》期刊2019-05-01)
徐栩娟,刘述民[2](2017)在《计算机技术在立体视觉行人检测系统中的研究》一文中研究指出智能汽车的核心技术是行人检测,而行人检测对行人安全、驾驶员具有重大意义,所以此项研究已经成为计算机视觉、智能车辆等领域的前沿研究课题。行人检测通常可分为感兴趣区分割、目标识别两阶段。基于距离的感兴趣区分割法鲁棒性很强,可以克服行人服饰、姿态与光照等因素的影响,由于需配置仪器如立体视觉测距、雷达等,经济成本高,算法也比较复杂。基于统计分类的目标识别法以提取行人图像特征为前提,然后通过统计学习法建立相应分类器(如Adaboost分类器、SVM分类器等)。该方法稳定性、通用性比较高,不过需要以寻找有效、稳定的目标属性或者特征为前提。随着时代发展,计算机技术的日新月异,测距手段以立体视觉的分割法所需的运算成本、经济成本会大大降低,因此基于立体视觉的ROIs分割技术将受到更多的关注,将运用立体视觉技术进行ROIs分割。由于轮廓曲线描述,受姿态、光线变化以及行人服饰等因素影响较小,边界是目标的分界线,是行人识别的重要特征。(本文来源于《科技广场》期刊2017年05期)
郭更新[3](2017)在《结合Kinect传感器和计算机立体视觉的叁维脚型数字化研究》一文中研究指出随着计算机视觉理论的不断研究和发展,虚拟现实技术已经应用到生活中的各个领域,主要包括航空航天、虚拟与现实、逆向工程和医疗等领域,物体的叁维重建已成为研究者热门研究领域之一。脚型数字化研究属于逆向工程,而逆向工程是计算机图像学领域的一个重要分支,得到了广大研究者的青睐。本文研究了脚型数字化的现状,针对现有的测量设备价格昂贵、扫描时间长、对操作者要求较高、自动化程度不高等缺点,因此亟需一种快速简便、精度较高的方法对人体脚型进行叁维数字化。微软公司推出了一款体感外设Kinect,其内置了一个深度相机,采用主动式的红外结构光来获取物体的叁维点云数据,不受物体纹理特性的影响。本文提出一种将Kinect传感器和计算机立体视觉相结合的叁维脚型数字化方法,实现了对人体脚型的叁维重建。本文的主要工作和研究内容如下:(1)Kinect传感器和双目相机系统的搭建。搭建脚型测量叁维重建系统、对搭建好的叁维测量系统先进行标定、对获取的双目图像和深度信息图像进行极线校正、进行立体匹配求取视差图、获得目标物体的叁维点云。对Kinect传感器获得的深度信息图像进行滤波、去噪、背景滤除等处理,对处理后的图像进行目标物体叁维点云的提取。(2)基于Harris-Laplace-SIFT算法的特征提取与匹配。将不同视图的RGB图像进行多尺度的表示、利用Harris算法进行特征点的提取、将提取的特征点通过SIFT描述符进行描述并生成128维的特征描述向量、最后计算特征向量的欧氏距离、找出最近邻点和次近邻点若它俩的比值小于某一个阈值则为正确匹配,最后去除误匹配点对。(3)ICP算法点云的拼接。由于不同视角坐标系的中心没有统一,本文提出基于特征匹配的初始配准算法对点云进行配准,利用提取的特征点的点云为初始配准点云,求得配准的最优参数,进而实现对不同视图的人体脚型叁维点云的拼接。实验结果表明,本文算法在配准过程减小了大量的计算,提高了配准效率,较好的完成的点云数据的拼接。对融合后的叁维脚型的数据点云进行叁角网格化处理、采用GEOMAGIC进行曲面重建构造轮廓线和曲面片、对优化处理好的曲面片进行格栅构造、然后进行NURBS(Non-Uniform Rational B-Spline)曲面拟合、渲染出逼真的叁维脚型模型,最后对人体脚型的特征参数进行提取。(本文来源于《浙江工业大学》期刊2017-04-30)
王昶[4](2017)在《双目立体视觉下的计算机的叁维重建方法》一文中研究指出双目立体匹配项目是双目立体视觉中重要的组成部分,也是关键性的应用步骤,需要相关研究人员结合实际需求建构更加系统化的处理措施和管理机制。不仅仅是一种全新的视觉理论框架,也是应用在立体匹配技术中的关键要素。本文对双目立体视觉下计算机叁维重建算法进行简要分析,并对仿真结果以及实验结果展开了讨论,旨在为相关研究人员提供有价值的参考建议。(本文来源于《电子世界》期刊2017年07期)
王强[5](2013)在《计算机随机点立体视检查图检测白内障手术植入不同类型人工晶体后立体视觉的比较分析》一文中研究指出目的:应用计算机随机点立体视检查系统检测白内障术后立体视觉功能,探讨该新型检测手段的可行性和实用性;并分析比较植入不同类型的人工晶状体的患者的立体视觉功能。方法:应用计算机随机点立体视检查图(random-dot stereogram, RDS)对78例白内障超声乳化合并人工晶状体植入术后的患者进行立体视觉功能的检测,检测时分别按照3种不同密度和4种不同随机点大小设定检查图,并比较检查结果的差异。此外,将受试者按照人工晶状体的类型分为“单焦组”(42人,植入美国ALCON公司单焦人工晶状体,型号Acrysof SN60WF,非球面设计)和“多焦组“(36人,植入美国ALCON公司多焦人工晶状体,型号Restor+3D SN6AD1,非球面渐进衍射型多焦点设计),比较这两组患者的立体视觉功能的差异。结果:在术后叁个月,(1)多焦组的裸眼中距离视力和裸眼近距离视力均显着好于单焦组,两组的裸眼远距离视力没有统计学差异;(2)当随机点的大小固定而密度不同时,患者立体视锐度检查结果没有统计学差异;(3)当随机点密度相同而大小不同时,患者立体视锐度检查结果的差异存在统计学意义;(4)多焦组立体视锐度显着优于单焦组。结论:计算机随机点立体视图是一种可靠的测量立体视功能的方法,可以用于白内障患者术后立体视觉功能的检测。立体视觉功能可能牵涉到复杂的神经学机制,视力可能并不是决定白内障术后患者立体视觉功能优劣的最主要因素。(本文来源于《浙江大学》期刊2013-10-01)
范路桥,段班祥,周文琼,姚锡凡[6](2013)在《基于计算机双目立体视觉的排爆机器人自动抓取的研究和实现》一文中研究指出研究和开发一个双目视觉系统用于智能排爆机器人的自动控制。该系统利用计算机双目视觉原理,采用Matlab 7作为运算引擎,调用机器视觉软件eVision 6.2进行立体匹配,实时捕获图像,进行摄像机标定、图像预处理和匹配,确定可疑目标物的坐标,把图像实时显示在控制台,并通过xPC目标系统实现该机器人实时控制系统,自动控制手臂靠近并准确抓取可疑目标物。排爆机器人的抓取实验表明,该双目立体视觉系统在精度上能满足排爆要求。(本文来源于《计算机与现代化》期刊2013年08期)
王雨蒙[7](2013)在《基于计算机立体视觉的标靶跟踪技术》一文中研究指出基于数字影像的叁维重建技术是计算机视觉学科的一个重要分支,广泛地应用于工业件、文物、地形、建筑等物体的测量和绘图任务。与传统的手工测量相比,该技术具有非接触、精度高、效率高、复杂模型适应性高等特点。在叁维重建的过程中拍摄相机的定位是这一领域一直没有彻底解决的问题。本文提出了一整套计算方法,利用跟踪相机辅助拍摄的手段基本解决了这一问题。本文的主要工作为以下叁个方面:首先,对于在影像中半自动求解标靶坐标的问题,提出了一套有效的标靶椭圆方程求解算法框架(见算法3.1)。该算法的计算步骤利用了多套经典算法,包括图像的自动对比度算法、高斯平滑滤波算法、坎尼边缘提取算法、HSCP边缘细化算法、椭圆拟合算法、椭圆参数反算。在此算法框架中,本文完成了椭圆参数反算公式的推导。其次,提出了一套标靶影像的快速全局搜索算法(见算法4.1)。该算法先在第一张影像上搜索出所有的标靶,然后又利用连续影像提供的运动信息预测每个标靶在未来影像上可能出现的位置,再根据当前影像数据对预测进行修正,最终得到标靶椭圆的围框(见算法4.3),为椭圆提取算法提供了输入参数。最后,提出了一种使用单一相机对标靶进行跟踪的方法。该方法只使用一台相机,加入固定模式的标靶,利用标靶之间的距离约束对采集相机进行跟踪和坐标求解。数值实验表明本文提出的第一套算法能够以很高的效率和准确率求解标靶坐标。本文提出的第二套算法为全自动标靶跟踪提供了可能性,并在初步的实验中取得了成功。本文提出的第叁套算法在略微损失精度的条件下,极大地简化了传统的跟踪方法,并在性能上取得了良好的效果。(本文来源于《西安电子科技大学》期刊2013-01-01)
王珺[8](2009)在《计算机立体视觉算法研究与实现》一文中研究指出立体视觉是目前计算机视觉中最活跃的领域之一。通过近二十年的研究,立体视觉已经发展出了一些可以在实时系统中应用的成熟立体匹配算法。立体视觉可以在许多领域中应用:车辆导航,视频监控和工业制造过程控制等,这些领域都有一定地实时性要求。由于对运算量的限制,大多数实时立体视觉系统在视差计算过程中采用了基于局部窗口的匹配算法。这些局部方法的视差图质量往往与全局算法相差甚远。然而最近的研究成果表明通过精确设计的匹配代价计算和收集方法,局部算法的误匹配率同样可以好于一些全局算法。本文主要通过对局部匹配算法的改进,使立体视觉系统达到室内视频监控系统对实时性和稳定性的要求。立体视觉系统主要分为摄像机定标,立体匹配和叁维重建叁部分。摄像机定标是几何校正和叁维重建的基础,其精度往往决定着整个系统的性能。本文采用基于平面定标模板的张正友定标方法,该方法的平面定标物便于在室内环境中使用。根据定标结果对立体图像对进行了畸变和外极几何校正,使图像对的外极线水平于扫描线且使图像对中的匹配点校正到同一像素行,有效减少了随后立体匹配过程的计算复杂度。立体匹配算法是立体视觉系统中最重要且运算量最大部分。本文根据监控系统对实时性的要求,对局部匹配算法进行了改进,提出了一种可以有效地区分目标物边缘的算法。使用了简单的预处理和后处理方法改善所得的视差图,其中快速有效的预处理滤波方法消除了图像对之间亮度差异对匹配结果造成的影响,并由后处理检测出图像中的误匹配点。在windows和VC平台上实现了实时立体视觉系统。实验分析了定标模板个数对定标精度的影响。给出了本文匹配算法在不同窗口大小下的误匹配率和预处理,后处理的效果。对比了本文算法与块匹配算法,全局DP,GC算法之间的视差图质量和算法实时性。(本文来源于《大连理工大学》期刊2009-12-12)
游莉,单磊,樊继宏,赵卫东,李鉴轶[9](2009)在《利用计算机立体视觉原理建立乳房体积测量系统》一文中研究指出目的:运用计算机立体测量技术建立乳房体积计算机立体测量系统。方法:(1)采用计算机立体视觉原理,设计乳房体积测量运算模式,编制乳房体积测量分析程序。(2)所建立的乳房体积测量系统系统和传统的水体积置换方法测试对照,然后将测试的结果进行配对t检验,研究本系统的精确性和可靠性。结果:(1)实现了数据的快速处理,测试空间范围为120mm×140mm×80mm,精确度最大误差为0.9mm。(2)本系统测量乳房体积,特别是快速、非接触和非侵入。与金标准水体积置换方法比较,P=0.485>0.05,差值的95%可信区间为(-14.0177,7.0843),说明本系统测试方法精确度高,可靠性强。结论:(1)本系统可应用于乳房体积测量,简捷而且精确,为临床工作提供了一种有效实验手段。(2)本系统为软组织形态分析的技术领域提供了一种新的技术方法。(本文来源于《中国医学物理学杂志》期刊2009年04期)
冯宇[10](2009)在《基于计算机立体视觉的叁维重建系统研究》一文中研究指出立体视觉叁维重建技术的研究是计算机视觉学科的一个重要领域,有助于实现非接触叁维测量与快速建模。该项技术工作效率高,有利于提高工作环境的自动化程度,是叁维建模的一个重要发展方向。目前市场对叁维模型的需求与日俱增,而传统手工建模方法繁琐费力,模型产出率仍然很低。正是这种供求之间矛盾的日益激化,推动着叁维重建技术不断向前发展。叁维重建的特点就是整个建模过程基本上自动完成,仅需少量人为干预,操作方法简单,省时省力,生产率高而又有一定的精度。高效的叁维自动建模能够减少设计费用和缩短设计周期,创造出巨大的经济效益。本论文是基于立体视觉的叁维重建系统研究,要建立一个叁维重建系统,需要借助视觉坐标测量机和计算机立体视觉中叁维重建技术。叁维重建系统包括五个部分:1.摄像机参数及传感器模型的标定。2.被测物体图像的获取。3.图像预处理和图像特征的提取。4.图像对双目立体匹配。5.确定图像的深度信息和最终实现物体的叁维重建。本文把叁维重建系统应用到帕萨特汽车上。论文重点介绍了摄像机标定,目标图像对处理和双目立体匹配,叁维重建。在摄像机标定部分,采用Harris角点提取算法来对视觉测量机进行标定。在图像对处理和匹配部分,提出用图像锐化和边缘提取算法来对帕萨特汽车图像对进行处理,并用VC++来完成图像对的双目立体匹配。在叁维重建部分:通过图像对的双目立体匹配,可以获得帕萨特汽车图像的深度信息,最终可以在OpenGL中重建出帕萨特汽车的叁维模型。也可以通过3d-max软件来完成对帕萨特汽车的叁维重建。(本文来源于《青岛科技大学》期刊2009-06-10)
计算机立体视觉论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
智能汽车的核心技术是行人检测,而行人检测对行人安全、驾驶员具有重大意义,所以此项研究已经成为计算机视觉、智能车辆等领域的前沿研究课题。行人检测通常可分为感兴趣区分割、目标识别两阶段。基于距离的感兴趣区分割法鲁棒性很强,可以克服行人服饰、姿态与光照等因素的影响,由于需配置仪器如立体视觉测距、雷达等,经济成本高,算法也比较复杂。基于统计分类的目标识别法以提取行人图像特征为前提,然后通过统计学习法建立相应分类器(如Adaboost分类器、SVM分类器等)。该方法稳定性、通用性比较高,不过需要以寻找有效、稳定的目标属性或者特征为前提。随着时代发展,计算机技术的日新月异,测距手段以立体视觉的分割法所需的运算成本、经济成本会大大降低,因此基于立体视觉的ROIs分割技术将受到更多的关注,将运用立体视觉技术进行ROIs分割。由于轮廓曲线描述,受姿态、光线变化以及行人服饰等因素影响较小,边界是目标的分界线,是行人识别的重要特征。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
计算机立体视觉论文参考文献
[1].查道路.实时双目计算机立体视觉关键技术研究[D].中国科学技术大学.2019
[2].徐栩娟,刘述民.计算机技术在立体视觉行人检测系统中的研究[J].科技广场.2017
[3].郭更新.结合Kinect传感器和计算机立体视觉的叁维脚型数字化研究[D].浙江工业大学.2017
[4].王昶.双目立体视觉下的计算机的叁维重建方法[J].电子世界.2017
[5].王强.计算机随机点立体视检查图检测白内障手术植入不同类型人工晶体后立体视觉的比较分析[D].浙江大学.2013
[6].范路桥,段班祥,周文琼,姚锡凡.基于计算机双目立体视觉的排爆机器人自动抓取的研究和实现[J].计算机与现代化.2013
[7].王雨蒙.基于计算机立体视觉的标靶跟踪技术[D].西安电子科技大学.2013
[8].王珺.计算机立体视觉算法研究与实现[D].大连理工大学.2009
[9].游莉,单磊,樊继宏,赵卫东,李鉴轶.利用计算机立体视觉原理建立乳房体积测量系统[J].中国医学物理学杂志.2009
[10].冯宇.基于计算机立体视觉的叁维重建系统研究[D].青岛科技大学.2009