导读:本文包含了唇同步论文开题报告文献综述及选题提纲参考文献,主要关键词:隐马尔可夫模型,语音识别,唇同步,梅尔倒频谱参数
唇同步论文文献综述
朱欣欣[1](2008)在《基于语音识别的动画人物唇同步系统》一文中研究指出随着国内市场对动漫产品需求的不断增长,以及国家对动漫产业的大力扶持,我国的动漫产业进入了一个高速成长期。唇同步是动画制作中不可或缺的一个环节,但是传统的唇同步方法完全由人工来实现,非常繁琐,效率很低。并且唇同步的质量得不到保证,完全依赖于制作人员的经验。所以,我们需要一种技术来帮助动画制作人员摆脱这一繁琐的工作,同时提高唇同步的质量。本文应用基于隐马尔可夫模型的语音识别技术来解决动画的唇同步问题。通过对语音识别技术的研究,以及对唇同步问题的分析,我们找到了用语音识别技术解决动画人物唇同步问题的切入点:用语音识别技术来获取语音中每个字的时间信息。基于这个想法,我们设计了两种解决动画人物唇同步问题的方法。第一种方法通过直接应用识别算法来获取每个字的时间信息。第二种方法根据语音文本构建一个组合模型,然后在组合模型上应用Viterbi算法,在计算过程中获取每个字的时间信息。这两种方法都可以有效地解决动画的唇同步问题,但是和第一种方法相比,第二种方法有效地减少了计算量并且不存在识别错误的问题,因而在计算效率和唇同步的效果上都要优于第一种方法。最后,本文基于第二种方法实现了一个唇同步系统,并探讨了实现中的关键问题:如何根据系统特点确定模型结构,如何选择合适的识别单元,如何根据系统特点修改一般化的算法使其在我们的系统中正常的工作,如何对语音信号进行参数化。(本文来源于《浙江大学》期刊2008-05-01)
侯亚荣,熊璋[2](2004)在《唇同步的自动识别与验证研究》一文中研究指出唇同步效果影响人类对语言的理解。着重研究汉语语音和口型的唇同步,将汉语对应口型划分为4类、两种状态(极点态与过渡态),得出汉语唇同步验证是对极点态音频和极点态视频的同步验证,提出基于极点态音频/视频知识库的唇同步识别与验证模型,分别阐述了模型中音频/视频特征分析子系统,提出了可以将基于运动对象识别的帧间差法与嘴唇形状、颜色和运动特征结合,实现嘴唇精确定位,最后给出唇同步验证过程。(本文来源于《计算机工程与设计》期刊2004年02期)
唇同步论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
唇同步效果影响人类对语言的理解。着重研究汉语语音和口型的唇同步,将汉语对应口型划分为4类、两种状态(极点态与过渡态),得出汉语唇同步验证是对极点态音频和极点态视频的同步验证,提出基于极点态音频/视频知识库的唇同步识别与验证模型,分别阐述了模型中音频/视频特征分析子系统,提出了可以将基于运动对象识别的帧间差法与嘴唇形状、颜色和运动特征结合,实现嘴唇精确定位,最后给出唇同步验证过程。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
唇同步论文参考文献
[1].朱欣欣.基于语音识别的动画人物唇同步系统[D].浙江大学.2008
[2].侯亚荣,熊璋.唇同步的自动识别与验证研究[J].计算机工程与设计.2004