短时谱论文_白燕燕,胡晓霞

导读:本文包含了短时谱论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:语音,重音,减法,模型,噪声,高斯,特征。

短时谱论文文献综述

白燕燕,胡晓霞[1](2019)在《基于MATLAB的语音短时谱的分析》一文中研究指出语音信号是一个非平稳的信号,具有时变特性,假设其在10~30ms内短时平稳。因此任何语音信号的分析必须建立在"短时"的基础上。标准傅里叶变换不适用于语音信号,应改为短时傅里叶变换对语音信号的频谱进行分析。语音信号经过短时傅里叶变换,其频谱成为"短时谱"。(本文来源于《电子测试》期刊2019年18期)

王泽勋[2](2015)在《多层次韵律和短时谱同步变换的情感语音合成》一文中研究指出在日常生活中,声音包含了表示文本内容的语义信息,而且也会传递一些情感信息。对于同一句话,如果说话人说话方式不同,听者所获得的信息也会不同。语音的情感转换,就是在语义相同的情况下,实现声音在不同情感间的转换。因此,情感转换是具有表现力的语音合成的重要研究方向。为了能够合成出高质量的情感语音,本文使用了一种多层次韵律和短时谱同步变换的情感合成方法。通过多层次的方法对高兴、生气、悲伤和中性这4种情感语音建立相应的韵律模型。在此基础上,训练得到中性语音与情感语音之间的映射关系,完成韵律转换。然后,再结合短时谱的转换,运用合成工具(STRAIGHT)最后合成有明显情感倾向的情感语音。对转换语音做ABX和MOS测评,结果表明多层次的方法明显改善了情感转换效果。同时,对于合成的情感语音进行谱失真检测,检测结果表明,相对于只对音节进行转换的方法,本文对于高兴、愤怒和悲伤的转换结果分别提高了2%、4%和6%。(本文来源于《苏州大学》期刊2015-04-01)

赵云雪,张珑,郑世杰[3](2014)在《短时谱特征的汉语重音检测方法研究》一文中研究指出重音是语言交流中不可或缺的部分,在语言交流中扮演着非常重要的角色。为了验证基于听觉模型的短时谱特征集在汉语重音检测方法中的应用效果,使用MFCC(Mel frequency cepstrum coefficient)和RASTAPLP(relative spectra perceptual linear prediction)算法提取每个语音段的短时谱信息,分别构建了基于MFCC算法的短时谱特征集和基于RASTA-PLP算法的短时谱特征集;选用NaiveBayes分类器对这两类特征集进行建模,把具有最大后验概率的类作为该对象所属的类,这种分类方法充分利用了当前语音段的相关语音特性;基于MFCC的短时谱特征集和基于RASTA-PLP的短时谱特征集在ASCCD(annotated speech corpus of Chinese discourse)上能够分别得到82.1%和80.8%的汉语重音检测正确率。实验结果证明,基于MFCC的短时谱特征和基于RASTA-PLP的短时谱特征能用于汉语重音检测研究。(本文来源于《计算机科学与探索》期刊2014年09期)

赵云雪,张珑,郑世杰[4](2014)在《融合上下文短时谱特征的汉语重音检测研究》一文中研究指出重音是语言交流中不可或缺的部分,在语言交流中扮演着非常重要的角色。本文基于ASCCD朗读语篇语料库,使用MFCC算法提取每个语音段的融合上下文子段拼接短时谱信息,构建基于MFCC算法的上下文短时谱特征集;并选用NaiveBayes分类器对这类特征集进行建模,而且将具有最大后验概率的类作为该对象所属的类,这种分类方法充分利用了当前语音段的相关语音特性;融合上下文的MFCC短时谱特征组在ASCCD上能够得到83.6%的汉语重音检测正确率。实验结果证明,融合上下文子段拼接特征规整方法可以用于汉语重音检测研究中。(本文来源于《智能计算机与应用》期刊2014年04期)

乔彬彬,江冰,马胜[5](2013)在《基于短时谱相估计改进型减谱法语音降噪研究》一文中研究指出针对手机等移动智能终端设备的降噪问题,通过对基本减谱法的分析研究发现其在使用中存在不足,对基本减谱法进行了功率谱修正和输入幅值谱自适应的改进,通过调节噪声系数α和功率谱系数β以提高语言处理的灵活性以及输出信号的信噪比。仿真实验对比了基本减谱法与改进减谱法对含噪语音的处理效果,结果表明改进减谱法对含噪语音的降噪效果更为明显。(本文来源于《微处理机》期刊2013年02期)

于文慧[6](2012)在《基于短时谱估计的MMSE语音增强算法研究》一文中研究指出语音信号是人类进行信息传播和思想交流的重要媒介,但其在传播过程中往往受到各种噪音信号的干扰,这使得我们很难得到纯净的语音信号,为提高语音信号的通信质量,语音增强处理就有极大的应用价值。语音增强技术涉及的知识不仅与信号处理理论有关,还与人的听觉感知特性、噪声特性等有关,同时,噪声来源广泛,它随不同的应用场合呈现不同的特性,这就导致并不能找到一种通用的语音增强算法对各种噪声进行处理,而是特定的算法应用到特定环境下才有可能获得良好的降噪效果。本文主要研究基于MMSE的语音增强算法,首先,在开始部分对语音增强的意义做出了详尽的介绍,同时对其历史及发展进行了简单的描述。然后,在第二部分介绍了语音增强涉及的相关知识点,其中包括语音特性、人耳听觉特性以及噪声特性等,也介绍了语音增强算法的分类,并简单描述了几种常用的语音增强算法。虽然语音信号是时变非平稳的信号,但是语音信号具有短时平稳性使得在对语音进行分析时可以把语音信号分为若干帧,把每一帧的语音看做是稳定的,进而进行处理。基于短时谱估计的语音增强算法大致包括:谱相减法、维纳滤波法、MMSE算法,在第叁部分对这几种语音增强算法用计算机仿真实验进行仿真对比,再用同输入信噪比后的输出信噪比来确定带噪语音信号的增强效果。从仿真结果可以看出,在短时谱估计的语音增强算法中,MMSE算法是语音增强最优的估计算法。第四部分主要是对MMSE的语音增强算法进行研究,为了计算和实现方便,对于MMSE的语音增强算法,以往我们假定语音信号服从高斯分布,但是经研究发现,有更接近语音信号的分布,也就是超高斯分布。对超高斯分布取特定的参数可以得到我们常用的分布模型(如拉普拉斯模型、伽玛模型等),同时发现这些模型都优于高斯模型。在计算机仿真实验中,主要是寻找在超高斯模型下的最优参数值,使得语音增强效果最好,并且保证在同输入信噪比的情况下输出信噪比最高。(本文来源于《吉林大学》期刊2012-06-01)

张东方[7](2012)在《基于短时谱估计的低信噪比语音增强技术研究》一文中研究指出语音增强技术可以降低噪声对纯净语音带来的影响,改善人耳的听辨效果和提高语音识别系统的识别率,具有广泛的应用前景。对于信噪比低的语音信号,人们愈是希望通过语音增强技术提高其质量。因此低信噪比语音增强技术具有极大的应用价值。在低信噪比条件下,语音增强的挑战性难题是噪声残留与语音失真的折中问题,以及算法对不同类型噪声的鲁棒性问题。本文以多种类型噪声为研究对象,重点研究了低信噪比条件下的基于短时谱估计语音增强技术,主要工作如下:首先对短时谱估计语音增强算法进行分析,重点研究了增益函数、先验信噪比估计、语音存在概率估计等,搭建了语音增强仿真测试平台,通过对比几种低信噪比短时谱估计语音增强算法的性能,验证了最佳对数谱幅度最小均方误差估计的语音增强算法噪声残留较少、取得较好增强效果的原因在于算法中的语音存在概率估计,同时验证了噪声估计在语音增强中的关键作用。其次,深入的研究了低信噪比条件下的噪声估计算法,分析了几种经典噪声估计算法,详细研究了最小值统计算法和最小值控制递归平均算法适应于低信噪比条件下噪声估计的优势,并提出了一种改进的噪声估计算法。本文算法采用语音存在标识参数来决定可变的搜索窗长度,从而一定程度上减小估计时延,并对后验语音存在概率进行修正,利用了最小跟踪值与噪声估计值之间的线性关系,引入了改进的安全阈值机制,对噪声估计值进行最值限制。对比分析了不同噪声条件下本文算法的估计性能和增强后效果,实验结果表明本文算法能够在低信噪比下进行更准确的噪声估计,明显减小噪声功率上升期间噪声估计时延。然后,研究了低信噪比条件下语音相位估计的重要性问题,结果表明低信噪比条件下,改进语音相位估计可以改善低信噪比条件下语音的质量,减小语音失真。论文提出了一种改进语音相位估计的增强算法,根据语音和噪声频谱的统计模型的对称性得到用先验信噪比倒数形式表示的噪声谱幅度估计值,利用谱幅度估计值实现了一种新的语音相位估计,并应用于最佳对数谱幅度最小均方误差估计增强算法中。仿真实验结果表明,本文算法取得了较好的效果,相比未改进语音相位估计的算法处理后的信号,语音失真度更小,语音质量有一定提高。在此基础上,通过对比实验结果,探讨了改进语音相位的算法对于不同类型噪声的鲁棒性,验证了频谱的统计模型的对称性的成立性。最后,综合上述研究成果,本文提出了一种低信噪比条件下改进相位估计、噪声估计的低失真语音增强算法。算法应用谱幅度最小均方误差估计谱幅度增益函数以减小信号失真,并给出了一种带约束边界的先验信噪比估计算法。实验结果显示在多种类型噪声的低信噪比带噪语音处理中,该方法能减小残留噪声,并更大程度地减小信号失真,有效地提高语音质量。(本文来源于《解放军信息工程大学》期刊2012-04-15)

孙博凯[8](2012)在《基于短时谱估计的语音增强算法研究与优化》一文中研究指出在现实社会的生产实践中,在语音信号的生成、传输和接收各个阶段都会受到背景噪声不同程度的干扰和影响。这些噪声影响人们正常的接收语音信号,对语音处理系统产生抑制作用。为了提高语音信号的质量,我们利用语音增强技术对带噪语音信号进行语音增强,目的在于还原纯净语音信号,提高语音的可懂度。论文研究了短时谱估计语音增强算法中的谱减法和最小均方误差估计算法,并对这两种算法进行了进一步改进。传统谱减语音增强算法的一个主要缺陷就是增强后的语音信号会残留明显的“音乐噪声”,针对这一不足我们采用多频带分解法对其进行改进。改进算法的原理是将带噪的语音信号按照频率划分成不同的频带,并使这些频带之间互不交迭,而后根据频带内带有噪声的语音信号和噪声信号信噪比,利用自适应算法计算得出这个频带的过减因子。分析了最小均方误差估计(MMSE)算法,并根据传统算法,结合语音感知特性,将最大似然估计应用到对数谱域中对算法进行改进,技术关键在于对每帧信号重新做最大似然估计,并将两个可以动态调节的参数和β引入估计式中,增加了算法的灵活性。最后对改进算法进行实验仿真,分析了仿真的结果以证明改进算法的有效性,语音信号在增强过后残留的“音乐噪声”减小,提高了语音的可懂度,信噪比增大,特别是改进的MMSE算法针对白噪声的消噪效果最为明显。(本文来源于《哈尔滨理工大学》期刊2012-03-01)

叶利剑,黄松华,邱小军[9](2011)在《基于短时谱分析的语音增强改进算法》一文中研究指出介绍了基本的语音增强短时谱分析算法的原理。基于经典的谱减算法进行改进,引入了先验信噪比估计,以及时间回归平均法对噪声进行更新,以及一系列后处理改进方法,提高了降噪效果。在保持语音可懂度的基础上,增强了噪声衰减量。主、客观实验结果表明,针对汽车噪声一类的平稳噪声,算法效果出色;而对于街道、人声一类非稳态噪声,该算法性能优于目前常见算法。(本文来源于《电声技术》期刊2011年09期)

刘晓明,班超帆,冯晓荣[10](2011)在《失真控制下的短时谱估计语音增强算法》一文中研究指出针对传统谱估计增强算法易产生语音畸变、导致语音清晰度低的问题,提出了一种失真控制下的短时谱估计语音增强的新算法.该算法首先引入语音畸变的客观度量参数,并根据这一参数得到抑制语音畸变的约束条件,然后结合人耳听觉掩蔽特性和无语音概率参数,修正最小均方误差对数谱估计函数,最后联立约束条件和估计函数,得到增强后的语音,从而实现了在噪声抑制和语音畸变之间的折中,改善了语音增强的效果.主观试听和客观测试结果均表明,与其他谱减法相比,在相同的信噪比和去噪度条件下,新算法的语音畸变度最小且几乎察觉不到音乐噪声.(本文来源于《西安交通大学学报》期刊2011年08期)

短时谱论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

在日常生活中,声音包含了表示文本内容的语义信息,而且也会传递一些情感信息。对于同一句话,如果说话人说话方式不同,听者所获得的信息也会不同。语音的情感转换,就是在语义相同的情况下,实现声音在不同情感间的转换。因此,情感转换是具有表现力的语音合成的重要研究方向。为了能够合成出高质量的情感语音,本文使用了一种多层次韵律和短时谱同步变换的情感合成方法。通过多层次的方法对高兴、生气、悲伤和中性这4种情感语音建立相应的韵律模型。在此基础上,训练得到中性语音与情感语音之间的映射关系,完成韵律转换。然后,再结合短时谱的转换,运用合成工具(STRAIGHT)最后合成有明显情感倾向的情感语音。对转换语音做ABX和MOS测评,结果表明多层次的方法明显改善了情感转换效果。同时,对于合成的情感语音进行谱失真检测,检测结果表明,相对于只对音节进行转换的方法,本文对于高兴、愤怒和悲伤的转换结果分别提高了2%、4%和6%。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

短时谱论文参考文献

[1].白燕燕,胡晓霞.基于MATLAB的语音短时谱的分析[J].电子测试.2019

[2].王泽勋.多层次韵律和短时谱同步变换的情感语音合成[D].苏州大学.2015

[3].赵云雪,张珑,郑世杰.短时谱特征的汉语重音检测方法研究[J].计算机科学与探索.2014

[4].赵云雪,张珑,郑世杰.融合上下文短时谱特征的汉语重音检测研究[J].智能计算机与应用.2014

[5].乔彬彬,江冰,马胜.基于短时谱相估计改进型减谱法语音降噪研究[J].微处理机.2013

[6].于文慧.基于短时谱估计的MMSE语音增强算法研究[D].吉林大学.2012

[7].张东方.基于短时谱估计的低信噪比语音增强技术研究[D].解放军信息工程大学.2012

[8].孙博凯.基于短时谱估计的语音增强算法研究与优化[D].哈尔滨理工大学.2012

[9].叶利剑,黄松华,邱小军.基于短时谱分析的语音增强改进算法[J].电声技术.2011

[10].刘晓明,班超帆,冯晓荣.失真控制下的短时谱估计语音增强算法[J].西安交通大学学报.2011

论文知识图

短时傅立叶中窗函数的作用示意目含(a)无啁啾补偿情况下高次谐波超连续...无啁啾补偿情况下高次谐波超连续谱(...超声换能器电压、电流信号功率密度谱...种算法提取的语音短时谱包络表1...

标签:;  ;  ;  ;  ;  ;  ;  

短时谱论文_白燕燕,胡晓霞
下载Doc文档

猜你喜欢