导读:本文包含了语音编码算法论文开题报告文献综述、选题提纲参考文献,主要关键词:语音,速率,矢量,线性,声码,可编程,门阵列。
语音编码算法论文文献综述写法
吴志军,郭安心,沈丹丹[1](2018)在《基于G.729语音编码非零脉冲位置信息的隐藏算法》一文中研究指出VoIP以语音流为传输媒介,具有传输数据量大和应用广泛的优点。但VoIP系统也面临数据安全和隐私泄露的安全威胁。针对编码标准G.729固定码本搜索的非遍历特性和具有一定冗余性的特点,该文提出基于G.729语音编码非零脉冲位置信息的隐藏算法。该算法在固定码本搜索过程中,利用秘密信息控制码本的搜索过程,并在非零脉冲位置和秘密信息之间构建函数进行信息隐藏。在搜索过程中利用最不重要脉冲替换思想并采用最小化失真准则控制由秘密信息的嵌入带来的音质失真。实验结果表明:算法隐藏容量可达400 bit/s,算法具有良好的隐蔽性(PESQ平均值约为3.45)。(本文来源于《电子与信息学报》期刊2018年06期)
蔡韫奇[2](2018)在《基于FPGA的G.729语音编码算法的实现与验证》一文中研究指出随着多媒体技术的发展,人们对语音编码提出了更高的性能要求。G.729语音编码算法能够在保证很高的语音质量的同时,以低延时,低码率进行语音压缩。但是目前DSP硬件实现G.729存在一定的性能极限,已经不能满足最新工程的需求。基于FPGA/ASIC实现G.729编码算法显得尤为迫切。论文首先详细分析了 G.729语音编码算法的基本原理。然后,用软件仿真了 G.729算法的实际性能,验证了编码算法。为后续硬件的实现以及验证,提供了理论基础和数据参考。论文基于Vivado HLS高层次综合工具设计了 G.729编码器IP核。调整C代码后移植到HLS平台,经过综合、联合仿真、IP核封装等步骤,最终生成了 G.729编码算法IP核,可在Vivado平台下后续硬件开发中使用。为了驱动IP核工作,利用Verilog语言设计了 IP核外围电路,并与IP核构成G.729编码验证系统。为了进一步缩短算法延时,降低硬件资源占用,利用Verilog语言设计了 G.729编码算法中线性预测部分。采用自顶向下的设计方法,对线性预测系统按功能划分模块,设计完成了预处理滤波器模块、加窗模块、自相关模块、林文孙—杜宾算法模块。在Vivado平台下完成了各模块以及系统的仿真,并给出相应的仿真结果。论文对上述两个系统分别进行了设计综合、布局布线,给出了综合报告,在Xilinx公司的KC705开发板上进行了硬件验证,使用在线逻辑分析仪抓取信号,硬件结果与软件仿真结果一致,表明硬件功能设计正确。最后,论文指出了设计中的不足之处以及今后进一步研究的方向。(本文来源于《东南大学》期刊2018-03-08)
王蓉蓉,李平,曾毓敏,韦怡[3](2017)在《一种基于GMM和多项式拟合的语音编码改进算法》一文中研究指出提出一种基于高斯混合模型和多项式拟合的语音编码改进算法.在GMM模型对短时语音谱包络进行参数化的基础上,将一定数量的语音帧划分为一个片段,利用谱特征的相关性对片段内的GMM参数进行多项式拟合联合编码,从而使得参数进一步减少.仿真结果表明,本文算法码率对比基于GMM的语音编码器有显着降低.(本文来源于《南京师范大学学报(工程技术版)》期刊2017年02期)
周航麒[4](2016)在《基于iLBC扩展的多速率语音编码算法研究》一文中研究指出语音信号在网络上进行传输,当出现信道负荷增大,带宽减少等情况时,容易出现丢包,抖动,延时,这样降低了语音质量;提升编码器对语音信号的编码性能很有必要。语音编码的主要目的是在适当减少复杂度和通信时延的条件下,尽可能占用较少的通信容量,提高传输过程中语音的质量。为了对传输过程中的差错具有较高鲁棒性和保证语音质量的同时,降低编码速率,节约宽带资源,提出了很多语音编解码算法,如:G.729、AMR、EVRC和iLBC等以及对这些算法的改进。其中iLBC(internet Low Bit codec)采用的是基于帧的线性预测编码技术,相比于其它编解码算法,该编码器具有动态码本更新技术、丢包隐藏技术和语音增强等技术。该语音编解码算法在基于IP的分组交换网络中具有很好的性能,当网络环境较差时仍可以提供高质量的语音服务。然而,iLBC在数据处理速率方面灵活性并不高,在处理丢包时,相比于码激励线性预测模型的编解码器会占用较高的比特率,这样增加了网络负荷,造成时延。针对上述问题,本文研究了基于iLBC扩展的多速率语音编解码算法,主要工作如下:详细介绍了一些扩展编码器的原理,分析了这些编码算法重构语音的质量。然后阐述iLBC的基本流程,继而在标准的iLBC编码器上进行改进。首先根据离散余弦变换较高的能量压缩特性,需要较少的比特数就能描述起始状态的特征,因此对语音信号中的起始状态采用频域的离散余弦变化来代替时域上的标量量化。然后为了减缓发送端的编码器对语音信号编码时出现丢包,而对语音质量造成的影响,在前面的步骤上增加了反馈调节模块,对语音的质量进行实时调整。最后,为了使编码器能支持音质较高的音频信号,在窄带的基础上增加了宽带编码模块,该方法主要是基于层的比特流进行处理,并对窄带和宽带编码流程进行了详细的描述。通过仿真实验,与经典的语音编解码算法相比较,模拟在不同丢包率和编码速率下各自的性能,本文算法处理后的语音信号更自然并且可懂性也较高。(本文来源于《湖北工业大学》期刊2016-06-01)
魏枫,孟利民[5](2016)在《基于Android的语音编码算法研究与应用》一文中研究指出针对基于Android的Vo IP(Voice over IP)在通信过程中,具有语音数据量大的特点。对目前存在的多种语音编码方案进行分析研究,编写基于Android的Vo IP系统对各种方案的语音压缩率、编码速率以及MOS(Mean Opinion Score)值进行测试。结果表明,Speex(一种基于码激励线性预测编码而设计的音频编码压缩格式)语音编码方案在综合考虑多方面因素的情况下,在基于Android的Vo IP通信系统中具有相对优势。(本文来源于《电声技术》期刊2016年05期)
吴游,冯金金[6](2016)在《语音编码算法在局域网通信系统中的优化实现》一文中研究指出针对多媒体通信技术在网络带宽有限和传输音频数据量大的情况下,带宽利用率低,传输效率低的问题,在局域网通信系统中选择并优化实现了G.723.1编解码算法。在VC++6.0平台上,采用TCP/IP协议,在两台计算机之间分别采用客户端/服务器模式完成了系统设计。实验结果表明,优化后的算法提高了性能,有较高的压缩比,编码后音频数据占用存储空间小,可以节省传输带宽,提高传输效率。(本文来源于《现代电子技术》期刊2016年09期)
何伟俊[7](2016)在《基于感知的低速率语音编码算法研究》一文中研究指出低速率语音编码技术的基本思路是识别语音与非语音信号并设计码本对两者进行压缩编码。现有的低速率语音编码算法侧重于对语音信号时空冗余度的挖掘,识别与压缩过程均忽略了人耳感知语音特点的考虑。目前,基于多帧联合技术的600bps~2.4kbps低速率语音编码器在高信噪比条件下已获得较好的性能,然而随着速率降低,在低信噪比环境下仍存在鲁棒性低、码本存储容量大、时延长等问题。鉴于以上考虑,论文把对语音信号的(主客观)感知因素纳入低速率语音编码器算法设计当中。首先,结合人耳对语音感知在频率上的差异对低信噪比下的鲁棒语音检测算法进行研究;其次,分别从人耳听觉对语音的主观感知和编码器对语音信号信息结构与内容的客观感知两个层面,重点研究设计更贴合语音信号信源空间的低复杂度码本。从识别与压缩两个角度进一步提高编码器的性能和稳定性。主要工作如下:1、针对编码器在低信噪比环境下语音检测准确率下降的问题,提出一种基于子带双特征的自适应保留似然比鲁棒语音检测算法。算法首先根据人耳对语音感知随频率的变化规律划分子带,然后在基于统计模型的似然比检验方法中引入保留权值,通过提取子带归一化双重特征,从时域的角度把具有明显语音特征的子带似然比保留下来参与综合评估,同时利用过去固定时长内的判决结果及相关子带特征参数自适应更新保留阈值。实验结果表明,与同类方法相比,在10dB,0dB和-10dB白噪声下检测准确率提高幅度分别为0.96%~15.91%,1.54%~17.96%和0.65%~11.44%,在10dB,0dB和-10d B Babble噪声下检测准确率提高幅度分别为2%~18.27%,2.9%~11.86%和0.18%~3.65%;方法同时被用于2.4kbps低速率语音编码器,在10dB,0dB和-10dB Babble噪声下,语音质量感知评价(Perceptual Evaluation of Speech Quality,PESQ)值分别提高了0.159,0.157和0.186;在10dB,0dB和-10dB白噪声下,分别提高了0.153,0.098和0.096。2、为了提高码本生成过程中初始码本对信源空间的感知表达能力,提出了一种基于自适应正交M码字分裂的码本生成方法。在码本初始化过程中把每个码字按照码本生成策略分裂成相互正交的多个码字,并通过感知码字对应胞腔的信源分布情况自适应设置分裂矢量大小,使初始化码字能更好地表达语音信号的信源空间,从而减少后续的聚类迭代次数。新方法与二分初始化码本生成方法相比,在保持相近量化失真的前提下,把生成不同大小码本的时间降低了18%~45%。3、针对基于平均失真度生成的传统码本对编码资源分配不合理问题,从人耳感知理解的语音角度,提出一种基于人耳感知的线谱频率(Linear Spectrum Frequency,LSF)参数矢量量化码本设计方案,该方案根据LSF残差的大致分布采用非标准椭圆方程划分多个区域,以过渡段信号更有助于人耳理解语音这一事实作为依据,采用按区域调整训练样本比例的方式对编码资源进行全局调整,并使用调整后的样本设计量化码本。实验结果表明,在500bps声码器应用中,新码本编译码后合成语音的PESQ值相比原码本在男女声样本上分别提高了0.03和0.02。另外,为了降低码本存储容量以及搜索码字造成的时延,把分区域设计码本的思想与格型矢量量化方法相结合,提出了一种基于全局非均匀局部均匀的自适应多尺度格型矢量量化方法,实验结果表明,改进方法在量化失真上略大于传统的多级矢量量化算法,但码本存储容量减少幅度为60%~100%,量化时延降低幅度为69%~80%,在时延、存储容量与量化性能之间取得更好的平衡。4、在编码器对语音信号信息结构与内容的客观感知层面上,从压缩和优化两个角度探讨利用压缩感知理论提升低速率编码器性能的可行性。一方面,分析了LSF参数在不同变换域下的稀疏性,开展了基于压缩感知的LSF参数重构性能研究,研究证实了LSF参数在DFT域和学习字典下均具有不同程度的稀疏性,且在重构性能方面学习字典优于固定变换域;另一方面,为了在译码端减少LSF参数的量化失真,提出了一种基于稀疏表示的译码端LSF参数优化算法,结合量化误差的先验知识,在译码端对声码器参数进行优化调整,研究结果表明,优化后的LSF参数平均失真度比优化前降低了约0.3~1.8%。5、最后,整合上述语音检测和感知码本设计的相关研究成果,提出了基于感知的500bps极低速率语音编码算法。实验结果表明,新算法与中科院在2013年提出的算法相比,在更低的码本存储需求下,无噪环境中合成语音的PESQ提高幅度为0.201和0.141。(本文来源于《华南理工大学》期刊2016-04-12)
何丹丹[8](2015)在《600bps语音编码算法研究和实现》一文中研究指出近年来,越来越多的高速宽带通信系统被应用于实际中,然而,由于低速率(LBR)和甚低速率(VLBR)语音通信是提供安全和保密语音通信的有效工具,故仍然比较重要,一直备受关注。另外,LBR和VLBR不需要占用太多的信道带宽,因此可以在很多恶劣的环境中应用。基于这些,本文重点研究和实现一种速率为600bps的语音编码算法。混合激励线性预测编码(MELP)将原始语音的编码比特率压缩至2.4Kbit/s,是LBR和VLBR语音通信领域中的一种非常典型和成功的语音编码方案。实际上,很多LBR和VLBR算法都是基于该编码方案实现和发展的。由于MELP算法较好的性能,本文也以其为基础,研究和实现一种600bps的语音编解码算法。本文设计的600bps算法中,语音帧长取为25ms,并将叁帧组合成一个超级帧。在编码端,对每一帧信号进行分析并提取出四种参数;在解码端,利用这四种参数进行语音重构。这些参数中,线谱频率(LSF)用于描述声道特性,语音判决用于区分清音帧和浊音帧,基音周期用于给出语音的基本频率,而增益用来计算语音帧的能量。编码时,使用45比特对连续叁帧语音所构成的超级帧的四种参数进行统一联合编码,达到降低编码比特率的目的。为了进一步降低编码比特率并提高语音质量,在本文设计的600bps语音编码算法基础上又引入了一种基于语音端点检测(VAD)和舒适噪声产生(CNG)模块的非连续传输(DTX)技术。该技术在编码端使用VAD算法将噪声和语音分开进行处理,由于对噪声帧采用的编码比特数远远少于语音帧,故可以达到降低编码比特率的目的。在解码端,若检测到噪声,则使用CNG算法产生对应的舒适噪声,以保证语音的连贯性。为了实际应用,又将设计的600bps语音编解码算法移植到TI TMS320C6416 DSP上,并对该编解码算法进行优化,使其在DSP-TMS320C6416开发板上能够很好的实时实现。采取的优化方法包括编译器选项优化、内联函数优化、C代码优化等,以此达到降低算法复杂度的目的。测试和评估结果表明,本文设计的600bps语音编解码算法能够获得较高可懂度的自然语音,其主观语音质量评估(PESQ)值为2.158。在高信噪比环境下,增加了非连续传输技术的语音编解码算法能在保证语音可懂度的同时降低编码比特率。在DSP平台上实现的600bps编解码算法的算法复杂度最终降至45兆周期/秒(MCPS)左右。(本文来源于《西安电子科技大学》期刊2015-11-01)
张雄伟,吴海佳,张梁梁,邹霞[9](2015)在《一种基于重构性深度网络的MELP语音编码改进算法》一文中研究指出为了提高深度模型的编码重构性能,本文为传统对比散度(Contrastive divergence,CD)添加了基于交叉熵的重构误差约束。利用改进后的算法训练了重构性深度自编码机(Reconstructive deep auto-encoder,RDAE),并用RDAE替换混合激励线性预测编码(Mixed excitation linear prediction,MELP)语音编码器中LSF参数的矢量量化方法。测试结果表明,改进后的算法在损失一定模型似然度的条件下获得了重构性能的提升,当RDAE隐藏层结点设为19bit时,本文方法所测得的加权LSF距离、重构语音质量、谱失真指标在训练集和测试集上均优于25bit矢量量化方法,即利用本文方法改进的MELP编码器,在不降低语音质量的条件下,可将MELP编码速率从2.4kb/s降低至2.1kb/s,编码速率降低了12.5%。(本文来源于《数据采集与处理》期刊2015年02期)
庞亮,陈亮,张翼鹏,张新卫[10](2014)在《改进的扩展码激励语音编码算法》一文中研究指出在研究基于扩展码激励的语音编码原理基础上,设计了LSF加权矢量量化、信号修正、固定码本搜索模块对原算法进行了改进,在保证语音编码质量不变的前提下,降低了算法复杂度。改进算法使用定点C代码实现,并在VC++6.0上进行了仿真验证。结果表明:改进后的算法复杂度比原始算法降低了20%;采用ITU-T P.826PESQ标准对改进算法合成语音进行测试,评估得分与原始算法几乎相同。(本文来源于《军事通信技术》期刊2014年04期)
语音编码算法论文开题报告范文
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
随着多媒体技术的发展,人们对语音编码提出了更高的性能要求。G.729语音编码算法能够在保证很高的语音质量的同时,以低延时,低码率进行语音压缩。但是目前DSP硬件实现G.729存在一定的性能极限,已经不能满足最新工程的需求。基于FPGA/ASIC实现G.729编码算法显得尤为迫切。论文首先详细分析了 G.729语音编码算法的基本原理。然后,用软件仿真了 G.729算法的实际性能,验证了编码算法。为后续硬件的实现以及验证,提供了理论基础和数据参考。论文基于Vivado HLS高层次综合工具设计了 G.729编码器IP核。调整C代码后移植到HLS平台,经过综合、联合仿真、IP核封装等步骤,最终生成了 G.729编码算法IP核,可在Vivado平台下后续硬件开发中使用。为了驱动IP核工作,利用Verilog语言设计了 IP核外围电路,并与IP核构成G.729编码验证系统。为了进一步缩短算法延时,降低硬件资源占用,利用Verilog语言设计了 G.729编码算法中线性预测部分。采用自顶向下的设计方法,对线性预测系统按功能划分模块,设计完成了预处理滤波器模块、加窗模块、自相关模块、林文孙—杜宾算法模块。在Vivado平台下完成了各模块以及系统的仿真,并给出相应的仿真结果。论文对上述两个系统分别进行了设计综合、布局布线,给出了综合报告,在Xilinx公司的KC705开发板上进行了硬件验证,使用在线逻辑分析仪抓取信号,硬件结果与软件仿真结果一致,表明硬件功能设计正确。最后,论文指出了设计中的不足之处以及今后进一步研究的方向。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
语音编码算法论文参考文献
[1].吴志军,郭安心,沈丹丹.基于G.729语音编码非零脉冲位置信息的隐藏算法[J].电子与信息学报.2018
[2].蔡韫奇.基于FPGA的G.729语音编码算法的实现与验证[D].东南大学.2018
[3].王蓉蓉,李平,曾毓敏,韦怡.一种基于GMM和多项式拟合的语音编码改进算法[J].南京师范大学学报(工程技术版).2017
[4].周航麒.基于iLBC扩展的多速率语音编码算法研究[D].湖北工业大学.2016
[5].魏枫,孟利民.基于Android的语音编码算法研究与应用[J].电声技术.2016
[6].吴游,冯金金.语音编码算法在局域网通信系统中的优化实现[J].现代电子技术.2016
[7].何伟俊.基于感知的低速率语音编码算法研究[D].华南理工大学.2016
[8].何丹丹.600bps语音编码算法研究和实现[D].西安电子科技大学.2015
[9].张雄伟,吴海佳,张梁梁,邹霞.一种基于重构性深度网络的MELP语音编码改进算法[J].数据采集与处理.2015
[10].庞亮,陈亮,张翼鹏,张新卫.改进的扩展码激励语音编码算法[J].军事通信技术.2014