声学模型论文开题报告文献综述

声学模型论文开题报告文献综述

导读:本文包含了声学模型论文开题报告文献综述、选题提纲参考文献,主要关键词:声学,模型,缩尺,卷积,声频,语音识别,陆空。

声学模型论文文献综述写法

刘巍,肖汶斌,程兴华,王勇献,张理论[1](2019)在《提高近场精度的海洋声学快速场改进模型》一文中研究指出为了提高海洋声学快速场模型在近场区域的计算精度,分析了影响经典快速场模型精度的因素,主要包括Bessel函数近似、忽略内行波项以及在水平距离最远处波数采样率过低,这些因素导致快速场模型近场误差较大、远场水平距离最远处结果不正确(计算结束后需要去除水平距离后段的声场)。提出能够提高经典快速场模型近场计算精度的改进模型,改进部分主要是采用保留内行波项的近似Bessel函数,再将近场上下两个基于声源点与对称轴的叁角形区域用波数积分解(使用精确Bessel函数)覆盖。算例测试结果表明:与经典快速场模型相比,改进模型可在绝对时间增加较少的情况下,显着提高近场计算精度,综合性能更优;与波数积分法相比,改进模型在误差为同量级的情况下,积分时间大幅降低,实际应用价值更高。(本文来源于《国防科技大学学报》期刊2019年06期)

朱洪涛,黄桂敏[2](2019)在《基于声学模型自适应与支持向量回归的英语朗读发音质量评测模型》一文中研究指出针对采用标准美音声学模型来评测中国学生英语发音准确性较低的问题,提出一种基于声学模型自适应与支持向量回归的英语朗读发音质量评测模型。采用最大似然线性回归和最大后验概率算法调整声学模型,以匹配中国学生的英语发音,提取发音准确度、流利度以及朗读完整度特征,引入支持向量回归算法,将这些评分特征融合为最终的发音质量评分。实验结果表明,该模型可提升发音质量评测性能。(本文来源于《桂林电子科技大学学报》期刊2019年05期)

刘大鹏,苏宏兵,蒋从双,王熙伟[3](2019)在《燃煤电厂声学模型搭建方法研究与应用》一文中研究指出大型工业项目的噪声控制工程具有声源众多、声源特性多样、传播规律复杂等诸多问题,对工程分析计算的要求很高。文章介绍了两个大型燃煤电厂噪声源数据采集方法、计算机声学模型搭建方法及其成果,获得的模型预测值与实测值具有良好的一致性。阐述了电厂声学模型建模的方法和成果,为同行研究和工程应用提供了经验和借鉴。(本文来源于《中国环保产业》期刊2019年10期)

丁雷[4](2019)在《声频工程中的声学缩尺模型》一文中研究指出声学缩尺模型在声频工程设计中扮演着重要角色,设计者利用缩尺模型,可以准确模拟厅堂内波动声学现象,辅助分析厅堂建筑中的混响时间、声波的吸收与扩散特性、声脉冲响应及声场均匀性分布情况等指标,检测是否会出现音质缺陷,实现厅堂建筑在建成前的可听化,并可利用测试数据对原设计方案进行修正及可行性调整。(本文来源于《电声技术》期刊2019年10期)

闫孝伟,李琦,宋昊,胡宇安[5](2019)在《基于局域实尺度模型的加压有限空间内水下声学材料降噪效果测量方法研究》一文中研究指出提出了一种加压环境下有限空间内水下声学材料降噪性能评价方法。本文利用有限元数值方法,设计了一种耐水压的局域实尺度模型,其作为背衬可在大型消声压力水罐中用于测量水下声学材料应用于舱段模型下的辐射声功率插入损失。建立了基于双水听器水下目标辐射噪声近场测量方法,并利用大型压力消声水罐开展敷设声学材料的局域实尺度模型辐射噪声测量试验,通过计算敷设声学材料前后模型辐射声功率插入损失,得到声学材料的降噪性能。仿真和试验结果表明:1OOHz~1000Hz频段内,本文建立的基于局域实尺度模型噪声测量方法可以有效评价加压环境下声学材料在舱段背衬条件下降噪效果。可用于指导水下声学材料的设计以及应用效果评价。(本文来源于《第十七届船舶水下噪声学术讨论会论文集》期刊2019-08-21)

杨金锋,李凯涛,贾桂敏,师一华[6](2019)在《基于DNN-HMM的陆空通话声学模型构建方法》一文中研究指出由于陆空通话特殊的语法结构与发音,通用语音识别声学模型不适用于陆空通话的声学建模。提出一种基于深度学习的民航陆空通话声学模型构建方法。基于建立的陆空通话语料库数据,利用DNN-HMM模型对陆空通话语音特征进行声学建模,并通过语音特征增强方法提高模型输入特征的鲁棒性。通过实验对比分析不同语音特征、特征维数和连接帧数对陆空通话声学模型的影响。实验结果表明,提出的基于DNNHMM的陆空通话声学模型可使音素错误率降低至5.62%。(本文来源于《中国民航大学学报》期刊2019年04期)

邓引引[7](2019)在《基于卷积神经网络的中文声学模型的识别效率优化与实现》一文中研究指出近年来,人工智能(Artificial Intelligence,AI)技术飞速发展,自动语音识别作为一种AI关键技术一直备受关注。如今,随着神经网络研究热潮的兴起,研究人员使用卷积神经网络(Convolution Neural Network,CNN)参与声学模型建模,并解码各个隐马尔科夫模型(Hidden Markov Model)状态的后验概率,形成CNN-HMM声学模型(下文简称CNN声学模型)。相比于传统声学模型,CNN声学模型拥有更好的识别效果,但是当中文CNN声学模型部署在语音识别系统中并连续识别海量音频数据时,基于CPU(中央处理单元)处理器的中文CNN声学模型面临着识别效率低的问题,因此如何提高中文CNN声学模型的识别效率是目前语音识别领域亟需解决的问题之一。本课题基于科大讯飞股份有限公司“基于卷积神经网络的声学模型效率优化”项目。经过分析研究,本文将从以下叁个方面优化中文CNN声学模型在CPU处理器上识别解码效率:利用AVX2指令集系统加速声学模型解码速度、给出一种8bit定点优化方案来解决浮点语音数据运算缓慢的问题、优化卷积运算方法提高CNN声学模型卷积运算效率,最后对中文CNN声学模型进行上述叁种优化来共同提高识别效率。针对上述优化方案,本文进行了模块测试和系统测试,并分别对比了优化前后的测试结果以验证优化方案的有效性和可行性。模块测试的结果表明,优化后的中文CNN声学模型可明显提升识别效率。同时,本文将优化前后的中文CNN声学模型分别部署到相同的语音识别系统中进行系统识别率和识别效率测试,系统测试的结果表明,使用优化后中文CNN声学模型的语音识别系统的平均识别效率相对提升77.58%,并且优化后语音识别系统平均字识别精确率的下降范围维持在1%以内,符合项目预期指标要求。最后,本文对优化后的语音识别系统进行了连续10多个小时的系统稳定性测试,测试结果表明,部署优化后中文CNN声学模型的语音识别系统能够长时间稳定工作,并且内存占用正常。综上所有测试结果表明,在基本不影响识别率和保证语音识别系统可以稳定运行的前提下,本文针对中文CNN声学模型给出的效率优化方案有效可行。目前,上述优化方案已应用于科大讯飞车载语音识别系统中。(本文来源于《重庆邮电大学》期刊2019-06-02)

秦云鹏[8](2019)在《基于数据加噪和文语对齐的声学模型训练》一文中研究指出在AI时代,语音由于比文字自然高效而更受人机交互领域的青睐。语音识别,即系统把语音信号输入转变为文字输出的过程。声学模型作为语音识别系统的核心模块,主流训练方式为深度神经网络隐马尔可夫模型(DNN-HMM)。训练声学模型是通过输入语音数据和标注文本数据对模型参数进行调优的过程。语音数据越充足,标注文本越准确,训练后模型泛化能力越强。然而现阶段存在如下问题:(1)训练数据获取难,训练数据资源匮乏。(2)人工根据语音转写标注文本时,由于键盘输入有误或者人工理解偏差,不可避免会出现少字多字错字等现象,导致标注文本数据不准确,如果将这类数据用于声学训练,会降低模型的泛化能力。(3)传统声学训练的语音数据是安静环境下录制的音频,训练得到的模型在噪声背景下往往识别率很低。针对以上叁点不足,本文展开了以下工作:(1)借鉴图像识别采用加噪进行数据增强的思路,本文选取机场、汽车、街道和火车4种噪声,采用Python程序对音频数据进行了加噪处理。通过数据加噪,一是解决了训练数据的获取难题,二是模拟噪声背景的声学模型训练,提升系统在噪声环境的鲁棒性。(2)针对标注文本不正确,本文在传统强制对齐(将语音和标注文本对齐的操作,属于文语对齐方式的一种)基础上,采用前向算法和后向算法,先对语音进行一次识别,将结果以词图形式储存,采用后验概率做搜索结果确认后,将语音识别结果与标注文本进行对比,剔除错误率较高的标注文本数据和相应音频数据,将剩余数据用作模型训练,我们将这一文语对齐方式称作词图对齐。(3)依据音频数据是否加噪和标注文本是否词图对齐,本文进行了加噪实验和对齐实验。实验结果显示,两组方法无论是单独使用,还是结合使用,都会一定程度提升语音识别系统的识别率,说明本文方法确实具备可行性。(本文来源于《山西大学》期刊2019-06-01)

徐高鹏[9](2019)在《基于深度学习的中文儿童语音识别声学模型研究》一文中研究指出儿童语音识别技术存在巨大的潜在市场,但大部分的语音识别研究都聚焦于成人,当下对儿童语音识别技术的研究较少,且儿童在发音及语言表达方面的特殊性也给儿童语音识别的研究带来了极大的挑战。因此本文从基于深度学习的中文儿童声学建模角度出发,对现有的声学模型进行优化,进一步研究新的儿童声学建模方法来提高中文儿童语音识别的准确率和解码效率。首先,本文围绕深度学习的声学建模技术,研究了时延神经网络(TDNN)和LSTM(Long Short-Term Memory)网络的模型结构,并分析了TDNN-LSTM模型在计算复杂度方面的问题,采用改进的OPGRU(Output-Gate Projected Gated recurrent unit)结构来代替LSTM。实验表明基于TDNN-OPGRU的声学模型,不仅比TDNN-LSTM的声学模型识别性能好,而且比TDNN-LSTM的解码速度快30%。针对儿童在生理学上的特性,通过在网络前段加入CNN(Convolutional Neural Networks)来捕获更有利于儿童语音识别的声学特征信息,最终采用基于CNN-TDNN-OPGRU的儿童语音声学模型,实验表明基于CNN-TDNN-OPGRU的儿童语音声学模型可以取得比TDNN-OPGRU更好的性能,验证了通过增加CNN层来提取更丰富的儿童声学特征的有效性。其次,为了进一步提高儿童语音识别的性能和解码效率,本文研究了前馈记忆序列神经网络(FSMN)的结构,将其应用于儿童声学建模中,并进行不同FSMN结构的设计及实验对比,实验验证了包含更多记忆模块的FSMN模型可以获得更丰富的上下文信息。在FSMN模型的基础上进一步研究了cFSMN(Compact-FSMN)以及基于深层结构FSMN组成的DFSMN(Deep FSMN)对于中文儿童语音识别系统性能的提升,通过实验结果的分析,表明基于DFSMM的儿童声学模型的词错率为25.76%,相比基于TDNN-LSTM的儿童声学模型可以获得1.7%的相对性能提升,且解码速度比TDNN-LSTM声学模型快2倍以上。最后,针对目前儿童语音识别训练语料资源不足,导致识别系统鲁棒性差的问题,将多任务学习(MTL)与DFSMN结合,提出基于MTL-DFSMN的中文儿童语音声学模型,将LF-MMI(Lattice Free MMI)准则和交叉熵训练准则一起用于DFSMN声学模型训练,在训练过程中两者同时更新模型参数和计算损失,在解码时,则由LF-MMI产生网络的输出。最终实验结果表明,基于MTL-DFSMN的中文儿童声学模型可以取得最佳性能,相对Relu-DNN模型词错率下降16%。(本文来源于《兰州理工大学》期刊2019-06-01)

刘竞扬,丛卫华,曾祥瑞[10](2019)在《叁维声学图像目标模型重构方法研究》一文中研究指出针对叁维声学图像可视化过程中,存在分辨率低、表面粗糙,目标质地与立体感不足的问题,文章采用行进立方体法,通过构造叁维声学数据场最小立方体,确定目标轮廓所在立方体内部叁角片元连接方式、顶点坐标、法向量建立目标表面叁维模型,实现了叁维声学目标的重构。文章利用叁维成像声纳海试数据开展算法性能与有效性验证,用多种分辨率数据对算法进行性能测试,构造了海试数据的掩埋目标叁维表面模型。研究结果表明:基于行进立方体法的叁维声学图像目标表面重构技术具有算法简单、计算量小的优点,算法耗时和采样点数成正比关系;在叁维声学图像可视化过程中对掩埋目标表面重构可以有效提高掩埋目标的立体感与辨识度。(本文来源于《中国声学学会水声学分会2019年学术会议论文集》期刊2019-05-25)

声学模型论文开题报告范文

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

针对采用标准美音声学模型来评测中国学生英语发音准确性较低的问题,提出一种基于声学模型自适应与支持向量回归的英语朗读发音质量评测模型。采用最大似然线性回归和最大后验概率算法调整声学模型,以匹配中国学生的英语发音,提取发音准确度、流利度以及朗读完整度特征,引入支持向量回归算法,将这些评分特征融合为最终的发音质量评分。实验结果表明,该模型可提升发音质量评测性能。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

声学模型论文参考文献

[1].刘巍,肖汶斌,程兴华,王勇献,张理论.提高近场精度的海洋声学快速场改进模型[J].国防科技大学学报.2019

[2].朱洪涛,黄桂敏.基于声学模型自适应与支持向量回归的英语朗读发音质量评测模型[J].桂林电子科技大学学报.2019

[3].刘大鹏,苏宏兵,蒋从双,王熙伟.燃煤电厂声学模型搭建方法研究与应用[J].中国环保产业.2019

[4].丁雷.声频工程中的声学缩尺模型[J].电声技术.2019

[5].闫孝伟,李琦,宋昊,胡宇安.基于局域实尺度模型的加压有限空间内水下声学材料降噪效果测量方法研究[C].第十七届船舶水下噪声学术讨论会论文集.2019

[6].杨金锋,李凯涛,贾桂敏,师一华.基于DNN-HMM的陆空通话声学模型构建方法[J].中国民航大学学报.2019

[7].邓引引.基于卷积神经网络的中文声学模型的识别效率优化与实现[D].重庆邮电大学.2019

[8].秦云鹏.基于数据加噪和文语对齐的声学模型训练[D].山西大学.2019

[9].徐高鹏.基于深度学习的中文儿童语音识别声学模型研究[D].兰州理工大学.2019

[10].刘竞扬,丛卫华,曾祥瑞.叁维声学图像目标模型重构方法研究[C].中国声学学会水声学分会2019年学术会议论文集.2019

标签:;  ;  ;  ;  ;  ;  ;  

声学模型论文开题报告文献综述
下载Doc文档

猜你喜欢