导读:本文包含了声场景分析论文开题报告文献综述、选题提纲参考文献,主要关键词:基音,声场,语音,说话,小波,卡尔,信号。
声场景分析论文文献综述写法
张翔[1](2014)在《语声场景分析系统的设计与实施》一文中研究指出语声场景分析要解决的问题是针对一段包含有多个未知说话人的语音文件,发现其语声场景发生改变(如说话人的切换,语音和非语音的切换等)的位置,并将不同说话人的说话语段区分标注,将相同的说话人标注为相同的标签。作为说话人识别技术的应用之一,它解决的问题是,在待处理的测试语音中的说话人人数、说话人身份、说话人性别、说话人所在场景等信息都未知的条件下,检测和识别出各个说话人在什么时间段说了话,实现对音频文件中的不同说话人的语音进行有效分割和检测。语声场景分析系统有着广泛的应用前景,如,针对新闻广播、会议记录、影视剧集等音频资料,利用该技术实现对语音中的说话人进行检测和跟踪,高效的提取说话人的富文本信息。语声场景分析系统主要包括语音特征提取、语音检测、说话入切换点检测和说话人聚类这四大步骤。本文重点在以下方面进行了研究:(1)概括和归纳语声场景分析系统的发展现状和技术基础。(2)对法国阿维尼翁大学(LIA)提出的基于E-HMM模型的语声场景分析(LIA Speaker Diarization, LIASD)系统进行了分析与测试,发现了LIASD系统存在的问题。(3)为了改善LIASD系统的不足,实现了一个包含说话人提纯过程的语声场景分析(Purified-LIA Speaker Diarization, P-LIASD)系统,并分析了P-LIASD系统的不足。(4)为了实现一个稳定性更良好的语声场景分析系统,本文设计并实施了一套带有多模块的语声场景分析(Multi-Module Speaker Diarization, MMSD)系统(5)分别对系统中包含的核心算法,即语音检测、说话人切换点检测、说话人聚类、说话人提纯、短语段后处理等算法,进行了研究与设计,分析了MMSD系统的核心功能模块的效果及对系统性能的影响。(6)最后对比分析了LIASD系统、P-LIASD系统以及MMSD系统的系统性能,并指出了叁者的优缺点,通过语声场景分析错误率(Diarization Error Rate, DER)指标衡量系统的准确性及稳定性。(本文来源于《北京邮电大学》期刊2014-12-01)
苏秦[2](2004)在《基于声场景分析的混迭语音信号分离》一文中研究指出本文简述了声场景分析(ASA)的概念及其在语音信号处理中的作用,并以小波变换的分析方法为工具,提出一种基于声场景分析的混迭语音信号分离算法。本文算法分为混迭语音信号分析和语音信号重构两大部分,具体流程为:首先利用小波变换对待分析的语音进行谐波信号分析,求取语音信号的小波能量谱图;然后通过非参数卡尔曼滤波对语音信号基音的概率密度函数(PDF)进行预测、更新,并对推导更新后的PDF进行最大值检测,从而获得混迭语音中各音源的最佳基音轨迹;最后求各倍频分量振幅,并进行语音信号的重构。文中利用提出的算法构造混迭语音分离系统,对若干组语音进行了实验,并和其它算法做比较,实验证明本算法对混迭语音信号的分离是有效的。(本文来源于《苏州大学》期刊2004-05-01)
赵鹤鸣,朱美虹,俞一彪,陈雪勤[3](2003)在《一种适于计算声场景分析的混迭语音基音检测方法》一文中研究指出本文提出了一种在混迭语音信号中检测各自语音分量基音信息的方法 .该方法采用小波变换作为基音检测模型中的滤波处理 ,并用广义自相关运算突出基音信息 ,用增强自相关累和消除冗余信息 ,并提出了用基音概率函数来预测并跟踪不同基音的变化以提高基音检测的准确性 .本文提出的方法可应用于计算声场景分析中 .实验结果表明 ,该方法对于混迭语音的基音检测是非常有效的 .(本文来源于《电子学报》期刊2003年01期)
陈雪勤[4](2002)在《基于计算声场景分析的混迭语音分离研究》一文中研究指出声场景分析主要研究如何在嘈杂的声音中感知环境事件。当各种声源同时存在时,人们将来自不同声源的声音信号区分开被称之声源分离问题,这是计算声场景分析的基础技术。 本文描述了一种能够有效分离混迭语音信号的系统。我们知道影响声源分离的因素有多种,想要实现混迭语音分离,必须知道人类听觉系统是如何从复杂的混迭语音流中得到属于各个源信号的信息的。 本文的主要工作可分为如下叁个方面: 1、建立一个能反映人类听觉心理特征的新的听觉模型,混迭语音信号经过该模型后转换成为一系列频率分量。 2、将变换后的信息转换成可以按照不同声源分组的感观要素。在此基础上,对上述过程所得到的感观要素按不同声源加以分组。 3、最后,利用来自同一声源的感观要素重新合成或重建感兴趣的语音源信号。 经实验证明本文所提出的混迭语音分离方法是有效的。(本文来源于《苏州大学》期刊2002-05-01)
赵鹤鸣,朱美虹,陈雪勤,肖筱华[5](2002)在《基于声场景分析的混迭语音分离研究》一文中研究指出从计算声场景思想出发,研究了如何从混迭语音中提取各源信号基音及谐波分量的方法,在此基础上根据语音信号正弦模型重建各语音分量,从而实现混迭语音分离。实验结果表明,笔者提出的方法是十分有效的。(本文来源于《通信技术》期刊2002年01期)
声场景分析论文开题报告范文
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文简述了声场景分析(ASA)的概念及其在语音信号处理中的作用,并以小波变换的分析方法为工具,提出一种基于声场景分析的混迭语音信号分离算法。本文算法分为混迭语音信号分析和语音信号重构两大部分,具体流程为:首先利用小波变换对待分析的语音进行谐波信号分析,求取语音信号的小波能量谱图;然后通过非参数卡尔曼滤波对语音信号基音的概率密度函数(PDF)进行预测、更新,并对推导更新后的PDF进行最大值检测,从而获得混迭语音中各音源的最佳基音轨迹;最后求各倍频分量振幅,并进行语音信号的重构。文中利用提出的算法构造混迭语音分离系统,对若干组语音进行了实验,并和其它算法做比较,实验证明本算法对混迭语音信号的分离是有效的。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
声场景分析论文参考文献
[1].张翔.语声场景分析系统的设计与实施[D].北京邮电大学.2014
[2].苏秦.基于声场景分析的混迭语音信号分离[D].苏州大学.2004
[3].赵鹤鸣,朱美虹,俞一彪,陈雪勤.一种适于计算声场景分析的混迭语音基音检测方法[J].电子学报.2003
[4].陈雪勤.基于计算声场景分析的混迭语音分离研究[D].苏州大学.2002
[5].赵鹤鸣,朱美虹,陈雪勤,肖筱华.基于声场景分析的混迭语音分离研究[J].通信技术.2002