立体声编码论文-李诗晴,涂卫平

导读:本文包含了立体声编码论文开题报告文献综述及选题提纲参考文献，主要关键词:参数立体声编码,先进音视频编码标准-第10部分(AVS-P10),空间参数

立体声编码论文文献综述

李诗晴,涂卫平^[1]（2016）在《AVS-P10立体声编码算法的优化设计与实现》一文中研究指出AVS-P10是我国首部具有完全自主知识产权的移动音频编解码标准,但是其立体声编码存在重建声像不够稳定、编码复杂度较高的问题。根据参数立体声编码原理,采用声道下混和立体声参数提取及合成技术,以AVS-P10的核心编码器为基础,设计并实现了一种高效的立体声编解码方案。实验结果表明,同等码率下,优化后的算法比AVS-P10立体声编码算法的主观音质提升约10MUSHRA得分,编码复杂度下降幅度达到40%~60%,解码复杂度略有下降。(本文来源于《计算机工程与应用》期刊2016年08期）

董石,胡瑞敏,涂卫平,王晓晨,郑翔^[2]（2013）在《基于极坐标域主成分分析的无线通信立体声参数编码技术(英文)》一文中研究指出High efficiency audio compression is the basic technology in audio involved multimedia communications. Downmixing and parametric coding is efficient coding scheme with wide applications in some up-to-date audio codecs such as Parametric Stereo (PS) in EAAC+ and MPEG-Surround. Principle Component Analysis (PCA) stereo coding followed this idea to map two channels to one channel with maximum energy and parameterize the secondary channel. This paper investigates the conventional PCA method performance under general stereo model with multiple sound sources and different directions, and then proposes a Polar Coordinate based PCA (PC-PCA) stereo coding method. It has been proved that when multiple sound sources exist with different directions, PC-PCA is better than the conventional PCA method when Mean to Standard deviation Ratio (MSR) is large. A stereo codec based on PC-PCA is proposed to validate the performance improvement of proposed method. Objective and subjective tests show the proposed method achieves a comparative quality and saves 50% parameter bit rate comparing with conventional PCA method, and obtains a 4-8 MUSHRA scores improvement comparing with state-of-the-art stereo codec at the same parameter bit rate.(本文来源于《中国通信》期刊2013年02期）

张瑞生^[3]（2012）在《多路立体声音频编码系统的设计与实现》一文中研究指出数字音频编码技术是数字多媒体技术的关键技术之一。音频编码通过去除原始音频数据中的各种冗余信息来实现数据量的压缩，方便音频信息的存储和传输，目前广泛应用于数字音频广播、数字电视系统、数字化家庭影院、可视电话会议系统等领域。在这些应用中，常常需要对采集到的音频数据进行实时编码，并且要求支持多路立体声同时处理，这就对音频编码系统的设计和实现提出了较高的要求。近年来，以DSP为代表的嵌入式信号处理器因计算性能强大、集成度高、功耗低等特点，逐渐为各种信号处理设备所使用。研究和实现基于DSP平台的实时音频处理系统，特别是支持多个声道同时编码的高性能音频编码系统，可以方便音频数据的采集和存储，也可以经过整合应用于音视频编码系统中，用于数字音视频节目的制作。本文基于TI公司的高性能数字信号处理器TMS320C6727，实现了一个支持多声道同时输入、编码和发送的实时音频编码系统，能够满足对多路立体声音频数据的处理要求。该系统还支持对码流的PES打包，输出的PES可进一步打包成TS，用于在通信网络上的传输。本文分析了现有音频编码标准的编码框架和编码算法的基本原理，介绍了TMS320C6727的内部模块结构和功能，给出了MP2编码算法在所用DSP平台上的优化方法，详细叙述了使用McASP、SPI和dMAX等模块实现音频数据的接收和码流发送的过程，介绍了DSP响应多种外部中断的方法和基于FLASH启动的实现过程。最终实现的实时音频编码系统支持四路八声道输入同时编码，输入为48KHz采样率的PCM数据，编码格式为MP2，输出码率为128Kbps。(本文来源于《天津大学》期刊2012-12-01）

张树华^[4]（2010）在《MDCT域信号处理及其在立体声编码中的应用》一文中研究指出修正离散余弦变换(Modified Discrete Cosine Transform, MDCT)能高效和紧致的表示信号,因而广泛用于各种感知编码(PerceptualAudioCoding,PAC)。但作为临界采样的实重迭变换,MDCT能量不守恒,无相位信息,难以直接分析和处理信号。由于这个限制,PAC向低码率发展时,引入独立的复变换用于低码率参数编码模块的信号分析和处理。然而引入独立变换增加了复杂度与算法延时,这两者又都是移动通信系统的重要指标。如果MDCT还能高效的分析和处理信号,那么就可以避免这两个问题。这是论文研究MDCT域信号处理的主要动机。在论文中,我们研究了MDCT与DFT的对应关系、正弦信号MDCT频谱特性,以及完全MDCT域低码率参数立体声编码。论文的主要贡献包括:(1)提出循环重迭变换(Circulant Lapped Transform, CLT),以此为桥梁得到MDCT-DFT转换矩阵的稀疏表示以及复杂度为O(N)的快速转换算法;(2)发现并证明正弦信号MDCT奇偶子频谱的线性相关性,提出奇偶子带划分法,对一般音乐信号最高有20dB的编码增益;(3)给出任意窗函数下正弦信号MDCT频谱的严格表达式,突破现有理论对窗函数的限制,得到适用任意窗函数的频率幅度估计方法,2到3次迭代达到机器精度;(4)提出最大相关度旋转(Maximal Coherence Rotation, MCR)变换,在正交变换下最大化子带信号对的相关度,并给出MCR参数与双耳线索参数的等价关系;(5)构建基于奇偶子带划分和MCR变换的MDCT域参数立体声编解码器MDCT-PS,与MPEG-4参数立体声(Parametric Stereo, PS)相比,复杂度降低43.9%,延时降低20ms,音质相当。综上,论文工作不仅将MDCT从一种信号表示工具拓展为一种高效的信号处理工具,还提供了低复杂度低延时立体声编码的可行方案。(本文来源于《清华大学》期刊2010-12-01）

吴连火^[5]（2009）在《参数立体声编码的研究与实现》一文中研究指出立体声编码可以将立体声音频信号压缩,使其所占存储空间与带宽降低,以便高效地存储和传输。与传统的立体声编码技术相比,参数立体声编码可以在不降低音质的前提下,获得更高的编码增益。参数立体声编码的理论基础是空间听觉,编码时将原立体声信号用单声道信号和空间参数来表达,解码时再进行相反的操作。还原声场中声音的基本信息由单声道信号反映,各个声像的位置和尺寸等信息则由空间参数控制,因此参数的选取在参数立体声编码技术占有重要的地位。本文通过对空间听觉理论的系统研究,分析得出合适的空间参数,并以此为依据建立参数立体声编码模型。从当前的空间听觉研究成果来看,本文所建模型涵盖了所有可用的空间参数,其他所谓的新参数本质上均可由所列参数衍生得到。目前已有的参数立体声编码技术,均符合本文所建模型。在给出编码模型后,本文研究了模型的实现,详细地介绍了编解码的具体细节。在剖析了典型参数立体声编码的基础上,本文探索了可能的改进方法,提出一种码流分层结构,采用这一结构可以得到变速率的编码算法。针对现有参数立体声存在的问题,本文提出了几个新的空间参数,并根据这些参数设计了基于FFT的编解码方案。最后对这一方案进行MUSHRA评分,测试结果表明,该方案和aacPlus v2中的参数立体声性能相当,但在左右声道相关性较小时,本文方案所得分值明显较高。需要指出,本文所研究的参数立体声编码,实际上并不局限于声道数为2的情况,可以推广为多声道音频编码。(本文来源于《大连理工大学》期刊2009-11-14）

贾懋珅,鲍长春^[6]（2009）在《一种符合ITU-T指标要求的嵌入式立体声语音频编码方法》一文中研究指出基于国际电信联盟标准化组织(ITU-T)编码标准G.729.1,本文提出了一种嵌入式变速率立体声语音与音频编码方法.本算法利用G.729.1和改进的调制迭接变换(Modulated Lapped Transform,MLT)编码技术对输入信号的中值与边带信息进行分层编码,形成具有嵌入式结构的码流.编码器可处理宽带和超宽带的立体声信号,宽带立体声信号编码的最大码率为48kb/s,超宽带立体声信号编码的最大速率为64kb/s.实现结果表明,本编码器的编码质量均达到了ITU-T对G.EV-VBR立体声编码的指标要求.(本文来源于《电子学报》期刊2009年10期）

张猛^[7]（2006）在《24位192kHz立体声编码译码器WM8569》一文中研究指出WM8569是 Wolfson 公司推出的一种带音量控制的立体声编解码器。其应用领域包括 DVD、个人视频录像机(PVR)、PC 声卡、LCD-TV 及汽车音频等。WM8569独立的模数转换器和数模转换器计时允许各自的录音和放音采样速率。带过采样和数字插值滤波器的一个立体声24位多位∑-Δ DAC 提供输出信号。数字音频输入字长从16～24位,采样率从8～192kHz。一个立体声多位∑-ΔDAC 被利用。数字音频输出字长与输入字长相同,但采样率变为32～96kHz。DAC 和 ADC支持独立的采样率。音频数据接口支持 I~2S、左/右调整和数字信号处理器(DSP)数字音频格式。器件经3线(本文来源于《电子世界》期刊2006年10期）

^[8]（2006）在《欧胜为便携设备推出带更低功耗1W立体声D类扬声器驱动的编码解码器》一文中研究指出欧胜微电子近日发布了WM8960立体声编码解码器(CODEC),它是一款集成了一个无滤波器D类立体声扬声器驱动器、多个立体声模拟数字转换器(ADC) 和数字模拟转换器(DAC)、耳机驱动器和一个内置锁相环的器件。该器件定位在便携式电子产品,诸如带有立体声扬声器的移动电话和个人移动视频播放器等等正在兴起的产品上、它们需要高质(本文来源于《电子与电脑》期刊2006年04期）

李宣鹏^[9]（2006）在《基于空间感知信息的立体声编码》一文中研究指出与传统立体声编码相比较,强度立体声编码可以有效地降低码率,但是强度立体声编码的局限性在于,如果对整个带宽或者听觉声像较宽信号进行编码时,会产生令人难以接受的失真,双耳线索编码(Binaual Cue Coding)克服了强度立体声编码的这一问题。研究结果表明,人耳对听觉空间声像特性的感知很大程度取决于音频声道间声级差(inter-channel level difference, ICLD)、时间差(inter-channel time difference, ICTD)和相关性(inter-channel coherence, ICC)。基于此原理,BCC用一个单声道向下混和信号来表现立体声或者多声道信号的波形信息,同时对ICLD、ICTD和ICC进行估计,并把估计结果作为边信息传输到解码器。解码器根据边信息,对传输的单声道信号进行综合处理,产生相应的立体声或者多声道输出信号,同时保证输出音频信号与源音频信号声道间空间感知参数近似相同。由于BCC边信息包含的信息量远远小于源音频数据的信息量,因此BCC码率接近于单声道信号码率。本文对BCC进行了探讨,实现了低复杂度BCC方案,主要包括:1、分析了ICLD、ICTD和ICC对声像方位的影响,给出了估计方法和快速算法。2、在借鉴他人工作的基础上,给出BCC完整的编码方案。3、重点讨论了低复杂度BCC的实现,其中主要包括子带划分、和信号求取、卷积在STFT中的实现、空间感知参数的量化编码以及BCC的解码算法等内容,实现了程序仿真,测试结果较理想,实现的立体声信号有较强的空间感,失真小。(本文来源于《东南大学》期刊2006-03-15）

^[10]（2006）在《欧胜立体声编码解码器为数字视频提供完美声音》一文中研究指出2005年12月19日,欧胜微电子有限公司发布了 WM8569立体声编码解码器(CODEC),该芯片瞄准了包括声卡、数字电视、DVD-RW设备和快速成长的便携式视频录像设备等广泛的应用。 WM8569是欧胜高性能、多声道编码解码器系列中的(本文来源于《电子与封装》期刊2006年01期）

立体声编码论文开题报告

（1）论文研究背景及目的

此处内容要求：

首先简单简介论文所研究问题的基本概念和背景，再而简单明了地指出论文所要研究解决的具体问题，并提出你的论文准备的观点或解决方法。

写法范例：

High efficiency audio compression is the basic technology in audio involved multimedia communications. Downmixing and parametric coding is efficient coding scheme with wide applications in some up-to-date audio codecs such as Parametric Stereo (PS) in EAAC+ and MPEG-Surround. Principle Component Analysis (PCA) stereo coding followed this idea to map two channels to one channel with maximum energy and parameterize the secondary channel. This paper investigates the conventional PCA method performance under general stereo model with multiple sound sources and different directions, and then proposes a Polar Coordinate based PCA (PC-PCA) stereo coding method. It has been proved that when multiple sound sources exist with different directions, PC-PCA is better than the conventional PCA method when Mean to Standard deviation Ratio (MSR) is large. A stereo codec based on PC-PCA is proposed to validate the performance improvement of proposed method. Objective and subjective tests show the proposed method achieves a comparative quality and saves 50% parameter bit rate comparing with conventional PCA method, and obtains a 4-8 MUSHRA scores improvement comparing with state-of-the-art stereo codec at the same parameter bit rate.

（2）本文研究方法

调查法：该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法：用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法：通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法：通过调查文献来获得资料，从而全面的、正确的了解掌握研究方法。

实证研究法：依据现有的科学理论和实践的需要提出设计。

定性分析法：对研究对象进行“质”的方面的研究，这个方法需要计算的数据较少。

定量分析法：通过具体的数字，使人们对研究对象的认识进一步精确化。

跨学科研究法：运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法：这是社会科学用来分析社会现象的一种方法，从某一功能出发研究多个方面的影响。

模拟法：通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

立体声编码论文参考文献

[1].李诗晴,涂卫平.AVS-P10立体声编码算法的优化设计与实现[J].计算机工程与应用.2016

[2].董石,胡瑞敏,涂卫平,王晓晨,郑翔.基于极坐标域主成分分析的无线通信立体声参数编码技术(英文)[J].中国通信.2013

[3].张瑞生.多路立体声音频编码系统的设计与实现[D].天津大学.2012

[4].张树华.MDCT域信号处理及其在立体声编码中的应用[D].清华大学.2010

[5].吴连火.参数立体声编码的研究与实现[D].大连理工大学.2009

[6].贾懋珅,鲍长春.一种符合ITU-T指标要求的嵌入式立体声语音频编码方法[J].电子学报.2009

[7].张猛.24位192kHz立体声编码译码器WM8569[J].电子世界.2006

[8]..欧胜为便携设备推出带更低功耗1W立体声D类扬声器驱动的编码解码器[J].电子与电脑.2006

[9].李宣鹏.基于空间感知信息的立体声编码[D].东南大学.2006

[10]..欧胜立体声编码解码器为数字视频提供完美声音[J].电子与封装.2006

标签：参数立体声编码; 先进音视频编码标准-第10部分(AVS-P10); 空间参数;

立体声编码论文-李诗晴,涂卫平

立体声编码论文文献综述

立体声编码论文开题报告

立体声编码论文参考文献

猜你喜欢