一、A SPEAKER ADAPTABLE VERY LOW BIT RATE SPEECH CODER BASED ON HMM(论文文献综述)
王蓉蓉[1](2017)在《基于GMM语音谱包络表示的编码算法研究》文中研究表明低速率语音编码和极低码率语音编码是现代语音编码技术研究和发展的一个重要方向。对于语音编码技术来说,降低比特率是其不断发展的目标和动力。语音端点检测是语音编码过程中的重要一环,本文在研究了基础的基于方差的语音端点检测算法的基础上,提出基于ERB尺度子带划分的方差语音端点检测算法。实验结果表明,本文提出的基于ERB尺度划分的方差语音端点检测算法与基础的方差语音端点检测算法以及基于Bark尺度划分的方差语音端点检测算法相比,检测正确率,错检率,漏检率均有相应的改进。本文在深入研究基于高斯混合模型(Gaussian Mixture Model, GMM)对语音谱包络参数化表示的语音编码方法的基础上,提出一种分段编码改进算法。该算法将固定数量的语音帧划分为一个片段,在GMM对短时语音谱包络进行参数化的基础上,利用多项式拟合语音片段内的GMM参数,从而使得参数数量减少。仿真结果表明,本文算法码率对比基本的基于GMM的语音编码器有明显降低。另外本文还提出一种基于改进的高斯混合模型的甚低码率语音编码器。该编码器将多帧GMM参数组成一个超帧,对多帧参数联合编码,改进了 GMM模型,并用新模型对语音谱包络进行参数化表示。仿真结果表明,该编码器降低了编码速率,在0.86kb/s时仍然可以获得可接受的解码语音。
彭景惠[2](2020)在《基于熵随机的网络流媒体动态隐密通信研究》文中进行了进一步梳理在信息化成为时代发展趋势的大背景下,互联网已渗透到人们的日常生活中,与个人、企业和政府的需求密切相关。随着Internet的兴起和数字语音编码技术的提高,网络语音电话(Voice over Internet Protocol,简称VoIP)等流媒体技术获得了突破性的进展,在公共网络中广泛应用。随之而来的数据安全问题亟待解决,因此需要设计切实可行的安全协议,探索流媒体数据安全通信方法,以促进网络应用的不断发展。本文从理论和技术出发,系统研究了基于网络流媒体的安全动态隐密通信(Covert communication)技术,涉及信息理论建模、安全性分析、隐写(Steganography)算法设计、编码、隐密通信测试以及性能和鲁棒性测量等。本研究以面向对象的C++编程为基础,开发了一套可扩展的VoIP隐密通信系统,为此项工作提供实验平台。针对网络流媒体数据安全通信的复杂性,本文在信息隐藏和密码学技术的融合方面开展了前瞻性的研究,提出了基于计算机处理器硬件的真随机数和单向密码累积器(One-way cryptographical accumulator)的隐密通信新方法。结合高级加密标准、动态密钥分配和单向密码累积认证,该方法能显着提高隐密通信系统的安全性、有效性和鲁棒性。作为网络通信的安全信道,VoIP隐密通信可以有效保护数据免受网络攻击,甚至来自量子对手的攻击。本文对基于VoIP网络流媒体的隐密通信研究做出了如下几点贡献:(1)针对VoIP流媒体通信过程中的“时变”和“丢包”特征,构建了一个新的流媒体安全隐密通信理论模型,以描述在被动攻击情形下流媒体隐密通信的安全场景,从理论上解决其分组隐藏容量的不确定性和机密信息的不完整性等关键性问题。鉴于使用流媒体隐写术实现VoIP隐密通信,该模型用随机过程对VoIP隐密通信的信息源进行建模,通过假设检验理论(Theory of hypothesis testing)对敌手的检测性能进行分析评估,建立一种高精度的离散预测模型,模拟流媒体隐密通信中有效载荷的时变特征。(2)针对加密密钥的安全问题,详细探讨了流媒体隐写术与隐密通信领域中基于硬件熵源的真随机密钥生成。研究了在流媒体隐密通信中,利用硬件熵源产生的真随机数作为AES-128加密算法的密钥,以保证其保护的数据绝对安全。安全性分析和Mann-Whitney-Wilcoxon测试表明,由真随机数发生器产生的密钥,以CPU的读取时间戳计数器(the Read Time Stamp Counter)为熵源,可有效抵御恶意攻击。提出了一种新颖的数据嵌入间隔选择算法,使用从逻辑混沌图(Logistic Chaotic Map)生成的随机序列随机选择VoIP流中的数据嵌入位置,提高流媒体隐密通信中数据嵌入过程的复杂度和机密性。(3)针对VoIP隐密通信过程中的密钥分配问题及流媒体“丢包”特征,设计了一个高效、用于安全通信认证的单向密码累加器。在此基础上,提出了一个基于动态密钥更新和传输的流媒体隐写算法,该算法将单向密码累加器集成到动态密钥交换中,以提供动态、安全、实时的密钥交换,用于VoIP流媒体隐密通信,解决了其通信过程中机密信息不完整性问题。此动态密钥分配算法可以保护数据通信免受网络攻击,包括威胁到大多已知隐写算法的中间人攻击。依据数学离散对数问题和t-test检验的隐写分析结果,该算法的优势在于其在公共信道上的密钥分配具有高度可靠性。通过安全性分析、隐写分析、非参数统计测试、性能和鲁棒性评估,检验了基于硬件熵源真随机数和动态密钥更新和传输的流媒体隐密通信算法的有效性。以可扩展的VoIP隐密通信系统为实验平台,针对不同的数据嵌入位置、嵌入信息长度和流媒体隐藏容量和速率,进行了一系列VoIP流媒体隐密通信研究。结果表明,该隐密通信算法在语音质量、信号失真和不可感知性等方面对实时VoIP通信几乎没有影响。在VoIP流媒体中使用该隐密通信算法嵌入机密信息后,其语音通信质量指数PESQ的平均值为4.21,接近原始VoIP语音质量,其平均信噪比SNR值为44.87,符合VoIP通信国际标准。与其他相关算法相比,本文提出的隐密通信算法平均隐藏容量高达796比特/秒,与其它隐写算法相当,但在解决VoIP隐密通信相关的安全问题方面更有效。
姜林[3](2017)在《基于非线性映射模型的音频带宽扩展编码研究》文中指出音频带宽扩展是现代音频编解码器的重要组成部分。它利用高低频具有相关性这一物理特性,通过复制低频信号作为高频基础信号,然后在高频参数的调整下获得最终的高频重建信号。现有方法在高低频相关性较强时能够获得较高的编码音质,然而,当高低频相关性较弱时,编码音质急剧下降。针对该问题,传统方法大多采用增加高频参数来提高重建音质,但这会带来编码码率增加的问题。上述复制低频的做法是建立在高低频具有线性或准线性的映射关系上,而实际上,由于音频信号的复杂多变性,高低频间应该是非线性关系。为此,本文通过数据驱动的方法研究高低频相关性与重建音质的关系,并在此基础上研究了高低频相关性在不同场景下的特征,利用相关性特征指导方法设计,提出高频低频的非线性映射模型,并在该模型基础上,提出了多模式带宽扩展框架。本文的研究工作及主要创新点如下:(1)高低频相关性与重建音质的关系研究传统带宽扩展方法利用高低频具有相关性这一物理特性,将低频信号复制到高频,然后利用高频参数进行调整。这一方法仅利用了单通道高低频互相关,当高低频的相关性变弱时,只能通过增加高频参数提高重建质量。本文认为,传统方法对于高低频的相关性利用和认识有限。故猜想,高低频间除了单通道内的互相关,应该还有单通道时域互相关、多通道空域互相关、多通道混合互相关。为揭示高低频间的这类相关性,本文提出了基于互信息的高低频相关性定量计算方法,建立了高低频相关性与重建音质的关系模型。通过数据驱动的方法进行实验统计归纳,得出如下结论:(1)高低频相关性与重建音质呈指数关系,变化趋势为凹型递减,当相关性较低时(MI<0.1),编码质量会急剧下降;(2)高低频间不仅具有同帧内的相关性,还具有上下文相关性,并且上下文相关性在邻近帧内(一般为3帧)表现显着;(3)高低频相关性在频率域模型上比源滤波器模型上表现更加显着。(2)高低频非线性映射模型传统带宽扩展中低频复制到高频的做法,将高低频间的映射关系定义成了线性或准线性的关系。由于音频信号复杂多变,高低频信号间应该属于非线性关系。因此,在生成高频精细结构时,可以利用非线性映射获得比较准确的高频信号。通过对传统非线性映射函数的研究发现,已有非线性映射函数并不足以建模高低频的非线性关系。为此,本文应用最新的深度神经网络模型,使用RNNs模型建模高低频的上下文相关性,使用GANs建模高低频同帧内的互相关性。通过结合RNNs和GANs模型提出了 RNNs-GANs模型,该模型具备较好的建模能力。实验结果表明,通过使用RNNs-GANs模型建立从低频到高频的非线性映射,在源滤波器模型和频率域模型上,主观音质分别提高12.05%和17.60%,客观音质分别提高15.15%和16.68%。(3)基于非线性映射模型的多模式带宽扩展框架根据前述研究,不同信号类型在时域和频域内的相关性具有明显差异,并且不同信号类型采用不同编码方法获得的重建音质也不同。为此,本文提出多模式带宽扩展框架。针对类语音信号,采用源滤波器编码框架;针对类音乐信号,采用频率域编码框架。对于高频精细结构,分别训练了两个RNNs-GANs模型用于从低频到高频的非线性映射。为了解决极低相关性下高频失真的问题,设计了高频感知参数用于恢复高频谐波;通过子带能量样条插值方法恢复高频能量分布;通过时域能量平滑方法消除高频“毛刺”现象。实验结果表明,相比经典SBR方法,客观音质提高了 13.27%,主观音质提高了 5.79%,同时编码码率下降了 54.5%;相比AMR WB+使用的BWE方法,客观音质提高了26.04%,主观音质提高了 20.65%;相比AVSP10使用的BWE方法,客观音质提高了 24.45%,主观音质提高了 17.03%。相比最新标准MPEG USAC和3GPP EVS中使用的方法,主、客观音质相当,但编码码率分别下降了 71.4%和47.4%。因此,本文方法达到了最新方法的编码音质,但码率有明显下降。
高思源[4](2014)在《基于AMR的网络语音处理算法研究与性能的仿真》文中研究指明网络语音是因特网语音发展的代表标志,它也可称为因特网语音(VoIP-Voice over Internet Protocol)技术。VoIP是在IP分组交换网络的基础上,来实现语音通信的传输技术,由于价格便宜和功能种类多,所以得到了广泛地应用。尽管VoIP在成本节省和服务改进方面提供了各种优势,但部分由于质量问题,其推广一直不太顺利。事实上,在传统电话系统和新型的VoIP系统之间存在着若干基本差异,网络的流畅与堵塞必然引起语音信号的延时、抖动、丢包、回声等现象,影响VoIP网络通话质量的主要原因就是丢包现象。在接收端,经过语音解码后的语音实时回放的质量的损失和劣化就是由于语音包的丢失所带来的。论文通过自适应多速率(AMR)语音编码技术在丢包处理上的算法,在VoIP系统中的信源信道,通过自适应的联合编码来实现丢包问题的解决方法。这种算法就是采用动态的网络状况,在信道编码上选取在Reed-Solomon码的前向纠错体制,运用E-Model评价模型对语音质量进行评估,然后自主选择一种能够达到语音质量最好的信源和信道编码速率。本文设计了一种自适应算法,适用于VoIP系统的信源信道速率,采用了AMR语音编码技术和基于RS码的前向纠错信道编码。这种算法通过E-Model评价模型从丢包和延时两点来判断语音的质量,依据当前变化的网络状况自适应地选择出语音质量最优的信源与信道编码方案。对于这种算法,以VisualC++6.0平台进行算法的分析,分别在不同的网络状态下,求解出使得语音质量最优时的信源信道速率以及前向纠错编码方式,如果与假定的结果相符,那么就证明了它的有效性。实验在NS2仿真环境下进行,模拟网络环境的变化,在VoIP系统中,结合信源、信道速率自适应算法,并与VoIP系统中固定速率G.729的编码器、VoIP系统中信源速率自适应AMR的编码器相比较。试验表明,论文设计的这种算法对于丢包和延时两个问题的影响都不同程度的下降,尤其是在网络拥塞的时候它的效果更加明显。
朱雷坚[5](2013)在《基于Android的实时语音通信系统的设计与实现》文中认为在有线网络时代,借助VoIP技术发展起来的IP电话曾经风靡一时。它凭借价格低廉、使用方便、性能稳定等众多优点积累了相当规模的用户,甚至动摇了电信运营商在电话业务上的垄断地位。随着3G网络技术的快速发展和普及,移动互联网正在逐步代替传统的有线网络。相比于有线网络时代的IP电话,移动互联网时代的IP电话有着前所未有的优势,摆脱了“线”的束缚,它成为真正可移动的、可随时随地使用的IP电话。本文详细介绍了语音编解码算法研究现状及发展趋势,探讨了基于Android系统开发的优势,在此基础上对移动互联网时代的IP电话做了需求分析,设计了一个基于Android的实时语音通信系统。根据需求分析,使用Android多媒体框架中的AudioRecord子类和Audio Track子类分别实现语音的采集和播放功能,选择G.711标准和G.729标准分别作为WIFI网络和3G网络下的语音编解码标准,采用RTP协议作为实时语音数据传输协议,利用SIP协议的信令控制功能模拟传统电话系统中的呼叫、应答和挂断动作。在实际开发过程中,选用G.711、G.729编解码库、Jlibrtp库和PJSIP库来完成语音编解码、RTP数据包收发和信令控制功能。同时,通过两种方法对G.729算法的实现方法进行优化,降低编解码过程的CPU占用率。第一种利用NDK移植G.729算法C语言库代替Java语言库,提高算法执行的效率;第二种利用增加G.729算法的搜索步长,降低算法复杂度和运算量。经过实际测试,该系统在功能、费用、性能方面都很好的能满足实时语音通信的需求。
张崇武[6](2012)在《基于单片机的语音编码系统实现》文中认为近年来,伴随着数字信号处理技术的快速发展,语音编解码技术也在不断的进步。语音信息通过编码进行压缩,降低信息流在信道传输中所占带宽和在存储器中占用的空间。压缩比、算法复杂度、信噪比等是衡量一种算法的最基本指标。各种编码算法的研究和深入,使得现代通信领域的语音质量达到了一个前所未有的水平。自适应差分脉冲编码调制算法(ADPCM)采用了先进的自适应量化和自适应预测技术,在脉冲编码调制(PCM)的基础上进一步压缩,是波形编码方式中性能最优的一种算法。ADPCM算法的复杂度不是很高,易于硬件实现。目前的语音系统大多是采用专用编码芯片或者是在DSP平台实现,其性能好,系统成本也高,在一些低端的语音通信领域不是一种经济可选的方案。单片机是一种廉价、高效、可靠的微型控制器件,在目前的电子领域有着广泛的应用。本论文尝试在PIC16C72单片机上实现上述高性能的ADPCM语音编码系统,以满足实际工程中低能耗、低成本、低带宽、高质量的低速语音通信的需要。本论文首先从语音编解码的现状考虑,阐述了课题的研究背景,分析了此课题研究的目的和意义。其次详尽的叙述了语音编码从发源至今漫长的发展历史,概括性的介绍了目前常用的几种编码方式的原理和各自的特点,同时介绍了编码速率、主客观评价体系和编码延迟等一系列语音编码质量评价方法,探讨未来语音编码发展的方向。然后详细的阐述了ADPCM的编码原理,由一般的抽样量化一步步改进到自适应预测自适应量化的ADPCM。最后通过对系统架构各模块仿真分析验证,程序软件设计,搭建了以单片机PIC16C72为核心的ADPCM语音编解码系统,最后对该语音系统进行性能测试,经测试,该语音系统误差较小,具有很好的效果。本文在系统搭建过程中所采用的低通滤波器是根据仿真结果折中考虑选择的一种,实际中肯定会有更好的滤波器可应用在语音系统中,因此基于单片机的语音编解码系统还有待进一步的研究,相信性能会越来越好。
杨丹[7](2012)在《一种简化的MELP算法与其可行性评估》文中认为近年来,随着宽带通信技术的飞速发展,语音通信在有线通信领域占用的带宽几乎已不成问题了。但是在移动通信、卫星通信等无线通讯领域中,仍需要降低语音编码速率以节省带宽,加快传输速率。语音编码技术是数字语音通信中的一项重要技术,它可使同样的信道容量传输更多的语音信号并节省存储空间。语音编码技术随着通信技术的发展也取得了很大的发展,广泛应用于短波、超短波、地面微波和卫星通信系统中。语音编码具有不可替代的作用,而且近年来各种语音数字存储、语音应答等应用对能够合成高质量语音的语音压缩编码算法提出了迫切的要求。语音编码总体上有3个的发展方向:低速率语音编码、变速率语音编码和不压缩语音编码。随着数字通信业务的发展,高质量的低速率语音编码技术将成为研究的热点,它必将在保密通信、语音邮件、网络通信、IP电话等领域有广泛的应用前景。MELP声码器是目前低速率语音编码中一种比较理想的编码方案,该算法是对传统线性预测编码参数模型的改进,它结合了混合激励和多带的思想,更好的模拟了自然语言特征,可以在2.4kbps的速率下合成出较高质量的语音。本论文深入研究了传统MELP(Mixed-exitation Linear Prediction,混合激励线性预测)语音编解码原理,对其编解码算法作了一些优化改进,对算法本身进行了优化,在基音周期提取算法上用整数基因周期代替分数基因周期,对语音帧的清浊判决的算法做了简化,优化改进后的算法的复杂度大大降低,改进算法得到的的合成语音质量大体上接近于传统算法。
李洪艳[8](2011)在《基于VoIP和异构计算的SPEEX研究与实现》文中提出随着移动通信技术和语音技术的快速发展,VoIP逐渐成为数据语音通讯中最有竞争力的技术之一,与此同时我们也对语音编解码技术提出了更高要求,即需要根据网络状况等影响因素的变化动态地改变编码速率,以提供不同质量的语音,使得语音通话质量达到最优。SPEEX语音编解码器的诸多优点(开源/免费,多种可用比特、可选复杂度等),正符合我们对语音编码器提出的各种要求,对其算法原理与应用实现进行研究具有非常重要的现实意义。本论文以SPEEX算法的开源代码为基础,针对计算量大的模块进行了GPGPU优化;并在VoIP终端设备上实现了SPEEX编解码器,达到了实时语音通话的效果。具体地讲,本文主要的工作有以下几个方面:(1)本文对码激励线性预测CELP的算法原理及其关键技术进行了分析,并在此基础上全面分析了SPEEX的算法特点及编码模式。(2)分析了OpenCL架构和OpenCL通用计算的流程,包括其运行的平台、执行模式、内存模型和编码模式;针对Speex算法中各个过程计算量的分布特点,对代码中耗时比较多的模块使用OpenCL通用编程方案进行了基于GPGPU的优化实现,包括基音搜索、码本搜索和回音消除的FFT部分;并给出了相对应的实验数据。(3)介绍了VoIP进行语音通信技术的基本过程和关键技术;详细分析了VoIP系统构成,服务器和客户端的功能,及VoIP对等实体间进行交互的方式;并对语音呼叫过程中的SIP信令控制流程进行了分析。实现了一个VoIP客户端系统软件,达到了实时语音通信要求,并详细介绍了语音编解码器的具体实现。
张聪[9](2010)在《面向3G通信的移动音频关键技术研究》文中进行了进一步梳理随着3G网络在国内正式运行以及各种新的多媒体移动接入技术的相继涌现,为移动多媒体应用带来了广阔的空间和新的机遇。但是,由于移动通信环境的复杂性、无线传输频带资源的有限性以及传输信道的多变性,使得传统音频编解码技术遇到了新的困难,因此,面向3G网络的移动音频编解码技术就成为了移动多媒体应用领域一个新的重点研究方向。为了适应移动环境苛刻的应用需求,本文在国家自然科学基金重点项目“移动音频编解码基础理论与关键技术”的资助下,力争在提高编码效率、降低运算量两方面克服理论缺陷,突破技术瓶颈,深入研究了移动音频编解码中的一些核心关键技术,包括:移动环境下的人类听觉感知特性和心理声学模型、带宽扩展以及错误隐藏等。在此基础上,形成了本论文的主要研究成果,具体如下:1.移动音频混合编码的心理声学模型在移动多媒体应用中,音频信号的内容比较复杂。为了解决复杂音频信号编码的关键性问题,本文在EAAC+编码系统的心理声学模型部分,将PEAQ编码标准中心理声学模型有关人耳耳廓加权的方法移植到EAAC+编码标准中,使掩蔽阈值的计算更加符合人耳的生理特性,从而有效提高掩蔽阈值计算的精确度。这样既可以保持处理音频信号编码方面的优势,又可以提高对语音信号编码的能力。改进的算法不存在编码模式选择的问题,运算复杂度相对较低。而且,通过改进算法编解码后的音频信号与原始信号的时域波形比较接近,波形的包络形状和能量与原始信号也比较逼近,具有相当的质量。2.移动音频的带宽扩展技术本论文在EAAC+编码算法的基础上,针对输入的原始音频信号所存在的正弦分量,提出了一种检测并去除正弦分量的带宽扩展算法。首先将输入的原始音频信号分成低频和高频两部分,对于低频部分,仍然按照SBR算法执行。对于高频部分,按照BBSM算法,将整个高频频带再分为高频区的低频子带和高频子带,减少后续传输的码率。通过检测并去除正弦分量,可以实现降低算法的编码复杂度。根据主观与客观评测结果表明,论文提出的带宽扩展算法,进行高频扩展后的重建音频信号的高频频谱保持了原信号的基本频谱特征,高频频谱与低频频谱连贯性好。3.移动音频的差错隐藏技术差错隐藏技术作为解决传输过程中音频信号出现数据丢包现象的有效手段,一直是音频编解码算法研究的重要环节。为了保证在移动环境下使人类听觉系统感知不到数据丢包所带来的音频质量下降,研究一种基于3G通信的差错隐藏方案。通过在编码端检测音乐信号的短暂态信号,并将相关信息作为附加数据嵌入到压缩音频码流的数据单元中,然后在解码时将嵌入的附加信息解码去执行错误隐藏,以达到重建音频信号的音质。本文从理论、方法上针对面向3G通信的移动音频编解码关键技术开展了研究,其研究方法和研究成果为面向3G通信的移动音频技术的推广应用奠定了基础。
尹光明[10](2010)在《G.726语音编码的优化研究与IP核设计》文中研究表明PCM即脉冲编码调制技术是应用最早和最广泛的语音编码技术。目前,采用非线性量化编码64Kbit/s的A律和μ律PCM被广泛地应用于各种通信系统。1988年ITU提出了G.726ADPCMi(自适应差分PCM)语音编码标准,规定了16Kbit/s、24Kbit/s、32Kbit/s、40Kbit/s编码速率标准。G.726标准的特点是算法简单,语音还原质量较高,在多次转换后语音质量有保证,广泛应用于数字电路倍增设备(DCME)中。本文首先对ITU-T G.726标准进行了分析和研究,并对各个部分的数学模型进行了详尽的解析。在此基础上在PC平台上VC编程实现了该标准的编解码器。整个程序分为编码器和解码器,解码器为G.726的标准解码器,而编码器整体分为自适应量化模块和自适应预测模块。在自适应量化模块中,分别实现了输入PCM格式转换,差分信号计算,量化定标因子自适应,自适应速度控制,单音信号和转移检测,以及自适应量化6个子算法。在自适应预测模块中,实现了反向自适应量化,以及自适应预测和重建信号子算法。然后对该程序进行了32kb/s,16kb/s码率下的语音测试。测试表明,在32kb/s码率下较好地还原了源音频,而在16kb/s码率下具有语音失真、还原噪声大等问题。为了解决16kb/s码率下的上述问题,本文首先进行了波形比对分析,发现该码率下输出语音包络与源音频相比存在很多突变。这是因为在编码器一端用自适应预测技术把语音信号的相关性去除以后,在解码器一端重构源信号时没能准确地恢复语音信号的相关性所造成的。即语音信号的线性相关性减弱造成了语音失真和还原噪声。因此,本文从解码器端对输出语音进行了语音重构。采用后向算术递归平均的方法增强了语音信号线性相关,并进行了测试实验。测试实验表明,该方法较好地解决了16kb/s码率下的上述问题,并通过实验证明在平均数N=3时效果是最优的,信噪比提高了3.54dB。随着EDA技术的发展采用可编程逻辑器件FPGA来实现语音信号的实时处理优势越来越明显,FPGA的高速性能和可重构性弥补了DSP和专用ASIC芯片的不足。而IP复用技术将显着降低FPGA的开发成本和开发周期,成为FPGA应用发展的核心领域。本文对G.726标准研究的基础上,对该标准的核心环节自适应预测模块进行了软IP核的开发。该IP核基于QUATUS II平台上用VHDL语言来开发,并综合、仿真、优化、下载验证,使其在运行速率、可移植性、资源使用等指标上达到最优。
二、A SPEAKER ADAPTABLE VERY LOW BIT RATE SPEECH CODER BASED ON HMM(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、A SPEAKER ADAPTABLE VERY LOW BIT RATE SPEECH CODER BASED ON HMM(论文提纲范文)
(1)基于GMM语音谱包络表示的编码算法研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 语音压缩编码的研究背景和意义 |
1.2 低速率语音编码 |
1.2.1 语音编码分类 |
1.2.2 低速率语音编码技术的理论依据 |
1.3 低速率语音编码 |
1.3.1 低速率语音编码器 |
1.3.2 低速率语音编码技术的发展与现状研究 |
1.4 语音编码器性能评价 |
1.5 本文研究内容及章节安排 |
第2章 基于ERB尺度划分的方差语音端点检测算法 |
2.1 引言 |
2.2 常用的语音端点检测算法 |
2.2.1 基于自/互相关的端点检测 |
2.2.2 基于谱熵的端点检测 |
2.2.3 基于方差的端点检测 |
2.3 基于方差的语音端点检测改进算法 |
2.3.1 ERB尺度频带划分 |
2.3.2 基于ERB子带划分的方差语音端点检测改进算法 |
2.4 实验与结果分析 |
2.4.1 实验平台 |
2.4.2 语音端点检测算法评判准则 |
2.4.3 实验结果及分析 |
2.5 本章小结 |
第3章 多项式拟合GMM参数的语音编码改进算法 |
3.1 引言 |
3.2 基于高斯混合模型的编码器 |
3.2.1 高斯混合模型基本理论 |
3.2.2 基于高斯混合模型的编码器 |
3.3 基于GMM和多项式拟合的语音编码改进算法 |
3.3.1 多项式拟合 |
3.3.2 改进算法 |
3.3.3 基于pGMM的编码器 |
3.4 实验及结果分析 |
3.4.1 实验平台 |
3.4.2 编码器性能评价 |
3.5 本章小结 |
第4章 基于改进GMM模型的甚低速率语音编码 |
4.1 引言 |
4.2 基于改进GMM模型的语音编码 |
4.2.1 改进算法 |
4.2.2 基于iGMM的编码器 |
4.3 实验及结果分析 |
4.3.1 实验平台 |
4.3.2 算法参数对语音质量的影响 |
4.3.3 编码器性能评价 |
4.4 本章小结 |
第5章 总结与展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
在读期间发表的学术论文及研究成果 |
致谢 |
(2)基于熵随机的网络流媒体动态隐密通信研究(论文提纲范文)
作者简历 |
摘要 |
abstract |
第一章 绪言 |
1.1 研究背景和意义 |
1.2 信息隐藏技术概述 |
1.2.1 信息隐藏定义及应用 |
1.2.2 信息隐藏技术的分类与研究现状 |
1.3 VoIP流媒体隐密通信研究现状 |
1.3.1 隐藏算法研究 |
1.3.2 随机密钥生成研究 |
1.3.3 隐密通信密钥分配研究 |
1.4 存在问题与难点 |
1.4.1 理论模型问题 |
1.4.2 随机密钥生成问题 |
1.4.3 容量不确定性问题 |
1.4.4 机密信息不完整性问题 |
1.5 本文组织结构 |
1.5.1 本文研究内容及创新点 |
1.5.2 本文组织结构 |
第二章 VoIP流媒体数据通信技术与安全 |
2.1 VoIP基本原理及主要特点 |
2.2 VoIP系统组成 |
2.2.1 终端用户设备 |
2.2.2 网络组件 |
2.2.3 呼叫处理器 |
2.2.4 网关 |
2.2.5 协议 |
2.3 VoIP通信原理及关键技术 |
2.3.1 VoIP通信原理 |
2.3.2 尽力而为服务的局限性 |
2.3.3 VoIP关键技术 |
2.4 VoIP安全性分析 |
2.4.1 VoIP组件的安全性分析 |
2.4.2 VoIP通信的安全问题 |
2.5 本章小结 |
第三章 隐写术与VoIP隐密通信 |
3.1 隐写术系统构成 |
3.1.1 原始载体 |
3.1.2 秘密信息 |
3.1.3 嵌入过程 |
3.1.4 含隐载体 |
3.1.5 隐写密钥 |
3.1.6 提取过程 |
3.2 隐写术的分类 |
3.2.1 根据载体类型分类 |
3.2.2 根据嵌入域分类 |
3.2.3 基于提取/检测条件分类 |
3.2.4 其他分类 |
3.3 基于隐写术的VoIP隐密通信 |
3.4 VoIP隐密通信系统性能评估 |
3.4.1 不可检测性 |
3.4.2 不可感知性 |
3.4.3 安全性 |
3.4.4 隐写容量 |
3.4.5 鲁棒性 |
3.5 VoIP隐密通信面临的攻击 |
3.6 本章小结 |
第四章 VoIP隐密通信理论建模及安全分析 |
4.1 VoIP隐密通信的信息理论模型 |
4.1.1 Cachin隐写信息理论模型及其安全性定义 |
4.1.2 VoIP隐密通信理论建模及安全性证明 |
4.2 VoIP隐密通信算法设计 |
4.2.1 加密算法 |
4.2.2 数据嵌入算法 |
4.2.3 数据提取算法 |
4.3 VoIP隐密通信系统构建 |
4.3.1 VoIP通信模块 |
4.3.2 密钥生成及分配模块 |
4.3.3 数据嵌入及提取模块 |
4.4 VoIP隐密通信实验平台搭建 |
4.4.1 性能测试 |
4.4.2 评估指标 |
4.5 本章小结 |
第五章 基于熵随机和混沌映射随机的VoIP隐密通信 |
5.1 基于硬件熵源和混沌映射的实时VoIP隐密通信设计 |
5.1.1 VoIP通信 |
5.1.2 基于硬件熵源的真随机密钥生成 |
5.1.3 基于混沌映射的VoIP隐密通信嵌入位置选择 |
5.1.4 秘密信息的嵌入与提取 |
5.2 实验设置 |
5.2.1 实验测量性能指标 |
5.2.2 实验平台搭建 |
5.2.3 信号质量测量 |
5.2.4 语音质量测量 |
5.3 实验结果与分析 |
5.3.1 实验测量结果 |
5.3.2 不可检测性分析 |
5.3.3 算法性能比较 |
5.3.4 安全性分析 |
5.4 本章小结 |
第六章 基于单向累积密钥分配的动态VoIP隐密通信 |
6.1 基于动态密钥分配的VoIP隐密通信系统 |
6.1.1 VoIP隐密通信的密钥分配问题 |
6.1.2 基于动态密钥分配的VoIP隐密通信模型 |
6.2 基于单向累积密钥分配的动态VoIP隐密通信设计 |
6.2.1 基于单向累积的密钥分配 |
6.2.2 秘密信息的嵌入 |
6.2.3 秘密信息的提取 |
6.3 安全性分析 |
6.3.1 通信方认证 |
6.3.2 中间人攻击 |
6.3.3 敌手攻击 |
6.4 实验结果与分析 |
6.4.1 不可感知性及鲁棒性分析 |
6.4.2 嵌入间隔影响分析 |
6.4.3 隐藏信息大小影响分析 |
6.4.4 统计不可检测性分析 |
6.4.5 算法性能比较 |
6.5 本章小结 |
第七章 总结与展望 |
7.1 研究成果与创新 |
7.2 研究局限性 |
7.3 未来研究展望 |
致谢 |
参考文献 |
(3)基于非线性映射模型的音频带宽扩展编码研究(论文提纲范文)
论文创新点 |
摘要 |
ABSTRACT |
1 绪论 |
1.1 研究背景及意义 |
1.2 带宽扩展简介 |
1.3 国内外研究现状 |
1.3.1 源滤波器模型带宽扩展 |
1.3.2 频率域模型带宽扩展 |
1.3.3 深度神经网络音频建模 |
1.4 存在的问题及分析 |
1.5 本文研究内容及组织结构 |
2 高低频相关性与重建音质的关系研究 |
2.1 引言 |
2.2 高频重建感知质量的影响因素 |
2.2.1 音高(Pitch) |
2.2.2 音色(Timbre) |
2.2.3 响度(Loudness) |
2.2.4 结论 |
2.3 高低频相关性的类型 |
2.4 相关性与重建音质的关系模型 |
2.4.1 高低频相关性定量计算方法 |
2.4.2 高频重建的性能评价方法 |
2.4.3 高低频相关性与重建音质的关系模型 |
2.5 实验评估 |
2.5.1 实验设置 |
2.5.2 高低频相关性与重建音质的关系拟合 |
2.5.3 单通道高低频互相关特性 |
2.5.4 单通道时域互相关特性 |
2.5.5 多通道空域(混合)互相关特性 |
2.5.6 信号表示对相关性的影响 |
2.6 本章小结 |
3 高低频非线性映射模型 |
3.1 传统带宽扩展框架 |
3.1.1 源滤波器模型框架 |
3.1.2 频率域模型框架 |
3.2 带宽扩展中常见非线性映射方法 |
3.2.1 常见非线性映射函数 |
3.2.2 频谱平移/调制方法 |
3.3 基于深度神经网络的非线性映射模型 |
3.3.1 本文非线性映射基本模型 |
3.3.2 RNNs模型非线性映射 |
3.3.3 GANs模型非线性映射 |
3.3.4 RNNs-GANs模型 |
3.4 实验评估 |
3.4.1 实验设置 |
3.4.2 模型训练 |
3.4.3 主观测试 |
3.4.4 客观测试 |
3.4.5 分析与讨论 |
3.5 本章小结 |
4 基于非线性映射模型的多模式带宽扩展框架 |
4.1 引言 |
4.2 多模式带宽扩展框架 |
4.2.1 基本框架 |
4.2.2 编码器 |
4.2.3 解码器 |
4.3 非线性映射 |
4.4 高频感知补偿 |
4.4.1 子带能量样条插值 |
4.4.2 高频感知恢复 |
4.4.3 时域能量平滑 |
4.5 实验评估 |
4.5.1 实验设置 |
4.5.2 主观测试 |
4.5.3 客观测试 |
4.5.4 时间复杂度测试 |
4.5.5 整体性能 |
4.6 本章小结 |
5 总结与展望 |
5.1 论文贡献和创新 |
5.2 未来工作展望 |
参考文献 |
攻读博士学位期间的科研成果 |
致谢 |
(4)基于AMR的网络语音处理算法研究与性能的仿真(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 课题的研究背景 |
1.2 国内外的研究现状 |
1.3 论文的组织结构 |
第2章 VOIP的原理及主要技术 |
2.1 VoIP技术概论 |
2.1.1 VoIP产生及发展过程 |
2.1.2 VoIP的技术现况 |
2.1.3 VoIP语音的基本传输过程 |
2.2 IP电话的语音通话质量 |
2.2.1 VoIP话音质量的影响因素 |
2.2.2 丢包技术的处理 |
2.2.3 基于拥塞控制的抗丢包技术 |
2.3 章末小结 |
第3章 适于VOIP的语音编码方法的研究 |
3.1 语音编码概述 |
3.1.1 语音编码的原理 |
3.1.2 语音编码的分类 |
3.1.3 语音编码性能的评价标准 |
3.2 变速率语音编码 |
3.2.1 变速率语音编码协议简介 |
3.2.2 变速率语音编码的分类 |
3.2.3 变速率语音编码的发展现况和发展方向 |
3.3 自适应多速率语音编码 |
3.3.1 AMR的应用原理 |
3.3.2 AMR解编码器的主要功能 |
3.4 章末小结 |
第4章 自适应多速率语音编码算法研究与设计 |
4.1 抗丢包编码算法 |
4.2 里德—所罗门码(RS码) |
4.2.1 RS码的编码 |
4.2.2 RS码的译码 |
4.3 E-MODEL评价模型 |
4.4 基于RS码的AMR算法的设计 |
4.4.1 对延迟、丢包的估计 |
4.4.2 AMR编码算法的描述 |
4.4.3 AMR编码算法的处理流程设计 |
4.5 章末小结 |
第5章 基于NS2的网络仿真与性能分析 |
5.1 仿真的简介 |
5.1.1 NS2简介 |
5.1.2 PESQ评价方法 |
5.2 仿真实验设计和性能评价 |
5.2.1 仿真环境及其参数 |
5.2.2 仿真结果及分析 |
5.3 章末小结 |
第6章 总结与展望 |
参考文献 |
致谢 |
(5)基于Android的实时语音通信系统的设计与实现(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 课题研究的背景和意义 |
1.2 国内外研究现状及趋势 |
1.2.1 语音编码简介 |
1.2.2 语音编码现状及趋势 |
1.2.3 移动操作系统简介 |
1.2.4 Android语音开发现状及趋势 |
1.3 本文研究内容组织结构 |
第2章 实时语音通信相关技术 |
2.1 语音编码技术 |
2.1.1 G.711语音编码标准 |
2.1.2 G.729语音编码标准 |
2.2 多媒体通信技术 |
2.2.1 实时传输协议 |
2.2.2 会话初始化协议 |
2.3 Android开发平台 |
2.4 本章小结 |
第3章 Android实时语音通信系统的整体方案设计 |
3.1 需求分析 |
3.2 整体方案介绍 |
3.3 移动终端 |
3.3.1 硬件环境 |
3.3.2 软件环境 |
3.4 信令通信模块的设计 |
3.4.1 SIP会话组成 |
3.4.2 SIP消息 |
3.5 语音压缩算法选择 |
3.6 数据传输协议选择 |
3.6.1 TCP协议和UDP协议 |
3.6.2 RTP/RTCP协议 |
3.7 本章小结 |
第4章 Android实时语音通信系统语音模块的实现 |
4.1 采集与播放模块 |
4.1.1 Android音频系统综述 |
4.1.2 Audio系统的各个层次 |
4.1.3 media库中的Audio框架部分 |
4.1.4 采集与播放 |
4.2 编码与解码模块 |
4.2.1 G.711编解码 |
4.2.2 G.729编解码 |
4.3 发送与接收模块 |
4.3.1 Jlibrtp库简介 |
4.3.2 基于Jlibrtp的RTP发送与接收实现 |
4.4 本章小结 |
第5章 G.729算法在Android平台上实现的优化 |
5.1 G.729实现库优化 |
5.2 G.729搜索步长优化 |
5.2.1 多级搜索优化原理 |
5.2.2 多级搜索优化实现 |
5.2.3 固定码书搜索优化原理 |
5.2.4 固定码书搜索优化实现 |
5.3 本章小结 |
第6章 测试、总结与展望 |
6.1 测试 |
6.1.1 延时和丢包率测试 |
6.1.2 CPU占用率测试 |
6.2 总结 |
6.3 展望 |
参考文献 |
致谢 |
攻读学位期间参加的科研项目和成果 |
(6)基于单片机的语音编码系统实现(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 课题研究背景 |
1.2 研究目的和意义 |
1.3 本文的主要内容和主要工作 |
第二章 语音编码概述 |
2.1 语音编解码发展历程 |
2.2 波形编码分类 |
2.3 语音编码质量评价体系 |
2.3.1 常用的语音质量评价方法 |
2.3.2 编码速率 |
2.3.3 编解码延时 |
2.3.4 算法复杂度 |
2.4 语音编码的研究方向 |
2.4.1 多话音源 |
2.4.2 优良的质量评价体系 |
2.4.3 更低的比特率 |
2.4.4 可分层编码器 |
第三章 ADPCM编码原理 |
3.1 语音波形数字化 |
3.1.1 模拟信号抽样 |
3.1.2 抽样后量化 |
3.2 语音信号量化的方法 |
3.2.1 均匀量化 |
3.2.2 非均匀量化 |
3.2.3 自适应量化 |
3.3 线性预测器 |
3.4 差分脉冲编码调制 |
3.4.1 带固定预测的自适应量化方式 |
3.4.2 自适应差分脉冲编码调制方式 |
第四章 语音系统设计方案及性能分析 |
4.1 系统硬件设计方案 |
4.1.1 方案总体架构 |
4.1.2 单片机选型依据 |
4.1.3 单片机相关参数的确定 |
4.1.4 语音采集及放大模块分析 |
4.1.5 低通滤波器电路分析 |
4.1.6 抗混叠滤波电路的研究与分析 |
4.2 程序软件设计 |
4.2.1 编码器设计 |
4.2.2 解码器设计 |
4.3 系统资源利用情况分析 |
第五章 语音系统硬件实现及测试 |
5.1 语音系统硬件实现 |
5.1.1 语音采集模块及前置放大与低通滤波器设计 |
5.1.2 后置低通滤波及放大电路设计 |
5.1.3 系统实现 |
5.2 系统性能测试 |
总结 |
参考文献 |
致谢 |
学位论文评阅及答辩情况表 |
(7)一种简化的MELP算法与其可行性评估(论文提纲范文)
中文摘要 |
Abstract |
第一章 绪论 |
1.1 国内外研究现状 |
1.2 本课题研究的意义 |
1.3 论文主要内容和研究特色 |
1.3.1 论文研究的主要内容 |
1.3.2 论文的研究特色 |
第二章 语音信号基础 |
2.1 语音的形成 |
2.2 语音信号数字化 |
2.3 语音编码的必要性 |
2.4 语音产生的数字模型 |
2.5 线性预测分析 |
2.5.1 线性预测分析的基本原理 |
2.5.2 线性预测分析的解法 |
第三章 MELP 声码器编码原理 |
3.1 算法概述 |
3.2 声码器编码原理 |
3.2.1 预处理 |
3.2.2 基音周期的计算与量化 |
3.2.3 增益的计算与量化 |
3.3 自适应增强 |
3.4 线性预测合成 |
3.5 增益的校正 |
3.6 傅氏级数幅度值的计算 |
3.7 编码参数的比特分配与发送 |
第四章 MELP 声码器解码原理 |
4.1 基音周期译码与纠错译码 |
4.2 噪声抑制 |
4.3 参数插值 |
4.4 混合激励生成与滤波 |
4.5 自适应谱增强 |
4.6 线性预测合成 |
4.7 增益的校正 |
4.8 脉冲整形滤波 |
4.9 合成环路控制 |
第五章 对 MELP 声码器的优化改进及仿真 |
5.1 对算法优化 |
5.2 对基音周期提取算法的优化 |
5.3 对语音帧清浊判决算法的改进 |
5.4 对解码器的改进 |
5.5 MELP 声码器的软件仿真及实验结果分析 |
5.5.1 语音波形比较 |
5.5.2 语谱图比较 |
第六章 语音编码器的质量评价 |
6.1 语音质量的定义 |
6.1.1 对发音者和语言的依赖 |
6.1.2 对信号功率级的依赖 |
6.1.3 背景噪声 |
6.1.4 多种编码的级联 |
6.1.5 信道误差所产生的影响 |
6.1.6 非语音信号 |
6.2 语音质量的客观评估 |
6.2.1 SNR 评估 |
6.2.2 MBSD 评估 |
6.2.3 压缩率 |
6.2.4 算法复杂度 |
6.2.5 算法稳定性和延迟 |
6.3 语音质量的主观评估 |
6.3.1 绝对等级的评定实验 ACR |
6.3.2 降低等级的评定实验 DCR |
6.3.3 诊断测量实验(DAM) |
6.3.4 合成语音的可懂度 |
6.3.5 对谈话者的辨认能力 |
6.3.6 通话实验 |
6.3.7 语音质量的总体评估 |
6.4 检测语音质量的数据库和另外的实验信号 |
6.5 确认语音编码器实现的方法 |
6.6 实验结论 |
第七章 总结和展望 |
7.1 论文工作总结 |
7.2 今后工作展望 |
参考文献 |
致谢 |
个人简历 |
(8)基于VoIP和异构计算的SPEEX研究与实现(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 课题研究的背景及意义 |
1.2 VoIP 发展现状和关键技术 |
1.2.1 VoIP 发展与现状 |
1.2.2 VoIP 关键技术介绍 |
1.2.3 语音编解码技术 |
1.3 GPU 应用于编解码的优势 |
1.3.1 GPU 与语音编解码 |
1.4 本文研究的主要内容 |
1.5 本文组织 |
第二章 基于CELP 的SPEEX 算法原理分析 |
2.1 SPEEX 编解码器简介 |
2.1.1 SPEEX 语音编解码算法相关概念 |
2.2 预处理 |
2.3 CELP 算法基本原理 |
2.3.1 语音信号生成模型 |
2.3.2 线性预测(LPC)基本原理 |
2.3.3 基音预测 |
2.3.4 自适应码本 |
2.3.5 噪音加重 |
2.3.6 合成分析 |
2.4 SPEEX 编码模式分析 |
2.4.1 SPEEX 窄带模式 |
2.4.2 SPEEX 宽带模式 |
2.5 SPEEX 语音编解码速率控制方式 |
2.5.1 SPEEX 速率调控方式 |
2.6 本章小结 |
第三章 基于异构计算的语音编解码优化 |
3.1 GPU 通用计算 |
3.1.1 可编程图形管线 |
3.1.2 GPU 向通用编程的发展 |
3.1.3 现代GPU 与CPU 的发展状况 |
3.1.4 移动GPGPU 编程 |
3.2 OPENCL 架构 |
3.2.1 平台模型 |
3.2.2 执行模型 |
3.2.3 内存模型 |
3.2.4 编程模型 |
3.2.5 OPENCL 通用计算 |
3.3 基于GPGPU 的SPEEX 编解码模块优化 |
3.3.1 OpenCL 性能优化的基本策略 |
3.3.2 基音搜索过程优化 |
3.3.3 码本搜索模块优化 |
3.3.4 回音消除中FFT 算法的优化 |
3.4 实验数据与分析 |
3.4.1 基音搜索的互相关计算 |
3.4.2 码本搜索模块 |
3.4.3 FFT 实验数据 |
3.5 本章小结 |
第四章 语音编解码在VOIP 系统中的实现 |
4.1 VoIP 语音通信系统的构成 |
4.1.1 系统结构 |
4.1.2 服务器端 |
4.1.3 客户端设计 |
4.1.4 工作过程 |
4.2 语音编解码器的实现 |
4.2.1 软件架构设计 |
4.2.2 语音编解码工作流程 |
4.2.3 语音通信协议 |
4.3 界面设计与运行实例 |
4.4 本章小结 |
第五章 总结与展望 |
5.1 本文的主要工作 |
5.2 有待继续研究的问题 |
致谢 |
参考文献 |
作者简介 |
(9)面向3G通信的移动音频关键技术研究(论文提纲范文)
摘要 |
ABSTRACT |
目录 |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 数字音频编码技术的发展现状 |
1.2.1 数字音频压缩编码 |
1.2.2 数字音频编码标准 |
1.3 移动音频编解码相关技术的研究现状 |
1.3.1 音频混合编码 |
1.3.2 音频带宽扩展 |
1.3.3 音频差错隐藏 |
1.4 论文的主要内容和结构安排 |
1.4.1 主要内容 |
1.4.2 论文结构 |
第二章 移动音频编码的理论基础和关键技术 |
2.1 音频编码的理论基础 |
2.1.1 听阈与听域 |
2.1.2 响度与响度级 |
2.1.3 听觉掩蔽与临界频带 |
2.1.4 声道间的相关性及冗余消除 |
2.2 音频压缩编码及其框架 |
2.2.1 子带编码 |
2.2.2 自适应变换编码 |
2.2.3 感知音频编码 |
2.3 空间音频编码 |
2.4 移动音频混合编码 |
2.4.1 音频混合编码 |
2.4.2 移动音频编码的关键技术 |
2.4.3 移动音频混合编码框架 |
2.5 小结 |
第三章 移动音频混合编码的心理声学模型研究 |
3.1 心理声学模型及其主要参数 |
3.1.1 人类听觉系统 |
3.1.2 绝对听觉阈值 |
3.1.3 感知熵 |
3.1.4 掩蔽叠加 |
3.2 几种感知心理声学模型 |
3.2.1 约翰逊模型 |
3.2.2 MPEG心理声学模型Ⅰ |
3.2.3 MPEG心理声学模型Ⅱ |
3.2.4 PEAQ心理声学模型 |
3.3 EAAC+心理声学模型 |
3.3.1 块转换 |
3.3.2 掩蔽阈值的计算 |
3.3.3 能量扩展计算 |
3.3.4 分组 |
3.4 改进的心理声学模型及性能评价 |
3.4.1 常见心理声学模型的优劣 |
3.4.2 改进方案 |
3.4.3 方案性能评价 |
3.5 小结 |
第四章 移动音频的带宽扩展研究 |
4.1 带宽扩展 |
4.1.1 带宽扩展的定义 |
4.1.2 带宽扩展框架 |
4.2 语音带宽扩展 |
4.2.1 窄带语音带宽扩展算法 |
4.2.2 AMR-WB+带宽扩展算法 |
4.3 音频带宽扩展 |
4.3.1 非盲目式与盲目式带宽扩展 |
4.3.3 EAAC+频谱带宽复制技术 |
4.4 改进算法及性能评价 |
4.4.1 常见带宽扩展算法的差异 |
4.4.2 改进方案 |
4.4.3 性能评价 |
4.5 小结 |
第五章 移动音频的差错隐藏 |
5.1 差错隐藏 |
5.2 音频差错隐藏技术 |
5.2.1 基于发送端的差错隐藏 |
5.2.2 基于接收端的差错隐藏 |
5.2.3 AMR-WB与AMR-WB+差错隐藏 |
5.3 改进算法及性能评价 |
5.3.1 常见差错隐藏算法的优劣 |
5.3.2 改进方案 |
5.3.3 方案性能评价 |
5.4 小结 |
第六章 总结与展望 |
6.1 工作总结 |
6.2 下一步工作展望 |
参考文献 |
附录:攻读博士学位期间科研成果 |
致谢 |
(10)G.726语音编码的优化研究与IP核设计(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 语音编码概述 |
1.2 语音编码器的分类 |
1.2.1 波形近似的语音编码器 |
1.2.2 参量编码器 |
1.3 课题的提出 |
1.4 研究的内容和论文组织结构 |
第2章 G.726语音编码标准的分析 |
2.1 输入PCM格式转换 |
2.2 差值信号计算 |
2.3 自适应量化器 |
2.4 逆自适应量化器 |
2.5 量化器定标因子自适应 |
2.6 自适应速度控制 |
2.7 自适应预测器 |
2.7.1 语音产生的源滤波器模型 |
2.7.2 线性预测分析(LPA)的求解 |
2.7.3 线性预测分析的实现和物理解释 |
2.7.4 G.726标准自适应预测器 |
2.8 单音和瞬变音检测器 |
2.9 解码器 |
2.10 本章小结 |
第3章 G.726标准的编程实现 |
3.1 程序模块的划分 |
3.2 功能模块的实现 |
3.2.1 g726.h头文件 |
3.2.2 g726.c文件 |
3.3 本章小结 |
第4章 G.726标准的优化研究 |
4.1 语音质量的测量方法 |
4.1.1 语音质量的客观测量 |
4.1.2 语音质量的主观测量 |
4.2 标准编解码器的语音测试 |
4.3 提高自适应预测精度对系统的影响 |
4.4 16kb/s码率编解码输出信号的优化 |
4.5 测试验证 |
4.6 本章小结 |
第5章 基于FPGA的自适应预测器软IP核设计 |
5.1 FPGA的基本特征与开发流程 |
5.2 采用FPGA实现数字信号处理的方法 |
5.3 基于FPGA的自适应预测器P核设计 |
5.3.1 自适应预测算法的优化 |
5.3.2 基于VHDL语言的程序设计 |
5.3.3 综合、时序分析 |
5.3.4 下载验证 |
5.3.5 封装成IP核 |
5.4 本章小结 |
第6章 结论 |
6.1 论文工作总结 |
6.2 未来研究的展望 |
参考文献 |
致谢 |
攻读学位期间发表的论着、获奖情况 |
四、A SPEAKER ADAPTABLE VERY LOW BIT RATE SPEECH CODER BASED ON HMM(论文参考文献)
- [1]基于GMM语音谱包络表示的编码算法研究[D]. 王蓉蓉. 南京师范大学, 2017(02)
- [2]基于熵随机的网络流媒体动态隐密通信研究[D]. 彭景惠. 中国地质大学, 2020(03)
- [3]基于非线性映射模型的音频带宽扩展编码研究[D]. 姜林. 武汉大学, 2017(01)
- [4]基于AMR的网络语音处理算法研究与性能的仿真[D]. 高思源. 东北大学, 2014(06)
- [5]基于Android的实时语音通信系统的设计与实现[D]. 朱雷坚. 浙江工业大学, 2013(03)
- [6]基于单片机的语音编码系统实现[D]. 张崇武. 山东大学, 2012(02)
- [7]一种简化的MELP算法与其可行性评估[D]. 杨丹. 青海师范大学, 2012(04)
- [8]基于VoIP和异构计算的SPEEX研究与实现[D]. 李洪艳. 电子科技大学, 2011(12)
- [9]面向3G通信的移动音频关键技术研究[D]. 张聪. 武汉大学, 2010(05)
- [10]G.726语音编码的优化研究与IP核设计[D]. 尹光明. 东北大学, 2010(04)