30岁转行做网站编辑wamp网站建设
2026/4/10 11:49:40 网站建设 项目流程
30岁转行做网站编辑,wamp网站建设,湖南还没有建网站的企业,郑州网站建设易云巢3.2.5 自适应差值脉冲编码调制#xff08; ADPCM#xff09;自适应差值脉冲编码调制#xff08; Adaptive Differential Pulse Code Modulation#xff0c; ADPCM#xff09;是一种为提高数字通信系统的频带利用率而发展起来的语音压缩编码技术#xff0c; ITU-T 为此制定…3.2.5 自适应差值脉冲编码调制 ADPCM自适应差值脉冲编码调制 Adaptive Differential Pulse Code Modulation ADPCM是一种为提高数字通信系统的频带利用率而发展起来的语音压缩编码技术 ITU-T 为此制定了G.721 推荐标准它可在 32 kb/s 数码率上达到 64 kb/s 的 PCM 数字电话语音质量。ADPCM 是在差分脉码调制 DPCM的基础上发展起来的所以首先介绍 DPCM 的原理。1差分脉码调制 DPCM语音信号和图像信号经抽样后得到样值序列经分析可知当前时刻的样值与前面相邻的若干时刻的样值之间有明显的关联。这样可以根据前一时刻的样值来预测当前时刻的样值预测值和实际值之差为差值。大量统计的结果是在大多数时间内信号本身的功率比差值的功率要大得多如果只传送这些差值来代替信号那么码组所需的位数就可以显著减小。差分脉冲调制就是利用样值之间的关联进行高效率波形压缩编码的一种典型方法。图 3-9 是差分脉码调制 DPCM原理组成框图图中模拟信号 x(t)和预测信号 xq(t)输入到比较器输出误差 e(t)x(t)-xq(t)。对 e(t)进行抽样、量化和编码得到了 DPCM 信号这是一个二进制的数字序列。此信号分成两路一路送至信道上传输另一路送至反馈支路经过本地译码器译码产生预测信号。在接收端可以用相同的译码器译码并经过低通滤波器后恢复模拟信号。图 3-9 差分脉码调制 DPCM原理组成框图DPCM 与 PCM 的区别是在 PCM 中是对信号的抽样值直接进行量化、编码后传输而DPCM 则是对信号抽样值与信号预测值的差值进行量化、编码后传输。由于差值信号的动态范围一般比信号小 如果输入信号统计特性已知 则进行适当预测可使差值信号范围更缩小。实验表明在较好图像质量的情况下每一抽样值只需 4 bit 就够了。因此大大压缩了传送的比特率。另一方面如果比特速率相同则 DPCM 比 PCM 信噪比可改善 1417 dB。DPCM 的缺点是较易受到传输线路噪声的干扰。因为 DPCM 能压缩比特率的实质是由于声音和图像信号相邻的抽样值之间存在明显的相关性因此用一般的 PCM 传输时信号含有多余信息。 DPCM 预测减少了多余信息所以抗传输噪声的能力必然降低。DPCM 预测效果与信号统计特性有密切关系要使声音和图像信号统计特性随时间变化获得最佳的效果预测电路应跟踪信号性质的变化。2自适应差分脉码调制 ADPCM为了能进一步提高 DPCM 方式的质量在语音相当宽的变化范围内仍能得到最佳的性能特别是适应因人、因时不同的语音信号变化在 DPCM 中增加自适应系统这里的自适应包括自适应预测和自适应量化增加自适应系统 DPCM 的称为自适应差分脉冲编码调制 ADPCM。1自适应量化自适应量化是对 DPCM 误差 e(t)信号非均匀量化过程中让量化间隔大小的变化与输入信号方差相匹配即量化间隔随输入信号的方差而变化。现有的自适应量化方案有两类一是其输入信号幅度或方差由输入信号本身估算这种方案称为前馈自适应量化器二是其量化阶距根据量化器的输出来进行自适应调整或等效地用输出编码信号进行自适应调整这类自适应量化方案称为反馈自适应量化器。无论采用哪种自适应量化方案都可以改善动态范围及信噪比比相同电平数固定量化改善 1012 dB。反馈控制的优点是量化阶距的信息由码字序列提取不需要传输或存储额外的阶距信息但在重建输出信号时传输误码对质量的影响比较明显。前馈控制时要求码字与阶距一起传输以用来得出信号虽然增加了复杂性但它有可能在差错控制保护下传输阶距减少传输误码的影响即使在高误码率传输时也有较好的输出信号质量。2自适应预测自适应预测是对 DPCM 预测信号 xq(t)进行自适应预测并将根据前面一个抽样确定下个预测值称为一阶预测采用前面若干个样值作为参考来推算预测值称为高阶预测。为了在接收端根据差值的编码产生下一个输入样值的准确预测估计可以对前面所有样值的有效信息冗余度进行加权求和加权系数又称为预测系数。自适应预测是使预测系数的改变与输入信号幅度值相匹配从而使预测误差为最小值这样预测的编码范围可减小可在相同编码倍数情况下提高信噪比。3 32 kb/s ADPCM 系统ITU-T G.721 建议提出了与现有 G.712 建议 64 kb/s PCM 系统兼容的 32 kb/s ADPCM 的实现其主要技术指标满足 G.712 对语音质量要求。32 kb/s ADPCM 编码器的方框图如图 3-10 所示。它由 PCM 码/均匀量化线性码间的变换器、自适应量化器、自适应逆量化器、自适应预测器和量化尺度适配器组成。编码器输入的信号为非均匀量化 PCM 码可以是 A 律和μ律 PCM 码。为了便于进行数字信号运算处理首先将 8 位非均匀量化码变换为 12 位均匀量化码然后进入 ADPCM 部分。均匀量化的 PCM 信号与预测信号相减获得预测误差信号。自适应量化器将该差值信号进行量化并编成 4 位 ADPCM 码输出。ADPCM 码流通过自适应逆量化器产生量化差值信号。量化差值信号与信号预测值相加形成再建信号。自适应预测器对再建信号及量化差值信号进行运算形成对输入 PCM 信号的预测信号估值。量化尺度适配器包括定标因子自适应和自适应速度控制两电路。编码器中的量化器和逆量化器的自适应均受量化尺度适配器中的定标因子的控制。32 kb/s ADPCM 解码器的方框图如图 3-11 所示。它由自适应逆量化器、自适应预测器、均匀量化线性码/PCM 码变换器、量化尺度适配器以及同步编码调整器组成。译码器中有与编码相同的电路只是多了一个同步编码调整器其作用是使级联工作时不产生误差积累。3.2.6 子带编码 SBC把语音信号的频带分割成不同的频带分量称为子带然后再分别对这些子带独立地进行抽样编码的方式称为子带编码 Sub-Band Coding SBC。子带编码将信号分解成不同频带分量的过程去除了信号的冗余度得到了一组互不相关的信号。这同 DPCM 方式的机理虽然不同但从去除冗余度角度这两者又是相似的。SBC 主要有两个优点首先是可以通过分配给各子带不同的量化间隔和编码比特数来分别控制它们的信噪比以较低的总码率获得较好的语音质量。这主要靠利用人耳听觉的“掩蔽”效应实现的。例如语音信号低频部分涉及语音基音周期和第一共振峰等对语音清晰度等主观品质影响较大信噪比应高些即量化间隔选小些分配较多的编码比特数对语音的高频部分量化噪声对语音质量的影响小些信噪比可低些所以量化间隔可以稍大些用较少的比特编码。这样便可在保证语音质量的前提下使编码的总比特数降低。基于此原因子带编码方式既不是纯粹的波形编码又不是纯粹的参量编码它是二者的结合应属于混合编码这类编码方式也称为频域编码。其次子带编码各子带的量化噪声相互独立被束缚在自己的子带内这样就能避免输入电平较低的子带信号被其他子带的量化噪声所淹没。实现子带编码原理的系统组成方框示意图如图 3-12 所示。在发端首先通过带通、调制将各个子带信号转换成低通信号然后再根据低通抽样定理对各子带信号进行抽样由于子带信号转换成了低通信号所以可使抽样频率降低到各子带带宽的两倍。接着分别量化编码最后将各路数字流合在一起送往信道中传输。在收端再将它分接即分路、解码并恢复各个子带信号然后将各个子带信号解调组合起来还原成原语音信号。实验证明 16 kb/s SBC 系统的语音质量相当于 24 kb/s 的 ADPCM 系统其典型参数如表 3-5 所示。子带编码器可应用于模拟线路 并兼容传输数字化语音 和在一般线路上传输数字语音。目前有人还提出了可变子带编码器其比特速率最低可达 4.8 kb/s其语音质量可与 7.2 kb/s的固定子带编码相比拟。3.3 语音参量压缩编码技术参量压缩编码的原理和设计思想与波形压缩编码完全不同。波形压缩编码的基本思路是忠实地再现语音的时域波形为了降低比特率可充分利用抽样点之间的信息冗余性对差值信号进行编码在不影响语音质量的前提下比特率可以降至 32 kb/s。参量压缩编码根据对语音的形成机理分析着眼于构造语音生成模型要了解参量压缩编码原理首先必须了解语音形成机理以及语音产生的数学模型。3.3.1 语音产生的过程及数学模型语音是由人类的发声器官产生气流通过声带、声门由咽腔、口腔和鼻腔等共同控制而发音完整的发声系统还包括由肺、支气管、气管组成的次声门系统次声门系统是产生语音能量的源泉。当空气从肺中呼出来时气流由于声道某一地方的收缩而受到扰动发出声波。语音形成的大致过程可如图 3-13 所示。语音按其激励分为 3 种形式浊音、清音和爆破音。1浊音与基音浊音又称有声音伴有声带振动的音发浊音时声带在气流的作用下准周期地闭合或开启。即气流通过声门、声带的张力使得声带发生张弛式的振荡这时就会产生一股准周期气流这股气流激励声道时就产生浊音如图 3-14 所示。由于声带振动有不同的频率因此浊音就有不同的音调称之为基音频率这个倒数称为基音周期若基音周期为 TP则基音频率为 fP。基音频率与个人声带有关在很大程度上反映了个人的特征。一般而言男性基音频率大致分布在 50250 Hz 左右女性和小孩的基音频率在 100400 Hz 左右。2清音和爆破音清音又称无声音声带不振动的音由声学和流体力学知当气流速度达到某一临界速度时就会引起湍流此时声带不振动声道被噪声状随机波激励产生较小幅度声波其波形与噪声很像这就是清音清音信号没有准周期特性如图 3-15 所示。图 3-15 清音如果声道完全闭合在闭合后产生气压然后突然释放这就得到了爆破音。从语音信号的频谱分析可知语音信号除基音外还存在基音的多次谐波浊音信号的能量主要集中在各基音谐波的频率附近而且主要集中于低于 3 kHz 的范围。另外气流压的不同强度就对应为声音的音量大小。3. 共振峰及声道模型参数人的声道和鼻道都可以看成非均匀截面的声道管如图 3-16 所示声道管的谐振频率称为共振峰频率。共振峰频率和声道的形状和大小密切相关每种形状都有一套共振峰频率作为其特征改变声道的形状参量数 a1 a2 a3… aN就产生不同的声音。图 3-16 声道模型口腔和鼻腔由流体力学知声道频率特性唇口声速与声门声速之比与谐波类似频率特性对应的谐振点叫做共振峰频率共振峰只会出现在浊音频谱中。共振峰频率由高到低依次为第一共振峰第二共振峰第三共振峰…分别用 F1 F2 F3…表示。一般浊音有 5 个共振峰前 3 个最重要。4语音信号产生的数学模型根据以上对实际发音器官和发音过程的分析 可将语音信号发生过程抽象为如图 3-17 所示的数学模型也就是说语音是语音激励源激励一个参数变化的声道而产生的。这里以具有一定周期的脉冲源表示浊音的激励以分布平坦的噪声源来表示清音激励。周期信号源表示浊音激励源随机噪声信号源表示清音激励。根据语音信号种类由浊/清音开关决定连接哪一种激励源。声道模型口腔和鼻腔可以看成一个时变线性系统对声波系统起滤波作用其参数随口腔运动缓慢变化增益控制代表语音的强度。3.3.2 参量编码与声码器简介语音信号的特征参数主要有基音周期、共振峰频率、清/浊音判决和语音强度。基音周期和清/浊音判决可以同时获得其方法主要有三大类 1时域法指直接用语音信号波形来估计的方法 2频域法指将语音信号变换到频域来估计的方法 3混合法指综合利用语音信号的频域和时域特性来估计的方法。语音信号参数编码始于 1939 年美国人 Homer Dudey 发明的声码器它是根据语音信号的特征参数来编码又称声源编码也称为声码器编码又叫“声码器技术”。参数编码是以发音机制的模型为基础用一套模拟声带频谱特性的滤波器系数和若干声源参数来描述这个模型在发送端从模拟语音信号中提取各个特征参量并进行量化编码从而实现语音信号到数字信号的转变的。构成声码器的主体是一个滤波器这个滤波器的作用相当于人类的发音器官——喉、嘴、舌的组合。声码器中滤波器的系数和若干声源参数由语音信号的频谱特性所决定。在发送端对输入语音信号加窗截取一帧语音对该帧语音信号进行分析模拟发声结构求出这帧语音信号的激励参数包括清浊音判决信息和基音周期参数和声道参数。然后对语音信号的特征参数进行提取和编码最后输出。在提取语音信号的特征参数时利用语音信号生成模型幅度谱上要逼近原语音并在编码前进行清浊音判断 力图使重建语音信号具有尽可能高的可懂度 即保持原语音的语意。在接收端根据接收到的参量编码和上述模型还原生成发话者的音素。即在浊音段激励信号采用具有该浊音段基音周期的周期脉冲序列在清音段激励信号采用白噪声序列。在合成端将激励信号通过代表声道特性的时变线性系统滤波器产生合成语音。具体来说用上述模型模拟语音的发声过程语音信号可以看做不同激励信号通过时变线性系统产生的输出。发送端对该模型的参量参数进行编码相当于对该语音信号的主要特征而并非具体的语音波形幅值编码。根据分析可知模型参数的更新频度较低并可利用抽样值间的一定相关性故可有效地降低编码比特率。声码器主要有通道声码器、 共振峰声码器、 相位声码器、 线性预测 LPC Linear Predictive Coding声码器等 LPC 声码器是重要的一种。其中 LPC 声码器是以线性组合模型均方误差最小意义下逼近原始波形的方法提取参数较好地解决了编码速率和语音质量的问题 以其成熟的算法和参数的精确估计成为研究的主流并已走向实用。美国政府 1980 年公布的 2.4 kb/s 线性预测编码算法 LPC-10 就是采用的这种方法。 1986 年美国第三代保密电话装置采用了 2.4 kb/s 的 LPC- 10e LPC- 10 的增强型作为语音处理方法。

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询