IT教程 ·

1994_An Algorithm To Reconstruct Wideband Speech From Narrowband Speech Based On Codebook Mapping

写给大忙人看的操作系统

 

择要

本文提出了一种从窄带语音中重构宽带语音的新算法,该算法有两个新的特性。第一是基于码本映照的频谱包络重构。第二是应用重构的频谱包络举行语音信号重构。由于该算法无需运用任何附加的发送信息就能够生成高质量的语音(盲源),所以它适用于任何收集,如现有的电话收集、支撑模仿和ISDN效劳的收集等。该算法应用于20个措辞人。经由历程acoustic distance measure(声学间隔丈量)和listening tests confirms(听力测试考证)了算法的优越机能。

弁言

近年来,高质量的声响已经由历程CD(小型光盘)和LDs(激光光盘)变得熟悉起来,这就进步了现有用劳的音质的需求。比方,一些调幅电台已入手下手用立体声替代单声道播送。这些趋向表明,革新的质量是传统体系或现有用劳中最主要的请求之一。在电话效劳方面,一个请求是供应宽带语音而不是窄带语音。由于宽带语音是清楚的,而且准确地保留了措辞人的身份,所以用户能够经由历程电话线更真实地交换[1][2]。

本文提出了一种从电话语音中发生宽带语音的要领。由于模仿电话的带宽限定在300Hz~3.4kHz之间。该算法发生一个附加的低频信号(50hz-300Hz)和一个高频信号(3.4kHz-7.3kHz)。这generation基于两个假定,一是窄带语音与低频带和高频带信号密切相干;二是纵然低频带和高频带信号不完全准确,也能明显进步感知语音质量。该算法的一个长处是能够在不增添任何分外信息的情况下生成宽带语音。这使得它适用于任何收集,如现有的电话网、支撑模仿和ISDN的收集等。另外,在传输带宽受限的情况下,如在挪动通信中,它也是有用的。

2 重修算法

该算法分为两个步骤,

  1. 步骤一:高频带和低频带的频谱包络重修。应用宽带语音集及其窄带版本生成映照函数,映照功能将窄带频谱的矢量映照到宽带频谱的矢量空间[3]的码书完成的。
  2. 步骤二:合成低频带和高频带信号。低频带信号采纳线性展望编码(LPC)来合成。在高频带信号合成方面,我们斟酌了LPC合成和波形叠加两种要领,末了将高频带和低频带信号叠加到电话语音中取得宽带语音。

下面诠释这两个历程的细节

2.1 频谱包络发生

要从窄带频谱包络中发生宽带频谱包络,须要一对码本。个中一个码本包括宽带频谱包络,另一个码本包括对应的窄带频谱包络。宽带频谱包络码本的码向量与窄带频谱包络的码向量具有一对一的对应关联。码本的制造步骤以下,下面步骤中的序号对应于图1中的数字。

  1. 宽带语音经由历程带通滤波器生成窄带语音
  2. 提取宽带和窄带语音频谱包络
  3. 运用LBG算法生成宽带码本[4]
  4. 运用宽带码本对宽带语音中的语音举行矢量量化
  5. 应用时候关联,将窄带语音的频谱包络举行聚类
  6. 均匀每一个窄带群集合的频谱包络,然后将其存储为窄带码本的码向量(当经由历程波形叠加发生高频信号时,须要别的码本)
  7. 挑选具有最接近每一个码矢量频谱包络的宽带波形,经由历程高通滤波器和带通滤波器后,将其存储为代表波形

1994_An Algorithm To Reconstruct Wideband Speech From Narrowband Speech Based On Codebook Mapping IT教程 第1张

图1  码本生成算法框图

2.2 从窄带语音生成宽带语音

图2是生成历程的框图,步骤以下

  1. 用LPC剖析输入窄带语音并提取基音、功率和频谱包络
  2. 运用窄带码本对每一个频谱包络举行矢量量化,并运用宽带码本对向量举行解码
  3. 发生低频信号。细节将在背面引见
  4. 发生高频信号。细节将在背面引见
  5. 对输入的窄带语音举行上采样
  6. 在(5)的输出中到场低频带和高频带信号,发生宽带语音

1994_An Algorithm To Reconstruct Wideband Speech From Narrowband Speech Based On Codebook Mapping IT教程 第2张

 图2 生成历程框图

  下面诠释低频带和高频带信号的发生。应用LPC合成手艺合成了低频信号。为了合成高频信号,提出了两种要领,一种是运用LPC合成法(要领1),另一种是运用波形形成法(要领2),图3、4和5离别是低频信号生成、高频信号生成的框图(要领1和要领2)。

低频段发生

  1. 应用所剖析的基音、功率和由宽带码本解码的频谱包络,经由历程LPC举行宽带语音合成。
  2. (1)的输出经由历程低通滤波器提取低频带信号(在这类情况下,我们运用STFT剖析/合成[5]作为低通滤波器)
  3. 将(2)的输出乘以一个常数,由于(2)的power(功率)insufficient(缺少)宽带语音。这就发生了低频带信号

1994_An Algorithm To Reconstruct Wideband Speech From Narrowband Speech Based On Codebook Mapping IT教程 第3张

低频段语音生成

高频带生成(要领1)

  1. 应用宽带码本解码后的基音、功率和频谱包络,用LPC合成宽带信号
  2. 经由历程高通滤波器(1)提取高频信号(在这类情况下,我们运用STFT剖析/合成作为高通滤波器)
  3. 将(2)的输出乘以余弦函数,以减小由LPC合成引发的脉冲,并使功率正常化。这就发生了高频信号

1994_An Algorithm To Reconstruct Wideband Speech From Narrowband Speech Based On Codebook Mapping IT教程 第4张

 高频带信号生成(要领一)

高频带生成(要领2)

  1. 参考码矢量索引,取得两个waveform(波形):一个来自窄带代表码本,另一个来自高频代表码本。
  2. 搜检波形是不是为浊音(voiced)或清音(unvoiced)
  3. 假如是浊音,则经由历程基音同步堆叠加法来合成窄带语音。假如没有浊音,则经由历程逐帧堆叠加法合成窄带语音
  4. 盘算(3)的输出与输入语音之间的功率比
  5. 用与(3)雷同的要领合成高频信号
  6. 将(5)的输出乘以功率比,取得高频信号。

1994_An Algorithm To Reconstruct Wideband Speech From Narrowband Speech Based On Codebook Mapping IT教程 第5张

 高频带信号生成(要领二)

3 机能评价

频谱失真和听觉测试评价了该算法的机能。 试验前提如表1所示

“措辞人相干”示意模子的练习数据和测试数来自统一个人,“措辞人自力”示意差别的措辞人。

3.1 频谱失真评价

经由历程运用宽带码本和窄带码原本丈量频谱失真,我们运用了10位男性措辞人和10位女性措辞人。

VQ失真盘算以下

(1)从宽带语音中提取频谱包络

(2)运用宽带码本举行矢量量化(1)

(3)离别盘算低频和高频信号(1)和(2)之间的平方偏差。偏差定义以下

$$D=sum_{t=0}^{T^{prime}}left[frac{1}{2 pi} int_{a}^{b}left[10 log _{10} frac{hat{Y}_{t}(omega)}{Y_{t}(omega)}right]^{2} d omegaright]^{frac{1}{2}}$$

重修失真盘算体式格局以下

(4)经由历程滤波(1)中运用的语音取得窄带语音,并提取窄带频谱包络

(5)应用窄带码本和宽带码本重构(4)输出相对应的宽带频谱包络

(6)离别盘算低频和高频信号(4)和(5)之间的平方偏差。偏差定义见(3)

试验效果如图6和图7所示。每一个失真值是一切措辞人对的均匀值。从效果来看,该算法能够像矢量量化一样准确地重修低频谱,而且重修失真跟着码本尺寸的增大而减小(8bit码本会致使3.5dB的频谱失真),在高带宽重修方面,运用4bit码本,重修失真的下降在6.5dB处饱和。这表明,高频信号和窄带语音的相干联数没有低频信号和窄带语音的相干联数高。

表1:测试前提

练习数据数目:186个单词均衡了一切音素

剖析窗函数:hamming

窗函数长度:21毫秒

帧移长度:3毫秒

LPC阶数:12

FFT点的数目:512

失真器量:LPC倒谱的欧氏间隔

1994_An Algorithm To Reconstruct Wideband Speech From Narrowband Speech Based On Codebook Mapping IT教程 第6张

图6:频谱失真(低频段)

1994_An Algorithm To Reconstruct Wideband Speech From Narrowband Speech Based On Codebook Mapping IT教程 第7张

图7:频谱失真(高频段)

3.2 听力测试评价

举行配对比较听力测试。基于以上效果,离别用8bit和4bit码本对低频和高频信号举行了宽带语音生成。两名男谈话人和两名女谈话人以自力于谈话者的体式格局受雇。随机从三个语音集合挑选两个语音集:电话语音、运用要领1生成的语音和运用要领2生成的语音2。六位听众被请求挑选一个比另一个更宽的语音。运用了77对。

试验效果如图8所示。效果表明,该算法能有用地从电话语音中重修宽带语音。就发生高频的最好要领而言,它们之间没有明显差别

 图8:偏好得分

4 总结

提出了一种应用码本映照生成窄带语音宽带语音的算法,并从频谱失真的角度考证了算法的机能,在措辞人相干和自力重构之间没有机能差别。听力测试证明,生成的宽带语音质量优于原始电话语音。我们设计革新高频信号的发生历程,以进步与窄带信号的相干性

申谢

我们谢谢语音处置惩罚部门的成员举行了有价值的议论。我们也谢谢语音和声学试验室主任北崎骏博士和语音处置惩罚小组组长杉村博士对这项事情的延续支撑。

参考文献

[1] Y. Cheng, D. O'Shaughnessy, P. Mermelstein, "Statistical Re covery of Wideband Speech From Narrowband Speech, "Proceedings of ICSLP92, pp. 1577-1480,19922

[2] N. Jayant,"High-Quality Coding of Telephone ech and wideband Audio, Advances in Speech Sign cessing, pp85-108,1992

[3] M. Abe, S. Nakamura, K. Shikano, H. Kuwabara, "Voice conversion through vector quantization, "ICASSP,88, pp. 655-658,1988

[4] Y. Linde, A. Buzo, and R. M. Gray, " An algorithm for vector quantizer design, "IEEE Trans. Commun COM-28, 1, pp 8495(Jan.19805

[5] Lawrence R. Rabiner, Ronald W. Schafer "Digital Processing of Speech Signals”,

 

Matplotlib绘制漫威英雄战力图,带你飞起来!

参与评论