您好, 访客   登录/注册

语音信号幅值分布的统计分析

来源:用户上传      作者: 李亚

  摘要:针对PCM编码的语音信号,提出了一种基于正交矩阵变换的语音处理方法以改变语音信号幅值的分布规律,从而减小语音信号的动态范围与标准差。实验表明,正交矩阵变换算法可以明显降低语音信号的幅值范围,实验数据显示变换后语音信号的标准差降低20%。同时多人试听实验证明解码后的语音质量没有降低。此算法缩小了语音信号的幅值范围和标准差,从而可以用更少的编码比特完成语音信号的编码,压缩效率可以进一步提高。
  关键词: 语音;幅值分布;正交矩阵;标准差;熵
  中图分类号:TP391.08 文献标识码:A 文章编号:1009-3044(2016)07-0164-02
  Statistics and Analysis of Speech Signal Amplitude Distribution
  LI Ya
  (Department of Computer Science, Tongji University, Shanghai 201804, China)
  Abstract: In view of PCM(Pulse Code Modulation) speech signal, this paper puts forward a method of speech processing based on orthogonal matrix transformation to change the amplitude distribution of speech signal, which can reduce the standard deviation of speech signal. Experiments indicate that the orthogonal matrix transformation algorithm can obviously reduce the amplitude range of speech signal, and the results show that and speech signal standard deviation is reduced by 20% through the transformation. At the same time, voice quality after decoding is not decreased according to listening experimenter. The algorithm reduces amplitude range and standard deviation of the speech signal, so speech signal can be coded with less bits and compression efficiency can be further improved.
  Key words: speech signal; amplitude distribution; orthogonal matrix; standard deviation; entropy
  1 概述
  早期的语音信号传输和处理都是以模拟方式进行的,自PCM脉冲编码调制理论提出来后,语音信号处理进入数字化时代。从最初64kb/s的标准PCM波形编码器到现在4kb/s以下的参量编码的声码器,语音压缩编码在几十年里得到迅速发展[1-2]。为了提高通信网中的信息传输效率及实现语音的高效存储,还需要对编码后的数字语音进行压缩,即语音压缩。
  目前,比较成熟的语音信号分析方法[3-4]主要有时域分析、短时傅里叶变换、倒谱以及LPC谱分析。通过对语音信号幅值的相关研究,可以统计得到语音信号的幅值分布。根据其幅值分布的特点,可以研究其他编码方案在语音信号中的应用,例如霍夫曼编码。
  2 原始语音信号的分布统计
  对原始模拟语音信号采样,可以得到语音信号的离散数据样点。假设采样后的语音信号有K=M×N数据样点,记为X=(X1,X2,…,XK),其中K、M、N都是正整数。则采样后信号数据点的矩阵形式可以表示为
  5 结论
  本文首先分析了语音信号相邻样本间的相关特性,并根据这种相关性,利用哈达玛矩阵对原始信号进行变换并统计幅值分布,实验结果表明此方法明显减小了语音信号的动态范围和标准差,从而提高语音信号的压缩率。其次,利用哈达码矩阵的正交特性可以恢复原始信号,同样可以采用其他类型的矩阵进行变换并统计分析。最后,此算法在语音编码和无线通信中有一定地参考价值,其具体应用有待进一步讨论研究。
  参考文献:
  [1] 赵晓群.数字语音编码[M]. 北京:机械工业出版社, 2007.
  [2] 时磊, 尚秋峰, 李健宇. 语音压缩编码技术研究进展[J]. 声学技术, 2008, 27(4):553-556.
  [3] 张宗念, 黄仁泰, 闫敬文. 压缩感知信号盲稀疏度重构算法[J]. 电子学报, 2011, 39(1):18-22.
  [4] 刘毅强,刘昱,段继忠,刘亚峰. 压缩感知处理语音信号的性能分析及比较[J]. 电声技术, 2012, 36(2):44-47.
  [5] 时娟. Walsh-Hadamard变换及其在信源编码中的应用[J]. 甘肃科学学报, 2005, 17(2):38-40.
  [6] Wang Guibao, Huang Hongzhong, Liu Yu, Zhang Xiaoling and Wang Zhonglai. Uncertainty estimation of reliability redundancy in complex systems based on the Cross-Entropy method[J]. Journal of Mechanical Science and Technology, 2009, 23(10):2612-2623.
  [7] 傅祖芸, 赵建中. 信息论与编码[M]. 北京:电子工业出版社, 2008.
  [8] 常荷. 熵与方差[J].开封教育学院学报, 2001,21(4):43-44.
转载注明来源:https://www.xzbu.com/8/view-7319346.htm