摘要
实现一种基于语音感知特征参数动态规整失真度量的客观侵入式语音质量评估算法,该算法分为特征提取、失真度量、MOS映射三个步骤。算法的创新在于:特征提取过程中选取更能表征语音实质的GFCC参数取代传统的LPC、LPCC、MFCC、IMFCC等参数,在失真度量过程中选用动态规整距离取代传统的平均欧式距离,MOS映射时对映射函数进行修正以防止出现坏值而影响算法性能。文章详细介绍了算法的原理,在实现算法的基础上从相关度和偏离误差等指标对算法性能进行衡量,结果证明算法性能良好。
This paper realizes an intrusive objective speech quality evaluation algorithm based on dynamic distortion measurement of speech perception characteristic parameters. The key steps of this algorithm(GFCCD_MOS) is feature extraction of Gammatone Frequency Cepstrum Coefficient, distortion measurement by Dynamic Time Warping and MOS-Mapping. This paper introduces the detail principle and measured the algorithm performance according to some indicators such as relevance and deviation error. The simulation results show the good performance of GFCCD_MOS.
引文
[1]陈国.语音质量客观评价方法研究进展[J].电子学报,2001,29(4):1-5.
[2]白燕燕.基于听觉特性的语音特征参数提取方法研究[J].自动化技术与应用,2015,(4):40-41.
[3]王玥.基于伽马通滤波器组的听觉特征提取算法研究[J].电子学报,2010,38(3):525-528.
[4]杨洁.动态时间规整DTW算法的研究[J].科技与创新,2016,(4):11-12.
[5]付强.语音的参数表示和质量客观评价研究[D].西安:西安电子科技大学,2000.
[6]尹伟.一种基于非均匀谱系数和GMM的语音质量评估方法[J].电路与系统学报,2010,15(4):104-109.
[7]陈明义.基于改进MFCC语音特征参数的语音质量评估的研究[J].电路与系统学报,2009,(6):111-114.