用户名: 密码: 验证码:
基于小波与神经网络的语音算法研究
详细信息    本馆镜像全文|  推荐本文 |  |   获取CNKI官网全文
摘要
本文在分析了语音信号声学特性、感知特性的基础上,针对小波和神经网络在语音处理中的优良性质,提出了使用小波和BP网络相结合的方法压缩语音数据。文中将整个语音压缩系统分为两个部分:小波模块部分和神经网络模块部分。在小波模块中,语音首先经过小波变换,转化为小波系数,然后通过小波阈值处理,压缩语音数据中不重要的信息,之后对包含重要信息的小波系数进行量化编码;神经网络模块中,利用小波模块产生的二进制数据作为神经网络的目标输出,同时产生出固定的矩阵数组作为输入。网络训练完成后传递网络的权值和阈值,达到神经网络压缩的目的。仿真实验表明,在保证语音质量可听的情况下,压缩倍数可以达到31倍左右。
This article analyses speech signal acoustics characteristic, perception characteristic. Considering good character of the wavelet and neural networks in speech treatment, the method of integrating wavelet and BP neural networks is submitted to compress speech data. Speech compression system is divided into two parts: wavelet module and neural networks module. In the wavelet module part, speech signal is changed into wavelet coefficient at the first time. Then unimportant information of wavelet coefficient is compressed through wavelet threshold value. At last the important information of wavelet coefficient is quantized and encoded. In neural networks module part, the output is the binary data from wavelet module. At the same time fixed matrix is generated to be the input of neural networks. When the network is trained to be completed, the threshold value of the network is preserved. At last the threshold value is transferred and compression data purpose is reached. The simulated experiment is indicated that speech signal can be recognized when the compression ratio is around 31.
引文
[1]周彦沛.低码率正弦变换编码研究:[硕士学位论文].四川:西南交通大学,2005
    [2]韩纪庆,张磊等.语音信号处理.北京:清华大学出版社,2004,115~158
    [3]鲍长春.低比特率数字语音编码基础.北京:北京工业大学出版社,2001,44~147
    [4]王贵平.基于奇异值分解的低速率波形内插语音编码算法的研究:[硕士学位论文].北京:北京工业大学,2005
    [5]李彦民,石雁祥.小波分析的发展过程及应用现状.伊犁师范学院学报,2000,(1):84~87
    [6]鄢玉,杨洁明.BP 神经网络算法探讨.科技情报开发与经济,2006,16(3):241~242
    [7]居来提.语音压缩编码.新疆教育学院学报,2002,18(2):96~100
    [8]舒晖.语音编码算法的研究与实现: [硕士学位论文].重庆:重庆大学,2005
    [9]D Kundur and D Hatzinakos. Digital Watermarking Using Multiresolution Wavelet Decomposition. International Conference on Acoustic, Speech and Signal Processing(ICASP), Seattle, USA, 1998,5:2969~2972.
    [10]张国伟,田岚.一种改进的基于小波变换的语音基频检测.临沂师范学院学报,2006,28(6):101~105
    [11]马道钧,刘然.小波变换在语音识别中的应用研究.北京电子科技学院学报,2007,15(2):77~79
    [12]王振力,张雄伟,白志强. 语音增强新方法的研究.南京邮电大学学报(自然科学版),2007,27(2):10~14
    [13]王惠琴,张秋余,薛建斌.基于小波变换多分辨率特性的语音消噪方法的研究.计算机工程与设计,2006,27(2):235~237
    [14]Donoho D L.De-noising by soft thresholding[J].IEEE Trans IT,1995,57(2): 613~627
    [15]何琴,邹华兴,白剑. 基于小波变换的语音信息隐藏算法.计算机应用研究,2005,(12):118~119
    [16]余伶俐. 语音信号的小波变换处理方法.长春工业大学学报(自然科学版),2005,26(3):229~232
    [17]OBAIGDAT M S,BRODZIK ANDY,SADOUN.A performance evaluation study of four wavelet algorithms for the pitch period estimation of speech signals[J].Information Sciences,1998,21(1):213~221
    [18]白静,张雪英,侯雪梅. 基于 RBF 神经网络的抗噪语音识别.计算机工程与应用,2007,43(22):28~30
    [19]洪锐,郭继昌. 基于 DCT 与神经网络的语音增强方法.电子测量计算,2006,29(6):44~45
    [20]谭建豪,章兢. 自组织特征映射网络在压缩编码设计中的应用.计算技术与自动化,2007,26(1):22~25
    [21]龚文凌,王洪澄. 神经网络在语音信号消噪处理中的应用.计算机应用与软件,2005,22(2):73~75
    [22]赵力. 语音信号处理.北京:机械工业出版社,2003,14~30
    [23]Mallat S. A theory for multiresolution signal decomposition: the wavelet representation. IEEE Trans Pattern Analysis and Machine intelligence, 1989,11(7):674-693
    [24]A Grossman, J Morlet and T Pau1. Transforms Associated to Square Integeable Representation,II,Examples,Am.Inst.Henri Poincare,1986,45(3):293-309.
    [25]李建华,李万社.小波理论发展及其应用(综述).河西学院学报,2006,22(2):27~31
    [26]何璠.基于 BP 人工神经网络的环境质量评价模型研究:[硕士学位论文].四川:四川大学,2006
    [27]Rumelhart D E,McClelland J L. Parallel distributed processing. MA:MIT press,Cambridge,1986,1(2):125~187
    [28]Rumelhart D E, Hinton G E, Willianms R J.Learning internal representations by error propagationin Parallel Distributed Processing.Rumelhart D E and McClelland J L,Eds.Cambridge,MA:MIT press,1986,318~362
    [29]李望晨.BP 神经网络改进及其在手写数字识别中的应用:[硕士学位论文].哈尔滨:哈尔滨工业大学,2006
    [30]唐晓初.小波分析及其应用.重庆:重庆大学出版社,2006,1~67
    [31]唐春阳.小波分析在语音处理中的应用:[硕士学位论文].西安:西北大学,2000
    [32]杨建国.小波分析及其工程应用.北京:机械工业出版社,2005,17~107
    [33]张维强.小波分析及其在语音信号处理中的应用:[硕士学位论文].西安:西安电子科技大学,2000
    [34]Daubechies I.Orthonormal Bases of Compactly Supported Wavelets.Commun Pure Appl Math,1988,(41):909~996
    [35]飞思科技产品研发中心.小波分析理论与 MATLAB7 实现.北京:电子工业出版社,2005,29~353
    [36]Abdul Mawla M A Najih, Prakash V. Speech compression using discreet wavelet tansform. IEEE Conference on Telecommunication Technology Proceedings. Shah Alam, Malaysia, 2003,1~4
    [37]李从鹤,郑辉.数据压缩技术的研究与应用.电信技术研究,2004,12:19~24
    [38]任红艳.基于最佳小波包分解的语音压缩研究:[硕士学位论文].西安:西北大学,2006
    [39]张彤.小波包分析及其在模拟电路故障诊断中的应用:[硕士学位论文]. 西安:西安电子科技大学,2005
    [40]飞思科技产品研发中心.神经网络理论与 MATLAB7 实现.北京:电子工业出版社,2005,25~199
    [41]魏海坤.神经网络结构设计的理论与方法.北京:国防工业出版社,2005,19~169
    [42]闻新,周露等.MATLAB 神经网络应用设计.北京:科学出版社,2000,132~302
    [43]杨国为,涂序彦,庞杰.基于虚拟信源的无损数据压缩方法研究.电子学报,2003,31(5):728~731
    [44]杨国为,涂序彦.采用小波与神经网络的高效图像数据压缩方案.光电工程,2004,31(1):65~68
    [45]靳蕃.神经计算智能基础.成都:西南交通大学出版社,2001,100~441
    [46]鲍长春.数字语音编码原理.西安:西安电子科技大学出版社,2007,5~58
    [47]F.W.Zaki , H.Hashish , S.H.Behiry.Speech compression using wavelet transform.Eighteenth National Radio Science Conference.2001,2:467~474
    [48]Abdul Mawla M.A.Najih,Abdul Rahman bin Ramli,V.Prakash,Syed A.R.Speech Compression Using Discreet Wavelet Transform.4th Nation Conference on Telecommunication Technology Proceedings.2003,1~4
    [49]符晓娟,杨万全.利用离散余弦变换的语音信号压缩方案.信息技术,2006,11:74~76
    [50]韩大晗,崔慧娟,唐昆,刘大力.可编程语音压缩专用处理器设计.清华大学学报(自然科学版),2007,47(1):76~79
    [51]马恋,何锫.基于神经网络的数据压缩研究.计算机技术与发展,2007,17(2):12~15
    [52]吴吉,徐美华.基于小波包变换的语音信号压缩及 DSP 实现.上海大学学报(自然科学版),2004,10:222~225

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700