MPEG-4语音编解码算法及其实现研究
详细信息    本馆镜像全文|  推荐本文 |  |   获取CNKI官网全文
摘要
数字信号的传输和存储,无论在可靠性、抗干扰性、保密性还是价格方面都远优于模拟信号,但数字话后的信号所占频带大大加宽,因此必须对数字信号进行压缩编码以减少信号所占的带宽。在语音处理领域,语音压缩编码技术已发展了近二十年,取得了许多成功,其中ISO组织于1996年制定的MPEG-4CELP语音压缩编码标准是重要的成果之一,包括了码率范围为2~24kb/s的码率,能提供很好的合成语音。其针对的应用从移动卫星通信到Internet技术,多媒体包装和语音数据库。在本论文中我们实现了其软件编解码,合成的语音有较高的编码质量。考虑到实际系统的性价比,我们以TI公司的TMS320VC5402芯片为硬件系统,实现了8k采样矢量量化参数的编码算法。论文第一章介绍了当今语音编码的发展。第二章介绍了语音编码的理论背景。第三章介绍了编码算法和解码算法。第四章介绍了具体实现方案。第五章对本论文做了简要总结。
In communication systems, the digital signal possesses a much better quality than the analog signal with its higher reliability, higher security, and lower price. However, the digital signal has its own disadvantages. For example, it needs higher bandwidths than the analog signal. Consequently, in order to reduce the bandwidth, we must take actions to compress the original digital. Scientists have been studying the speech compressing technology and have got many valuable achievements since the 1980's. MPEG-4 CELP is one of the important achievements with high voice synthesis quality at the rate of 2~24kb/s. It can be applied from mobile satellite communication to multi-media package and speech database. In this paper, we realize the algorithms. Chapter 1 presents the development of speech code. Chapter 2 presents the background of speech code. Chapter 3 presents the algorithms of encode and decode. Chapter 4 presents the implementation of the algorithm. Chapter 5 gives the summary of this paper.
引文
[1] 杨行峻,迟惠生等,语音信号数字处理,电子工业出版社,1995.8
    [2] 姚天任,数字语音处理,华中理工大学出版社,1992.4
    [3] [美]Jerry D.Gibson Toby Berger Tom Lookabaugh Dave Lindbergh Richard L.Baker著,李煜晖,朱山风,段上为 等译,多媒体数字压缩原理与标准,电子工业出版社,2000.8
    [4] 张益贞,刘滔,Visual C++实现MPEG/JPEG编解码技术,人民邮电出版社,2002.11
    [5] [美]Michael J.Yong著,邱仲潘 等译,Visual C++6从入门到精通,电子工业出版社,1999.1
    [6] 戴明桢,周建江,TMS320C54x DSP结构原理及应用,北京航空航天大学出版社,2001.11
    [7] 张雄伟,陈亮,徐光辉,DSP集成开发与应用实例,电子工业出版社,2002.6
    [8] ISO/IEC International Standard 14496-3 "Information Technology - Very Low Bitrate Audio-Visual Coding"-Part3: Audio Subpart1:Main Document
    [9] ISO/IEC International Standard 14496-3 "Information Technology - Very Low Bitrate Audio-Visual Coding" -Part3: Audio Subpart3:CELP
    [10] TI TMS320C54x DSP Reference Set, Volume 1:CPU and Peripherals, 1999
    [11] TI TMS320C54x DSP Reference Set, Volume 2:Mnemonic Instruction Set, 1996
    [12] TI TMS320C54x DSP Reference Set, Volume 3:Algebraic Instruction Set, 1997
    [13] TI TMS320C54x DSP Reference Set, Volume 4:Applications Guide, 1996
    [14] TI TMS320C54x DSP Reference Set, Volume 5:Enhanced Peripherals, 1999
    [15] TI TMS320C54x Code Composer Studio Tutorial, 2000
    [16] C.H. Lee, "On rubst Linear Prediction of Speech", IEEE Trans. On ASSP, 1988. pp. 642-650
    [17] F.K. Soong and B.H. Juang, "Line Spectrum Pair(LSP) and Speech Data Compression," in Proc. Int. Conf. On ASSP, 1991, pp. 661-664
    [18] J. Makhoul, S. Roucos and H. Gish, "Vector Quantization in Speech Coding," in Proc. IEEE Man-Machine Voice Commum, 1985
    [19] 张海燕,潘苏 CELP短时预测器算法的研究,南京邮电学院学报,第15卷第2期1995年6月
    [20] 陈亮,陈敏 LSP参数的快速计算及其高效量化研究,解放军理工大学学报(自然科学版),第二卷第5期,2001年
    [21] 吴琼,施锐,陈健,TMS320C54x实现GSM语音编解码器,南京航空航天大学学报,第31卷第2期,1999年4月
    [22] 赵胜辉,匡镜明,刘波涛,一种改进的规则脉冲激励-长时预测语音编码方案,北京理工大学学报,第15卷第2期,1995年5月
    [23] 胡剑凌,徐盛,陈健,MPEG-4多媒体通信音频编码,计算机工程,第26卷第7期,
    
    2000年7月
    [24] 陈渔源,冉戟,码本激励线性预测语音编码器的算法研究,铁道学报,第18卷第四期,1996年8月
    [25] 王卫峰,张秀彬,MPEG音频实时编码优化设计,研究与设计 微型电脑应用,第16卷第八期,2000

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700