用户名: 密码: 验证码:
通讯终端上名片识别系统的实现
详细信息    本馆镜像全文|  推荐本文 |  |   获取CNKI官网全文
摘要
图像处理技术近几年来发展迅速,越来越多的领域使用图像处理技术,并将这些技术和该领域的一些特有技术相结合,开发出各具特色的产品特征。
     根据我们实际的项目调研,我们发现在实际的商务和经济活动中,名片已经做为一个重要的身份信息载体,使用频繁,然而名片的收集增多,管理也就越来越麻烦,虽然现代科技发达,像商务通这样的设备比比皆是,可是又让大家头疼的是需要人工的输入。
     本文就是在实际的项目中,研究名片识别的方法,并将名片识别的一些方法和手机这个嵌入式系统相结合,开发出基于手机这个嵌入式系统的名片识别后端处理芯片。
     文章首先阐述了名片识别系统(Business Card Recognition)应用的必要性和在手机上开发的限制,然后给出了一般名片识别系统的总的框架图,并针对各个模块作出了简单的说明。为了将一般的字符识别应用到名片识别中,我们进一步分析了名片这个研究对象的总体特征。文章的主体结构,我们是沿着先前介绍的总的框架图一个一个大的模块进行研究和实现的。在文章的第二章,我们研究了图像预处理的一些理论,并提出了改进的二值化算法,即将局部阈值法Bernsen算法和全局阈值法Ostu算法相结合的方法。试验也证明这种改进的算法较好的达到了图像二值化的预处理效果。在名片字符识别模块应用的是一般的字符识别模块,所以这一部分的理论中只是介绍为主。第四、五章是将名片的内容特征以及名片上的一些关键词,结合深度搜索算法,统计语言模型等一些理论,针对几个重要的关键词提出相应的处理方法,对名片识别的结果进行进一步处理,用以提高识别的准确率。
     最后,是对前面叙述的理论的应用,也就是我们研究的目的:名片识别芯片的设计。在这里,我们将我们开发过程中的一些思想、设计框架、硬件模块划分和软件模块划分等做了比较详细的介绍。因为本文是在一款手机的开发过程中要实现名片识别而进行的一系列的研究和软硬件的实现中来撰写的,所以在论文的撰写过程中,我们也只是对主要关键算法和模块进行说明,在论文中我们进行了以下的理论研究和实际项目开发的介绍。
     (1) BCR的前期预处理,如:格式转换,二值化,版面分析等等。
     (2) BCR的核心算法,主要是介绍了特征提取的一些方法和理论。
     (3) BCR的后处理的一些知识。
     (4) BCR在手机上的实现的项目的介绍。
Image-Processing application is more and more important in every walk of life, most of company have developed a lot of production with Image-Processing application.According to my research, the name card is more and more important to ourselves because of the business information In now daily life,.But in the most time,people find that manual input of the name card to the digital devices is very bored to us.We must input the name, position,telephone number,and others to the devices;We must modify if we input it as error;We must find the record when we use it and store it after we input.So many things are not funny to us.This article study and research the mehtods of business card recognition in the progress of a cell-phone case. In the head of the paper, we introduce the concept of the BCR, and give the characters of the business card image. In the pre-processing introduction, we will give the advanced method of Two-value method. And in the following chapters we will study the name-card character recognition,content recognition, late-processing. In the last, we give design flow-char and module design in the cell-phone case.In the society of technology and science, communication is more advance than before,more and more people has one cell-phones at least.And the cell-phone is the ordinary tool to business people.As our investigation,few cell-phone has the Business Card Recognition(BCR) function,but this function is important to these people.So we make a project of the cell-phone to implement the function of BCR.In the progress of the edition, we description the following item mainly:(1) Pre-precession of BCR,such as Image Capture, Data Exchange,Layout Analysis(2) Key algorithm of BCR.(3) later processing of BCR.(4) Implement the BCR on cell-phone.
引文
[1] Liu J H, Ding X Q, Wu Y S. "Description and Recognition of Form and Automated Form Data Entry. Proc. of 3rd" ICDAR, Canada, 1995
    [2] 夏德深,傅德胜等.现代图象处理技术与应用[M].南京:东南大学出版社,1997.
    [3] 章毓晋.图象工程(上册)图象处理和分析.北京:清华大学出版社,1999.
    [4] 章毓晋,图像工程(下册)——图像理解与计算机视觉.北京:清华大学出版社,1999.
    [5] Pavlidis T Zhou J,"PageSegmentation and Claasification". CVGIP:Graphical Models and Image Processing. 1992
    [6] Guo H, Ding X Q, Guo F X. "Realization of a high-performance bilingual Chinese-English OCR system. Proc. of 3rd" ICDAR, Canada, 1995
    [7] Saiga H, NakamuraY, Kitamura Y, Morita T. An OCR systemf or BusinessCards. Proc. of 2nd ICDAR, Japan, 1993
    [8] Kazem Taghva, Junichi Kanai, and Thomas A. Nartker, "An Evaluation of OCR Accuracy" ISRI 1993 Annual Research Report, pp.9-20, 1993
    [9] Toyohide Watanade, and Xiao Huang, "Automatic Acquisition fo Layout Knowledge of Understandging Business Cards," ICDIR, 1997
    [10] Stephan Baumann, Majdi Ben Hadj Ali, Andreas Dengel, Thorsten J, Micheal Malburg, Achim Weigel, Claudia Wenzel, "Message Extraction from Printed Documents", ICDIR, 1997
    [11] Tin Kam Ho, and Henry S. Baird, "Large-Scale Simulation Studies in Image Pattern Recognition", IEEE Trans. On PAMI, vol.19, no.10, pp.1067-1079, 1997
    [12] Richard C. Angell, George E. Freund, and Peter Willett, "Automatic Spellting Correction Using a Trigram Similarity Measure," Information Procession and Management, 19:255-261, 1983
    [13] Patrick A. V. Hall and Geoff R. Dowling, "Approxmate String Matching", ACM Computing Surveys, 12, 1980
    [14] James L. Peterson, "Computer Programs for Detecting and Correcting Spelling Errors," Communications of the ACM, 23, 1980
    [15] R. M. Iyer and M. Ostendorf, Modeling Long Distance Dependence in Language:Topic Mixtures Versus Dynamic Cache Models. IEEE Transactions on Speech and Audio Processing 1999
    [16] Xu Zhiming, Wang Xiaolong, A New Linguistic Decoding Algorithm for Handwritten Chinese Character Recognition. Journal of Computer Science and Technology. 2000
    [17] 朱靖波姚天顺:中文信息自动抽取,东北大学学报 1998-2
    [18] 鲁松、白硕等:词距离的计算方法,自然语言理解与机器翻译2001-9-11
    [19] 王梦云、曹素青:基于字频向量的中文文本自动分类,情报学报2000第六期
    [20] 崔荣一、林景浩、朴勇军:基于人工神经网络的手写体朝鲜文字识别系统的设计,延边大学学报1999
    [21] 李建华、王晓龙:中文人名自动识别的一种有效方法,高技术通讯2002 2
    [22] 刘挺、吴岩、王开铸:基于信息抽取和文本生成的自动文摘系统设计,情报学报、1997年12月
    [23] 刘刚、张洪刚、郭军:基于变帧率训练的HMM汉语人名识别,中文信息学报第巧卷第Ⅰ期
    [24] 许晓斌、林碧琴等:用于连续语音识别的词汇搜索算法,北方交通大学学报 1998年12月
    犯李元祥、刘长松、丁晓青:一种利用校对信息的汉字识别自适应后处理方法,中文信息学报2000
    [25] 何新贵、彭甫阳:中文文本的关键词自动抽取和模糊分类,中文信息学报 第13卷第1期
    [26] 徐志明:统计语言模型研究及其在汉字识别中的应用,哈尔滨工业大学博士论文 2001年1月
    [27] 薛翠芳、郭炳炎,汉语文本特征词的抽取方法,情报学报2000年6月
    [28] 夏莹、马少平、孙茂松等:汉字文本识别的自动后处理,语言文字应用1997年第2期
    [29] 丁丰、袁保宗:一种基于最大墒原理的汉语实体提取方法,铁道学报2001年10月
    [30] 李元样、丁晓青;基于IHMM的汉语文本识别后处理研究,中文信息学报第13卷第4期
    [31] 林鸿飞、姚天顺:基于概念的中文文本可视化表示机制,小型微型计算机系统 2000年10月
    [32] 李元样、丁晓青、刘长松,一种墓于噪声信道模型的汉字识别后处理新方法,清华大学学报(自然科学版)2001年第41卷第1期
    [33] 曾黄麟:墓于粗集方法的一种文字识别,四川轻化工学院学报1998
    [34] 阳爱民、潘玉春:无词典的中文文档集特征词抽取方法,中国包装工业
    [35] 夏莹、常新功、马少平:利用上下文相关信息的汉字文本识别,中文信息学报 第10卷第1期
    [36] 谢旭东、丁晓青等:一个基于混合语言模型的日文识别后处理系统,中文信息学报 2001.9
    [37] 靳简明:集成汉英OCR系统识别中文名片,情报学报2000年6月
    [38] 李金宗,《模式识别导论》,高等教育出版社,1994
    [39] 郑人杰,《计算机软件测试技术》,清华大学出版社,1992
    [40] 蔡自兴,徐光枯,《人工智能及应用(第二版)》,清华大学出版社,1996

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700