时间:2024-06-01
薛峰 朱强
摘要:伴随越来越多的人利用手机等移动设备处理日常工作以及生活中的各种事宜。本文基于Android系统技术平台对图文同步识别系统进行分析和研究,针对图形和文字不太规范,图文识别系统不明显等缺陷提出了相应的改进方案,尽可能对图文进行同步预览以及识别,结合系统实际运行过程中存在的问题,提出消噪、亮度均衡、阈值分割等质量提升处理措施,保证图文信息的识别率得到提升。
关键词:Android应用系统 图文同步 识别系统
中图分类号:TP391.41 文献标识码:A 文章编号:1007-9416(2016)09-0058-02
如何利用Android系统对软件进行研究和开发,逐渐成为目前相关领域工作人员需要研究和思考的问题,系统架构和开发模式将会对系统最终的运用成果产生直接的影响,智能手机系统中研究和开发所得的尚书七号、ABBYY FineReader都运用在手机扫描设备中。但是,其便捷性相对较低,而且图文信息处理较为繁琐,无法满足对文字进行识别和记录的需求,通过对终端设备图文信息进行识别能解决大型设备移动难度大、使用步骤繁杂等劣势,让办公和移动学习更加顺利进行。
1 系统知识理论
当前使用Android手机平台能够在一定程度上达到OCR等功能要求,通过这种移动系统使用和开发能够方便对各种不同接口函数进行使用,对各种不同的硬件设备进行调用,并实施编程开发,在对系统进行开发是要能够加大对相关开发工具的使用,包括Android SDK、Java JDK和Eclipse等。
1.1 JAVA技术支持
Java属于一种面向对象的编程语言。当前使用的主要目的就是让程序开发者能够一次完成编写,从而顺利运行,这就标志着从一个平台转移到另外平台,不需要对代码进行重新编译,Java应用程序一般会翻译成字节码,因此,无论哪种计算机体结构在所有的Java虚拟机上使用。Java语法来自于C++,但是,存在的差异的是配合语法结构化,一般面对对象编程,Java是作为一种面向对象的构成因素,一切的代码都属于类范围、对象除了浮点、整形、字符、布尔型,Java也改变了C++中会出错的指针、goto语句以及全局变量等。
1.2 Android编程技术
现阶段Android系统所具有的内核控制包括储存器、安全、进程、驱动程序模型和网络堆叠等几种。Android构件包括Linux Knrnel、Libraries、Applications等。针对移动设备应用程序来分析,界面设计给用户留下的首个印象关键点界面设计效果将会对用户的选择造成直接影响,Android工具开发期间提供了直接简单的设计方法和界面布局,开发者使用设计UI界面、XNL文件开发、利用简单有效的操作能够对交互按钮进行增加,对布局位置进行设计,对图片和文字格式进行调整,这种逻辑控制分开、界面设计从根本上提升了编程效率,程序员可以利用逻辑实现进行考虑。
2 程序设计
2.1 OCR功能模块
(1)预处理。预处理也是保证ORC功能模块实现的首要步骤,也是后期对图文信息进行操作的条件,因为图文信息受到自然环境因素的影响,包括空气中下雨、灰尘、光照缺乏、收集设备硬件的影响,从而让图文信息中的图文达到更加清晰。[3]所以,在对文本图像进行相应的识别和处理之前,首先要能够对其图文实施预处理,尽可能排除各种不良干扰因素可能会对识别结果造成的影响。(2)字符处理。在进行字符处理也是该程序相对重要的一个步骤,正确科学的字符处理也是保证相关功能、用户体验效果得到提升的主要途径,一般基本类型的核心所在就是OCR算法,该种算法能够出现相应的候选字符分级列表,包括特征提取和矩阵匹配两种。[4]Tesseract和Cuneiform两种不同的软件的使用可以通过相应的方法来完成字符识别,其中第二种方法也称之为自适应识别,并且利用能够更好地对第二次剩余的字母可信度形状进行认可。
2.2 系统设计
系统选择层次式的设计结构,如下图1所示,顶层属于用户操作的UI交互界面,主要是负责和用户的触屏点击等操作、识别结果进行显示。下面层次则是系统功能模块层,负责对业务逻辑进行处理,包括同步、批量以及联网识别等。同步识别模式包括对预览图文进行同步连续识别,用户在对拍摄图文进行预览的过程中能够看到相应的识别效果;批量识别模块能够对批量图文进行一次性识别,利用一键来获得电子书的效果;联网识别则能够对服务器端口进行识别接口,让性能较低的移动终端获得相应的支持;最后的图文处理层则主要是结合手机或者其他移动终端拍摄图文显示出的特点,结合图文的实际状况来提升引擎文字所具有的识别率,让图文能够更容易被识别。针对处理之后的图文文字实施文字识别,并且识别所得的结果返回到UI交互界面。
对软件图标进行点击之后就转入到功能选择系统,更好地完成实时、批量识别工作,全面系统地阅读文档资料。触摸面上面设置的图标一旦遭到触发就会让功能事件发生,并开始操作实时识别,通过单张图片、连续图片拍摄识别技术产生相应的功效,配合实际识别、手机联网等问题选择是否能够利用网络进行识别,并将获得的结果转变为文档信息资料。[6]通过系统本身所具有的批量识别技术挑选出需要调整的图文资料,配合图文的信息、质量来选择是否进行联网识别操作,结合储存位置选择文档,并将其打开阅读,完成相关操作之后则认为操作结束,返回到选取功能的界面,实际操作如图2所示。
3 系统实现
首先为预览图文同步识别,因为手机硬件之间存在差异,对图片的实际识别和处理速度、连续拍照时间间隔都存在较大的差异,因此,在对图文信息进行连续采集时不可能对固定时间间隔进行设定,避免出现文字信息识别、图文显示不对称等现象。所以,系统利用Android系统所提供的接口条件,在实际拍摄获得的预览图文帧信息,保证图文显示以及识别结果能够达到需求。其次,在对单张拍摄图文进行识别时,通过对取景框触碰来达到指定对焦的目的,按下拍照按钮就能够得到关于图文处理的相关数据,还能够在提升质量、识别处理工作之后在文档编辑框显示识别结果。[7]因为拍摄单张图文识别并非需要对图文数据进行联系采取,图文从获取到识别都是顺序完成,所以,只要选择单线程就能够独立完成。最后,文档阅读模块能够为用户提供更多的文档编辑和查阅操作,包括内置和外置阅读器,利用相应的系统选择需要查阅的文档,并将其内容读取到编辑框中加以显示,可进行编辑保存等。
4 结语
该系统的研究和开发基本上满资料查阅、场景记录等需求,利用OCR手机字符增强识别的方法能够让用户需求得到更好地满足,人性化体验的增加具有显著的市场价值,系统实现图文字符识别以及图文处理要求,但是,其存在一定的缺陷,例如技术不成熟、处理适度较慢,所以,需要对系统功能进行继续完善,对代码质量进行优化,这也是后期的研究发展方向。
参考文献
[1]杨飞,茅和华,温一军.基于Android的随身客户信息管理系统的设计与开发[J].沙洲职业工学院学报,2012(04):11-16.
[2]任伟嘉,何志毅,陈名松.Android平板电脑无线控制的计算机演示系统[J].计算机工程与设计,2015(02):556-561.
[3]王国裕,李玄华,张红升. Android应用框架层usb驱动设计及在DAB接收机上的应用[J].电子质量,2015(03):26-29.
[4]孔令来,王倩,季红.基于Android系统平台设计和实现电子书的阅读应用[J].电子制作,2013(24):50-55.
[5]鲍晓.基于Android平台的新闻资讯阅读软件的设计与实现[J].计算机应用,2013(S2):279-282+289.
[6]朱应丽,崔彦军,解建军.基于Android平台的信息采集传输系统设计[J].电脑与信息技术,2014(02):4-7.
[7]陈望挺,林满足,陈健,章跃,傅奇佳,竺乐庆.基于JSP和Android的C/S结构问卷系统[J].计算机应用,2013(03):886-889.
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!