主办单位: 共青团中央   中国科协   教育部   中国社会科学院   全国学联  

承办单位: 贵州大学     

基本信息

项目名称:
基于Android平台的云计算手写输入法
小类:
信息技术
简介:
本作品在Google Android手机操作系统上开发了一个手写输入法软件,并借助云计算技术,建立了一个云手写识别系统服务器,通过无线网络为移动用户提供高准确率手写识别、倾斜书写识别和用户自适应识别等服务
详细介绍:
云计算的提出,使得超级计算能力通过互联网自由流通成为了可能,并为各种应用开创了一种崭新的应用模式,逐渐发展成为一种网络应用趋势。超级计算机应用因需要非常昂贵的硬件投入面临着极高的推广门槛,云计算则通过互联网将普通的个人计算机和标准服务器结合成计算机机群,宣告了低成本提供超级计算服务的可能。用户在任何时间、任何地点,用任何可以连接至互联网的终端设备访问“云”即可获得所需服务。 与传统的移动终端手写识别系统相比,采用云计算的手写识别技术有着十分明显的优势: 1.更高的识别率。传统的高识别率算法受计算量、存储量等限制无法被用于移动终端,而采用云计算技术后,高精度的识别算法可运行于云计算服务器端,移动终端通过与服务器的数据传递,可以获得更准确的识别率。 2.更精简的移动终端系统。如上所述,由于主要的识别计算运行于云计算服务器端,移动终端上的识别系统可以牺牲较小的识别性能来换取大幅降低的识别引擎存储空间。通过基于子空间共享的矢量量化压缩技术,整体分类器字典的容量从76.4MB降到了2.06MB,大幅压缩了97.3%,而识别率则仅仅下降0.88%,仍然维持在97%以上的水平。因此可以更广泛的适用于存储空间有限的移动终端设备,且方便用户下载使用。 3.更快的服务器响应。使用云计算技术搭建服务器,通过负载均衡、请求分配等技术,能够获得远远优于普通服务器的性能。通过测试已得,与普通服务器相比,云计算服务器可以在更短的时间内,处理更多的并发用户数。云服务器的超级计算能力,为处理大量用户并发获取服务提供了良好的保障性和稳定性,从而大大提高用户体验性。 正是由于有着这些优势,使得云计算手写识别技术成为急待我们去研究解决的热点问题。在移动终端系统的选择中,我们选择了Android智能手机操作系统,作为一个极具发展潜力的操作系统,Android系统的全球智能手机市场占有率从2009年的3.5%增长到2010年的25.5%,并且于2011年2月推出了针对平板电脑的Android 3.0。选择Android客户端大大拓宽了本作品的商业应用价值。

作品图片

  • 基于Android平台的云计算手写输入法
  • 基于Android平台的云计算手写输入法
  • 基于Android平台的云计算手写输入法
  • 基于Android平台的云计算手写输入法
  • 基于Android平台的云计算手写输入法

作品专业信息

设计、发明的目的和基本思路、创新点、技术关键和主要技术指标

基本思路: 首先由用户输入未辨识的字符,识别系统先将采集到的这些信号作预处理,模式识别系统都有一个训练模块,用来训练产生用于识别的参考模型或者参考模式。用来训练的数据通常都是已标记类别的样本的特征矢量。通过一定的训练算法,将这些样本的统计特性训练出来,得出相应的参考模型或者参考模式。用户在书写后,书写笔迹通过2.5G、3G、WiFi等无线网络传输到云计算服务器端。服务器端采用Enomaly虚拟云架构设计,用户借助3G、WiFi等高速无线网络,移动终端和云服务器之间数据传输所需的时间非常小,用户难以感觉到明显的延时。同时,我们在云计算服务器端加入了倾斜书写识别、书写者自适应技术,为用户提供更好的用户体验。 技术关键: 1. Android智能操作系统; 2. 手写识别技术; 3. 云计算技术; 4. 增量学习技术; 5. 倾斜矫正技术; 6. 分类器压缩技术; 主要技术指标: 1)客户端识别率(平均) >= 97% 2)服务器端识别率(平均) >= 97.45% 3)工整输入识别率 >= 99% 4)连笔输入识别率 >= 96% 5) 旋转输入识别率 >= 93% 6)与服务器通信时间 < 16毫秒(300个并发用户) 7)存储空间 < 2MB 8)支持字符集:国标一二级字库6763类汉字,单子识别支持英文大小写字母,数字、常见符号等; 9)支持词典词汇量:>100,000个中文词组

科学性、先进性

1.云计算识别系统 实验结果表明,传统C/S模式的传统服务器在用户并发数为300时处理能力已经达到极限,而采用基于云计算架构的手写识别系统能轻松处理1000个并发用户的服务请求,在处理300个并发用户时,接入率为100%,平均识别处理时间仅为16ms,大大低于传统服务器模式的接入率(82.7%)和处理时间(340ms)。 2.实现了书写方向上的无约束 本作品提出一种中心平衡法,实现了无论用户以何种方向角度书写词组,识别系统都能将它识别出来。 3.特定用户自适应学习 本作品将传统的书写者无关的手写识别系统转化成为一个书写者相关的手写识别系统。实验结果表明,在利用增量学习技术对特定书写者的风格进行学习后,其平均错误率下降的比率超过51%。 4.极小的分类器存储量 本作品着力解决了高性能分类器MQDF的存储空间问题。利用子空间分布共享等技术对MQDF分类器进行压缩,降低其所需的存储量,使得MQDF分类器在手持设备上的应用成为可能。

获奖情况及鉴定结果

[1].2010年第一届中国云计算与SaaS学术会议 优秀论文奖。 [2].2010年中科院自动化所模式识别国家重点实验室,手写汉字识别评测联机系统识别率第一,脱机系统识别率第二。

作品所处阶段

试用阶段

技术转让方式

作品可展示的形式

实物,现场演示,图片

使用说明,技术特点和优势,适应范围,推广前景的技术性说明,市场分析,经济效益预测

技术特点和优势: 1、基于Enomaly虚拟云架构,将多台普通个人计算机和标准服务器利用网络结合起来组成超级计算机群,提供强劲的识别处理能力,保证用户的识别速度。 2、针对手写汉字的倾斜矫正算法,以实现旋转方向无关的手写识别。 3、在现有的LDA和MQDF算法中加入增量技术,实现特定用户自适应系统,提供更好的用户体验。 4、独创的两级压缩技术,将算法所需的巨大存储量极大程度的压缩. 适用范围: 本作品运行于Android操作平台,适用于手机、PDA、平板电脑等移动电子设备。 推广前景: 智能手机已不断取代传统手机进入人们的生活,智能手机的市场出货量从2009年的1.77亿部提高至2010年的3.02亿部,增幅高达71%。与此同时,作为新一代触摸屏操作系统,Android在2010年更是大放异彩,其智能手机在全球市场上的占有率从2009年的4%飙升到24%,在中国市场上由2008年的0.3%飙升至14.3%。

同类课题研究水平概述

在云计算时代,“云”会替我们做存储和计算的工作,“云”就是计算机群,每一个群包含几十万台、甚至上百万台计算机,“云”的好处在于其中的硬件、软件、信息、资料可以随时更新,保证“云”长生不老。云计算的主要三大形式如下: 1.软件即服务(Software-as-a-Service).SaaS是一种软件布局模型,其应用专为网络交付而设计。SaaS提供商为企业搭建信息化所需要的所有网络基础设施及软件、硬件运作平台,并负责所有前期的实施、后期的维护等一些列服务,省去了用户在服务器和软件授权上的开支。通过Internet,厂商将应用软件统一部署在自己的服务器上,用户根据自己的需求,通过互联网向厂商订购所需要的服务。 2.平台即服务(Platform-as-a-Service).PaaS提供给用户的服务是用户采用的开发语言和开发工具,它能够提供企业进行定制化研发的中间件平台,同时涵盖数据库和应用服务等,企业员工共享同一个开发平台,提高工作效率。此外,PaaS对于SaaS运营商来说,可以帮助他们进行产品多元化和产品定制化,用户可以基于他们的平台开发多种SaaS应用,使其成为多元化的软件供应商。 3.基础设施即服务(Infrastructure-as-a-Service).IaaS通过Internet为用户提供完善的计算机基础设施获得服务,包括处理、存储、网络和其它基本的计算资源,用户可以部署和运行任意软件,包括操作系统和应用程序。即用户可以在网络上获得一个虚拟的计算机资源。
建议反馈 返回顶部
Baidu
map