基本信息
- 项目名称:
- 基于视觉的手势识别MP3设计
- 来源:
- 第十二届“挑战杯”省赛作品
- 小类:
- 信息技术
- 大类:
- 科技发明制作B类
- 简介:
- 此作品设计是基于视觉识别技术的基础上,使用微处理器控制摄像头采集视频,然后通过图像算法准确将人的手势从平面图像中分离出来,再经过图像抗干扰处理后识别出手的运动方向,进而控制播放器的歌曲切换、声音大小等操作,使人们摆脱了传统的按键控制,让MP3更人性化、智能化。
- 详细介绍:
- 无
作品专业信息
设计、发明的目的和基本思路、创新点、技术关键和主要技术指标
- 创新点:1、利用微处理器处理手势信息,以此来控制MP3的播放,摆脱传统的按键控制,使得MP3更智能化、人性化;2、利用嵌入式系统来处理图像,摆脱传统的计算机的处理,使设备更微型化,更廉价;3、图像处理的算法是通过颜色分割整合辨别法和运动目标识别法相结合,相比传统单一的算法更简洁,并且运用了一些快速算法以减少占用CPU运算量;4、采用简单手势就能与设备进行交互,这很大程度上的节省了人们学习使用设备的时间。 技术关键和主要指标:1、摄像头能够较准确的对环境进行图像采集;2、采集进来的图像经过图像压缩能够以最少的存储空间储存,减少设备的费用、面积,便于携带;3、图像处理的算法,使得能够精准的提取手的动作;4、把MP3整合进去,使得CPU通过摄像头提取出来的信息能够准确的控制MP3的播放。
科学性、先进性
- 基于视觉的手势识别技术是新一代人机交互的重要内容,使用微控制器通过摄像头理解人们的手势并做出相应的反应,使人们摆脱了传统的按键的控制,将改变人们的生产生活方式。现有的音响设备大多数要么是通过按键来控制的,要么是通过触摸屏来控制的,始终没有办法不去触摸播放器而控制这些设备。而本作品是通过摄像头采集人的手势并识别,以此来控制播放器的操作,摆脱了传统的按键控制,这正是当今社会智能化发展的一个方向。除此之外,传统的图像识别是基于计算机等一些比较高端的设备上,成本高,体积大,不方便携带。而该产品融入了现代新兴的图像识别的应用技术,把图像处理应用于微处理器上,突破计算机等高端设备体积大、成本高等缺点。
获奖情况及鉴定结果
- 无
作品所处阶段
- 整机调试
技术转让方式
- 无
作品可展示的形式
- 实物
使用说明,技术特点和优势,适应范围,推广前景的技术性说明,市场分析,经济效益预测
- 该作品的使用非常简单,启动开机开机按键后,就可以通过手的上下、左右移动等手势来控制MP3的增加音量、减少音量、上一首、下一首等操作。该技术的特点是通过利用微处理器ARM控制摄像头采集图像和数字图像信号的算法来提取手势信息并进行处理,以此来控制MP3播放,具有更智能化、人性化的优势,突破了传统MP3的使用。该技术也可以应用在家用的音响等设备上,使得音响等设备可以根据人的手势来控制,具有很高的便利性。当前社会经济的飞速发展,人们的生活水平不断地提升,对娱乐性的设备需求量急剧上升,因此对设备的设计要求也越往智能化和微型化。该作品具有一定创新突破,设计的功能也具有相当高的智能化,不但可以满足人们的精神需求,更能使人们的生活更加便利。由此可知其经济效益非常高。
同类课题研究水平概述
- 国外对手势识别的研究已有很长的历史,1991年富士通实验室完成了对46个手势符号的识别工作;J.Davis和M.Shah将戴上指尖具有高亮标记的视觉手套的手势作为系统的输入,可识别7种手势;Starner等在对美国手势中带有词性的40个词汇随机组成的句子识别率达到99.2%;K.Grobel和M.Assam从视频录像中提取特征,采用HMM技术识别262个孤立词,正确率为91.3%。 我国的高文、吴江琴等人给出了ANN与HMM的混合方法作为手势的训练识别方法,以增强识别方法的分类特性和减少模型的估计参数的个数,将ANN-HMM混合方法应用于有18个传感器的CyberGlove型号的数据手套的中国手势识别系统中,孤立词识别率为90%,简单语句级别率为92%。另外,清华大学远新、徐光佑等给出了一种基于视觉的动态孤立手势识别技术,借助于图像运动的变化参数模型和鲁棒回归分析,提出了一种基于运动分割的图像运动估计方法。基于图像运动参数,构造了两种表现变化模型分别作为手势的表现特征,利用最大最小优化算法来创建手势参考模板,并利用基于模板的分类技术进行识别,对12中手势的识别率超过90%。在进一步研究中,他们又给出了有关连续动态手势的识别,融合手势运动信息和皮肤颜色信息,进行复杂背景下的手势分割;通过结合手势的时序信息、运动表现及形状表现,提出动态手势的时空表现模型,并提出基于颜色、运动以及形状等多模式信息的分层融合策略抽取时空表现模型的参数,最后,提出了动态时空规整算法用于手势识别,对于12中手势,平均识别率高达97%。