主办单位: 共青团中央   中国科协   教育部   中国社会科学院   全国学联  

承办单位: 贵州大学     

基本信息

项目名称:
视听觉智能机器人
小类:
信息技术
简介:
本作品试图制具备阅读能力的人工智能机器人,使机器人掌握阅读能力,让它们能够看懂交通标志和地名,从而可以自己独立驾驶,独立“生活”。本机器人能会话,能阅读,能唱歌,能听懂人的意思,是人类的好帮手。
详细介绍:
本作品试图制具备阅读能力的人工智能机器人,使机器人掌握阅读能力,让它们能够看懂交通标志和地名,从而可以自己独立驾驶,独立“生活”。本机器人能会话,能阅读,能唱歌,能听懂人的意思,是人类的好帮手。

作品专业信息

设计、发明的目的和基本思路、创新点、技术关键和主要技术指标

作品设计: 该机器人可以使用图像识别、语音识别以及语音功能处理基本的行走任务。 基于计算机视觉和听觉认知计算,设计一款具有通过语音和视觉图像识别指令两个渠道来指挥机器人行为。虽然它的外形像一个简单的小车,但是它具备机器人的几个条件。 在本机器人系统内有一个强大的图像和语音处理系统,可以帮助它分析图像,分析语音信号,发出行动指令。比如,用户发出语音指令,需要机器人去扫垃圾,机器人接到指令后,开始安排路线,机器人按照路线行动,但是它必须要认识路线上的标志,知道该在哪里转弯,然后找到用户需要的品牌。如果它没有阅读能力,要完成这些任务是不可能的。当然,机器人除了需要阅读能力外,一些基本的户外活动能力也是必需的,比如它需要知道走人行道,需要识别障碍物,不至于被障碍物绊倒,也不会和其他行人相撞。它还要学会识别红绿灯,知道绿灯行、红灯停。即使在绿灯的时候,它还要学会避让快速穿过的警车、救护车和消防车。 基本思路: 1、利用摄像头实时采集的图像信息,通过图像处理和模式识别算法,来识别汉字,障碍物,从而指导其前行。 2、通过采集到的语音指令来控制其行动。 3.能够根据语音或文字识别,来控制机器人的行走动作,如前进、后退、左转、右转,唱歌等。 创新点: 设计的机器人可以使用图像识别、语音识别以及语音功能处理基本的行走任务。 技术关键:语音识别,汉字识别,汉字发音。 主要技术指标:智能避障、语音交互、字符识别。

科学性、先进性

本作品试图制具备阅读能力的人工智能机器人,使机器人掌握阅读能力,让它们能够看懂交通标志和地名,从而可以自己独立驾驶,独立“生活”。本机器人能会话,能阅读,能唱歌,能听懂人的意思,是人类的好帮手。

获奖情况及鉴定结果

作品所处阶段

试验中

技术转让方式

作品可展示的形式

录像,实物

使用说明,技术特点和优势,适应范围,推广前景的技术性说明,市场分析,经济效益预测

该作品使用简单,操作方便,打开主程序之后,可以选择两套控制方法,一种是语音指令控制,一种是图像识别控制。能够很好的控制车辆的行驶,应用前景十分广阔如:无人生产线,自动巡逻,井下探测等等

同类课题研究水平概述

阅读能力和听觉能力很重要 对于人类来说,会识字就基本上算是会阅读了,因为人类对读出声来的本国文字,很容易明白文字所蕴含的含义。比如,当我们念出“前进”两个字的时候,就知道继续走。然而,对于机器来说,识字是很难的事情。 会认字只是阅读能力的第一步,更重要的是要理解所看到的字词的具体含义。但是,这对人类很简单的事情对机器人来说就很更难了。当机器人看到“后退”二字时,它可以轻易地读出来,但是要让它理解“银行”的真正含义,并把所需完成的任务结合起来,则是一件难事。如果机器人能够正确地理解所看到的事物和标志,它就能够不需用户的帮助自由地活动了。 机器人如何进行阅读呢?其原理和人们进行阅读一样。当我们在街上看到某个标牌时,这个标牌在我们视网膜上会形成一个影像,然后通过视神经传递到大脑,我们掌管阅读的神经区域就能够认识它,并分析它的意义。对于机器人来说,这个过程会稍微复杂一些。它首先会把看到的标牌拍成照片输送到电脑中,电脑中的光学文字识别系统(OCR)需要先把图像中的文字识别出来,并转化为文本,然后再分析这些文本的含义。 机器人体内的光学文字识别系统有时也会出错,随着识别系统的不断完善,机器人麻烦用户的次数会越来越少。 牛津大学机器人专家伊格玛•珀斯纳博士表示,研制出具备阅读能力的机器人将是一项巨大进步。他在接受《新科学家》杂志采访时说:“有时候,你可以根据一个封闭房间上的标签准确判断可能在这个房间内找到什么。阅读能力能够帮助你探测无法直接看到的东西。”阅读机器人将来的一个重要用途是帮助人们完成购物和送快递等跑腿的工作,它要比人的信任度高得多,至少它不会偷看你的邮件,或是吞没你的贵重物品。还有一个重要的用途是抢险救灾,如果没有阅读能力,它在火灾中不知道该进入哪个楼层哪个房间。比如,消防人员发现8楼302房间有人被困,不会阅读的机器人就很难理解被困人究竟在哪里,而阅读机器人则可以顺利地找到房间。相信随着阅读机器人的不断进化,未来的机器人将成为我们生活中的好帮手。 然而,机器人在阅读方面却面临很大难度,很难判断看到的是什么,此外,它们仍无法阅读书写在曲面上的文字。图像识别方面,关键问题是对于汉字、字母的识别,当前大多数关于车辆中的识别只是仅仅对于简单路标符号的识别,汉字与字母等字符的识别难度较大。
建议反馈 返回顶部
Baidu
map