主办单位: 共青团中央   中国科协   教育部   中国社会科学院   全国学联  

承办单位: 贵州大学     

基本信息

项目名称:
--语音幽灵
小类:
信息技术
简介:
本项目的目的在于开发出一个适合于嵌入式平台使用的语音合成服务器,为嵌入式平台上需要将文本转换为语音的应用提供服务。该语音合成服务器转换速度快,支持普通话、粤语和英语三种语言。同时还开发了一个有声阅读器的客户端作为演示,其利用语音合成服务器提供的服务,能将指定的文本“读”出来。
详细介绍:
在当前数字信息技术和网络技术高速发展的后PC(Post-PC)时代,嵌入式系统已经广泛地渗透到科学研究、工程设计、军事技术、各类产业和商业文化艺术以及人们的日常生活等方方面面中。随着国内外各种嵌入式产品的进一步开发和推广,嵌入式技术越来越和人们的生活紧密结合。Linux从1991年问世到现在,短短的十几年时间已经发展成为功能强大、设计完善的操作系统之一;越来越多的企业和研发机构都转向嵌入式Linux的开发和研究上,在新兴的嵌入式操作系统领域内也获得了飞速发展。 在嵌入式设备,如在电子书、手机、智能玩具、信息家电和车载GPS上,语音合成技术有着越来越广泛的应用。采用全球卫星定位系统(GPS)来提供道路状况和定位信息是运输交通行业的一大趋势,几乎已成为未来车辆的必备设备。在车载GPS上加入语音技术,可使得驾驶员在眼与手忙的情况下,通过语音实时接受动态路况信息及通知、公告,及时获取感兴趣的车主个性化定制的信息,将平面显示导航上升到立体语音导航。在消费类产品中结合电子书,使电子书不仅可以看,还可以听! 随着移动通信的发展,手机日益普及,需求量成倍增长。手机作为移动通信终端正朝着小型化、多功能化、个性化方向发展。带有语音合成功能的手机,可以用语音播报来电号码,概述电子邮件内容,给予日程提醒,收听网络信息等。嵌入式语音技术还能在智能语音玩具、测量仪器等众多领域得到广泛应用。从发展趋势来看,语音技术在嵌入式设备上的全面运用已成为不可扭转的趋势。

作品图片

  • --语音幽灵
  • --语音幽灵
  • --语音幽灵
  • --语音幽灵
  • --语音幽灵

作品专业信息

设计、发明的目的和基本思路、创新点、技术关键和主要技术指标

在嵌入式设备,如在电子书、手机、智能玩具、信息家电和车载GPS上,语音合成技术有着越来越广泛的应用。采用全球卫星定位系统(GPS)来提供道路状况和定位信息是运输交通行业的一大趋势,几乎已成为未来车辆的必备设备。在车载GPS上加入语音技术,可使得驾驶员在眼与手忙的情况下,通过语音实时接受动态路况信息及通知、公告,及时获取感兴趣的车主个性化定制的信息,将平面显示导航上升到立体语音导航。在消费类产品中结合电子书,使电子书不仅可以看,还可以听! 随着移动通信的发展,手机日益普及,需求量成倍增长。手机作为移动通信终端正朝着小型化、多功能化、个性化方向发展。带有语音合成功能的手机,可以用语音播报来电号码,概述电子邮件内容,给予日程提醒,收听网络信息等。嵌入式语音技术还能在智能语音玩具、测量仪器等众多领域得到广泛应用。从发展趋势来看,语音技术在嵌入式设备上的全面运用已成为不可扭转的趋势。 语音合成,又称文语转换(Text to Speech)技术,能将任意文字信息实时转化为标准流畅的语音朗读出来,相当于给机器装上了人工嘴巴。它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是中文信息处理领域的一项前沿技术,解决的主要问题就是如何将文字信息转化为可听的声音信息,也即让机器像人一样开口说话。 利用语音合成技术还能增加产品使用的趣味性并降低使用门槛。例如:语音日程提醒、时间播报等更人性化的语音秘书功能,语音听网、听书,朗读各种来源的新闻及小说,对各种编辑软件实现有声语音校对等。

科学性、先进性

中文语音处理和语音合成,利用中文韵律等相关知识对中文语句进行分词、词性判断、注音、数字符号转换,语音合成通过查询中文语音库得到语音。我们将输入的文本采用恰当的技术手段分解成若干的字或词组,以此作为基本的拼接单位,将其对应的语音进行拼接,从而形成语音输出。这种方法的计算量小、计算速度快,而且合成语音自然度较高,显然比较适合于芯片性能较弱的嵌入式系统方面的应用。 本作品具有如下特性:  支持文本、txt文件、html文件和pdf文件的语音合成  提供普通话、粤语和英语三种语言的语音合成。客户端可以在请求包中指定语言。  语音合成服务器能为嵌入式平台上的所有应用提供语音合成服务,应用程序只需和服务器建立连接,并按指定的数据包格式发送请求,就能获得相应的语音数据。  语音合成速度快,占用系统资源少。

获奖情况及鉴定结果

2010年在广东技术师范学院校团委组织的“软件设计大赛”中获得一等奖

作品所处阶段

中试阶段

技术转让方式

暂无

作品可展示的形式

现场演示

使用说明,技术特点和优势,适应范围,推广前景的技术性说明,市场分析,经济效益预测

• 带有语音合成功能的手机,可以用语音播报来电号码,概述电子邮件内容,给予日程提醒,收听网络信息等。 • 在车载GPS上加入语音技术,可使得驾驶员在眼与手忙的情况下,通过语音实时接受动态路况信息及通知、公告,及时获取感兴趣的车主个性化定制的信息,将平面显示导航上升到立体语音导航。 • 通过电子图书、”会说话的书”, 利用"听书"的方式轻松地度过那漫长的旅途或者上下班时间。在闲暇时刻闭上眼睛悠然的收听喜爱的文章,给自己一个放松的机会; • 嵌入式语音技术还能在智能语音玩具、测量仪器等众多领域得到广泛应用。

同类课题研究水平概述

TTS作为一种诱人的新技术,如果能很好的嵌入到增值业务的应用中去,必将形成一个更好的应用前景。 目前中文TTS系统,比较著名的有:IBM,Microsoft,Fujitsu,科大讯飞,捷通华声等研究的系统。目前比较关键的就是中文韵律处理、符号数字、多音字、构词方面有较多的问题,需要不断研究,使得中文语音合成的自然化程度较高。   杭州音通软件有限公司是由国家教育部和浙江省人民政府联办并依托浙江大学而成立的高新技术公司,音通公司主要致力于计算机语音技术的研发并逐步开拓语音识别、语音流媒体传输等其它语音领域的研究。其核心技术(Intone_TTS)是具有自主知识产权的中文语音合成技术,在由浙江省科技厅组织的鉴定中被专家一致鉴定为国内领先地位,并已申请多项国家专利。 Intone_TTS是一套把文本信息转换为语音信息的开发工具包,为系统集成商、软件开发商提供了完备的接口函数和编程示例,使用户能够灵活的进行调用,并集成到其它应用系统中。接口需要语音合成运行库的支
建议反馈 返回顶部
Baidu
map