主办单位: 共青团中央   中国科协   教育部   中国社会科学院   全国学联  

承办单位: 贵州大学     

基本信息

项目名称:
“Davinci”多维度混合图像检索引擎
小类:
信息技术
简介:
“Davinci”是以基于内容的图像搜索技术为基础,实现的多功能图像检索引擎。
详细介绍:
本系统在考察了现有搜索系统不足的基础上,结合各种内容分析与智能检索技术所设计的一套多维度混合图像检索引擎,实现用户既可根据图像内嵌入的文字检索图片与视频,又可根据图像相似度、颜色、是否有人脸等特征检索。同时还实现了基于未知特征学习的图像分类,以及从网络根据关键字与内容特征检索图片。

作品图片

  • “Davinci”多维度混合图像检索引擎
  • “Davinci”多维度混合图像检索引擎
  • “Davinci”多维度混合图像检索引擎
  • “Davinci”多维度混合图像检索引擎
  • “Davinci”多维度混合图像检索引擎

作品专业信息

设计、发明的目的和基本思路、创新点、技术关键和主要技术指标

本课题设计开发的是一个多维度混合图像检索引擎软件系统。 系统包括:基于内容的图像搜索、基于关注域的图像分类、基于纹理的特征识别方法以及网络搜索等。实现了用户既可根据关键字检索图片与视频,又可根据图像相似度、颜色、是否有人脸等特征检索。同时还实现了基于未知特征学习的图像分类,以及从网络根据关键字与内容特征检索图片。在研究过程中设计完整的检索框架和软件接口规范,并进行实验、测试与实践,使其在实际系统的运转和反馈过程中不断完善,适应未来发展的需求。 通过与现有大型图像内容检索引擎的功能和效果对比,可以发现本系统能够提供更多的内容检索功能,具有更加高效、准确的检索效果,满足实际的图像检索需求。(具体参见申报论文)

科学性、先进性

与现有图像检索系统的比较 与传统的基于文本检索相比较,本系统直接从媒体内容中提取特征线索,突破了基于文本检索的局限,提供更多样的检索方式。与Google、Baidu的基于内容图像检索比较可以发现,本系统提供了基于图像、视频包含文字检索、以图片为检索条件的相似判断检索、基于未知特征的图像分类、人脸检索等更多的检索功能,检索效果与现有检索引擎效果相当,而本系统能够提供更多的内容检索功能,满足实际的图像检索需求。(详细比较参见申报正文)

获奖情况及鉴定结果

1.获浙江工业大学“运河杯”学生课外学术科技作品竞赛特等奖 2.本系统第一期已于2009年10月获得软件著作权保护(著作权号:2009SR059146) 3.已经在“杭州新世纪”公司的电力设备图像自动归类系统中试用 4.拟在“淘宝(中国)软件有限公司”的图想项目中应用

作品所处阶段

中试阶段

技术转让方式

软件

作品可展示的形式

磁盘,现场演示

使用说明,技术特点和优势,适应范围,推广前景的技术性说明,市场分析,经济效益预测

作用说明及技术特点和优势 本系统包括图形用户界面、预处理、网络检索、特征库生成、图像检索和特征数据库六个子系统,提供了美观的界面和灵活的检索方式,实现用户既可根据关键字检索图片与视频,又可根据图像相似度、颜色、是否有人脸等特征检索。同时还实现了基于未知特征学习的图像分类,以及从网络根据关键字与内容特征检索图片。本系统第一期已于2009年10月获得软件著作权保护(著作权号:2009SR059146)。 作品的适应范围、推广范围和推广前景 本作品的成果将为今后的进一步研究提供重要的支持和保障,理论方面的成果可以为长期的研究提供思路和准备,工程方面的成果可用于商业搜索引擎、多媒体信息检索研究、人工智能应用研究。 本系统可以广泛地应用于多个领域,如公共信息业、广告、教育、医学、商业及娱乐等。系统可以建立高效的图像检索机制,提高图像信息的获取效率,从而解决图像检索的难点,创造较好的经济效益。

同类课题研究水平概述

据统计,人类接受的外部信息70%以上来自视觉,图像和视频作为一种内容丰富、表现直观的多媒体信息被大量广泛的使用,如何有效的检索这些多媒体信息成为迫切需要解决的问题。传统的基于文本的检索无法满足海量环境下多媒体信息库的检索要求。为了克服基于文本查询的局限性,出现了基于内容的图像检索、基于内容的视频检索。 现今,各种与图像相关的研究与应用领域都在快速发展,例如可视化娱乐、教育、生物医学、犯罪预防和图像数据库。这些大规模用数字信息存储的数据给CBIR(Content-Based Image Retrieval基于内容的图像检索)带来了挑战性的搜索问题。近些年来,对基于内容的图像搜索领域的研究开始变得非常活跃。在CBIR的研究中包含了很多不同的领域,例如计算机视觉、机器学习、信息获取、人机交互、数据挖掘、数据库管理、信息理论等等。现在,随着研究人员和工程师对该研究领域的不断关注,在CBIR中出现了一些交叉领域,因而更促进了该研究方向的快速发展。 CBIR系统的目的就是获取与用户查询相关的所有图像。这种方法与基于文本的搜索系统不同,一个图片搜索引擎能够分析出数据库中每个图像的内容和对象,并根据用户查询的相关等级进行划分。搜索内容的机器理解过程是先从图像中提取语义信息,然后依据用户的查询要求,以形式语言的方式来表达用户的需求。举例来说,一个基于内容的搜索引擎以某种基于预先提取的和存储索引的方式来整理图像信息,再依据这些抽象的数据信息来查询数据库,从而获取与用户所提交的查询内容最相似的图像。 当前许多研究机构和大学已经对CBVR进行了大量的研究工作,并且开发出部分实验性的图像/视频检索原型系统。国外比较典型的检索系统有:法国信息研究院开发的LIG系统,IBM的Almaden实验室开发的QBIC图像视频检索系统,加州大学开发的基于LSCOM 语义检测器的 Cuvid系统,VIRAGE公司的VIR(Visual Information Retrieval)图像引擎,哥伦比亚大学开发的面向对象的视频查询系统ViedeoQ。国内的主要研究有:复旦大学的交互式视频检索系统,清华大学目前在研究基于内容的新闻视频的镜头特征提取、索引和摘要等。国防科技大学多媒体研究中心研究开发出多媒体信息查询和检索系统以及基于新闻节目浏览的检索系统。
建议反馈 返回顶部
Baidu
map