图像内容语义标注方法技术

技术编号：2947161 阅读：199 留言：0更新日期：2012-04-11 18:40

本发明专利技术公开了一种图像内容语义标注方法。它将图像处理技术和机器学习技术以及自然语言处理等相关技术结合起来实现对图像内容的语义标注：利用图像处理、机器学习和自然语言语义处理等技术，将图像视觉特征的语义标注术和图像文本特征语义标注结合起来对图像内容进行语义标注；同时还支持根据具体用户的标注特点校正底层的标注映射规则库，使得标注结果更加符合具体用户的标注需求。本发明专利技术的图像内容语义标注方法能够广泛应用于需要进行图像检索的各个应用当中，它提高了现存图像内容标注方法的标注精确度并且拓展了它的适用范围，直接为图像检索方法的改进提供了有力的推动。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种图像标注的，特别涉及使用图像处理技术、自然语言处理技术和机器学习技术，利用图像内容的视觉特征和相关文本等属性信息对图像内容进行语义标注。
技术介绍
近年来随着日益改进的数字图象技术以及因特网的简易可用性，数字图像的普及性正在迅速增长，每天有越来越多的数字图象变为可用。设计一个能够快速准确地检索用户需要的图像的方法有着巨大的现实意义。目前主要有两种图像检索方式。一种是基于图像关键字的检索，另一种是基于内容的图像检索CBIR，它们之间的差别在于图像内容的标注方式不同。被应用于图像关键字检索的图像关键字标注目前主要有两种方法生成一个或多个人手工选择的关键字标注、图像关键字标注自动生成装置自动生成。1)人工生成图像关键字标注是早期图像检索方法中的主要方法，与图像关键字标注自动生成方法相比有精确度高的特点。但是人工生成图像关键字标注方法主要有两个缺点一是需要手工检查并且仔细标注每一图像，这些步骤需要大量的劳动且成本非常高，尤其是随着因特网的普及和数字图像规模越来越大的情况下；二是不同的用户由于各自的世界观和专业领域知识，对于相同的图像的内容有着各自的理解因而对图像做出不同的语义标注，这导致了图像内容语义标注的不一致性。2)图像关键字标注自动生成装置主要是利用除图像内容之外的其它属性信息来生成图像关键字标注。目前图像关键字自动标注方法主要针对因特网等一些附带丰富文本等相关信息的图像。这个方法和手工方法相比最大的优势是不需要人工干涉，缺点是图像的精确度相对于手工方式来说比较低。近年来一些使用基于图像内容的图像检索的图像管理系统开始形成。通常，基于图...

【技术保护点】
一种图像内容语义标注方法，其特征在于：１）首先，通过图像语义标注接口将图像原始数据输入图像数据处理层，抽取出图像视觉特征数据和图像文本特征数据；２）其次，将步骤１）抽取出的图像视觉特征数据输入图像视觉特征标注层，这个模块能够完成以下的功能：首先访问预先建立的视觉特征标注映射规则库，抽取出和图像视觉特征相符的映射规则，然后访问图像内容语义标注映射存储层，从中取出和映射规则对应的标注作为图像视觉特征的语义标注；３）再次，将步骤１）抽取出的图像文本特征数据输入图像文本特征标注层，这个模块利用自然语言语义处理层中的自然语言语义处理技术抽取出图像文本特征数据的语义标注；４）最后，在图像内容语义标注层，使用自然语言语义处理技术，把图像视觉特征的语义标注和图像文本特征的语义标注融合起来作为图像内容语义标注输出，经过一个是否为学习模式的条件判断：如果处于学习模式下，将语义标注结果反馈给标注映射规则学习层；如果不是处于学习模式下，将语义标注结果输出给用户。

【技术特征摘要】

【专利技术属性】
技术研发人员：陈纯，卜佳俊，黄鹏，刘康苗，康志明，
申请(专利权)人：浙江大学，
类型：发明
国别省市：86[中国|杭州]

全部详细技术资料下载我是这个专利的主人