【技术实现步骤摘要】
一种基于类马氏相关性度量的跨媒体检索方法
本专利技术涉及一种跨媒体检索方法,特别涉及一种基于类马氏相关性度量的跨媒体检索方法。
技术介绍
跨媒体检索是近年来提出的一个新的概念,传统的检索方式基本都是单模态检索,即文本检索文本,图像检索图像,音频检索音频或视频检索视频,最典型的代表是百度、google、yahoo等商业大众信息检索引擎和酷狗、youtube等音乐和视频检索平台,它们的实现都是在文字标注的基础上实现的。因为市场的需求,跨媒体检索成为近年来的研究热点。跨媒体在多媒体的基础上利用各种媒体的形式和特征对相同或相关的信息用不同的媒体表达形式进行处理,由此达到存储、检索和交换等目的。在跨媒体信息环境下,用户提交一种媒体对象作为查询示例,检索系统可以返回不同种类的其它媒体对象,以满足客户的多种感官体验,如利用图像示例检索语义相关的音频或视频片段。跨媒体间的相关性是指同一事物的不同模态的媒体在底层特征上存在潜在相关性,通过对这些数据用特定的数据方法关联,可得到它们之间相关性的度量,最终的检索结果根据相关性高低排序。由于跨媒体检索涉及到不同媒体的底层特征数据的提取和不 ...
【技术保护点】
一种基于类马氏相关性度量的跨媒体检索方法,包括以下步骤:步骤一:输入文本、图像数据库;步骤二:将文本、图像数据库中的文本和图像分别存入不同文档,并把文本和图像都分为训练集和测试集;步骤三:对文本和图像各自的训练集和测试集提取特征,得到文本和图像各自的训练特征集和测试特征集;步骤四:把文本和图像的特征集的数据统一到同一子空间;步骤五:应用类马氏距离公式计算统一到同一子空间后文本和图像测试集之间的相关性;步骤六:根据文本和图像本身所属的类和步骤五所得的马氏距离,用平均精确度指标和召回率指标确定检索精度。
【技术特征摘要】
1.一种基于类马氏相关性度量的跨媒体检索方法,包括以下步骤:步骤一:输入文本、图像数据库;步骤二:将文本、图像数据库中的文本和图像分别存入不同文档,并把文本和图像都分为训练集和测试集;步骤三:对文本和图像各自的训练集和测试集提取特征,得到文本和图像各自的训练特征集和测试特征集;步骤四:把文本和图像的特征集的数据统一到同一子空间;步骤五:应用类马氏距离公式计算统一到同一子空间后文本和图像测试集之间的相关性;步骤六:根据文本和图像本身所属的类和步骤五所得的马氏距离,用平均精确度指标和召回率指标确定检索精度。2.根据权利要求1所述的基于类马氏相关性度量的跨媒体检索方法,其特征在于:所述步骤二中,文本、图像数据库中文本、图像对的数量为P,文本和图像的训练集的样本量均为n,文本和图像的测试集的样本量均为m,步骤二具体步骤为:文本数据集作为一个子目录存储于文本图像数据库文件下,且文本数据集文档目录下包含训练集和测试集两个子目录,文本训练集样本量占整个文本数据集样本量的75%,文本测试集样本量占文本数据集样本量的25%;图像数据集作为一个子目录存储于文本图像数据库文件下,且图像数据集文档目录下包含训练集和测试集两个子目录,图像训练集样本量占整个图像数据集样本量的75%,图像测试集样本量占图像数据集样本量的25%。3.根据权利要求2所述的基于类马氏相关性度量的跨媒体检索方法,其特征在于:所述步骤三具体步骤为:对文本的训练集和测试集用LDA算法提取K个特征,记训练特征集为X,其中X=[x1,x2,…,xn];测试特征集为Xte,其中Xte=[u1,u2,…,um],xi、uj都是K维数据,一个特征代表一维,其中i=1,2,3,…,n、j=1,2,3,…,m;对图像的训练集和测试集用SIFT算法提取L个特征,记训练特征集为Y,其中Y=[y1,y2,…,yn];测试特征集为Yte,其中Yte=[h1,h2,…,hm],yi、hj均为L维数据,其中i=1,2,3,…,n、j=1,2,3,…,m。4.根据权利要求3...
【专利技术属性】
技术研发人员:裴廷睿,吴海滨,赵津锋,曹江莲,田淑娟,
申请(专利权)人:湘潭大学,
类型:发明
国别省市:湖南,43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。