一种挖掘图像主体信息的方法和装置制造方法及图纸

技术编号:9765901 阅读:125 留言:0更新日期:2014-03-15 11:33
本发明专利技术公开了一种挖掘图像主体信息的方法,包括:获取图像及其标注信息;利用训练数据获取所述图像标注信息的支持信息列表;从所述支持信息列表中提取所述图像的主体信息。本发明专利技术实施可以相对准确的挖掘出图像的主体信息,排除了该图像标注信息或注释信息中不必要的干扰描述,提高了数据搜索的准确度。

【技术实现步骤摘要】
一种挖掘图像主体信息的方法和装置
本专利技术涉及数据处理的
,具体涉及一种挖掘图像主体信息的方法和装置。
技术介绍
随着互联网和多媒体技术的飞速发展,互联网上的图像资源日益丰富,从网络上获取的图像资源也往往包含多种多样的信息,如背景、时间、地点、主体等等,而如此多的信息在通常情况下并非是用户真正所要关注的内容;例如,在浏览时事新闻网页时往往会出现多个图像,而用户对于新闻中的图像可能只关注时间和地点;而用户在浏览体育新闻网页时,可能只关注出现的多个图像中的人物和背景等;但是,在上述情形下,用户从网络上获取的图像资源往往只有该图像的注释或标注信息等,并且由于所获取图像包含的海量信息,其注释或标注信息并不能准确给出该图像的主体信息;例如,对于用户在浏览体育新闻网页时出现的配图,用户只能通过新闻标题和文章概要猜测配图所要表达的内容,并不能准确获知该配图的人物信息。因此,如何在网络环境下实现对于图像的挖掘,从而准确获取该图像的主体信息就变得十分必要和迫切。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的一种挖掘图像主体信息的方法和相应的一种挖本文档来自技高网...
一种挖掘图像主体信息的方法和装置

【技术保护点】
一种挖掘图像主体信息的方法,包括:获取图像及其标注信息;利用训练数据获取所述图像标注信息的支持信息列表;从所述支持信息列表中提取所述图像的主体信息。

【技术特征摘要】
1.一种挖掘图像主体信息的方法,包括:获取图像及其标注信息;利用训练数据获取所述图像标注信息的支持信息列表;从所述支持信息列表中提取所述图像的主体信息;所述利用训练数据获取图像标注信息的支持信息列表包括:获取所述图像标注信息的中间数据;从图像数据库中提取与所述中间数据相关的训练数据;计算所述训练数据与所述中间数据的第一相关性分值;利用所述第一相关性分值生成所述图像标注信息的支持信息列表。2.如权利要求1所述的方法,其特征在于,所述计算训练数据与所述中间数据的第一相关性分值包括:计算训练数据与所述中间数据的相关性权值并求和E1;将所有训练数据与所述中间数据的相关性权值进行累加处理并求和E2;通过计算所述E2与所述E1的比值确定该训练数据与所述中间数据的第一相关性分值。3.如权利要求1所述的方法,其特征在于,还包括:在确定训练数据与中间数据的第一相关性分值之后进行所述训练数据的去噪处理。4.如权利要求3所述的方法,其特征在于,所述进行训练数据的去噪处理包括:计算与任一训练数据相同步长的其他训练数据与所有训练数据的相关性权值,将该相关性权值进行累加处理并求和后确定该任一训练数据的噪声权值F1;将所有训练数据的噪声进行累加处理并求和后确定所有训练数据的总噪声权值F2;通过获取所述第一相关性分值与所述训练数据的噪声值之差确定所述训练数据与所述中间数据的第二相关性分值;其中,所述F1与所述F2的比值为所述训练数据的噪声值。5.如权利要求1所述的方法,其特征在于,所述从支持信息列表中提取所述图像的主体信息包括:获取所述图像标注信息的所有中间数据及其相关训练数据;通过统计相同训练数据在所述支持信息列表中的分值计算每个中间数据的得分;判断所述每个中间数据的得分与预设阈值的大小,当一中间数据的得分不小于所述预设阈值,则确定该中间数据为所述图像的主体信息。6.一种挖掘图像主体信息的装置,包括:获取单元,用于获取图像及其标注信息;生成单...

【专利技术属性】
技术研发人员:陶哲薛红霞白明韩玉刚
申请(专利权)人:北京奇虎科技有限公司奇智软件北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1