A method of image retrieval for underwater scene includes the following steps: data storage; extraction of search event subject; data preprocessing; correlation calculation. The invention aims at the large number of underwater operation pictures collected by ROV, but can be stored according to the operation, and has the characteristics of partial text description, making full use of the text information and image information contained in the pictures, and obtaining the picture retrieval results in a more efficient way. And the retrieval results are arranged in descending order of correlation, which is more convenient to view the results. The implementation of this technology can solve the problem of mass image deletion and selection, provide accurate reference data for advanced application analysis of specific underwater operation tasks, improve the accuracy of application analysis data, and provide strong technical support for better underwater operation tasks.
【技术实现步骤摘要】
一种针对水下作业场景的图片检索方法
本专利技术涉及图像处理
,尤其涉及一种针对水下作业场景的图片搜索方法。
技术介绍
在图像数据领域,当对摄像头采集到的各种作业图像进行去重、检索、比对等操作时,需要从成百上千张图片中搜索相关度最高的图片。目前很多的图片检索方法都是针对两张图片的相似性进行大量计算得到的结果,在待比对图片量较大的情况下耗时长;有的方法则在检索过程中损失掉大量图片信息,造成图片检索准确性低;另外水下作业图像为ROV摄像头在水下作业时获得,作业场景具有特定类型,且存储时要附少量文字说明,传统图片检索方法仅对图像信息进行分析,而忽略了文字说明部分包含的信息。因此,在兼顾计算量和检索精度的同时,提高检索效率,成为了水下作业场景图片检索亟待解决的问题。
技术实现思路
本专利技术针对现有技术中的不足,提供一种针对水下作业场景的图片检索方法,旨在减少计算时间、提高检索精度,从而提高检索效率。为实现上述目的,本专利技术采用以下技术方案:一种针对水下作业场景的图片检索方法,其特征在于,包括如下步骤:步骤1:将所有图片按水下作业类型分类存放,图片文件以文字说明作为文件名;步骤2:从搜索主题事件中提取出要检索内容的事件中心词数据集;步骤3:提取图片中包含的文本信息,构造出代表图片文本信息的文本中心词汇数据集;步骤4:提取图片中包含的图像信息,构造出代表图片图像信息的标志矩阵;步骤5:计算图片中包含的文本信息与搜索主题事件中所有事件中心词的相关性 ...
【技术保护点】
1.一种针对水下作业场景的图片检索方法,其特征在于,包括如下步骤:/n步骤1:将所有图片按水下作业类型分类存放,图片文件以文字说明作为文件名;/n步骤2:从搜索主题事件中提取出要检索内容的事件中心词数据集;/n步骤3:提取图片中包含的文本信息,构造出代表图片文本信息的文本中心词汇数据集;/n步骤4:提取图片中包含的图像信息,构造出代表图片图像信息的标志矩阵;/n步骤5:计算图片中包含的文本信息与搜索主题事件中所有事件中心词的相关性;/n步骤6:计算图片中包含的图像信息与搜索主题事件中所有事件中心词的相关性;/n步骤7:综合图片中包含的文本信息、图像信息与搜索主题事件的相关性,得到最符合的搜索结果。/n
【技术特征摘要】
1.一种针对水下作业场景的图片检索方法,其特征在于,包括如下步骤:
步骤1:将所有图片按水下作业类型分类存放,图片文件以文字说明作为文件名;
步骤2:从搜索主题事件中提取出要检索内容的事件中心词数据集;
步骤3:提取图片中包含的文本信息,构造出代表图片文本信息的文本中心词汇数据集;
步骤4:提取图片中包含的图像信息,构造出代表图片图像信息的标志矩阵;
步骤5:计算图片中包含的文本信息与搜索主题事件中所有事件中心词的相关性;
步骤6:计算图片中包含的图像信息与搜索主题事件中所有事件中心词的相关性;
步骤7:综合图片中包含的文本信息、图像信息与搜索主题事件的相关性,得到最符合的搜索结果。
2.如权利要求1所述的一种针对水下作业场景的图片检索方法,其特征在于:所述步骤2中,利用TDT方法,从搜索主题事件中提取出其中包含的关键词,组成事件中心词数据集。
3.如权利要求1所述的一种针对水下作业场景的图片检索方法,其特征在于:所述步骤3具体如下:
利用word2vec软件工具,从图片文件名中提取出中心词;采用基于词频的卡方统计方法,计算出每个提取出的中心词基于出现频率的卡方值PCHI
PCHI=CHI×F(k,t)
其中
CHI为中心词k的传统卡方值,由传统卡方统计公式x2(k,t)计算得到,t为该类作业任务主题,N为同一类水下作业图片中提取出的中心词总数,A为包含中心词k的且符合主题t的中心词数,B为包含中心词k但不符合主题t的中心词数,C为不包含中心词k但符合主题t的中心词数,D为不包含中心词k且不符合主题t的中心词数;F(k,t)用于描述中心词k在主题t中出现的频率,Nk为主题t中包含中心词k的个数,Nt为主题t中所有中心词的个数;
计算所有中心词的PCHI值,高于平均值的中心词被选定为该类水下作业图片中包含的文本中心词,这些中心词组成的文本中心词汇数据集用于描述图片中包含的文本信息。
4.如权利要求1所述的一种针对水下作业场景的图片检索方法,其特征在于:所述步骤4具体如下:
采用非重复关键帧NDK提取方法,提取出每种类型图片的NDK来表示作业图片中包含的图像信息,计算出某个NDK属于某搜索主题事件的可能性K(NDKk,Er)
其中,|NDKk∩Er|表示NDKk和Er中含有的相同关键帧个数,|NDKk|表示含有NDKk这个非重复关键帧的水下作业图片类型数,Er表示第r个搜索主题事件,NDKk表示第k个NDK,各下标均表示编号;
比对每个NDK与搜索主题事件的事件中心词之间的关系,将获得最大K值的搜索主题事件作为该NDK的事件标签;最后构造出一个以每个NDK为行的开头,对应的事件标签为行的结尾,对应的文本中心词为行的中间内容的标志矩阵B。
5.如权利要求4所述的一种针对水下作业场景的图片检索方法,其特征在于:所述步骤5具体如下:
计算两个NDK之间的相关性C(NDKx,NDKy)
其中,|NDKx∩NDKy|表示同时含有NDKx和NDKy的水下作业图片类型数,Min(|NDKx|,|NDKy|)表示含有NDKx的水下作业图片类型数和含有NDKy的水下作业图片类型数中的较小值;取所有相关性的平均值为标准值,相关性高于平均值的两个NDK互为相邻NDK,而在矩阵B中与这两个NDK对应的文本中心词也为相邻文本中心词;重新构造的标志矩阵EB以每个NDK为行的开头,对应的事件标签为行的结尾,对应的文本中心词和相邻文本中心词为行的中间内容;
利用Jaccard相似性系数计算出标志矩阵EB中某一文本中心词与事件标签间的相关性S(Tk,Er)
其中,Tk表示出现在矩阵EB第k个NDK行上的文本中心词,Ta表示出现在其相邻NDK行上的文本中心词,且与第k个NDK具有相同的事件标签Er;n为第k个NDK行上对应的文本中心词的数量;
根据某一个NDK行所对应的具有相同事件标签的文本中心词之间的相似性,进而计算出某一NDKk与搜索主题事件之间的任意相关性S(NDKk,Er)
...
【专利技术属性】
技术研发人员:杨雪,陈巍,刘静,陈伟,夏细明,李佩娟,温秀平,郭铁铮,陈国军,
申请(专利权)人:南京工程学院,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。