用于水下作业场景图片识别的训练数据集构建方法技术

技术编号:23984954 阅读:24 留言:0更新日期:2020-04-29 13:05
本发明专利技术公开了一种用于水下作业场景图片识别的训练数据集构建方法,包括:对分类型存储的水下作业场景图片进行提取文本中心词和提取NDK近似重复关键帧的数据预处理操作,构造标志矩阵作为数据分析的原始数据矩阵,计算文本中心词之间的协方差矩阵和NDK之间的协方差矩阵,将原始数据矩阵Y变化为过渡矩阵W,在R型因子分析和Q型因子分析间建立联系,并根据线性代数对偶定理,通过R型因子分析简化Q型因子分析的计算过程,得到文本中心词的因子载荷矩阵,并对其进行正交旋转,从旋转后的因子载荷矩阵中选择出一类作业类型水下作业场景图片的训练集,依次对各作业类型的水下作业场景图片进行训练集样本筛选,构建最具代表性的样本训练集。

Training data set construction method for underwater scene image recognition

【技术实现步骤摘要】
用于水下作业场景图片识别的训练数据集构建方法
本专利技术涉及人工智能
,具体而言涉及一种用于水下作业场景图片识别的训练数据集构建方法。
技术介绍
ROV遥控无人潜水器在水下作业过程中拍摄到的场景图像具有重要的研究价值,当需要进行水下作业场景图像检索以分析ROV工作数据及水下场景信息时,选择合适的样本数据集进行训练,是准确检索出最具参考价值图像的重要保证。构建训练数据集需要了解分类区域大量参照数据和完整的水下地理环境以及作业知识。人工选择样本训练集工作方式枯燥、单调,划分结果因人而异,且选出的训练集代表性不足,不能达到全面的训练效果,而传统因子分析方法构建训练数据集,计算量大,耗时长,对样本数量较少的类型训练效果欠佳。
技术实现思路
本专利技术的目的在于提供一种用于水下作业场景图片识别的训练数据集构建方法,包括:对分类型存储的水下作业场景图片进行提取文本中心词和提取NDK近似重复关键帧的数据预处理操作,构造标志矩阵作为数据分析的原始数据矩阵,计算文本中心词之间的协方差矩阵和NDK之间的协方差矩阵,将原始数据矩阵Y变化为过渡矩阵W,在R型因子分析和Q型因子分析间建立联系,并根据线性代数对偶定理,通过R型因子分析简化Q型因子分析的计算过程,得到文本中心词的因子载荷矩阵,并对其进行正交旋转,从旋转后的因子载荷矩阵中选择出一类作业类型水下作业场景图片的训练集,依次对各作业类型的水下作业场景图片进行训练集样本筛选,构建最具代表性的样本训练集。为达成上述目的,结合图1,本专利技术提出一种用于水下作业场景图片识别的训练数据集构建方法,所述方法包括:S1:将采集到的水下作业场景图片按照作业类型存储至不同的文件目录,以水下作业场景图片的文字描述作为水下作业场景图片文件的名称。S2:根据作业类型对水下作业场景图片进行数据预处理,包括提取文本中心词和提取NDK近似重复关键帧,所述文本中心词表示水下作业场景图片中包含的文本信息,所述NDK近似重复关键帧表示水下作业场景图片中包含的图像信息。S3:将NDK近似重复关键帧作为行数据,文本中心词作为列数据,构造标志矩阵Y,所述标志矩阵Y表示所有水下作业场景图片信息,作为数据分析的原始数据矩阵,其中,NDK近似重复关键帧为数据样本,T文本中心词为变量:S4:将原始数据矩阵Y转化为归一化概率矩阵G:G=(Gij)=Y/T其中,定义Gi.为原始数据矩阵Y中相同NDK近似重复关键帧的行上所有元素之和,定义G.j为原始数据矩阵Y中相同文本中心词的列上所有元素之和,S5:计算文本中心词之间的协方差矩阵和NDK之间的协方差矩阵,将原始数据矩阵Y变化为过渡矩阵W,所述过渡矩阵W的元素将NDK的协方差矩阵和文本中心词的协方差矩阵建立关联,进而在R型因子分析和Q型因子分析间建立联系。S6:计算NDK协方差矩阵的特征值和特征向量进行R型因子分析,根据线性代数对偶定理,计算文本中心词协方差矩阵的特征向量进行Q型因子分析,或者,计算文本中心词协方差矩阵的特征值和特征向量进行Q型因子分析,根据线性代数对偶定理,计算NDK协方差矩阵的特征向量进行R型因子分析。S7:根据对偶定理,通过NDK协方差矩阵的特征值和特征向量得到文本中心词的特征向量,并以此为依据得到文本中心词的因子载荷矩阵Z,将所述因子载荷矩阵Z进行正交旋转,得到旋转后的因子载荷矩阵Z*,从旋转后的因子载荷矩阵Z*选择出该类作业类型水下作业场景图片中的训练集。S8:重复步骤S2至S7,依次对各作业类型的水下作业场景图片进行训练集样本筛选,构建出样本训练集。进一步的,步骤S2中,所述提取文本中心词的过程包括:S211:从水下作业场景图片文件的名称中提取出中心词。S212:采用基于词频的卡方统计法,计算每个提取出的中心词基于出现频率的卡方值PCHI:PCHI=CHI×F(k,t)其中,CHI为中心词k的传统卡方值,由传统卡方统计公式计算得到:t为该作业类型任务的主题,N为同一作业类型水下作业场景图片中提取出的中心词总数。A为包含中心词k且符合主题t的中心词数;B为包含中心词k但不符合主题t的中心词数;C为不包含中心词k但符合主题t的中心词数;D为不包含中心词k且不符合主题t的中心词数。为中心词k在主题t中出现的频率,其中,Nk为主题t中包含中心词k的个数,Nt为主题t中所有中心词的个数。S213:计算所有中心词的PCHI值以及PCHI平均值。S214:选取PCHI值高于PCHI平均值的中心词,作为该作业类型水下作业场景图片所包含的文本中心词,构成的文本中心词数据集为水下作业场景图片中所包含的文本信息。进一步的,所述提取NDK近似重复关键帧的过程包括:S221:将每幅水下作业场景图片以包含图像信息的关键点形式存储至数据库。S222:将从每一类作业类型的水下作业场景图片中提取的所有关键点组成关键点群,作为一个NDK近似重复关键帧,与该类水下作业场景图片中所包含的图像信息一一对应。S223:对比该类作业类型的所有NDK近似重复关键帧,去除重复的NDK近似重复关键帧,将剩余所有不重复的NDK近似重复关键帧作为该作业类型水下作业场景图片中所包含的图像信息。进一步的,步骤S5中,所述计算文本中心词之间的协方差矩阵和NDK之间的协方差矩阵,将原始数据矩阵Y变化为过渡矩阵W,所述过渡矩阵W的元素将NDK的协方差矩阵和文本中心词的协方差矩阵建立关联,进而在R型因子分析和Q型因子分析间建立联系的过程包括:S51:将每个文本中心词点的坐标用各NDK在所述文本中心词中的权重表示,构建概率权重矩阵W:其中,S52:根据各NDK在所有文本中心词中占比不同,采用加权距离D描述第i个NDK的第a个文本中心词和第b个文本中心词之间的相关程度:S53:简化加权距离D,在R型因子分析中定义每个文本中心词为向量Wj*:所有文本中心词对应第i个NDK的概率平均值Ai为:其中,G.j为第j个文本中心词列上所有概率之和。S54:计算第x个NDK和第y个NDK之间的协方差dxy:假设,得到第x个NDK和第y个NDK之间的协方差矩阵D为:D=(dxy)m×m=WWT。S55:在Q型因子分析中定义每个NDK点为向量所述NDK点表示第i个NDK在特征空间中的位置,所有NDK点对应第j个文本中心词的概率平均值Aj为:其中,Gi.为第i个NDK行上所有概率之和。S56:计算得到第u个文本中心词和第v个文本中心词之间的协方差矩阵B为:B=(buv)n×n=WTW。进一步的,步骤S6中,所述计算NDK协方差矩阵的特征值和特征向量进行R型因子分析,根据线性代数对偶定理,计算文本中心词协方差矩阵的特征向量进行Q型因子分析,或者,计算文本中心词协方差本文档来自技高网...

【技术保护点】
1.一种用于水下作业场景图片识别的训练数据集构建方法,其特征在于,所述方法包括:/nS1:将采集到的水下作业场景图片按照作业类型存储至不同的文件目录,以水下作业场景图片的文字描述作为水下作业场景图片文件的名称;/nS2:根据作业类型对水下作业场景图片进行数据预处理,包括提取文本中心词和提取NDK近似重复关键帧,所述文本中心词表示水下作业场景图片中包含的文本信息,所述NDK近似重复关键帧表示水下作业场景图片中包含的图像信息;/nS3:将NDK近似重复关键帧作为行数据,文本中心词作为列数据,构造标志矩阵Y,所述标志矩阵Y表示所有水下作业场景图片信息,作为数据分析的原始数据矩阵,其中,NDK近似重复关键帧为数据样本,T文本中心词为变量:/n

【技术特征摘要】
1.一种用于水下作业场景图片识别的训练数据集构建方法,其特征在于,所述方法包括:
S1:将采集到的水下作业场景图片按照作业类型存储至不同的文件目录,以水下作业场景图片的文字描述作为水下作业场景图片文件的名称;
S2:根据作业类型对水下作业场景图片进行数据预处理,包括提取文本中心词和提取NDK近似重复关键帧,所述文本中心词表示水下作业场景图片中包含的文本信息,所述NDK近似重复关键帧表示水下作业场景图片中包含的图像信息;
S3:将NDK近似重复关键帧作为行数据,文本中心词作为列数据,构造标志矩阵Y,所述标志矩阵Y表示所有水下作业场景图片信息,作为数据分析的原始数据矩阵,其中,NDK近似重复关键帧为数据样本,T文本中心词为变量:



S4:将原始数据矩阵Y转化为归一化概率矩阵G:
G=(Gij)=Y/T
其中,
定义Gi.为原始数据矩阵Y中相同NDK近似重复关键帧的行上所有元素之和,
定义G.j为原始数据矩阵Y中相同文本中心词的列上所有元素之和,
S5:计算文本中心词之间的协方差矩阵和NDK之间的协方差矩阵,将原始数据矩阵Y变化为过渡矩阵W,所述过渡矩阵W的元素将NDK的协方差矩阵和文本中心词的协方差矩阵建立关联,进而在R型因子分析和Q型因子分析间建立联系;
S6:计算NDK协方差矩阵的特征值和特征向量进行R型因子分析,根据线性代数对偶定理,计算文本中心词协方差矩阵的特征向量进行Q型因子分析,或者,计算文本中心词协方差矩阵的特征值和特征向量进行Q型因子分析,根据线性代数对偶定理,计算NDK协方差矩阵的特征向量进行R型因子分析;
S7:根据对偶定理,通过NDK协方差矩阵的特征值和特征向量得到文本中心词的特征向量,并以此为依据得到文本中心词的因子载荷矩阵Z,将所述因子载荷矩阵Z进行正交旋转,得到旋转后的因子载荷矩阵Z*,从旋转后的因子载荷矩阵Z*选择出该类作业类型水下作业场景图片中的训练集;
S8:重复步骤S2至S7,依次对各作业类型的水下作业场景图片进行训练集样本筛选,构建出样本训练集。


2.根据权利要求1所述的用于水下作业场景图片识别的训练数据集构建方法,其特征在于,步骤S2中,所述提取文本中心词的过程包括:
S211:从水下作业场景图片文件的名称中提取出中心词;
S212:采用基于词频的卡方统计法,计算每个提取出的中心词基于出现频率的卡方值PCHI:
PCHI=CHI×F(k,t)
其中,CHI为中心词k的传统卡方值,由传统卡方统计公式计算得到:



式中,t为该作业类型任务的主题,N为同一作业类型水下作业场景图片中提取出的中心词总数;
A为包含中心词k且符合主题t的中心词数;B为包含中心词k但不符合主题t的中心词数;C为不包含中心词k但符合主题t的中心词数;D为不包含中心词k且不符合主题t的中心词数;

为中心词k在主题t中出现的频率,其中,Nk为主题t中包含中心词k的个数,Nt为主题t中所有中心词的个数;
S213:计算所有中心词的PCHI值以及PCHI平均值;
S214:选取PCHI值高于PCHI平均值的中心词,作为该作业类型水下作业场景图片所包含的文本中心词,构成的文本中心词数据集为水下作业场景图片中所包含的文本信息。


3.根据权利要求1所述的用于水下作业场景图片识别的训练数据集构建方法,其特征在于,步骤S2中,所述提取NDK近似重复关键帧的过程包括:
S221:将每幅水下作业场景图片以包含图像信息的关键点形式存储至数据库;
S222:将从每一类作业类型的水下作业场景图片中提取的所有关键点组成关键点群,作为一个NDK近似重复关键帧,与该类水下作业场景图片中所包含的图像信息一一对应;
S223:对比该类作业类型的所有NDK近似重复关键帧,去除重复的NDK近似重复关键帧,将剩余所有不重复的NDK近似重复关键帧作为该作业类型水下作业场景图片中所包含的图像信息。


4.根据权利要求1所述的用于水下作业场景图片识别的训练数据集构建方法,...

【专利技术属性】
技术研发人员:杨雪刘静陈巍李佩娟陈伟夏细明郭铁铮温秀平陈国军耿冉冉
申请(专利权)人:南京工程学院
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1