用于水下作业场景图片识别的训练数据集构建方法技术

技术编号：23984954 阅读：31 留言：0更新日期：2020-04-29 13:05

本发明专利技术公开了一种用于水下作业场景图片识别的训练数据集构建方法，包括：对分类型存储的水下作业场景图片进行提取文本中心词和提取NDK近似重复关键帧的数据预处理操作，构造标志矩阵作为数据分析的原始数据矩阵，计算文本中心词之间的协方差矩阵和NDK之间的协方差矩阵，将原始数据矩阵Y变化为过渡矩阵W，在R型因子分析和Q型因子分析间建立联系，并根据线性代数对偶定理，通过R型因子分析简化Q型因子分析的计算过程，得到文本中心词的因子载荷矩阵，并对其进行正交旋转，从旋转后的因子载荷矩阵中选择出一类作业类型水下作业场景图片的训练集，依次对各作业类型的水下作业场景图片进行训练集样本筛选，构建最具代表性的样本训练集。

Training data set construction method for underwater scene image recognition

全部详细技术资料下载

【技术实现步骤摘要】
用于水下作业场景图片识别的训练数据集构建方法
本专利技术涉及人工智能
，具体而言涉及一种用于水下作业场景图片识别的训练数据集构建方法。
技术介绍
ROV遥控无人潜水器在水下作业过程中拍摄到的场景图像具有重要的研究价值，当需要进行水下作业场景图像检索以分析ROV工作数据及水下场景信息时，选择合适的样本数据集进行训练，是准确检索出最具参考价值图像的重要保证。构建训练数据集需要了解分类区域大量参照数据和完整的水下地理环境以及作业知识。人工选择样本训练集工作方式枯燥、单调，划分结果因人而异，且选出的训练集代表性不足，不能达到全面的训练效果，而传统因子分析方法构建训练数据集，计算量大，耗时长，对样本数量较少的类型训练效果欠佳。
技术实现思路
本专利技术的目的在于提供一种用于水下作业场景图片识别的训练数据集构建方法，包括：对分类型存储的水下作业场景图片进行提取文本中心词和提取NDK近似重复关键帧的数据预处理操作，构造标志矩阵作为数据分析的原始数据矩阵，计算文本中心词之间的协方差矩阵和NDK之间的协方差矩阵，将原...

【技术保护点】
1.一种用于水下作业场景图片识别的训练数据集构建方法，其特征在于，所述方法包括：/nS1：将采集到的水下作业场景图片按照作业类型存储至不同的文件目录，以水下作业场景图片的文字描述作为水下作业场景图片文件的名称；/nS2：根据作业类型对水下作业场景图片进行数据预处理，包括提取文本中心词和提取NDK近似重复关键帧，所述文本中心词表示水下作业场景图片中包含的文本信息，所述NDK近似重复关键帧表示水下作业场景图片中包含的图像信息；/nS3：将NDK近似重复关键帧作为行数据，文本中心词作为列数据，构造标志矩阵Y，所述标志矩阵Y表示所有水下作业场景图片信息，作为数据分析的原始数据矩阵，其中，NDK近似重复...

【技术特征摘要】
1.一种用于水下作业场景图片识别的训练数据集构建方法，其特征在于，所述方法包括：
S1：将采集到的水下作业场景图片按照作业类型存储至不同的文件目录，以水下作业场景图片的文字描述作为水下作业场景图片文件的名称；
S2：根据作业类型对水下作业场景图片进行数据预处理，包括提取文本中心词和提取NDK近似重复关键帧，所述文本中心词表示水下作业场景图片中包含的文本信息，所述NDK近似重复关键帧表示水下作业场景图片中包含的图像信息；
S3：将NDK近似重复关键帧作为行数据，文本中心词作为列数据，构造标志矩阵Y，所述标志矩阵Y表示所有水下作业场景图片信息，作为数据分析的原始数据矩阵，其中，NDK近似重复关键帧为数据样本，T文本中心词为变量：

S4：将原始数据矩阵Y转化为归一化概率矩阵G：
G＝(Gij)＝Y/T
其中，
定义Gi.为原始数据矩阵Y中相同NDK近似重复关键帧的行上所有元素之和，
定义G.j为原始数据矩阵Y中相同文本中心词的列上所有元素之和，
S5：计算文本中心词之间的协方差矩阵和NDK之间的协方差矩阵，将原始数据矩阵Y变化为过渡矩阵W，所述过渡矩阵W的元素将NDK的协方差矩阵和文本中心词的协方差矩阵建立关联，进而在R型因子分析和Q型因子分析间建立联系；
S6：计算NDK协方差矩阵的特征值和特征向量进行R型因子分析，根据线性代数对偶定理，计算文本中心词协方差矩阵的特征向量进行Q型因子分析，或者，计算文本中心词协方差矩阵的特征值和特征向量进行Q型因子分析，根据线性代数对偶定理，计算NDK协方差矩阵的特征向量进行R型因子分析；
S7：根据对偶定理，通过NDK协方差矩阵的特征值和特征向量得到文本中心词的特征向量，并以此为依据得到文本中心词的因子载荷矩阵Z，将所述因子载荷矩阵Z进行正交旋转，得到旋转后的因子载荷矩阵Z*，从旋转后的因子载荷矩阵Z*选择出该类作业类型水下作业场景图片中的训练集；
S8：重复步骤S2至S7，依次对各作业类型的水下作业场景图片进行训练集样本筛选，构建出样本训练集。

2.根据权利要求1所述的用于水下作业场景图片识别的训练数据集构建方法，其特征在于，步骤S2中，所述提取文本中心词的过程包括：
S211：从水下作业场景图片文件的名称中提取出中心词；
S212：采用基于词频的卡方统计法，计算每个提取出的中心词基于出现频率的卡方值PCHI：
PCHI＝CHI×F(k,t)
其中，CHI为中心词k的传统卡方值，由传统卡方统计公式计算得到：

式中，t为该作业类型任务的主题，N为同一作业类型水下作业场景图片中提取出的中心词总数；
A为包含中心词k且符合主题t的中心词数；B为包含中心词k但不符合主题t的中心词数；C为不包含中心词k但符合主题t的中心词数；D为不包含中心词k且不符合主题t的中心词数；

为中心词k在主题t中出现的频率，其中，Nk为主题t中包含中心词k的个数，Nt为主题t中所有中心词的个数；
S213：计算所有中心词的PCHI值以及PCHI平均值；
S214：选取PCHI值高于PCHI平均值的中心词，作为该作业类型水下作业场景图片所包含的文本中心词，构成的文本中心词数据集为水下作业场景图片中所包含的文本信息。

3.根据权利要求1所述的用于水下作业场景图片识别的训练数据集构建方法，其特征在于，步骤S2中，所述提取NDK近似重复关键帧的过程包括：
S221：将每幅水下作业场景图片以包含图像信息的关键点形式存储至数据库；
S222：将从每一类作业类型的水下作业场景图片中提取的所有关键点组成关键点群，作为一个NDK近似重复关键帧，与该类水下作业场景图片中所包含的图像信息一一对应；
S223：对比该类作业类型的所有NDK近似重复关键帧，去除重复的NDK近似重复关键帧，将剩余所有不重复的NDK近似重复关键帧作为该作业类型水下作业场景图片中所包含的图像信息。

4.根据权利要求1所述的用于水下作业场景图片识别的训练数据集构建方法，...

【专利技术属性】
技术研发人员：杨雪，刘静，陈巍，李佩娟，陈伟，夏细明，郭铁铮，温秀平，陈国军，耿冉冉，
申请(专利权)人：南京工程学院，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人