目标检测方法、装置、设备和存储介质制造方法及图纸

技术编号:32905150 阅读:16 留言:0更新日期:2022-04-07 11:55
本发明专利技术公开了一种目标检测方法、装置、设备和存储介质。目标检测方法,包括:确定目标检测数据集,对目标检测数据集进行目标检测,提取图像特征;对图像特征嵌入第一数据库的标注知识,得到增强后的图像特征;将增强后的图像特征送入分类器进行检测,得到目标检测得分;对图像特征嵌入第二数据库的文本知识并处理,得到矫正分数;基于目标检测得分和矫正分数,得到目标检测的最终分类得分。采用本发明专利技术,可以提高目标检测的分类和定位能力,提高检测能力。力。力。

【技术实现步骤摘要】
目标检测方法、装置、设备和存储介质


[0001]本专利技术涉及计算机视觉
,特别是涉及一种目标检测方法、装置、设备和存储介质。

技术介绍

[0002]随着卷积神经网络CNN的出现和快速发展,深度学习逐步取代传统的机器学习,并且以绝对优势在图像研究方面占据了主导地位;计算机视觉相关任务,比如图像分类、目标检测、语义分割等,都因此获得了极大的突破,并成功应用在生活的方方面面,比如OCR(Optical Character Recognition光学字符识别)文字识别、指纹识别、人脸支付、自动驾驶等。
[0003]卷积神经网络通过训练学习到的图像特征,有效提高了目标检测在一些公开数据集上的性能,比如现阶段的检测网络如Faster RCNN、YOLO等,能够在数据集Pascal VOC和MSCOCO同时满足高准确率和高速率的要求。但是这些公开数据集涉及的目标种类有限,比如Pascal VOC只有20类,MSCOCO只有80类,而在真实需要进行目标检测的使用场景中,可能涉及到成百上千的目标种类。所以,只在几十类的小规模公开数据集上性能优良是远远不够的,因此,目标检测的研究热点方向也开始转向了大规模数据集上的目标检测。
[0004]从小规模目标检测到大规模目标检测,数据集几十类扩展到百类或者千类的大规模数据集,对卷积神经网络的要求也随之增高,以往的检测网络的目标检测性能急剧下降。

技术实现思路

[0005]本专利技术要解决的技术问题是:现有技术中大规模目标检测的检测性能低。
[0006]为解决上述技术问题,本专利技术提供了一种目标检测方法、装置、设备和存储介质。
[0007]一种目标检测方法,包括:
[0008]确定目标检测数据集,对所述目标检测数据集进行目标检测,提取图像特征;
[0009]对所述图像特征嵌入第一数据库的标注知识,得到增强后的图像特征;
[0010]将所述增强后的图像特征送入分类器进行检测,得到目标检测得分;
[0011]对所述图像特征嵌入第二数据库的文本知识并处理,得到矫正分数;
[0012]基于所述目标检测得分和所述矫正分数,得到目标检测的最终分类得分。
[0013]在其中一个实施例中,所述图像特征包括视觉特征和几何特征;所述对所述图像特征嵌入第一数据库的标注知识,得到增强后的图像特征,包括:
[0014]基于所述第一数据库的标注知识构建出属性知识图和关系知识图,其中,所述标注知识包括属性信息和关系信息;
[0015]对所述视觉特征嵌入所述属性知识图、所述关系知识图得到第一知识图谱,根据所述第一知识图谱和所述图像特征生成第一增强特征;
[0016]基于所述几何特征构建第二知识图谱,根据所述第二知识图谱和所述图像特征生成第二增强特征;
[0017]将所述图像特征、所述第一增强特征和所述第二增强特征融合,得到所述增强后的图像特征。
[0018]在其中一个实施例中,所述对所述视觉特征嵌入所述属性知识图、所述关系知识图得到第一知识图谱,根据所述第一知识图谱和所述图像特征生成第一增强特征,包括:
[0019]对所述视觉特征嵌入所述属性知识图、所述关系知识图,通过多层感知机获取第一知识图谱的边权值并生成第一知识图谱;
[0020]将所述第一知识图谱的边权值、预设的第一维度变换矩阵和所述图像特征相乘,得到所述第一增强特征。
[0021]在其中一个实施例中,所述基于所述几何特征构建第二知识图谱,根据所述第二知识图谱和所述图像特征生成第二增强特征,包括:
[0022]将所述几何特征作为输入,通过多层感知机获取第二知识图谱的边权值并生成第二知识图谱;
[0023]将所述第二知识图谱的边权值、预设的第二维度变换矩阵和所述图像特征相乘,得到所述第二增强特征。
[0024]在其中一个实施例中,所述对所述图像特征嵌入第二数据库的文本知识并处理,得到矫正分数,包括:
[0025]基于所述第二数据库学习得到文本知识,基于所述文本知识和所述图像特征生成语义知识图谱;
[0026]对所述语义知识图谱的边集合进行自适应激活,生成自适应语义知识图谱;
[0027]将所述自适应语义知识图谱送入全连接层,获得所述矫正分数。
[0028]在其中一个实施例中,所述基于所述目标检测得分和所述矫正分数,得到目标检测的最终分类得分,包括:
[0029]将所述目标检测得分和所述矫正分数相乘,得到目标检测的最终分类得分。
[0030]在其中一个实施例中,所述目标检测数据集包括MSCOCO 2017数据集、VG数据集和ADE数据集中的至少一种;所述第一数据库包括VG数据库,所述第二数据库包括Google News数据库。
[0031]一种目标检测装置,包括:
[0032]特征提取模块,用于确定目标检测数据集,对所述目标检测数据集进行目标检测,提取图像特征;
[0033]第一嵌入模块,用于对所述图像特征嵌入第一数据库的标注知识,得到增强后的图像特征;
[0034]分类检测模块,用于将所述增强后的图像特征送入分类器进行检测,得到目标检测得分;
[0035]第二嵌入模块,用于对所述图像特征嵌入第二数据库的文本知识并处理,得到矫正分数;
[0036]得分校正模块,用于基于所述目标检测得分和所述矫正分数,得到目标检测的最终分类得分。
[0037]一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如下步骤:
[0038]确定目标检测数据集,对所述目标检测数据集进行目标检测,提取图像特征;
[0039]对所述图像特征嵌入第一数据库的标注知识,得到增强后的图像特征;
[0040]将所述增强后的图像特征送入分类器进行检测,得到目标检测得分;
[0041]对所述图像特征嵌入第二数据库的文本知识并处理,得到矫正分数;
[0042]基于所述目标检测得分和所述矫正分数,得到目标检测的最终分类得分。
[0043]一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如下步骤:
[0044]确定目标检测数据集,对所述目标检测数据集进行目标检测,提取图像特征;
[0045]对所述图像特征嵌入第一数据库的标注知识,得到增强后的图像特征;
[0046]将所述增强后的图像特征送入分类器进行检测,得到目标检测得分;
[0047]对所述图像特征嵌入第二数据库的文本知识并处理,得到矫正分数;
[0048]基于所述目标检测得分和所述矫正分数,得到目标检测的最终分类得分。
[0049]与现有技术相比,上述方案中的一个或多个实施例可以具有如下优点或有益效果:
[0050]对目标检测数据集进行目标检测得到图像特征后,对图像特征嵌入标注知识并基于分类器检测得到目标检测得分,对图像特征嵌入文本知识处理得本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标检测方法,其特征在于,包括:确定目标检测数据集,对所述目标检测数据集进行目标检测,提取图像特征;对所述图像特征嵌入第一数据库的标注知识,得到增强后的图像特征;将所述增强后的图像特征送入分类器进行检测,得到目标检测得分;对所述图像特征嵌入第二数据库的文本知识并处理,得到矫正分数;基于所述目标检测得分和所述矫正分数,得到目标检测的最终分类得分。2.根据权利要求1所述的方法,其特征在于,所述图像特征包括视觉特征和几何特征;所述对所述图像特征嵌入第一数据库的标注知识,得到增强后的图像特征,包括:基于所述第一数据库的标注知识构建出属性知识图和关系知识图,其中,所述标注知识包括属性信息和关系信息;对所述视觉特征嵌入所述属性知识图、所述关系知识图得到第一知识图谱,根据所述第一知识图谱和所述图像特征生成第一增强特征;基于所述几何特征构建第二知识图谱,根据所述第二知识图谱和所述图像特征生成第二增强特征;将所述图像特征、所述第一增强特征和所述第二增强特征融合,得到所述增强后的图像特征。3.根据权利要求2所述的方法,其特征在于,所述对所述视觉特征嵌入所述属性知识图、所述关系知识图得到第一知识图谱,根据所述第一知识图谱和所述图像特征生成第一增强特征,包括:对所述视觉特征嵌入所述属性知识图、所述关系知识图,通过多层感知机获取第一知识图谱的边权值并生成第一知识图谱;将所述第一知识图谱的边权值、预设的第一维度变换矩阵和所述图像特征相乘,得到所述第一增强特征。4.根据权利要求2所述的方法,其特征在于,所述基于所述几何特征构建第二知识图谱,根据所述第二知识图谱和所述图像特征生成第二增强特征,包括:将所述几何特征作为输入,通过多层感知机获取第二知识图谱的边权值并生成第二知识图谱;将所述第二知识图谱的边权值、预设的第二维度...

【专利技术属性】
技术研发人员:吴晓雨张愉刘茜
申请(专利权)人:中国传媒大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1