一种司法证据图像的目标检测方法技术

技术编号：40194267 阅读：9 留言：0更新日期：2024-01-26 23:56

本发明专利技术涉及一种司法证据图像的目标检测方法，属于计算机视觉与目标检测技术领域。本发明专利技术利用基于代表区域的样本分配算法，通过利用RoI特征的代表区域和目标真值之间的位置关系实现了针对司法证据图像数据更加合理的样本分配，抑制了基于IoU值分配方式引入的噪声，并且加快了模型收敛速度；通过CLNet将回归分支的统一预测拆分为四个边界的定位组合，通过对代表区域进行排序，挖掘出最接近四个边界的四个局部特征，实现了司法证据图像中无效信息和噪声的过滤，利用边界附近的四个局部特征并行的实现了对边界框的回归，提升了检测方法对司法证据目标的定位准确度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种司法证据图像的目标检测方法，属于计算机视觉与目标检测。

技术介绍

1、随着电子信息的不断发展，司法领域证据图像也逐渐走向电子化，电子化的发展，解决了原始纸质卷宗在翻阅、保存、运输等方面难题。但是，对于司法人员来讲，大量案件卷宗的查阅仍然需要耗费大量精力，这给司法人员带来了非常大的工作强度。例如，在卷宗翻阅中证据的查找与比对，对不同司法证据图像中证物的匹配等，这一系列的工作会极大程度的降低法官的办案效率。利用目标检测、图像匹配等计算机视觉技术，可以提取电子卷宗中图像证据的有价值目标，或实现相似案件间的关联，能够使得法官在卷宗查阅过程中更加便捷，该方法旨在针对电子卷宗中的图像证据利用目标检测技术进行有价值目标的提取。

2、目标检测作为计算机视觉领域中的一项基础任务，旨在给定的图像中确定是否存在某些类别的物体并进行定位。广泛应用于智能安防、无人驾驶、数字医疗、人机交互和内容审核等领域，极大的提升了效率和质量，同样，目标检测可以应用在计算机辅助司法智能处理领域，为法官阅览电子卷宗提供帮助，提升法官办案的效率。近年来，随着深度学习的逐渐兴起，基于深度学习的目标检测算法也得到了广大研究人员的追捧，根据其整体发展脉络来看，可以将近年来目标检测的研究划分为三个主要分支：两阶段目标检测算法、一阶段目标检测算法以及基于transformer的目标检测算法。其中，两阶段检测器速度较慢，但检测精度较高。一阶段检测器由于没有明显的候选区域提取过程，其直接在特征图上预测物体的类别和坐标，因而具有较快的速度，随着目标检测的发展，

3、两阶段目标检测算法的整体流程可以划分为三个主要步骤，首先使用选择性搜索或者区域建议网络提取一系列候选区域。然后提取候选区域的特征。最后对提取得到的特征进行分类和回归，其中分类是为了区分前景和背景，即所需要检测的目标和干扰物，在分类任务中，算法会根据正负样本的分布去学习一个最优的分类边界将两者划分开。因此，正样本和负样本的分布和比例是影响模型好坏的一个重要因素。两阶段目标检测算法主要以基于目标框的样本分配方式为主。回归则是对目标的位置进行回归，通常以目标框的形式表示，目前的两阶段目标检测算法中的分类和回归分支使用了相同的全局特征。

4、尽管目标检测技术得到了深入的发展，但是，应用于司法图像数据的两阶段目标检测技术仍然存在以下缺陷：

5、第一，对于两阶段目标检测算法的样本分配方式来说，直接通过计算候选框和真值框之间的iou值来确定正负样本，在司法场景中，司法证据图像中的有价值目标多为不规则物体，在面对形状非规则的物体时，比如部分中空形(手铐)、月牙形(镰刀)或者细长形(棍棒)物体，部分正样本实际上包含了大量的背景或者噪声信息，尤其司法图像证据中存在较为杂乱的背景环境。这种情况下，网络强行将含有大量背景信息的候选框分类为前景类物体，且强行将其回归到真值框上，严重影响了模型的优化方向，降低了模型的精度，不利于司法图像中有价值目标的识别。同时，当有多个物体重合时，目前的样本分配方式也会引入一定的噪声信息。

6、第二，在目标检测算法的分类和回归任务中使用相同的全局特征，当人们对物体进行分类时，往往会观察物体的整个外观，当前目标检测算法的分类任务符合这一特性。但对于回归任务，或者说目标定位时，在现实中往往会更加关注物体的局部边界，但目前目标检测算法的回归分支与这一特性相违背，同时在回归任务中为了确保使用更多靠近边界的特征，回归分支需要保持全局信息的位置关系，这给学习过程带来了额外的负担，对检测算法的性能也会产生一定的影响，从而降低目标检测算法对于司法证物的识别。

7、综上所述，为了实现高效、鲁棒的两阶段目标检测算法，如何克服上述缺陷，是当前领域亟待解决的技术问题。

技术实现思路

1、本专利技术的目的是针对现有的两阶段目标检测技术在司法图像数据上应用存在的问题和不足，为有效解决两阶段目标检测技术中样本分配和回归定位的不合理性的技术问题，并进一步提升目标检测技术在司法场景下的检测精度，创造性地提出一种司法证据图像的目标检测方法。

2、本专利技术的创新点在于：一是提出了面向代表区域的样本分配方法，利用候选框的内容信息作为样本分配的评价指标之一，避免了特征内容和标签错配的问题，提升了司法证据目标检测的准确度；二是提出了面向代表区域的组合定位网络，将检测头的分类分支和回归分支进行了拆分，同时挖掘物体的周边代表区域进行边界预测和组合定位，提升了方法对司法证据目标的定位能力。

3、本专利技术采用以下技术方案实现。

4、一种司法证据图像的目标检测方法，包括以下步骤：

5、步骤1：输入司法证据图像目标检测数据集，获得图像和每张图像对应的真值标签，并对图像进行预处理操作，构成训练数据集。

6、具体地，图像预处理可以采用以下方式：

7、首先，将输入图像的短边缩放到800像素，同时长边不超过1333像素；

8、然后，以0.5的概率对图像随机水平翻转，进行数据增广。

9、步骤2：基于两阶段目标检测网络faster r-cnn，搭建基于代表区域感知的目标检测网络r2pnet。

10、具体地，步骤2包括以下步骤：

11、步骤2.1：搭建骨干特征提取网络，输入为一张预处理后的司法证据图像，输出为该图像的特征图。

12、步骤2.2：在步骤2.1所述骨干特征提取网络后，搭建区域建议网络rpn和roi池化网络，获得步骤2.1输出司法证据特征图中若干感兴趣区域的roi特征。

13、步骤2.3：在步骤2.2所述的区域建议网络rpn和roi池化网络后，搭建特征采样网络fsn，获得步骤2.2中每个输出roi特征的若干高斯分布，并将输出的高斯分布以掩膜的形式应用到输入的roi特征中，获得每个roi特征的代表区域。

14、其中，对于步骤2.3所述特征采样网络fsn，对于输入为w×h的司法证据特征，w表示特征图的宽度、h表示特征图的高度，输出为k组二维高斯分布的均值μ和方差σ，其中k为超参数，μ和σ的输出形状都为2×k；μ由μx和μy组成，分别表示k个高斯函数在水平和垂直方向上的均值；σ由σx和σy组成，分别为k个高斯函数在水平和垂直方向上的标准差。

15、具体地，步骤2.3包括以下步骤：

16、步骤2.3.1：对于输入为w×h的特征，通过padding＝0的1×1卷积进行降维，输入通道数为256，输出通道数为4；

17、步骤2.3.2：对于步骤2.3.1输出的特征图，通过padding＝0的1×1卷积进行特征提取，输出特征图在空间维度上进行展平处理；

18、步骤2.3.3本文档来自技高网...

【技术保护点】

1.一种司法证据图像的目标检测方法，其特征在于，包括以下步骤：

2.如权利要求1所述的一种司法证据图像的目标检测方法，其特征在于，步骤1中，司法证据图像预处理采用以下方式：

3.如权利要求1所述的一种司法证据图像的目标检测方法，其特征在于，步骤2.3包括以下步骤：

4.如权利要求1所述的一种司法证据图像的目标检测方法，其特征在于，步骤4包括以下步骤：

5.如权利要求4所述的一种司法证据图像的目标检测方法，其特征在于，步骤4.1包括以下步骤：

【技术特征摘要】

1.一种司法证据图像的目标检测方法，其特征在于，包括以下步骤：

2.如权利要求1所述的一种司法证据图像的目标检测方法，其特征在于，步骤1中，司法证据图像预处理采用以下方式：

3.如权利要求1所述的一种司法证据图像的目标检测...

【专利技术属性】
技术研发人员：马波，易鑫，梁一丁，
申请(专利权)人：北京理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人