System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于双通道特征提取网络的数据处理方法技术_技高网

基于双通道特征提取网络的数据处理方法技术

技术编号:41264735 阅读:3 留言:0更新日期:2024-05-11 09:21
本发明专利技术公开了一种基于双通道特征提取网络的数据处理方法,包括:将获取到的待处理数据输入至预先训练得到的目标网络模型中进行数据分析处理;其中,目标网络模型中包括第一特征提取网络和第二特征提取网络;基于第一特征提取网络对待处理数据进行特征提取,得到第一待融合特征;以及基于第二特征提取网络对待处理数据进行处理,得到包括空洞的第二待融合特征;对第一待融合特征和第二待融合特征融合处理,得到多尺度特征,并基于多尺度特征确定注意力矩阵;基于注意力矩阵和预先设定的随机概率值,确定目标特征;通过对目标特征分析处理,确定与待处理数据相对应的数据处理结果。解决了模型过拟合的问题,提高模型预测准确度。

【技术实现步骤摘要】

本专利技术涉及深度学习,尤其涉及基于双通道特征提取网络的数据处理方法


技术介绍

1、随着人工智能和深度学习的发展,计算机视觉领域和自然语言处理领域都取得了飞速的发展。相关的特征提取的数据处理技术方案中,基于视觉变换(visiontransformer,vit)模型的提出,将自注意力机制和transformer模型应用到视觉领域,打通了自然语言处理(natural language processing,nlp)和计算机视觉(computer vision,cv)之间的鸿沟,为后续高效进行更多的视觉分类、检测等任务提供了可能。但是,vit模型也存在着一定的不足之处,例如下采样率单一,无法提取图像的多尺度特征,以及对训练数据集规模要求较大等;而且传统vit模型只在数据量较大的数据集上训练才可以取得较好的图像分类效果,若训练数据集达不到一定的规模,vit模型的训练过程中就容易出现过拟合(overfitting)的问题,使得最终的图像分类效果不佳。


技术实现思路

1、本专利技术提供了一种基于双通道特征提取网络的数据处理方法,以提高模型预测的准确度。

2、根据本专利技术的一方面,提供了一种基于双通道特征提取网络的数据处理方法,该方法包括:

3、将获取到的待处理数据输入至预先训练得到的目标网络模型中进行数据分析处理;其中,所述目标网络模型中包括第一特征提取网络和第二特征提取网络,所述第二特征提取网络对应于空洞卷积网络;

4、基于所述第一特征提取网络对所述待处理数据进行特征提取,得到第一待融合特征;以及基于所述第二特征提取网络对所述待处理数据进行处理,得到包括空洞的第二待融合特征;

5、通过对所述第一待融合特征和所述第二待融合特征融合处理,得到多尺度特征,并基于所述多尺度特征确定注意力矩阵;

6、基于所述注意力矩阵和预先设定的随机概率值,确定目标特征;

7、通过对所述目标特征分析处理,确定与所述待处理数据相对应的数据处理结果。

8、进一步的,所述第一特征提取网络和所述第二特征提取网络所对应的卷积尺寸不同,所述第二特征提取网络所采用的卷积核尺寸中kernel size为第一预设数值、stride为第二预设数值、dilation为第三预设数值。

9、进一步的,所述通过对所述第一待融合特征和所述第二待融合特征融合处理,得到多尺度特征,包括:

10、通过对所述第一待融合特征和所述第二待融合特征加权处理,得到融合特征;

11、基于全局平均池化操作对所述融合特征降维处理,得到所述多尺度特征。

12、进一步的,所述通过对所述第一待融合特征和所述第二待融合特征加权处理,得到融合特征,包括:

13、基于训练得到所述目标网络模型时所确定的第一权重和第二权重,对所述第一待融合特征和所述第二待融合特征加权处理,得到所述融合特征;

14、其中,所述第一权重和所述第二权重是在训练得到所述目标网络模型的过程中基于训练样本所对应的预测输出结果和所述训练样本的理论输出结果的损失值动态调整的。

15、进一步的,所述基于所述多尺度特征确定注意力矩阵,包括:

16、基于所述目标网络模型中的至少一个目标矩阵对所述多尺度特征进行处理,得到所述注意力矩阵。

17、进一步的,所述基于所述注意力矩阵和预先设定的随机概率值,确定目标特征,包括:

18、基于预先设定的随机概率值,确定与所述注意力矩阵的维度相一致的待处理矩阵中每个元素所对应的目标概率值;

19、基于每个元素的所述目标概率值,确定每个元素的目标信息;

20、基于所述目标信息和所述注意力矩阵,确定所述目标特征。

21、进一步的,在得到所述目标特征之后,还包括:

22、基于所述目标特征和预先设定的第二目标矩阵相乘处理,以更新所述目标特征。

23、进一步的,所述通过对所述目标特征分析处理,确定与所述待处理数据相对应的数据处理结果,包括:

24、基于所述目标网络模型中的多层感知模块对所述目标特征分析处理,得到待分类特征;

25、基于目标函数对所述待分类特征进行处理,得到数据处理结果并输出。

26、进一步的,若所述待处理数据为待分类数据,所述数据处理结果为与至少一个分类结果所对应的概率矩阵,所述概率矩阵中的每个元素值用于表征分类结果所对应的概率值。

27、进一步的,目标网络模型包括vit模型。

28、本专利技术实施例的技术方案,将获取到的待处理数据输入至预先训练得到的目标网络模型中进行数据分析处理;其中,所述目标网络模型中包括第一特征提取网络和第二特征提取网络,所述第二特征提取网络对应于空洞卷积网络;基于所述第一特征提取网络对所述待处理数据进行特征提取,得到第一待融合特征;以及基于所述第二特征提取网络对所述待处理数据进行处理,得到包括空洞的第二待融合特征;通过对所述第一待融合特征和所述第二待融合特征融合处理,得到多尺度特征,并基于所述多尺度特征确定注意力矩阵;基于所述注意力矩阵和预先设定的随机概率值,确定目标特征;通过对所述目标特征分析处理,确定与所述待处理数据相对应的数据处理结果。解决了模型过拟合的问题,提高模型预测的准确度。

29、应当理解,本部分所描述的内容并非旨在标识本专利技术的实施例的关键或重要特征,也不用于限制本专利技术的范围。本专利技术的其它特征将通过以下的说明书而变得容易理解。

本文档来自技高网...

【技术保护点】

1.一种基于双通道特征提取网络的数据处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述第一特征提取网络和所述第二特征提取网络所对应的卷积尺寸不同,所述第二特征提取网络所采用的卷积核尺寸中kernelsize为第一预设数值、stride为第二预设数值、dilation为第三预设数值。

3.根据权利要求1所述的方法,其特征在于,所述通过对所述第一待融合特征和所述第二待融合特征融合处理,得到多尺度特征,包括:

4.根据权利要求3所述的方法,其特征在于,所述通过对所述第一待融合特征和所述第二待融合特征加权处理,得到融合特征,包括:

5.根据权利要求1所述的方法,其特征在于,所述基于所述多尺度特征确定注意力矩阵,包括:

6.根据权利要求1所述的方法,其特征在于,所述基于所述注意力矩阵和预先设定的随机概率值,确定目标特征,包括:

7.根据权利要求1所述的方法,其特征在于,在得到所述目标特征之后,还包括:

8.根据权利要求1所述的方法,其特征在于,所述通过对所述目标特征分析处理,确定与所述待处理数据相对应的数据处理结果,包括:

9.根据权利要求1所述的方法,其特征在于,若所述待处理数据为待分类数据,所述数据处理结果为与至少一个分类结果所对应的概率矩阵,所述概率矩阵中的每个元素值用于表征分类结果所对应的概率值。

10.根据权利要求1所述的方法,其特征在于,所述目标网络模型包括ViT模型。

...

【技术特征摘要】

1.一种基于双通道特征提取网络的数据处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述第一特征提取网络和所述第二特征提取网络所对应的卷积尺寸不同,所述第二特征提取网络所采用的卷积核尺寸中kernelsize为第一预设数值、stride为第二预设数值、dilation为第三预设数值。

3.根据权利要求1所述的方法,其特征在于,所述通过对所述第一待融合特征和所述第二待融合特征融合处理,得到多尺度特征,包括:

4.根据权利要求3所述的方法,其特征在于,所述通过对所述第一待融合特征和所述第二待融合特征加权处理,得到融合特征,包括:

5.根据权利要求1所述的方法,其特征在于,所述基于所述多尺...

【专利技术属性】
技术研发人员:刘欣刚刘昊煜吴少智苏涵冯承霖张立澄彭伟航
申请(专利权)人:电子科技大学长三角研究院衢州
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1