补充样本生成方法、装置、设备和存储介质制造方法及图纸

技术编号：38038344 阅读：15 留言：0更新日期：2023-06-30 11:04

本申请涉及人工智能技术，提供一种补充样本生成方法、装置、设备和存储介质，可以用于生成金融领域中的补充票据，使用补充票据训练得到的票据识别模型能够较好的分析金融支付的变化规律，其中方法包括：从原始样本集中选出训练样本集；按照预设间隔生成多个样本编码，生成与每个样本编码对应的补充样本；计算每个补充样本与对应训练正样本之间的第一相似度，计算每个补充样本与对应训练负样本之间的第二相似度；根据所有第一相似度和所有第二相似度计算损失函数值，根据损失函数值训练待训练卷积神经网络，得到补充样本生成模型；使用损失函数值进行训练，补充样本生成模型能够生成与训练正样本相似且与训练负样本差异较大的标准的补充样本。标准的补充样本。标准的补充样本。

全部详细技术资料下载

【技术实现步骤摘要】
补充样本生成方法、装置、设备和存储介质

[0001]本申请涉及人工智能
，例如涉及补充样本生成方法、装置、设备和存储介质。

技术介绍

[0002]随着人工智能和大数据的发展，要作出正确的金融决策依赖于大量的金融样本。在一些情况下，只能获取到较少的金融样本例如金融票据。金融票据包含金额、签名和日期，使用金融票据训练待训练神经网络能够得到金融票据识别模型，金融票据识别模型能够自动识别金融票据。用于训练的金融票据的数量越多，金融票据识别模型的识别效果越好，较少的金融票据导致金融票据识别模型的识别效果较差。

技术实现思路

[0003]本申请提供一种补充样本生成方法、装置、设备和存储介质，旨在解决在金融票据的数量较少的情况下训练得到的金融票据识别模型的识别效果较差的问题。
[0004]为解决上述问题，本申请采用以下技术方案：
[0005]本文提供了补充样本生成方法，包括：
[0006]获取原始样本集，从所述原始样本集中选出训练样本集，所述训练样本集包含多个训练正样本和多个训练负样本；
[0007]按照预设间隔生成多个样本编码，生成与每个所述样本编码对应的补充样本；
[0008]计算每个所述补充样本与对应所述训练正样本之间的相似度，得到第一相似度；
[0009]计算每个所述补充样本与对应所述训练负样本之间的相似度，得到第二相似度；
[0010]根据所有所述第一相似度和所有所述第二相似度计算损失函数值；
[0011]根据所述损失函数值训练待训练卷...

【技术保护点】

【技术特征摘要】
1.一种补充样本生成方法，其特征在于，包括：获取原始样本集，从所述原始样本集中选出训练样本集，所述训练样本集包含多个训练正样本和多个训练负样本；按照预设间隔生成多个样本编码，生成与每个所述样本编码对应的补充样本；计算每个所述补充样本与对应所述训练正样本之间的相似度，得到第一相似度；计算每个所述补充样本与对应所述训练负样本之间的相似度，得到第二相似度；根据所有所述第一相似度和所有所述第二相似度计算损失函数值；根据所述损失函数值训练待训练卷积神经网络，得到补充样本生成模型，所述补充样本生成模型用于生成所述补充样本。2.根据权利要求1所述的补充样本生成方法，其特征在于，所述根据所有所述第一相似度和所有所述第二相似度计算损失函数值，包括：根据以下公式计算所述损失函数值：其中，z
i
为第i个所述补充样本，x
i
为第i个所述训练正样本，y
j
为第j个所述训练负样本，log为对数运算符号，τ为调节参数，i为训练正样本序号，j为训练负样本序号，N1为训练正样本总数，所述训练正样本总数与训练负样本总数相同，exp为指数运算符号，sim为相似度计算函数，FinalLoss为所述损失函数值，exp(sim(z
i
，x
i
))为所述第一相似度，exp(sim(z
i
，y
j
))为所述第二相似度。3.根据权利要求1所述的补充样本生成方法，其特征在于，所述生成与每个所述样本编码对应的补充样本，包括：将所述样本编码输入所述待训练卷积神经网络的多层感知层生成中间样本；将所述中间样本输入所述待训练卷积神经网络的补充样本生成层生成所述补充样本。4.根据权利要求1所述的补充样本生成方法，其特征在于，所述得到补充样本生成模型之后，还包括：从所述原始样本集中筛选出测试样本集；依次将所述测试样本集中的每个测试样本输入所述补充样本生成模型，生成所述补充样本。5.根据权利要求1...

【专利技术属性】
技术研发人员：舒畅，陈又新，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人