System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及金融科技领域或其他相关领域,具体而言,涉及一种异常交易数据的识别方法、装置、存储介质及电子设备。
技术介绍
1、银行商户收单业务中,商户对账是确保金融交易准确性的关键步骤。商户对账是指商户与银行之间对比和核对交易数据的过程,以确保两者之间的交易记录一致。目前,现有技术中主要通过人工标记异常交易数据,需要耗费大量时间和精力,对账效率较低,并且,人工标记异常数据的主观判断容易导致误判,可能会错过一些真正的异常情况或将正常情况误判为异常,识别异常交易数据的准确率较低。
2、针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
1、本专利技术实施例提供了一种异常交易数据的识别方法、装置、存储介质及电子设备,以至少解决现有技术中在商户对账过程中,通过人工标记异常交易数据,存在识别异常交易数据的准确率较低的技术问题。
2、根据本专利技术实施例的一个方面,提供了一种异常交易数据的识别方法,包括:获取待对账的目标交易数据,其中,目标交易数据为多模态数据,多模态数据中至少包括文本数据、音频数据、图像数据以及数值数据;对目标交易数据进行多模态特征提取,得到多模态特征集合;通过目标模型对多模态特征集合进行聚类分析,得到分析结果,并依据分析结果,从目标交易数据中确定异常交易数据和异常交易数据对应的异常类别,其中,目标模型是通过样本数据集对改进k均值聚类算法训练得到的。
3、进一步地,获取待对账的目标交易数据,包括:获取待对账的交易数据,其中,待对账的
4、进一步地,通过目标模型对多模态特征集合进行聚类分析,得到分析结果,包括:通过目标模型计算多模态特征集合中的每个数据特征向量表示与多个聚类中心之间的加权距离,得到每个数据特征向量表示对应的多个距离值,其中,距离值用于表征数据特征向量表示与聚类中心之间的相似度;将每个数据特征向量表示对应的多个距离值作为分析结果。
5、进一步地,依据分析结果,从目标交易数据中确定异常交易数据和异常交易数据对应的异常类别,包括:对于每个数据特征向量表示,将最大距离值对应的聚类中心作为目标聚类中心;依据目标聚类中心对应的类别,从目标交易数据中确定异常交易数据和异常交易数据对应的异常类别。
6、进一步地,通过以下步骤生成目标模型:获取样本数据集,并将样本数据集分为训练集和测试集,其中,样本数据集包含真实标签,真实标签用于标识真实数据类别;依据训练集和测试集对改进k均值聚类算法进行训练和优化,得到目标模型。
7、进一步地,依据训练集和测试集对改进k均值聚类算法进行训练和优化,得到目标模型,包括:确定聚类中心的数量为k,并从训练集中随机选择k个样本作为初始聚类中心,其中,k为正整数;确定训练集中每个样本的初始权重,并依据每个样本的初始权重,确定每个样本对应的初始聚类中心,得到多个初始数据簇;依据多个初始数据簇、真实标签以及测试集对改进k均值聚类算法进行训练和优化,直至改进k均值聚类算法符合预设收敛条件,得到目标模型。
8、进一步地,在从目标交易数据中确定异常交易数据和异常交易数据对应的异常类别之后,该方法还包括:依据异常交易数据和异常交易数据对应的异常类别,生成每个异常类别对应的异常数据报告;将每个异常类别对应的异常数据报告发送至目标对象。
9、根据本专利技术实施例的另一方面,还提供了一种异常交易数据的识别装置,包括:获取模块,用于获取待对账的目标交易数据,其中,目标交易数据为多模态数据,多模态数据中至少包括文本数据、音频数据、图像数据以及数值数据;处理模块,用于对目标交易数据进行多模态特征提取,得到多模态特征集合;确定模块,用于通过目标模型对多模态特征集合进行聚类分析,得到分析结果,并依据分析结果,从目标交易数据中确定异常交易数据和异常交易数据对应的异常类别,其中,目标模型是通过样本数据集对改进k均值聚类算法训练得到的。
10、根据本专利技术实施例的另一方面,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,其中,计算机程序被设置为运行时执行上述的异常交易数据的识别方法。
11、根据本专利技术实施例的另一方面,还提供了一种电子设备,该电子设备包括一个或多个处理器;存储器,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现用于运行程序,其中,程序被设置为运行时执行上述的异常交易数据的识别方法。
12、在本专利技术实施例中,采用通过多模态算法综合考虑不同类型的数据特征,通过改进k均值聚类算法自动将数据进行分类的方式,首先获取待对账的目标交易数据,然后对目标交易数据进行多模态特征提取,得到多模态特征集合,然后通过目标模型对多模态特征集合进行聚类分析,得到分析结果,并依据分析结果,从目标交易数据中确定异常交易数据和异常交易数据对应的异常类别。其中,目标交易数据为多模态数据,多模态数据中至少包括文本数据、音频数据、图像数据以及数值数据,目标模型是通过样本数据集对改进k均值聚类算法训练得到的。
13、在上述过程中,引入多模态算法,将来自不同类型的数据特征综合考虑,打破了单一数据源的局限,提供了更丰富的信息,提高了异常数据识别的准确性;引入改进k均值聚类算法能够自动将数据进行分类,节省了时间成本和人力成本,显著降低了误判率,提高了识别异常交易数据的准确率,从而提升对账过程的准确性和效率。
14、由此可见,通过本专利技术的技术方案,达到了实现商户对账中异常数据自动检测的目的,从而实现了提高识别异常交易数据的准确率和效率的技术效果,进而解决了现有技术中在商户对账过程中,通过人工标记异常交易数据,存在识别异常交易数据的准确率较低的技术问题。
本文档来自技高网...【技术保护点】
1.一种异常交易数据的识别方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,获取待对账的目标交易数据,包括:
3.根据权利要求2所述的方法,其特征在于,通过目标模型对所述多模态特征集合进行聚类分析,得到分析结果,包括:
4.根据权利要求3所述的方法,其特征在于,依据所述分析结果,从所述目标交易数据中确定异常交易数据和所述异常交易数据对应的异常类别,包括:
5.根据权利要求1所述的方法,其特征在于,通过以下步骤生成所述目标模型:
6.根据权利要求5所述的方法,其特征在于,依据所述训练集和所述测试集对所述改进K均值聚类算法进行训练和优化,得到所述目标模型,包括:
7.根据权利要求1所述的方法,其特征在于,在从所述目标交易数据中确定异常交易数据和所述异常交易数据对应的异常类别之后,所述方法还包括:
8.一种异常交易数据的识别装置,其特征在于,包括:
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权
10.一种电子设备,其特征在于,所述电子设备包括一个或多个处理器;存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现用于运行程序,其中,所述程序被设置为运行时执行所述权利要求1至7任一项中所述的异常交易数据的识别方法。
...【技术特征摘要】
1.一种异常交易数据的识别方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,获取待对账的目标交易数据,包括:
3.根据权利要求2所述的方法,其特征在于,通过目标模型对所述多模态特征集合进行聚类分析,得到分析结果,包括:
4.根据权利要求3所述的方法,其特征在于,依据所述分析结果,从所述目标交易数据中确定异常交易数据和所述异常交易数据对应的异常类别,包括:
5.根据权利要求1所述的方法,其特征在于,通过以下步骤生成所述目标模型:
6.根据权利要求5所述的方法,其特征在于,依据所述训练集和所述测试集对所述改进k均值聚类算法进行训练和优化,得到所述目标模型,包括:
7.根据权利...
【专利技术属性】
技术研发人员:郑希,
申请(专利权)人:中国工商银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。