基于决策树的报文分拣方法及装置制造方法及图纸

技术编号:37346314 阅读:20 留言:0更新日期:2023-04-22 21:40
本公开提供了一种基于决策树的报文分拣方法,涉及人工智能技术领域,可以应用于金融科技领域。该方法包括:获取待分拣报文的属性信息;将所述属性信息输入预先训练的决策树模型分类器中,以输出所述待分拣报文的分类结果;根据所述分类结果对所述待分拣报文进行分拣操作。本公开还提供了一种基于决策树的报文分拣装置、设备、存储介质和程序产品。存储介质和程序产品。存储介质和程序产品。

【技术实现步骤摘要】
基于决策树的报文分拣方法及装置


[0001]本公开涉及人工智能
,具体涉及报文自动分类
,更具体地涉及一种基于决策树的报文分拣方法、装置、设备、存储介质和程序产品。

技术介绍

[0002]大小额支付系统是跨行支付系统的重要组成部分,报文是业务流转的重要依据,因此大小额系统的收发报效率对于业务处理的效率有着决定性的作用。
[0003]相关技术中,根据预设的大小额支付系统的收报地区分拣规则对大小额报文进行分拣。对于大小额支付系统的收报地区分拣规则,由于银行业务场景众多,不同场景间互相影响耦合,且分拣逻辑复杂,导致程序代码繁杂,在一定程度上降低了代码可读性和程序执行效率。进而影响报文分拣效率。
[0004]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0005]鉴于上述问题,本公开提供了提高报文分拣效率的基于决策树的报文分拣方法、装置、设备、介质和程序产品。
[0006]根据本公开的第一个方面,提供了一种基于决策树的报文分拣方法,所述方法包括:
[0007]获取待分拣报文的属性信息;
[0008]将所述属性信息输入预先训练的决策树模型分类器中,以输出所述待分拣报文的分类结果;以及
[0009]根据所述分类结果对所述待分拣报文进行分拣操作。
[0010]根据本公开的实施例,预先训练决策树模型分类器包括:
[0011]将已分拣的历史报文作为训练数据集,对所述训练数据集进行预处理,以生成目标分类特征;
[0012]将所述目标分类特征和所述历史报文输入分类器进行模型训练,以生成决策树。
[0013]根据本公开的实施例,所述对所述训练数据集进行预处理,以生成目标分类特征包括:
[0014]使用自然语言处理技术对历史报文进行分词处理,以确定所述历史报文的分类属性;
[0015]将所述历史报文的分类属性进行文本表示;
[0016]使用特征选择算法对文本表示后的分类属性进行特征提取,以生成初始分类特征;以及
[0017]根据所述初始分类特征与所述历史报文的分拣结果的相关度确定目标分类特征。
[0018]根据本公开的实施例,所述将所述目标分类特征和所述历史报文输入分类器进行
模型训练,以生成决策树包括:
[0019]计算所述目标分类特征的信息增益;
[0020]根据所述信息增益确定决策树的根节点和子节点,以生成决策树。
[0021]根据本公开的实施例,所述将所述属性信息输入预先训练的决策树模型分类器中,以输出所述待分拣报文的分类结果包括:
[0022]根据待分拣报文的属性信息确定与所述待分拣报文的目标分拣链路;
[0023]根据所述目标分拣链路确定所述待分拣报文的分类结果;
[0024]输出所述待分拣报文的分类结果。
[0025]根据本公开的实施例,还包括:
[0026]将完成分拣的报文加入所述训练数据集;
[0027]根据更新后的训练数据集重新训练决策树模型分类器。
[0028]根据本公开的实施例,所述属性信息包括业务类型信息和客户类型信息。
[0029]本公开的第二方面提供了一种基于决策树的报文分拣装置,所述装置包括:
[0030]代码降噪模块,用于对测试脚本代码进行预处理,以生成目标测试脚本代码信息;
[0031]获取模块,用于获取待分拣报文的属性信息;
[0032]分类模块,用于将所述属性信息输入预先训练的决策树模型分类器中,以输出所述待分拣报文的分类结果;以及
[0033]分拣模块,用于根据所述分类结果对所述待分拣报文进行分拣操作。
[0034]根据本公开的实施例,还包括:分类模型训练模块。
[0035]分类模型训练模块,用于预先训练决策树模型分类器。
[0036]根据本公开的实施例,分类模型训练模块包括预处理子模块和决策树生成子模块。
[0037]预处理子模块,用于将已分拣的历史报文作为训练数据集,对所述训练数据集进行预处理,以生成目标分类特征;
[0038]决策树生成子模块,用于将所述目标分类特征和所述历史报文输入分类器进行模型训练,以生成决策树。
[0039]根据本公开的实施例,预处理子模块包括:分词单元、文本表示单元、特征提取单元和目标分类特征确定单元。
[0040]分词单元,用于使用自然语言处理技术对历史报文进行分词处理,以确定所述历史报文的分类属性;
[0041]文本表示单元,用于将所述历史报文的分类属性进行文本表示;
[0042]特征提取单元,用于使用特征选择算法对文本表示后的分类属性进行特征提取,以生成初始分类特征;以及
[0043]目标分类特征确定单元,用于根据所述初始分类特征与所述历史报文的分拣结果的相关度确定目标分类特征。
[0044]根据本公开的实施例,决策树生成子模块包括信息增益计算单元和决策树生成单元。
[0045]信息增益计算单元,用于计算所述目标分类特征的信息增益;
[0046]决策树生成单元,用于根据所述信息增益确定决策树的根节点和子节点,以生成
决策树。
[0047]根据本公开的实施例,分类模块包括第一确定子模块、第二确定子模块和输出子模块。
[0048]第一确定子模块,用于根据待分拣报文的属性信息确定与所述待分拣报文的目标分拣链路;
[0049]第二确定子模块,用于根据所述目标分拣链路确定所述待分拣报文的分类结果;
[0050]输出子模块,用于输出所述待分拣报文的分类结果。
[0051]根据本公开的实施例,还包括分类模型更新模块。
[0052]分类模型更新模块,用于将完成分拣的报文加入所述训练数据集,根据更新后的训练数据集重新训练决策树模型分类器。
[0053]本公开的第三方面提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得一个或多个处理器执行上述基于决策树的报文分拣方法。
[0054]本公开的第四方面还提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行上述基于决策树的报文分拣方法。
[0055]本公开的第五方面还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述基于决策树的报文分拣方法。
[0056]通过本公开的实施例提供的一种基于决策树的报文分拣方法,获取待分拣报文的属性信息;将所述属性信息输入预先训练的决策树模型分类器中,以输出所述待分拣报文的分类结果;以及根据所述分类结果对所述待分拣报文进行分拣操作。相比于相关技术,本公开实施例提供的方法通过引入以决策树算法为基础的分类器,通过有监督学习方法自学习出一系列报文本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于决策树的报文分拣方法,其特征在于,所述报文分拣方法包括:获取待分拣报文的属性信息;将所述属性信息输入预先训练的决策树模型分类器中,以输出所述待分拣报文的分类结果;以及根据所述分类结果对所述待分拣报文进行分拣操作。2.根据权利要求1所述的报文分拣方法,其特征在于,预先训练决策树模型分类器包括:将已分拣的历史报文作为训练数据集,对所述训练数据集进行预处理,以生成目标分类特征;将所述目标分类特征和所述历史报文输入分类器进行模型训练,以生成决策树。3.根据权利要求2所述的报文分拣方法,其特征在于,所述对所述训练数据集进行预处理,以生成目标分类特征包括:使用自然语言处理技术对历史报文进行分词处理,以确定所述历史报文的分类属性;将所述历史报文的分类属性进行文本表示;使用特征选择算法对文本表示后的分类属性进行特征提取,以生成初始分类特征;以及根据所述初始分类特征与所述历史报文的分拣结果的相关度确定目标分类特征。4.根据权利要求2所述的报文分拣方法,其特征在于,所述将所述目标分类特征和所述历史报文输入分类器进行模型训练,以生成决策树包括:计算所述目标分类特征的信息增益;根据所述信息增益确定决策树的根节点和子节点,以生成决策树。5.根据权利要求1所述的报文分拣方法,其特征在于,所述将所述属性信息输入预先训练的决策树模型分类器中,以输出所述待分拣报文的分类结果...

【专利技术属性】
技术研发人员:罗宗凯蔡良晶黄孝斌
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1