针对监管报送需求的数据处理方法和系统技术方案

技术编号:36864351 阅读:49 留言:0更新日期:2023-03-15 18:54
本发明专利技术公开了一种针对监管报送需求的数据处理方法和系统,其采用基于深度学习的人工智能语言理解算法来提取出监管报送需求的文本描述中基于全局的上下文词语义特征,并基于所述词语义特征在向量维度和样本维度下的小尺度关联特征以及所述词语义特征在向量维度下的进一步小尺度关联特征的融合特征来表示所述监管报送需求的文本描述的词语义特征的多尺度语义理解特征信息,以此来进行对于所述监管报送需求所需汇总的数据项标签的组合判断。这样,能够对于所述监管报送需求的数据进行智能语义理解分析处理,以准确地确定所述监管报送需求所需汇总的数据项。管报送需求所需汇总的数据项。管报送需求所需汇总的数据项。

【技术实现步骤摘要】
针对监管报送需求的数据处理方法和系统


[0001]本申请涉及智能监管
,且更为具体地,涉及一种针对监管报送需求的数据处理方法和系统。

技术介绍

[0002]集团性企业,监管部门会对各个公司进行监管,例如监管部门会统一监督管理全国银行保险市场、维护市场秩序、保障其合法运行的行为。目前,各个被监管机构(例如银行)从自身不同业务系统的数据中进行报送,而监管机构基于监管报送需求来汇总计算相关数据并基于汇总结果来实现监管目标。
[0003]但是,监管机构需要依赖专业人士来对监管报送需求进行理解和解读,以确定需要汇总的相关数据项,这一方面导致了监管效率的降低,同时因对专业人士的依赖,引入了人为监管误差。
[0004]因此,强调一种针对监管报送需求的数据处理方案。

技术实现思路

[0005]为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种针对监管报送需求的数据处理方法和系统,其采用基于深度学习的人工智能语言理解算法来提取出监管报送需求的文本描述中基于全局的上下文词语义特征,并基于所述词语义特征在向量维度和样本维度下的小尺度关联特征以及所述词语义特征在向量维度下的进一步小尺度关联特征的融合特征来表示所述监管报送需求的文本描述的词语义特征的多尺度语义理解特征信息,以此来进行对于所述监管报送需求所需汇总的数据项标签的组合判断。这样,能够对于所述监管报送需求的数据进行智能语义理解分析处理,以准确地确定所述监管报送需求所需汇总的数据项。
[0006]根据本申请的一个方面,提供了一种针对监管报送需求的数据处理方法,其包括:获取监管报送需求的文本描述;对所述监管报送需求的文本描述进行分词处理以得到词序列;将所述词序列通过基于转换器的上下文编码器以得到多个词语义特征向量;将所述多个词语义特征向量进行二维排列为特征矩阵后通过文本卷积神经网络模型以得到第一尺度监管报送需求理解特征向量;将所述多个词语义特征向量排列为一维特征向量后通过一维卷积神经网络模型以得到第二尺度监管报送需求理解特征向量;融合所述第一尺度监管报送需求理解特征向量和所述第二尺度监管报送需求理解特征向量以得到分类特征向量;以及将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示监管报送需求所需汇总的数据项标签的组合。
[0007]在上述针对监管报送需求的数据处理方法中,所述将所述词序列通过基于转换器的上下文编码器以得到多个词语义特征向量,包括:将所述词序列排列为输入向量;将所述
输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量;计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;以及,将所述自注意力特征矩阵与以所述词序列中各个词作为值向量分别进行相乘以得到所述多个词语义特征向量。
[0008]在上述针对监管报送需求的数据处理方法中,所述将所述多个词语义特征向量进行二维排列为特征矩阵后通过文本卷积神经网络模型以得到第一尺度监管报送需求理解特征向量,包括:使用所述文本卷积神经网络模型的各层在层的正向传递中分别进行:对输入数据进行卷积处理以得到卷积特征图;对所述卷积特征图进行基于局部特征矩阵的均值池化以得到池化特征图;以及,对所述池化特征图进行非线性激活以得到激活特征图;其中,所述文本卷积神经网络模型的最后一层的输出为所述第一尺度监管报送需求理解特征向量,所述文本卷积神经网络模型的第一层的输入为所述特征矩阵。
[0009]在上述针对监管报送需求的数据处理方法中,所述将所述多个词语义特征向量排列为一维特征向量后通过一维卷积神经网络模型以得到第二尺度监管报送需求理解特征向量,包括:使用所述一维卷积神经网络模型的各层在层的正向传递中对输入数据分别进行基于一维卷积核的卷积处理和非线性激活处理以由所述一维卷积神经网络模型的最后一层输出所述第二尺度监管报送需求理解特征向量,其中,所述一维卷积神经网络模型的第一层的输入为所述一维特征向量。
[0010]在上述针对监管报送需求的数据处理方法中,所述融合所述第一尺度监管报送需求理解特征向量和所述第二尺度监管报送需求理解特征向量以得到分类特征向量,包括:将所述第一尺度监管报送需求理解特征向量和所述第二尺度监管报送需求理解特征向量进行级联以得到初始分类特征向量;计算所述第一尺度监管报送需求理解特征向量和所述第二尺度监管报送需求理解特征向量之间的小尺度局部衍生特征向量作为加权特征向量,其中,所述小尺度局部衍生特征向量与所述第一尺度监管报送需求理解特征向量和所述第二尺度监管报送需求理解特征向量之间的按位置差分的绝对值有关;以及,计算所述加权特征向量与所述初始分类特征向量之间的按位置点乘以得到所述分类特征向量。
[0011]在上述针对监管报送需求的数据处理方法中,所述计算所述第一尺度监管报送需求理解特征向量和所述第二尺度监管报送需求理解特征向量之间的小尺度局部衍生特征向量作为加权特征向量,包括:以如下公式计算所述第一尺度监管报送需求理解特征向量和所述第二尺度监管报送需求理解特征向量之间的小尺度局部衍生特征向量作为所述加权特征向量;其中,所述公式为:其中和分别是所述第一尺度监管报送需求理解特征向量和所述第二尺度监管报送需求理解特征向量的第个位置的特征值,表示所述加权特征向量的第个位置的特征值。
[0012]在上述针对监管报送需求的数据处理方法中,所述将所述分类特征向量通过分类器以得到分类结果,包括:使用所述分类器的全连接层对所述分类特征向量进行全连接编
码以得到编码分类特征向量;以及,将所述编码分类特征向量输入所述分类器的Softmax分类函数以得到所述分类结果。
[0013]根据本申请的另一方面,提供了一种针对监管报送需求的数据处理系统,包括:文本获取模块,用于获取监管报送需求的文本描述;分词模块,用于对所述监管报送需求的文本描述进行分词处理以得到词序列;上下文编码模块,用于将所述词序列通过基于转换器的上下文编码器以得到多个词语义特征向量;文本编码模块,用于将所述多个词语义特征向量进行二维排列为特征矩阵后通过文本卷积神经网络模型以得到第一尺度监管报送需求理解特征向量;一维编码模块,用于将所述多个词语义特征向量排列为一维特征向量后通过一维卷积神经网络模型以得到第二尺度监管报送需求理解特征向量;融合模块,用于融合所述第一尺度监管报送需求理解特征向量和所述第二尺度监管报送需求理解特征向量以得到分类特征向量;以及组合结果生成模块,用于将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示监管报送需求所需汇总的数据项标签的组合。
[0014]在上述针对监管报送需求的数据处理系统中,所述上下文编码模块,进一步用于:将所述词序列排列为输入向量;将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量;计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;对所述自注意关本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种针对监管报送需求的数据处理方法,其特征在于,包括:获取监管报送需求的文本描述;对所述监管报送需求的文本描述进行分词处理以得到词序列;将所述词序列通过基于转换器的上下文编码器以得到多个词语义特征向量;将所述多个词语义特征向量进行二维排列为特征矩阵后通过文本卷积神经网络模型以得到第一尺度监管报送需求理解特征向量;将所述多个词语义特征向量排列为一维特征向量后通过一维卷积神经网络模型以得到第二尺度监管报送需求理解特征向量;融合所述第一尺度监管报送需求理解特征向量和所述第二尺度监管报送需求理解特征向量以得到分类特征向量;以及将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示监管报送需求所需汇总的数据项标签的组合。2.根据权利要求1所述的针对监管报送需求的数据处理方法,其特征在于,所述将所述词序列通过基于转换器的上下文编码器以得到多个词语义特征向量,包括:将所述词序列排列为输入向量;将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量;计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;以及将所述自注意力特征矩阵与以所述词序列中各个词作为值向量分别进行相乘以得到所述多个词语义特征向量。3.根据权利要求2所述的针对监管报送需求的数据处理方法,其特征在于,所述将所述多个词语义特征向量进行二维排列为特征矩阵后通过文本卷积神经网络模型以得到第一尺度监管报送需求理解特征向量,包括:使用所述文本卷积神经网络模型的各层在层的正向传递中分别进行:对输入数据进行卷积处理以得到卷积特征图;对所述卷积特征图进行基于局部特征矩阵的均值池化以得到池化特征图;以及对所述池化特征图进行非线性激活以得到激活特征图;其中,所述文本卷积神经网络模型的最后一层的输出为所述第一尺度监管报送需求理解特征向量,所述文本卷积神经网络模型的第一层的输入为所述特征矩阵。4.根据权利要求3所述的针对监管报送需求的数据处理方法,其特征在于,所述将所述多个词语义特征向量排列为一维特征向量后通过一维卷积神经网络模型以得到第二尺度监管报送需求理解特征向量,包括:使用所述一维卷积神经网络模型的各层在层的正向传递中对输入数据分别进行基于一维卷积核的卷积处理和非线性激活处理以由所述一维卷积神经网络模型的最后一层输出所述第二尺度监管报送需求理解特征向量,其中,所述一维卷积神经网络模型的第一层的输入为所述一维特征向量。5.根据权利要求4所述的针对监管报送需求的数据处理方法,其特征在于,所述融合所述第一尺度监管报送需求理解特征向量和所述第二尺度监管报送需求理解特征向量以得到分类特征向量,包括:
将所述第一尺度监管报送需求理解特征向量和所述第二尺度监管报送需求理解特征向量进行级联以得到初始分类特征向量;计算所述第一尺度监管报送需求理解特征向量和所述第二尺度监管报送需求理解特征向量之间的小尺度局部衍生特征向量作为加权特征向量,其中,所述小尺度局部衍生特征向量与所述第一尺度监管报送需求理解特征向量和所述第二尺度监...

【专利技术属性】
技术研发人员:钱吕见王蒙唐美玲
申请(专利权)人:杭银消费金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1