报文的关键字定位方法及装置制造方法及图纸

技术编号:39733862 阅读:10 留言:0更新日期:2023-12-17 23:36
本发明专利技术公开了一种报文的关键字定位方法及装置,涉及人工智能技术领域,该方法包括:对原始报文关键字和原始报文进行文本处理,得到目标报文关键字和目标报文;所述文本处理包括符号剔除处理

【技术实现步骤摘要】
报文的关键字定位方法及装置


[0001]本专利技术涉及人工智能
,尤其涉及报文的关键字定位方法及装置


技术介绍

[0002]本部分旨在为权利要求书中陈述的本专利技术实施例提供背景或上下文

此处的描述不因为包括在本部分中就承认是现有技术

[0003]现阶段,金融风险关键字名单的筛查需要报文进行识别,从而实现每一金融风险关键字的溯源

目前多采用在业务处理时在原
MT/FMT
报文中以高亮形式显示命中金融风险名单的内容

[0004]现有金融风险关键字名单系统一般处理过程如下:将命中关键字的原始名称在原报文中进行匹配,匹配到就将这一块内容高亮

但现有技术只适用于保留了报文原始关键字,可以在原报文中进行全词匹配的情况

但目前因报文文本存在特殊字符和同义字的情况

或文本出错的情况,均无法在原报文中匹配原始位置,导致报文关键字定位存在局限性的问题,也降低了报文的关键字定位的效率


技术实现思路

[0005]本专利技术实施例提供一种报文的关键字定位方法,用以提升报文关键字定位的准确度和效率,该方法包括:
[0006]对原始报文关键字和原始报文进行文本处理,得到目标报文关键字和目标报文;所述文本处理包括符号剔除处理

同义字转换和输入形式转换;所述原始报文关键字用于描述银行的金融风险特征的关键字;
[0007]将所述目标报文关键字与目标报文进行文本匹配;
[0008]在文本匹配成功时,确定所述目标报文中与所述目标报文关键字匹配的报文字段;在文本匹配不成功时,计算每一目标报文关键字与所述目标报文中每一字段之间的文本相似度;将所述文本相似度超过预设数值的字段,确定为所述目标报文中与所述目标报文关键字匹配的报文字段;
[0009]对与所述报文字段相关联的原始报文中的字段进行标记处理
[0010]本专利技术实施例还提供一种报文的关键字定位装置,用以提升报文关键字定位的准确度和效率,该装置包括:
[0011]文本处理模块,用于对原始报文关键字和原始报文进行文本处理,得到目标报文关键字和目标报文;所述文本处理包括符号剔除处理

同义字转换和输入形式转换;所述原始报文关键字用于描述银行的金融风险特征的关键字;
[0012]文本匹配模块,用于将所述目标报文关键字与目标报文进行文本匹配;
[0013]报文字段确定模块,用于在文本匹配成功时,确定所述目标报文中与所述目标报文关键字匹配的报文字段;在文本匹配不成功时,计算每一目标报文关键字与所述目标报文中每一字段之间的文本相似度;将所述文本相似度超过预设数值的字段,确定为所述目
标报文中与所述目标报文关键字匹配的报文字段;
[0014]标记处理模块,用于对与所述报文字段相关联的原始报文中的字段进行标记处理

[0015]本专利技术实施例还提供一种计算机设备,包括存储器

处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述报文的关键字定位方法

[0016]本专利技术实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述报文的关键字定位方法

[0017]本专利技术实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现上述报文的关键字定位方法

[0018]本专利技术实施例中,对原始报文关键字和原始报文进行文本处理,得到目标报文关键字和目标报文;所述文本处理包括符号剔除处理

同义字转换和输入形式转换;所述原始报文关键字用于描述银行的金融风险特征的关键字;将所述目标报文关键字与目标报文进行文本匹配;在文本匹配成功时,确定所述目标报文中与所述目标报文关键字匹配的报文字段;在文本匹配不成功时,计算每一目标报文关键字与所述目标报文中每一字段之间的文本相似度;将所述文本相似度超过预设数值的字段,确定为所述目标报文中与所述目标报文关键字匹配的报文字段;对与所述报文字段相关联的原始报文中的字段进行标记处理,与现有技术中在报文文本出错时无法准确匹配到关键字的技术方案相比,通过对关键字和报文的文本处理,以及计算每一目标报文关键字与所述目标报文中每一字段之间的文本相似度,解决了现有技术下因报文文本问题无法准确报文定位的问题,提升了报文关键字定位的准确度和效率

附图说明
[0019]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图

在附图中:
[0020]图1为本专利技术实施例中一种报文的关键字定位方法的流程示意图;
[0021]图2为本专利技术实施例中一种报文的关键字定位装置的结构示例图;
[0022]图3为本专利技术实施例中一种报文的关键字定位装置的具体示例图;
[0023]图4为本专利技术实施例中一种报文的关键字定位装置的具体示例图;
[0024]图5为本专利技术实施例中提供的一种计算机设备的示意图

具体实施方式
[0025]为使本专利技术实施例的目的

技术方案和优点更加清楚明白,下面结合附图对本专利技术实施例做进一步详细说明

在此,本专利技术的示意性实施例及其说明用于解释本专利技术,但并不作为对本专利技术的限定

[0026]本文中术语“和
/
或”,仅仅是描述一种关联关系,表示可以存在三种关系,例如,
A

/

B
,可以表示:单独存在
A
,同时存在
A

B
,单独存在
B
这三种情况

另外,本文中术语“至
少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括
A、B、C
中的至少一种,可以表示包括从
A、B

C
构成的集合中选择的任意一个或多个元素

[0027]在本说明书的描述中,所使用的“包含”、“包括”、“具有”、“含有”等,均为开放性的用语,即意指包含但不限于

参考术语“一个实施例”、“一个具体实施例”、“一些实施例”、“例如”等的描述意指结合该实施例或示例描述的具体特征

结构或者特点包含于本申请的至少一个实施例或示例中

在本说明书中,对上述术语的示意性表述不一定指的是相同本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种报文的关键字定位方法,其特征在于,包括:对原始报文关键字和原始报文进行文本处理,得到目标报文关键字和目标报文;所述文本处理包括符号剔除处理

同义字转换和输入形式转换;所述原始报文关键字用于描述银行的金融风险特征的关键字;将所述目标报文关键字与目标报文进行文本匹配;在文本匹配成功时,确定所述目标报文中与所述目标报文关键字匹配的报文字段;在文本匹配不成功时,计算每一目标报文关键字与所述目标报文中每一字段之间的文本相似度;将所述文本相似度超过预设数值的字段,确定为所述目标报文中与所述目标报文关键字匹配的报文字段;对与所述报文字段相关联的原始报文中的字段进行标记处理
。2.
如权利要求1所述的方法,其特征在于,还包括:在对原始报文进行文本处理得到目标报文时,记录原始报文中每一字段和目标报文中每一字段之间的映射关系;对与所述报文字段相关联的原始报文中的字段进行标记处理,包括:根据所述映射关系,确定与所述报文字段相关联的原始报文中的字段;对与所述报文字段相关联的原始报文中的字段进行标记处理
。3.
如权利要求1所述的方法,其特征在于,将所述文本相似度超过预设数值的字段,确定为所述目标报文中与所述目标报文关键字匹配的报文字段,包括:将所述文本相似度超过预设数值的字段,作为待处理字段;从所述待处理字段中确定所述文本相似度最高的字段,确定为所述目标报文中与所述目标报文关键字匹配的报文字段
。4.
如权利要求1所述的方法,其特征在于,还包括:对与所述报文字段相关联的原始报文中的字段所在的报文段落,进行二次标记处理
。5.
如权利要求1所述的方法,其特征在于,对与所述报文字段相关联的原始报文中的字段进行标记处理,包括:切分原始报文的多个栏位;在每一栏位下,并行确定与所述报文字段相关联的原始报文中的字段;对与所述报文字段相关联的原始报文中的字段进行标记处理
。6.
一种报文的关键字定位装置,其特征在于,包括:文本处理模块,用于对原始报文关键字和原始报文进行文本处理,得到目标报文关键字和目标报文;所述文本处理包括符号剔除处理

同义字转换和输入形式转换;所述原始报文关键字用于描述银行的金融风险特征的...

【专利技术属性】
技术研发人员:郭龙城赵婷婷
申请(专利权)人:中国建设银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1