【技术实现步骤摘要】
报文的关键字定位方法及装置
[0001]本专利技术涉及人工智能
,尤其涉及报文的关键字定位方法及装置
。
技术介绍
[0002]本部分旨在为权利要求书中陈述的本专利技术实施例提供背景或上下文
。
此处的描述不因为包括在本部分中就承认是现有技术
。
[0003]现阶段,金融风险关键字名单的筛查需要报文进行识别,从而实现每一金融风险关键字的溯源
。
目前多采用在业务处理时在原
MT/FMT
报文中以高亮形式显示命中金融风险名单的内容
。
[0004]现有金融风险关键字名单系统一般处理过程如下:将命中关键字的原始名称在原报文中进行匹配,匹配到就将这一块内容高亮
。
但现有技术只适用于保留了报文原始关键字,可以在原报文中进行全词匹配的情况
。
但目前因报文文本存在特殊字符和同义字的情况
、
或文本出错的情况,均无法在原报文中匹配原始位置,导致报文关键字定位存在局限性的问题,也降低了报文的关键字定位的效率
。
技术实现思路
[0005]本专利技术实施例提供一种报文的关键字定位方法,用以提升报文关键字定位的准确度和效率,该方法包括:
[0006]对原始报文关键字和原始报文进行文本处理,得到目标报文关键字和目标报文;所述文本处理包括符号剔除处理
、
同义字转换和输入形式转换;所述原始报文关键字用于描述银行的金融风险特征的关键字;
[00 ...
【技术保护点】
【技术特征摘要】
1.
一种报文的关键字定位方法,其特征在于,包括:对原始报文关键字和原始报文进行文本处理,得到目标报文关键字和目标报文;所述文本处理包括符号剔除处理
、
同义字转换和输入形式转换;所述原始报文关键字用于描述银行的金融风险特征的关键字;将所述目标报文关键字与目标报文进行文本匹配;在文本匹配成功时,确定所述目标报文中与所述目标报文关键字匹配的报文字段;在文本匹配不成功时,计算每一目标报文关键字与所述目标报文中每一字段之间的文本相似度;将所述文本相似度超过预设数值的字段,确定为所述目标报文中与所述目标报文关键字匹配的报文字段;对与所述报文字段相关联的原始报文中的字段进行标记处理
。2.
如权利要求1所述的方法,其特征在于,还包括:在对原始报文进行文本处理得到目标报文时,记录原始报文中每一字段和目标报文中每一字段之间的映射关系;对与所述报文字段相关联的原始报文中的字段进行标记处理,包括:根据所述映射关系,确定与所述报文字段相关联的原始报文中的字段;对与所述报文字段相关联的原始报文中的字段进行标记处理
。3.
如权利要求1所述的方法,其特征在于,将所述文本相似度超过预设数值的字段,确定为所述目标报文中与所述目标报文关键字匹配的报文字段,包括:将所述文本相似度超过预设数值的字段,作为待处理字段;从所述待处理字段中确定所述文本相似度最高的字段,确定为所述目标报文中与所述目标报文关键字匹配的报文字段
。4.
如权利要求1所述的方法,其特征在于,还包括:对与所述报文字段相关联的原始报文中的字段所在的报文段落,进行二次标记处理
。5.
如权利要求1所述的方法,其特征在于,对与所述报文字段相关联的原始报文中的字段进行标记处理,包括:切分原始报文的多个栏位;在每一栏位下,并行确定与所述报文字段相关联的原始报文中的字段;对与所述报文字段相关联的原始报文中的字段进行标记处理
。6.
一种报文的关键字定位装置,其特征在于,包括:文本处理模块,用于对原始报文关键字和原始报文进行文本处理,得到目标报文关键字和目标报文;所述文本处理包括符号剔除处理
、
同义字转换和输入形式转换;所述原始报文关键字用于描述银行的金融风险特征的...
【专利技术属性】
技术研发人员:郭龙城,赵婷婷,
申请(专利权)人:中国建设银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。