交易报文筛查方法及装置制造方法及图纸

技术编号:39641644 阅读:13 留言:0更新日期:2023-12-09 11:08
本发明专利技术公开了一种交易报文筛查方法及装置,涉及大数据领域,其中该方法包括:将待筛查交易报文与高频剔除策略库进行比对,对符合高频剔除策略的语句进行剔除;高频剔除策略库为根据从历史交易报文中提取常用的固定句子

【技术实现步骤摘要】
交易报文筛查方法及装置


[0001]本专利技术涉及大数据
,尤其涉及一种交易报文筛查方法及装置


技术介绍

[0002]本部分旨在为权利要求书中陈述的本专利技术实施例提供背景或上下文

此处的描述不因为包括在本部分中就承认是现有技术

[0003]根据监管要求,金融机构需要对所有交易进行实时名单筛查,确认交易是否涉及监管要求重点关注的名单

交易报文名单筛查需要对金融机构所有类型的交易报文进行筛查,也包括交易报文中的自由域

由于自由域报文为完全非结构化格式,而且一般非常长,名单筛查系统无法准确识别出自由域中哪些单词是客户名称

银行名称

国家名称和港口名称,所以需要对自由域进行全文搜索,即每个单词都要进行搜索

全文搜索一方面因为报文长度比较长,因此筛查时间会比较长,响应时间很难满足交易系统时效性要求,另一方面全文搜索把每个单词都当作客户名称的一部分进行搜索,容易导致大量的误命中,金融机构需要投往大量人力物力进行人工审核


技术实现思路

[0004]本专利技术实施例提供一种交易报文筛查方法,用以提高交易报文筛查的效率和准确率,该方法包括:
[0005]获取待筛查交易报文;
[0006]将待筛查交易报文与预先配置的高频剔除策略库进行比对,对符合高频剔除策略的语句在进行报文筛查之前进行剔除,得到剔除高频语句后的剩余报文内容;所述高频剔除策略库为根据从历史交易报文中提取常用的固定句子

固定短语及固定语法表达方式的其中之一或任意组合生成的策略库;符合高频剔除策略的语句为出现次数超过预设频率的语句;
[0007]将剔除高频语句后的剩余报文内容送入名单筛查系统进行名单筛查

[0008]本专利技术实施例还提供一种交易报文筛查装置,用以提高交易报文筛查的效率和准确率,该装置包括:
[0009]获取单元,用于获取待筛查交易报文;
[0010]筛查单元,用于将待筛查交易报文与预先配置的高频剔除策略库进行比对,对符合高频剔除策略的语句在进行报文筛查之前进行剔除,得到剔除高频语句后的剩余报文内容;所述高频剔除策略库为根据从历史交易报文中提取常用的固定句子

固定短语及固定语法表达方式的其中之一或任意组合生成的策略库;符合高频剔除策略的语句为出现次数超过预设频率的语句;
[0011]传送单元,用于将剔除高频语句后的剩余报文内容送入名单筛查系统进行名单筛查

[0012]本专利技术实施例还提供一种计算机设备,包括存储器

处理器及存储在存储器上并
可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述交易报文筛查方法

[0013]本专利技术实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述交易报文筛查方法

[0014]本专利技术实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现上述交易报文筛查方法

[0015]本专利技术实施例中,交易报文筛查方案,与现有技术中需要全文搜索效率低且容易出现误命中的技术方案相比,通过:首先根据历史交易报文进行高频句子

高频短语和高频表达式的提取与统计,自动生成高频剔除策略库;在进行交易报文名单筛查时,在筛查之前根据高频剔除策略库对待筛查报文进行高频句子,高频短语和高频表达式的剔除,在原报文的基础上大大地缩小了名单筛查的内容范围,极大地提高系统筛查效率,同时由于被剔除的内容当中包含了大量容易误命中的单词,在剔除之后再进行筛查,也大大地降低了系统误命中的概率,从而提高了系统筛查的准确性,降低了金融机构运营成本

附图说明
[0016]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图

在附图中:
[0017]图1为本专利技术实施例中交易报文筛查方法的流程示意图;
[0018]图2为本专利技术另一实施例中交易报文筛查方法的流程示意图;
[0019]图3为本专利技术又一实施例中交易报文筛查方法的流程示意图;
[0020]图4为本专利技术实施例中交易报文筛查装置的结构示意图;
[0021]图5为本专利技术另一实施例中交易报文筛查装置的结构示意图

具体实施方式
[0022]为使本专利技术实施例的目的

技术方案和优点更加清楚明白,下面结合附图对本专利技术实施例做进一步详细说明

在此,本专利技术的示意性实施例及其说明用于解释本专利技术,但并不作为对本专利技术的限定

[0023]本申请技术方案中对数据的获取

存储

使用

处理等均符合法律法规的相关规定

[0024]银行交易报文:银行交易报文是银行之间往来交易所用的交易系统的通讯报文,例如环球同业银行金融电讯协会
SWIFT
所用的
SWIFT
报文,跨境人民币交易报文
CIPS
报文和境内外币交易报文
FMT
报文等

[0025]自由域:银行交易报文根据报文规范由一到多个报文栏位组成,有些报文栏位为结构化,有些报文栏位为非结构化或者半结构化的,例如
swift
报文
MT700

45A、46A
等,根据报文规范为
100*65X

Narrative
,即允许写
100
行,每行最多
65
个字符的自由文本,这种栏位也叫自由域

[0026]报文样例:
[0027]{1:F01PCBCCNBJAZJX0620491787}{2:O7201902181214SHBKCNBJAXXX26801578531812141902N}{3:{108:0490697439}}{4:
[0028]……
[0029]:47A:+DOCUMENTS MUST BE PRESENTED PRIOR TO CREDIT EXPIRY DATE,DESPITEOF THE PERIOD FOR PRESENTATION IN DAYS
[0030]+QUANTITY AND CREDIT AMOUNT 5PCT MORE OR LESS ALLOWED
[0031]+SHIPPER SHOU本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种交易报文筛查方法,其特征在于,包括:获取待筛查交易报文;将待筛查交易报文与预先配置的高频剔除策略库进行比对,对符合高频剔除策略的语句在进行报文筛查之前进行剔除,得到剔除高频语句后的剩余报文内容;所述高频剔除策略库为根据从历史交易报文中提取常用的固定句子

固定短语及固定语法表达方式的其中之一或任意组合生成的策略库;符合高频剔除策略的语句为出现次数超过预设频率的语句;将剔除高频语句后的剩余报文内容送入名单筛查系统进行名单筛查
。2.
如权利要求1所述的方法,其特征在于,还包括:通过对历史交易报文进行统计分析,自动生成高频剔除策略库
。3.
如权利要求2所述的方法,其特征在于,通过对历史交易报文进行统计分析,自动生成高频剔除策略库,包括:遍历指定范围内的所有历史交易报文,通过提取每两个历史交易报文的最长相同固定句子

固定短语和固定语法表达方式,将出现次数超过预设频率的固定句子

固定短语及固定语法表达方式的其中之一或任意组合的策略加入待推荐高频剔除策略库
。4.
如权利要求3所述的方法,其特征在于,还包括:将待推荐高频剔除策略库推送给金融机构合规人员的终端进行审核,在接收到审核通过的结果时,将待推荐高频剔除策略库作为最终的高频剔除策略库
。5.
如权利要求2所述的方法,其特征在于,还包括:对出现次数超过预设频率的固定句子用正式表达式进行表示,生成高频剔除策略

【专利技术属性】
技术研发人员:叶小强陈云
申请(专利权)人:中国建设银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1