System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及计算机,具体而言,涉及一种风险账户识别方法、装置、电子设备和存储介质。
技术介绍
1、目前,商业银行采用反洗钱名单对账户名称进行模糊匹配的方式来识别可能存在的风险账户。在跨境交易中,由于各个账户对应的客户遍布不同国家,所使用的语种也不尽相同,使得翻译后得到的账户名称可能存在若干别名或者变体,导致风险账户识别的准确率低,无法满足商业银行进行风险防控的需要。
2、因此,如何提高风险账户识别的准确率,满足商业银行进行风险防控的需要成为业界亟待解决的技术问题。
技术实现思路
1、本申请提供一种风险账户识别方法、装置、电子设备和存储介质,用于解决如何提高风险账户识别的准确率,满足商业银行进行风险防控的需要的技术问题。
2、本申请提供一种风险账户识别方法,包括:
3、获取待识别账户的账户名称在当前语种下的字符表示结果;
4、基于所述当前语种对应的单变音位编码规则,对所述字符表示结果进行编码,得到所述账户名称对应的语音代码;
5、将所述账户名称对应的语音代码与各个风险账户名称对应的语音代码进行匹配;
6、基于语音代码匹配结果,确定所述待识别账户的风险识别结果;
7、其中,所述当前语种对应的单变音位编码规则是基于所述当前语种中各个字母在不同字符表示结果中对应的音位变体确定的。
8、在一些实施例中,所述将所述账户名称对应的语音代码与各个风险账户名称对应的语音代码进行匹配之前,包括:
10、基于所述当前语种对应的单变音位编码规则,对各个风险账户名称的字符表示结果进行编码,得到各个风险账户名称对应的语音代码。
11、在一些实施例中,所述获取待识别账户的账户名称在当前语种下的字符表示结果之后,所述方法包括:
12、对所述字符表示结果中的各个字符进行检测,确定所述字符表示结果中存在不属于所述当前语种对应的第一字母;
13、在所述字符表示结果中删去所述第一字母,并将所述字符表示结果中各个字母均转换为大写格式或者小写格式。
14、在一些实施例中,所述在所述字符表示结果中删去所述第一字母,并将所述字符表示结果中各个字母均转换为大写格式或者小写格式之后,所述方法包括:
15、确定所述字符表示结果中各个分词中位于词首的字母组合;
16、在所述字母组合与预设字母组合匹配的情况下,删去所述字母组合中的第二字母;
17、其中,所述第二字母在所述预设字母组合中不发音。
18、在一些实施例中,所述在所述字母组合与预设字母组合匹配的情况下,删去所述字母组合中的第二字母之后,所述方法包括:
19、在各个分词中对遍历各个字母,确定当前字母以及所述当前字母对应的下一字母;
20、在所述当前字母与所述下一字母相同的情况下,在各个分词中删去所述下一字母。
21、在一些实施例中,所述在所述当前字母与所述下一字母相同的情况下,在各个分词中删去所述下一字母之后,所述方法包括:
22、在各个分词中确定各个字母对应的音素类型和排列位置;
23、在任一字母对应的音素类型为元音字母且排列位置为词首的情况下,在各个分词中保留所述任一字母;
24、在任一字母对应的音素类型为元音字母且排列位置为词中或者词尾的情况下,在各个分词中删除所述任一字母。
25、在一些实施例中,所述基于所述当前语种对应的单变音位编码规则,对所述字符表示结果进行编码,得到所述账户名称对应的语音代码,包括:
26、在各个分词中对音素类型为辅音字母的字母进行检测;
27、在任一字母与第一辅音字母相匹配的情况下,将所述任一字母的字符表示结果作为所述任一字母的语音代码;所述第一辅音字母的音位变体对应的字符表示结果与所述第一辅音字母相同;
28、在任一字母与第二辅音字母相匹配的情况下,将所述任一字母的音位变体对应的字符表示结果作为所述任一字母的语音代码;所述第二辅音字母的音位变体对应的字符表示结果与所述第二辅音字母不同;
29、在任一字母与第三辅音字母相匹配的情况下,确定所述任一字母在各个分词中的字母组合,确定所述字母组合中所述任一字母对应的音位变体,将所述音位变体对应的字符表示结果作为所述任一字母的语音代码;所述第三辅音字母的音位变体是基于所述第三辅音字母在分词中的字母组合确定的。
30、本申请提供一种风险账户识别装置,包括:
31、获取单元,用于获取待识别账户的账户名称在当前语种下的字符表示结果;
32、编码单元,用于基于所述当前语种对应的单变音位编码规则,对所述字符表示结果进行编码,得到所述账户名称对应的语音代码;
33、匹配单元,用于将所述账户名称对应的语音代码与各个风险账户名称对应的语音代码进行匹配;
34、识别单元,用于基于语音代码匹配结果,确定所述待识别账户的风险识别结果;
35、其中,所述当前语种对应的单变音位编码规则是基于所述当前语种中各个字母在不同字符表示结果中对应的音位变体确定的。
36、本申请提供一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述的风险账户识别方法。
37、本申请提供一种计算机可读的存储介质,所述计算机可读的存储介质包括存储的程序,其中,所述程序运行时执行所述的风险账户识别方法。
38、本申请提供的风险账户识别方法、装置、电子设备和存储介质,获取待识别账户的账户名称在当前语种下的字符表示结果;基于当前语种对应的单变音位编码规则,对字符表示结果进行编码,得到账户名称对应的语音代码;将账户名称对应的语音代码与各个风险账户名称对应的语音代码进行匹配;基于语音代码匹配结果,确定待识别账户的风险识别结果;由于当前语种对应的单变音位编码规则是基于当前语种中各个字母在不同字符表示结果中对应的音位变体确定的,将账户名称转化为语音代码之后再进行比较,可以从语言发音的角度以音位为单位对账户名称进行识别,能够有效地鉴别出账户名称在当前语种下因读音而造成的拼写错误,避免出现漏检风险,提高了风险账户的识别准确率,满足商业银行进行风险防控的需要。
本文档来自技高网...【技术保护点】
1.一种风险账户识别方法,其特征在于,包括:
2.根据权利要求1所述的风险账户识别方法,其特征在于,所述将所述账户名称对应的语音代码与各个风险账户名称对应的语音代码进行匹配之前,包括:
3.根据权利要求1所述的风险账户识别方法,其特征在于,所述获取待识别账户的账户名称在当前语种下的字符表示结果之后,所述方法包括:
4.根据权利要求3所述的风险账户识别方法,其特征在于,所述在所述字符表示结果中删去所述第一字母,并将所述字符表示结果中各个字母均转换为大写格式或者小写格式之后,所述方法包括:
5.根据权利要求4所述的风险账户识别方法,其特征在于,所述在所述字母组合与预设字母组合匹配的情况下,删去所述字母组合中的第二字母之后,所述方法包括:
6.根据权利要求5所述的风险账户识别方法,其特征在于,所述在所述当前字母与所述下一字母相同的情况下,在各个分词中删去所述下一字母之后,所述方法包括:
7.根据权利要求6所述的风险账户识别方法,其特征在于,所述基于所述当前语种对应的单变音位编码规则,对所述字符表示结果进行编码,得到
8.一种风险账户识别装置,其特征在于,包括:
9.一种电子设备,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行权利要求1至7任一项所述的风险账户识别方法。
10.一种计算机可读的存储介质,其特征在于,所述计算机可读的存储介质包括存储的程序,其中,所述程序运行时执行权利要求1至7任一项所述的风险账户识别方法。
...【技术特征摘要】
1.一种风险账户识别方法,其特征在于,包括:
2.根据权利要求1所述的风险账户识别方法,其特征在于,所述将所述账户名称对应的语音代码与各个风险账户名称对应的语音代码进行匹配之前,包括:
3.根据权利要求1所述的风险账户识别方法,其特征在于,所述获取待识别账户的账户名称在当前语种下的字符表示结果之后,所述方法包括:
4.根据权利要求3所述的风险账户识别方法,其特征在于,所述在所述字符表示结果中删去所述第一字母,并将所述字符表示结果中各个字母均转换为大写格式或者小写格式之后,所述方法包括:
5.根据权利要求4所述的风险账户识别方法,其特征在于,所述在所述字母组合与预设字母组合匹配的情况下,删去所述字母组合中的第二字母之后,所述方法包括:
6.根据权利要...
【专利技术属性】
技术研发人员:汪盛,
申请(专利权)人:中银金融科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。