生僻字检测方法、装置、存储介质以及终端制造方法及图纸

技术编号:38033042 阅读:14 留言:0更新日期:2023-06-30 10:59
本说明书实施例公开了一种生僻字检测方法、装置、存储介质以及终端,涉及信息处理技术领域。首先获取待检测的对象名称,判断对象名称中是否存在替代字符或者拆分字符;然后若存在,则确定对象名称中存在生僻字。由于在实际情况中,当遇到对象名称中存在生僻字时,大多会将对象名称中的生僻字进行替换或者拆分,那么只要确定对象名称中存在替代字符或者拆分字符,那么就可以确定对象名称中存在生僻字,不需要用户手动进行参与就可以实现对生僻字的检测,大大提高了生僻字的检测效率。大大提高了生僻字的检测效率。大大提高了生僻字的检测效率。

【技术实现步骤摘要】
生僻字检测方法、装置、存储介质以及终端


[0001]本说明书涉及信息处理
,尤其涉及一种生僻字检测方法、装置、存储介质以及终端。

技术介绍

[0002]随着通信技术的快速发展,逐步迈入项目处理的信息化时代,对应的姓名、地名、住址等信息逐步摆脱了纸质记录和存储原始方式,效率得到极大提升。由于我国汉字历史源远流长,到目前为止还存在比较多的冷僻字、异体字、地方特有字等特殊生僻字符继续使用。

技术实现思路

[0003]第一方面,本说明书实施例提供一种生僻字检测方法,所述方法包括:
[0004]获取待检测的对象名称,判断所述对象名称中是否存在替代字符或者拆分字符;
[0005]若存在,则确定所述对象名称中存在生僻字。
[0006]在一种可能的实现方式中,所述判断所述对象名称中是否存在替代字符或者拆分字符之前,还包括:检测所述对象名称的每个名称字符是否属于常用字符编码库的常用字符;若每个所述名称字符均属于所述常用字符编码库的常用字符,则确定所述对象名称不存在生僻字;若存在至少一个所述名称字符不属于所述常用字符编码库的常用字符,则确定所述对象名称存在生僻字。
[0007]在一种可能的实现方式中,所述检测所述对象名称的每个名称字符是否属于所述常用字符编码库的常用字符,包括:获取针对所述常用字符编码库的常用字符识别正则式;采用所述常用字符识别正则式检测所述对象名称的每个名称字符是否属于所述常用字符编码库对应的常用字符码点范围。
[0008]在一种可能的实现方式中,所述判断所述对象名称中是否存在替代字符或者拆分字符,包括:判断所述对象名称的每个名称字符是否属于替代字符范围,所述字符替代范围包括但不限于数字字符编码范围以及拼音字符编码范围;若每个所述名称字符均不属于所述替代字符范围,则确定所述对象名称不存在替代字符;若存在至少一个所述名称字符属于所述替代字符范围,则确定所述对象名称存在替代字符。
[0009]在一种可能的实现方式中,所述确定所述对象名称不存在替代字符之后,还包括:获取所述对象名称对应的身份信息卡的卡面图像,以及对所述卡面图像中的卡面对象名称进行字数识别,得到所述卡面对象名称的第一字数;若所述对象名称的名称字符对应的第二字数与所述第二字数不一致,则确定所述对象名称中存在拆分字符;若所述对象名称的名称字符对应的第二字数与所述第二字数一致,则确定所述对象名称中不存在拆分字符。
[0010]在一种可能的实现方式中,所述确定所述对象名称中存在生僻字之后,还包括:针对所述对象名称中生僻字发出提醒,并展示所述对象名称中生僻字。
[0011]第二方面,本说明书实施例提供一种生僻字检测装置,所述装置包括:
[0012]字符判断模块,用于获取待检测的对象名称,判断所述对象名称中是否存在替代字符或者拆分字符;
[0013]生僻字确定模块,用于若存在,则确定所述对象名称中存在生僻字。
[0014]第三方面,本说明书实施例提供一种包含指令的计算机程序产品,当所述计算机程序产品在计算机或处理器上运行时,使得所述计算机或所述处理器执行上述的方法的步骤。
[0015]第四方面,本说明书实施例提供一种计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行上述的方法的步骤。
[0016]第五方面,本说明书实施例提供一种终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序适于由处理器加载并执行上述的方法的步骤。
[0017]本说明书一些实施例提供的技术方案带来的有益效果至少包括:
[0018]本说明书实施例提供一种生僻字检测方法,首先获取待检测的对象名称,判断对象名称中是否存在替代字符或者拆分字符;然后若存在,则确定对象名称中存在生僻字。由于在实际情况中,当遇到对象名称中存在生僻字时,大多会将对象名称中的生僻字进行替换或者拆分,那么只要确定对象名称中存在替代字符或者拆分字符,那么就可以确定对象名称中存在生僻字,不需要用户手动进行参与就可以实现对生僻字的检测,大大提高了生僻字的检测效率。
附图说明
[0019]为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书实施例的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0020]图1为本说明书一个或多个实施例提供的一种生僻字检测系统的场景示意图;
[0021]图2为为本说明书一个或多个实施例提供的一种生僻字检测方法的流程示意图;
[0022]图3为本说明书一个或多个实施例提供的另一种生僻字检测方法的流程示意图;
[0023]图4为本说明书一个或多个实施例提供的一种生僻字检测装置的结构框图;
[0024]图5为本说明书一个或多个实施例提供的一种终端的结构示意图。
具体实施方式
[0025]下面将结合本说明书中的附图,对本说明书中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书保护的范围。
[0026]在本说明书的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。在本说明书的描述中,需要说明的是,除非另有明确的规定和限定,“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是
可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本说明书中的具体含义。此外,在本说明书的描述中,除非另有说明,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
[0027]在相关技术中,银行等金融机构遇到姓名含系统不支持的生僻字的用户时,有的银行会将生僻字用拼音或者数字代替,有的银行会将生僻字进行拆字,从而生成用户的替代字名字。由于相关系统中使用方正字库,所以这些替代字姓名无法通过相关系统的核验,对尽职调查造成客观的困难,因此需要一种生僻字检测方法提前检测出姓名等对象名称中的生僻字。
[0028]下面结合具体的实施例对本说明书进行详细说明。
[0029]请参见图1,为本说明书一个或多个实施例提供的一种生僻字检测系统的场景示意图。如图1所示,生僻字检测系统至少可以包括用户端集群和服务平台100。
[0030]用户端集群可以包括至少一个用户端,如本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种生僻字检测方法,所述方法包括:获取待检测的对象名称,判断所述对象名称中是否存在替代字符或者拆分字符;若存在,则确定所述对象名称中存在生僻字。2.根据权利要求1所述的方法,所述判断所述对象名称中是否存在替代字符或者拆分字符之前,还包括:检测所述对象名称的每个名称字符是否属于常用字符编码库的常用字符;若每个所述名称字符均属于所述常用字符编码库的常用字符,则确定所述对象名称不存在生僻字,并执行所述判断所述对象名称中是否存在替代字符或者拆分字符的步骤;若存在至少一个所述名称字符不属于所述常用字符编码库的常用字符,则确定所述对象名称存在生僻字。3.根据权利要求2所述的方法,所述检测所述对象名称的每个名称字符是否属于所述常用字符编码库的常用字符,包括:获取针对所述常用字符编码库的常用字符识别正则式;采用所述常用字符识别正则式检测所述对象名称的每个名称字符是否属于所述常用字符编码库对应的常用字符码点范围。4.根据权利要求1至3任一项所述的方法,所述判断所述对象名称中是否存在替代字符或者拆分字符,包括:判断所述对象名称的每个名称字符是否属于替代字符范围,所述字符替代范围包括但不限于数字字符编码范围以及拼音字符编码范围;若每个所述名称字符均不属于所述替代字符范围,则确定所述对象名称不存在替代字符;若存在至少一个所述名称字符属于所述替代字符范围,则确定所述对象名称存在替...

【专利技术属性】
技术研发人员:谢涛
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1