关键词匹配方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:21914015 阅读:30 留言:0更新日期:2019-08-21 12:26
本申请提供了一种关键词匹配方法、装置、计算机设备和存储介质,其中,该方法包括:获取被检字符串;根据预设规则对所述被检字符串的格式进行规范化处理,以获取处理后的被检字符串;获取预设的关键词参数表,其中,所述预设的关键词参数表中有多个关键词;确定所述处理后的被检字符串中是否存在所述关键词参数表中的至少一个关键词;在确定存在至少一个关键词的情况下,确定关键词匹配成功。上述实施例中的关键词匹配方法,只需对被检字符串的格式进行规范化处理,无需将被检字符串转换为其他码制,也就无需在大型主机系统上建立整套的其他码制运行处理环境,可以有效节约系统的资源,提高关键词匹配的效率、且降低关键词匹配成本。

Keyword matching methods, devices, computer equipment and storage media

【技术实现步骤摘要】
关键词匹配方法、装置、计算机设备和存储介质
本申请涉及计算机内容分析
,特别涉及一种关键词匹配方法、装置、计算机设备和存储介质。
技术介绍
在银行办理业务过程中,某些场景需要系统检索输入的字符串中是否含有指定关键词,一旦检索到了指定关键词,需要执行一定操作,比如向业务操作人员提示错误等。目前,银行通常采用大型主机系统进行交易存储与处理,此类大型主机系统配套使用的编码方案是EBCDIC码(ExtendedBinaryCodedDecimalInterchangeCode,广义二进制编码的十进制交换码)。在EBCDIC码中,英文字母不是连续排列的、中间会出现多次断续。同时EBCDIC码制与其他码制完全不兼容,加剧了EBCDIC码环境中数据处理的复杂度。而且,由于受到交易处理时间、系统性能以及系统环境等方面的限制,在交易处理过程中,将被检字符串由EBCDIC码转换为其他码制的成本极高。此外,若采用非EBCDIC码处理环境,需要在大型主机系统上建立整套的其他码制运行处理环境,耗时长成本高,而且性能上未必能得到保证。因此,这造成了基于大型主机系统EBCDIC码环境的交易没有按其他码制进行处理的环境,进而导致基于大型主机系统EBCDIC码环境中的交易的业务字段匹配起来非常困难。针对上述问题,目前尚未提出有效的解决方案。
技术实现思路
本申请实施例提供了一种关键词匹配方法,以解决现有技术中基于大型主机系统EBCDIC码环境中的业务字段匹配困难的问题。本申请实施例提供了一种关键词匹配方法,包括:获取被检字符串;根据预设规则对所述被检字符串的格式进行规范化处理,以获取处理后的被检字符串;获取预设的关键词参数表,其中,所述预设的关键词参数表中有多个关键词;确定所述处理后的被检字符串中是否存在所述关键词参数表中的至少一个关键词;在确定存在至少一个关键词的情况下,确定关键词匹配成功。在一个实施例中,在获取预设的关键词参数表之后,还包括:确定预设的关键词参数表中的各个关键词是否已被规范化处理;在确定存在未被规范化处理的关键词的情况下,根据预设规则对未规范化处理的关键词的格式进行规范化处理。在一个实施例中,根据预设规则对被检字符串的格式进行规范化处理,包括以下至少之一:将被检字符串中的全角字符转换为半角字符;对被检字符串中的空格进行规范化处理;对被检字符串中的中文分隔符进行规范化处理。在一个实施例中,根据预设规则对被检字符串的格式进行规范化处理,还包括:将被检字符串中的大写字符转换为小写字符。在一个实施例中,对被检字符串中的空格进行规范化处理,包括以下之一:去除被检字符串中的所有空格;将被检字符串中连续的多个空格合并为一个空格。在一个实施例中,对被检字符串中的中文分隔符进行规范化处理,包括:去除被检字符串中空的中文字符;以及去除被检字符串中相邻的中文分隔符。在一个实施例中,在获取预设的关键词参数表之前,还包括:获取多个关键词;将多个关键词写入参数表中并在相邻关键词之间插入预设的分隔符,以生成预设的关键词参数表。在一个实施例中,确定处理后的被检字符串中是否存在关键词参数表中的至少一个关键词,包括:根据预设的分隔符从预设的关键词参数表中逐个读取关键词;将逐个读取的关键词,与处理后的被检字符串进行逐字匹配,以确定处理后的被检字符串中是否存在关键词参数表中的至少一个关键词。本申请实施例还提供了一种关键词匹配装置,包括:第一获取模块,用于获取被检字符串;规范化模块,用于根据预设规则对被检字符串的格式进行规范化处理,以获取处理后的被检字符串;第二获取模块,用于获取预设的关键词参数表,其中,预设的关键词参数表中包括多个关键词;确定模块,用于确定处理后的被检字符串中是否存在关键词参数表中的至少一个关键词;匹配模块,在确定存在至少一个关键词的情况下,确定匹配成功。本专利技术实施例还提供一种计算机设备,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现上述任意实施例中所述的关键词匹配方法的步骤。本专利技术实施例还提供一种计算机可读存储介质,其上存储有计算机指令,所述指令被执行时实现上述任意实施例中所述的关键词匹配方法的步骤。在本申请实施例中,提供了一种关键词匹配方法,根据预设规则对被检字符串的格式进行规范化处理,获取预设的关键词参数表,然后确定处理后的被检字符串中是否存在关键词参数表中的至少一个关键词,并且在确定存在至少一个关键词的情况下,确定关键词匹配成功。上述关键词匹配方法只需对被检字符串的格式进行规范化处理,而无需将被检字符串转换为其他码制,也就无需在大型主机系统上建立整套的其他码制运行处理环境,可以有效节约系统的资源,提高关键词匹配的效率;同时,通过将多个关键词维护在预设的关键词参数表中,可以降低关键词存储的复杂度,提高存储空间的资源利用率,并且可以增强关键词存储的可扩展性。通过上述方案解决了现有技术中基于大型主机系统的EBCDIC码环境中业务字段匹配困难的问题,达到有效提升关键词匹配效率、降低关键词匹配成本的技术效果。附图说明此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,并不构成对本申请的限定。在附图中:图1示出了本申请一实施例中的关键词匹配方法的流程图;图2示出了本申请一实施例中的关键词匹配方法所涉及的模块的结构框图;图3示出了本申请一实施例中的关键词匹配方法的流程图;图4示出了本申请一实施例中的关键词匹配装置的示意图;图5示出了本申请一实施例中的计算机设备的示意图。具体实施方式下面将参考若干示例性实施方式来描述本申请的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本申请,而并非以任何方式限制本申请的范围。相反,提供这些实施方式是为了使本申请公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。本领域的技术人员知道,本申请的实施方式可以实现为一种系统、装置设备、方法或计算机程序产品。因此,本申请公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。本专利技术实施例提供了一种关键词匹配方法,如图1所示,可以包括以下步骤:步骤S101,获取被检字符串。具体地,银行在处理业务时,会收到各种交易报文,需要对交易报文中的字符串进行关键词匹配,一旦被检字符串中存在关键词,系统就执行相应的预设操作,例如报错、弹框、跳转页面等。在对被检字符串进行关键词匹配之前,可以从银行系统的业务处理模块获取被检字符串。步骤S102,根据预设规则对被检字符串的格式进行规范化处理,以获取处理后的被检字符串。目前,银行通常采用大型主机系统进行交易存储与处理,此类大型主机系统配套使用的编码方案是EBCDIC码。从业务处理模块获取的被检字符串可能是采用EBCDIC码的字符串。而在EBCDIC码中,英文字母不是连续排列的,中间会出现多次断续,而且中英文混输、字符间存在数量不确定的无意义空格。因此,在进行关键词匹配之前,需要根据预设规则对被检字符串的格式进行规范化处理,以获取处理后的被检字符串。其中,预设规则可以根据被检字符串的格式以及业务要求来设置。步骤S103,获取预设的关键词参数表,其中,预设的关键词参数表中本文档来自技高网...

【技术保护点】
1.一种关键词匹配方法,其特征在于,包括:获取被检字符串;根据预设规则对所述被检字符串的格式进行规范化处理,以获取处理后的被检字符串;获取预设的关键词参数表,其中,所述预设的关键词参数表中有多个关键词;确定所述处理后的被检字符串中是否存在所述关键词参数表中的至少一个关键词;在确定存在至少一个关键词的情况下,确定关键词匹配成功。

【技术特征摘要】
1.一种关键词匹配方法,其特征在于,包括:获取被检字符串;根据预设规则对所述被检字符串的格式进行规范化处理,以获取处理后的被检字符串;获取预设的关键词参数表,其中,所述预设的关键词参数表中有多个关键词;确定所述处理后的被检字符串中是否存在所述关键词参数表中的至少一个关键词;在确定存在至少一个关键词的情况下,确定关键词匹配成功。2.根据权利要求1所述的方法,其特征在于,在获取预设的关键词参数表之后,还包括:确定所述预设的关键词参数表中的各个关键词是否已被规范化处理;在确定存在未被规范化处理的关键词的情况下,根据所述预设规则对未规范化处理的关键词的格式进行规范化处理。3.根据权利要求1所述的方法,其特征在于,所述根据预设规则对所述被检字符串的格式进行规范化处理,包括以下至少之一:将所述被检字符串中的全角字符转换为半角字符;对所述被检字符串中的空格进行规范化处理;对所述被检字符串中的中文分隔符进行规范化处理。4.根据权利要求3所述的方法,其特征在于,所述根据预设规则对所述被检字符串的格式进行规范化处理,还包括:将所述被检字符串中的大写字符转换为小写字符。5.根据权利要求3所述的方法,其特征在于,所述对所述被检字符串中的空格进行规范化处理,包括以下之一:去除所述被检字符串中的所有空格;将所述被检字符串中连续的多个空格合并为一个空格。6.根据权利要求3所述的方法,其特征在于,所述对所述被检字符串中的中文分隔符进行规范化处理...

【专利技术属性】
技术研发人员:卜琳侯燕关海涛
申请(专利权)人:中国银行股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1