用于对信息进行匹配的方法和系统技术方案

技术编号:21686413 阅读:38 留言:0更新日期:2019-07-24 14:45
本发明专利技术涉及计算机技术,具体涉及用于对信息进行匹配的方法、系统以及实现该方法的计算机设备和计算机可读存储介质。按照本发明专利技术一个方面的用于对信息进行匹配的方法,其特征在于,包括下列步骤:A)对原始信息进行修正;B)将所修正的原始信息划分为多个信息部分以分别与第一词库进行匹配,其中所述多个信息部分分别对应于所述原始信息的多个信息类别;C)对所述多个信息部分分别进行校正以得到经校正信息;以及D)对所述经校正信息进行分词匹配。

Methods and systems for matching information

【技术实现步骤摘要】
用于对信息进行匹配的方法和系统
本专利技术涉及计算机技术,具体涉及用于对信息进行匹配的方法、系统以及实现该方法的计算机设备和计算机可读存储介质。
技术介绍
现有技术中,对信息的匹配方法多是采用精确匹配方法,例如采用表格精确匹配或者人工关键词匹配的方法,所述方法导致出现了匹配成功率较低以及效率低下等问题。在实际应用中,例如行名和行号的匹配中,由于行号过期或者行号错误导致客户资金结算交易的失败,为银行工作带来很多困难。在精确匹配的方法中,采用表格的精确匹配成功率较低,人工关键词匹配的方法效率低下。此外,所述方法难以解决在匹配失败的情况下的修正的机制。公开于本专利技术背景部分的信息仅仅旨在增加对本专利技术的总体背景的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术。
技术实现思路
本专利技术的一个方面是提供一种对信息进行匹配的方法。按照本专利技术的一个方面的一种对信息进行匹配的方法,其中,包括下列步骤:A)对原始信息进行修正;B)将所修正的原始信息划分为多个信息部分以分别与第一词库进行匹配,其中所述多个信息部分分别对应于所述原始信息的多个信息类别;C)对所述多个信息部分分别进行校正以得到经校正信息;D)对所述经校正信息进行分词匹配;其中,对所述多个信息部分进行校正包括如下项中的至少一项:C1)基于信息变更表来变更所述步骤B)中未匹配成功的信息;其中,所述信息变更表记录对应于各所述信息类别的所述信息部分的名称变更信息;以及C2)基于第一数据源来对所述步骤B)中未匹配成功的信息进行补充。可选地,在上述方法中,在步骤A)中,所述修正包括下列中的一种或多种:剔除公有信息、替换简称和修改错误信息。可选地,在上述方法中,所述信息变更表基于匹配成功的信息进行更新。可选地,在上述方法中,所述分词匹配包括下列步骤:基于信息的划分类别将所述信息划分为多个部分;以及对所述多个部分分别进行匹配。可选地,在上述方法中在步骤D)中,如果所述信息匹配出多个名称,则利用所述名称的相似度进行筛选。可选地,在上述方法中,在步骤D)中,进一步包括:当所述信息匹配成功时,输出所述信息的匹配名称和编号;以及当所述信息未匹配成功时,基于精确匹配方法对所述信息进行匹配,并将匹配结果加入所述信息变更表。可选地,在上述方法中,其中所述信息是银行行号和行名。本专利技术另一方面的目的是提供一种对信息进行匹配的系统。按照本专利技术的另一方面的一种对信息进行匹配的系统,其包括修正模块,用于对原始信息进行修正;分类模块,用于将所修正的原始信息划分为多个信息部分以分别与第一词库进行匹配,其中所述多个信息部分分别对应于所述原始信息的多个信息类别;校正模块,用于对所述多个信息部分分别进行校正以得到经校正信息;以及匹配模块,用于对上述信息进行匹配。本专利技术还一方面的目的是提供一种对信息进行匹配的计算机设备。按照本专利技术的还一方面的一种对信息进行匹配的计算机设备,其包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现上述用于对信息进行匹配的方法。本专利技术又一方面的目的是提供一种计算机可读存储介质。按照本专利技术又一方面的计算机可读存储介质,其上存储计算机程序,该计算机程序被处理器执行时实现上述的用于对信息进行匹配的方法。根据本专利技术的一个方面的用于对信息进行匹配的方法,能够解决在多场景下的信息匹配问题,针对一些不完整、不准确的信息,其匹配成功率高,且具备自我学习的机制,能够记录匹配失败的信息,以提高下一次匹配的成功率。多种其它特征和优点将从如下详细描述和附图中显而易见。附图说明本专利技术的上述和/或其它方面和优点将通过以下结合附图的各个方面的描述变得更加清晰和更容易理解,附图中相同或相似的单元采用相同的标号表示。附图包括:图1示出了按照本专利技术一实施例的用于对信息进行匹配的方法的流程图。图2示出了按照本专利技术一实施例的用于对信息进行匹配的示例性方法的流程图。图3示出了按照本专利技术一实施例的对信息进行匹配的系统的示意图。图4示出了按照本专利技术一实施例的用于对信息进行匹配的计算机设备的示意图。具体实施方式在本说明书中,参照其中图示了本专利技术示意性实施例的附图更为全面地说明本专利技术。但本专利技术可以按不同形式来实现,而不应解读为仅限于本文给出的各实施例。给出的各实施例旨在使本文的披露全面完整,以将本专利技术的保护范围更为全面地传达给本领域技术人员。诸如“包含”和“包括”之类的用语表示除了具有在说明书和权利要求书中有直接和明确表述的单元和步骤以外,本专利技术的技术方案也不排除具有未被直接或明确表述的其它单元和步骤的情形。诸如“第一”和“第二”之类的用语并不表示单元在时间、空间、大小等方面的顺序而仅仅是作区分各单元之用。下文参考根据本专利技术实施例的方法和系统的流程图说明、框图和/或流程图来描述本专利技术。将理解这些流程图说明和/或框图的每个框、以及流程图说明和/或框图的组合可以由计算机程序指令来实现。可以将这些计算机程序指令提供给通用计算机、专用计算机或其他可编程数据处理设备的处理器以构成机器,以便由计算机或其他可编程数据处理设备的处理器执行的这些指令创建用于实施这些流程图和/或框和/或一个或多个流程框图中指定的功能/操作的部件。可以将这些计算机程序指令存储在计算机可读存储器中,这些指令可以指示计算机或其他可编程处理器以特定方式实现功能,以便存储在计算机可读存储器中的这些指令构成包含实施流程图和/或框图的一个或多个框中指定的功能/操作的指令部件的制作产品。可以将这些计算机程序指令加载到计算机或其他可编程数据处理器上以使一系列的操作步骤在计算机或其他可编程处理器上执行,以便构成计算机实现的进程,以使计算机或其他可编程数据处理器上执行的这些指令提供用于实施此流程图和/或框图的一个或多个框中指定的功能或操作的步骤。还应该注意在一些备选实现中,框中所示的功能/操作可以不按流程图所示的次序来发生。例如,依次示出的两个框实际可以基本同时地执行或这些框有时可以按逆序执行,具体取决于所涉及的功能/操作。图1示出了按照本专利技术一实施例的用于对信息进行匹配的方法的流程图。如图1所示,在步骤110中,对原始信息进行修正,主要的修正包括:提出公有信息、替换简称或修改错误信息。之后进入步骤120。在步骤120中,将所修正的原始信息划分为多个信息部分以分别与第一词库进行匹配,其中所述多个信息部分分别对应于所述原始信息的多个信息类别,第一词库是指所述信息对应于行业标准中制定的相应名称和编号。之后进入步骤130。在步骤130中,对所述多个信息部分分别进行校正以得到经校正信息,其中,对所述多个信息部分进行校正包括如下项中的至少一项:基于信息变更表来变更所述步骤120中未匹配成功的信息;其中,所述信息变更表记录对应于各所述信息类别的所述信息部分的名称变更信息;以及基于第一数据源来对所述步骤120中未匹配成功的信息进行补充。在步骤140中,对所述经校正信息进行分词匹配,如果所述信息匹配出多个名称,则利用所述名称的相似度进行筛选。可选地,步骤140进一步包括:当所述信息匹配成功时,输出所述信息的匹配名称和编号;以及当所述信息未匹配成功时,基于精确匹配方法对所述信息进行匹配,并将匹配结果加入所述信本文档来自技高网...

【技术保护点】
1.一种对信息进行匹配的方法,其特征在于,包括下列步骤:A)对原始信息进行修正;B)将所修正的原始信息划分为多个信息部分以分别与第一词库进行匹配,其中所述多个信息部分分别对应于所述原始信息的多个信息类别;C) 对所述多个信息部分分别进行校正以得到经校正信息;以及D) 对所述经校正信息进行分词匹配;其中,对所述多个信息部分进行校正包括如下项中的至少一项:C1)基于信息变更表来变更所述步骤B)中未匹配成功的信息;其中,所述信息变更表记录对应于各所述信息类别的所述信息部分的名称变更信息;以及C2)基于第一数据源来对所述步骤B)中未匹配成功的信息进行补充。

【技术特征摘要】
1.一种对信息进行匹配的方法,其特征在于,包括下列步骤:A)对原始信息进行修正;B)将所修正的原始信息划分为多个信息部分以分别与第一词库进行匹配,其中所述多个信息部分分别对应于所述原始信息的多个信息类别;C)对所述多个信息部分分别进行校正以得到经校正信息;以及D)对所述经校正信息进行分词匹配;其中,对所述多个信息部分进行校正包括如下项中的至少一项:C1)基于信息变更表来变更所述步骤B)中未匹配成功的信息;其中,所述信息变更表记录对应于各所述信息类别的所述信息部分的名称变更信息;以及C2)基于第一数据源来对所述步骤B)中未匹配成功的信息进行补充。2.如权利要求1所述的方法,其中,在步骤A)中,所述修正包括下列中的一种或多种:剔除公有信息、替换简称和修改错误信息。3.如权利要求1所述的方法,其中,所述信息变更表基于匹配成功的信息进行更新。4.如权利要求1所述的方法,其中,所述分词匹配包括下列步骤:基于信息的划分类别将所述信息划分为多个部分;以及对所述多个部分分别进行匹配。5.如权利要求1所述的方法,其中,在步骤D)中,如果所述信息匹配出多个名称,则利用所述...

【专利技术属性】
技术研发人员:鲁志军赵张云李岭孙小羽陆佳伟仇志付
申请(专利权)人:中国银联股份有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1