System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 字符串匹配方法及装置制造方法及图纸_技高网

字符串匹配方法及装置制造方法及图纸

技术编号:40824949 阅读:12 留言:0更新日期:2024-04-01 14:45
本发明专利技术提供一种字符串匹配方法及装置,其中方法包括:基于第一字符串的字符顺序,确定第一字符串的第一有向图,并基于第二字符串的字符顺序,确定第二字符串的第二有向图;确定第一有向图与第二有向图的最大重合子图;基于最大重合子图的顶点数、第一字符串的字符数量以及第二字符串的字符数量,确定第一字符串与第二字符串的字符距离;基于字符距离,确定第一字符串与第二字符串的匹配度。本发明专利技术提供的字符串匹配方法及装置,通过有向图表示字符串可以同时兼顾字符的匹配以及字符在字符串中的顺序,从而能够更加精准地进行字符串的匹配,提升了字符串的匹配准确度。

【技术实现步骤摘要】

本专利技术涉及计算机,尤其涉及一种字符串匹配方法及装置


技术介绍

1、现有的金融场景中,经常存在需要进行字符串的匹配过程。例如,对于用户信息的验证、交易账号的查询、对账单与实际交易记录进行匹配以及付款方和收款方的账号信息进行匹配等过程,均需要进行字符串的准确匹配过程。

2、现有的方法由于仅对目标字符串与候选字符串作精确匹配或比较目标字符串是否为候选字符串,所以当目标字符串与候选字符串仅有一些字符不同时(如用户拼写错误时),很难进行准确比较,存在遗漏的风险,无法准确实现对匹配程度的确定过程。


技术实现思路

1、本专利技术提供一种字符串匹配方法及装置,用以解决现有技术针对字符串的匹配程度的准确率不高的技术问题。

2、本专利技术提供一种字符串匹配方法,包括:

3、基于第一字符串的字符顺序,确定所述第一字符串的第一有向图,并基于第二字符串的字符顺序,确定所述第二字符串的第二有向图;

4、确定所述第一有向图与所述第二有向图的最大重合子图;

5、基于所述最大重合子图的顶点数、所述第一字符串的字符数量以及所述第二字符串的字符数量,确定所述第一字符串与所述第二字符串的字符距离;

6、基于所述字符距离,确定所述第一字符串与所述第二字符串的匹配度。

7、根据本专利技术提供的一种字符串匹配方法,基于所述字符距离,确定所述第一字符串与所述第二字符串的匹配度,包括:

8、基于所述字符距离、所述第一字符串的字符数量以及所述第二字符串的字符数量,确定所述第一字符串与所述第二字符串的相似度;

9、基于所述相似度,确定所述第一字符串与所述第二字符串的匹配度。

10、根据本专利技术提供的一种字符串匹配方法,基于所述相似度,确定所述第一字符串与所述第二字符串的匹配度,包括:

11、将所述相似度与预设相似度阈值进行比对,确定所述相似度与预设相似度阈值的比对结果;

12、基于所述比对结果,确定所述第一字符串与所述第二字符串的匹配度。

13、根据本专利技术提供的一种字符串匹配方法,确定所述第一有向图与所述第二有向图的最大重合子图,包括:

14、遍历所述第一有向图的所有子图;

15、将所述第一有向图的所有子图分别与所述第二有向图进行对比,确定所述第一有向图与所述第二有向图的最大重合子图。

16、根据本专利技术提供的一种字符串匹配方法,字符距离为:

17、d(a,b)=(l(a)-g(a,b))+(l(b)-g(a,b));

18、其中d(a,b)为所述字符距离,l(a)为所述第一字符串的字符数量,l(b)为所述第二字符串的字符数量,g(a,b)为所述最大重合子图的顶点数。

19、根据本专利技术提供的一种字符串匹配方法,相似度为:

20、

21、其中,m(a,b)为相似度,d(a,b)为所述字符距离,l(a,b)为所述第一字符串的字符数量与所述第二字符串的字符数量之和。

22、本专利技术还提供一种字符串匹配装置,包括:

23、有向图构建模块,用于基于第一字符串的字符顺序,确定所述第一字符串的第一有向图,并基于第二字符串的字符顺序,确定所述第二字符串的第二有向图;

24、最大重合子图确定模块,用于确定所述第一有向图与所述第二有向图的最大重合子图;

25、字符距离确定模块,用于基于所述最大重合子图的顶点数、所述第一字符串的字符数量以及所述第二字符串的字符数量,确定所述第一字符串与所述第二字符串的字符距离;

26、匹配度确定模块,用于基于所述字符距离,确定所述第一字符串与所述第二字符串的匹配度。

27、本专利技术还提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一种字符串匹配方法。

28、本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一种字符串匹配方法。

29、本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种字符串匹配方法。

30、本专利技术提供的字符串匹配方法及装置,通过确定第一字符串的第一有向图以及第二字符串的第二有向图的最大重合子图。基于最大重合子图的顶点数、第一字符串的字符数量以及第二字符串的字符数量,实现对第一字符串与第二字符串的字符距离的确定,从而最终实现对第一字符串与第二字符串匹配度的确定。其中,有向图表示字符串可以同时兼顾字符的匹配以及字符在字符串中的顺序,从而能够更加精准地进行字符串的匹配,提升了字符串的匹配准确度。

本文档来自技高网...

【技术保护点】

1.一种字符串匹配方法,其特征在于,所述方法包括:

2.根据权利要求1所述的字符串匹配方法,其特征在于,所述基于所述字符距离,确定所述第一字符串与所述第二字符串的匹配度,包括:

3.根据权利要求2所述的字符串匹配方法,其特征在于,所述基于所述相似度,确定所述第一字符串与所述第二字符串的匹配度,包括:

4.根据权利要求1所述的字符串匹配方法,其特征在于,所述确定所述第一有向图与所述第二有向图的最大重合子图,包括:

5.根据权利要求1-4任一项所述的字符串匹配方法,其特征在于,所述字符距离为:

6.根据权利要求2所述的字符串匹配方法,其特征在于,所述相似度为:

7.一种字符串匹配装置,其特征在于,包括:

8.一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述字符串匹配方法。

9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述字符串匹配方法。

10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述字符串匹配方法。

...

【技术特征摘要】

1.一种字符串匹配方法,其特征在于,所述方法包括:

2.根据权利要求1所述的字符串匹配方法,其特征在于,所述基于所述字符距离,确定所述第一字符串与所述第二字符串的匹配度,包括:

3.根据权利要求2所述的字符串匹配方法,其特征在于,所述基于所述相似度,确定所述第一字符串与所述第二字符串的匹配度,包括:

4.根据权利要求1所述的字符串匹配方法,其特征在于,所述确定所述第一有向图与所述第二有向图的最大重合子图,包括:

5.根据权利要求1-4任一项所述的字符串匹配方法,其特征在于,所述字符距离为:

6.根据权利要求2所述的字符串...

【专利技术属性】
技术研发人员:杨妍
申请(专利权)人:中银金融科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1