文本匹配方法、装置、设备和介质制造方法及图纸

技术编号:39148840 阅读:11 留言:0更新日期:2023-10-23 14:57
本发明专利技术实施例公开了一种文本匹配方法、装置、设备和介质,其中,文本匹配方法包括:当检测到文本配置文件的更新动态时,根据更新动态更新预设配置缓存表,基于更新后的预设配置缓存表中的配置信息生成目标AC自动机,通过目标AC自动机对待匹配文本内容进行分析,得到目标文本匹配结果。本实施例的技术方案,解决了因程序启动后无法实时更换匹配规则以及无法实现对多种文件采取不同的分析匹配方式而降低文件匹配速度技术问题,实现了利用不同的配置文件生成匹配规则,提升了文件匹配速度,提高了文件匹配的准确率。了文件匹配的准确率。了文件匹配的准确率。

【技术实现步骤摘要】
文本匹配方法、装置、设备和介质


[0001]本专利技术实施例涉及数据处理
,尤其涉及一种文本匹配方法、装置、设备和介质。

技术介绍

[0002]目前,为了能够快速的进行文件和文本的整理,可以利用计算机技术对这些文件和数据进行自动化处理,通过文件匹配功能来分析指定文本内容的文本文件。
[0003]但是,传统的文本匹配功能存在着程序启动后无法实时更换匹配规则、无法实现对关键词的模糊匹配、不支持通配符实现对关键词串的匹配以及无法实现对多种文件采取不同的分析匹配方式等问题,使得文本匹配效率低。

技术实现思路

[0004]本专利技术实施例提供了一种文本匹配方法、装置、设备和介质,可以提升文件匹配速度,提高文件匹配的准确率。
[0005]第一方面,本专利技术实施例提供了一种文本匹配方法,该方法包括:
[0006]当检测到文本配置文件的更新动态时,根据更新动态更新预设配置缓存表;
[0007]基于更新后的预设配置缓存表中的配置信息生成目标AC自动机;
[0008]通过目标AC自动机对待匹配文本内容进行分析,得到目标文本匹配结果。
[0009]第二方面,本专利技术实施例还提供了一种文本匹配装置,该装置包括:
[0010]配置缓存表更新模块,用于当检测到文本配置文件的更新动态时,根据更新动态更新预设配置缓存表;
[0011]文本匹配算法生成模块,用于基于更新后的预设配置缓存表中的配置信息生成目标AC自动机;
[0012]文本匹配模块,用于通过目标AC自动机对待匹配文本内容进行分析,得到目标文本匹配结果。
[0013]第三方面,本专利技术实施例还提供了一种计算机设备,所述计算机设备包括:
[0014]一个或多个处理器;
[0015]存储器,用于存储一个或多个程序;
[0016]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本专利技术任意实施例所提供的文本匹配方法。
[0017]第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本专利技术任意实施例所提供的文本匹配方法。
[0018]本实施例的技术方案,通过当检测到文本配置文件的更新动态时,根据更新动态更新预设配置缓存表,基于更新后的预设配置缓存表中的配置信息生成目标AC自动机,通过目标AC自动机对待匹配文本内容进行分析,得到目标文本匹配结果。本实施例的技术方案,解决了因程序启动后无法实时更换匹配规则以及无法实现对多种文件采取不同的分析
匹配方式而降低文件匹配速度技术问题,实现了利用不同的配置文件生成匹配规则,提升了文件匹配速度,提高了文件匹配的准确率。
附图说明
[0019]图1为本专利技术实施例提供的一种文本匹配方法的流程图;
[0020]图2为本专利技术实施例提供的一种文本匹配方法的流程图;
[0021]图3为本专利技术实施例提供的一种文本匹配装置的结构示意图;
[0022]图4为本专利技术实施例提供的一种计算机设备的结构示意图。
具体实施方式
[0023]下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。
[0024]实施例一
[0025]图1为本专利技术实施例提供的一种文本匹配方法的流程图,本实施例可适用于对文本文件内容匹配分析的场景。该方法可以由文本匹配装置执行,该装置可以由软件和/或硬件的方式来实现,集成于具有应用开发功能的计算机设备中。
[0026]如图1所示,本实施例的文本匹配方法包括以下步骤:
[0027]S110、当检测到文本配置文件的更新动态时,根据更新动态更新预设配置缓存表。
[0028]其中,预设配置缓存表可以是存储在数据库中的一张数据表,用于存储配置的标识号、配置的生效状态和配置的内容。配置的生效状态可以分为已生效、待生效和已失效等。
[0029]具体的,当检测到文本配置文件的更新动态时,都可以实时更新预设配置缓存表,然后,按照当前配置缓存表中各配置的生效状态从配置文件夹中读取目标文本匹配所需的配置的信息,目标文本匹配所需的配置的信息包含配置的标识号、配置的生效状态和配置的内容。配置的内容主要有关键词组与联结符号联结构成,其中,连接符号可以包括与、非等符号构成。可以理解的是,“与”左右两侧位置需要有关键词同时存在,非表示关键词不能存在。关键词可以使用通配符,以便更好的完成匹配需求。
[0030]S120、基于更新后的预设配置缓存表中的配置信息生成目标AC自动机。
[0031]其中,目标AC自动机可以是本次文本匹配所需要的AC自动机。
[0032]具体的,文本匹配装置首先会获取到预设配置缓存表中配置信息的加载状态,如果加载完成,则会先销毁旧的AC自动机,并生成新的AC自动机。在生成新的AC自动机的过程中,会从预设配置缓存表中中读取已加载且生效状态的配置信息,并进一步对读取到的配置信息进行处理,去掉冗余的配置信息,得到一个最终的用于生成新的AC自动机的目标配置信息表。进而,可以根据目标配置信息表中关键词进行AC自动机的构建,得到目标AC自动机。
[0033]S130、通过目标AC自动机对待匹配文本内容进行分析,得到目标文本匹配结果。
[0034]其中,待匹配文本内容为准备进行文本匹配的文本文件内容。目标文本匹配结果可以是待匹配文本内容经过文本匹配后经过分析得到的分析结果。
[0035]具体的,文本匹配装置根据AC自动机内部工作原理对待匹配文本内容进行解析,获取到待匹配文本内容中出现的关键词以及关键词所在的待匹配文本内容中的位置等数据,通过关键词索引与关键词配置对照表进行配置命中的最终计算,得到目标文本匹配结果。
[0036]本实施例的技术方案,通过当检测到文本配置文件的更新动态时,根据更新动态更新预设配置缓存表,基于更新后的预设配置缓存表中的配置信息生成目标AC自动机,通过目标AC自动机对待匹配文本内容进行分析,得到目标文本匹配结果。本实施例的技术方案,解决了因程序启动后无法实时更换匹配规则以及无法实现对多种文件采取不同的分析匹配方式而降低文件匹配速度技术问题,实现了利用不同的配置文件生成匹配规则,提升了文件匹配速度,提高了文件匹配的准确率。
[0037]进一步的,按照预设频率对预设配置缓存表进行配置信息整合。
[0038]其中,预设频率是预先设定的更新配置文件缓存表的频率,示例性的,预设频率可以是每晚的24时更新。
[0039]具体的,如果配置信息发生更新则实时更新预设配置缓存表,并且会在每晚的24时对重复的配置进行配置的整合,保证配置的准确性与唯一性。
[0040]可选的,按照预设频率在预设配置缓存表查找需要进行增加、删除或者修改操作的待整合配置信息,对待整合配置信息进本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本匹配方法,其特征在于,包括:当检测到文本配置文件的更新动态时,根据所述更新动态更新预设配置缓存表;基于更新后的所述预设配置缓存表中的配置信息生成目标AC自动机;通过所述目标AC自动机对待匹配文本内容进行分析,得到目标文本匹配结果。2.根据权利要求1所述的方法,其特征在于,检测到文本配置文件的更新动态,包括:当在预设配置文件存储路径检测到新的配置文件时,检测到文本配置文件的更新动态。3.根据权利要求2所述的方法,其特征在于,根据所述更新动态更新预设配置缓存表,包括:配置标识信息从所述新的配置文件中读取配置标识信息及配置内容;根据所述配置标识信息和所述配置内容更新所述预设配置缓存表,并更新所述配置标识信息对应配置信息的生效状态。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:按照预设频率对所述预设配置缓存表进行配置信息整合。5.根据权利要求4所述的方法,其特征在于,所述按照预设频率对所述预设配置缓存表进行配置信息整合,包括:按照预设频率在所述预设配置缓存表查找需要进行增加、删除或者修改操作的待整合配置信息;对所述待整合配置信息进行相应的信息增加、删除或者修改操作。6.根据权利要求1所述的方法,其特征在于,所述基于更新后的所述预设配置缓存表中的配置信息生成目标AC自动机,包括:根据...

【专利技术属性】
技术研发人员:王艳辉王玺桥牛国辉
申请(专利权)人:哈尔滨工业大学软件工程股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1