一种文本检索方法、装置、电子设备及存储介质制造方法及图纸

技术编号:39439945 阅读:15 留言:0更新日期:2023-11-19 16:22
本申请实施例提供一种文本检索方法、装置、电子设备及存储介质,该方法包括:获取待检索文本,并根据待检索文本,确定待检索文本中的每一个检索词;根据待检索文本和在预先存储的检索数据库,确定与待检索文本对应的检索策略;根据检索策略和待检索文本中的每一个检索词,在预先存储的检索数据库中进行检索,判断待检索文本中是否包括检索数据库中的关键词,通过将检索数据库中多个关键词字符构建搜索树,采用不同的检索策略,根据待检索文本中的每一个字符在检索数据库中进行检索,从而待检索文本中是否包括检索数据库中的关键词,这样,将检索数据库中所有关键字只需要在待检索文本中检索一次,不需要消耗很长时间,提高检索效率。索效率。索效率。

【技术实现步骤摘要】
一种文本检索方法、装置、电子设备及存储介质


[0001]本申请涉及计算机
,具体而言,涉及一种文本检索方法、装置、电子设备及存储介质。

技术介绍

[0002]为了提升坐席工作质量及工作效率,需要对销售人员的通话录音进行实时的通话质检,实时筛选对话中的文本词,并高亮展示,规范销售话术因实时检索需要服务在很短的时间内做出响应.现有技术中,服务器上建立有关键词数据库,然后在获取的待检索文本中查找数据库中的每一个关键词,示例性地,关键词数据库中包括有八个关键词,每一个关键词在待检索文本中检索一遍,需要消耗50ms,而八个关键词则需要在待检索文本中检索八遍,消耗400ms,这样需要消耗很长时间,检索效率较慢,如何提高文本检索效率是目前急需解决的问题。

技术实现思路

[0003]本申请的一些实施例的目的在于提供一种文本检索方法、装置、电子设备及存储介质,通过本申请的实施例的技术方案,通过获取待检索文本,并根据所述待检索文本,确定所述待检索文本中的每一个检索词;根据所述待检索文本和在预先存储的检索数据库,确定与所述待检索文本对应的检索策略;其中,所述检索数据库中包括多个关键词构成的搜索树;根据所述检索策略和所述待检索文本中的每一个检索词,在所述预先存储的检索数据库中进行检索,判断所述待检索文本中是否包括检索数据库中的关键词,本申请实施例中将检索数据库中多个关键词字符构建搜索树,采用不同的检索策略,根据待检索文本中的每一个字符在检索数据库中进行检索,从而待检索文本中是否包括检索数据库中的关键词,这样,将检索数据库中所有关键字只需要在待检索文本中检索一次,不需要消耗很长时间,提高检索效率。
[0004]第一方面,本申请的一些实施例提供了一种文本检索方法,包括:获取待检索文本,并根据所述待检索文本,确定所述待检索文本中的每一个检索词;根据所述待检索文本和在预先存储的检索数据库,确定与所述待检索文本对应的检索策略;其中,所述检索数据库中包括多个关键词构成的搜索树;根据所述检索策略和所述待检索文本中的每一个检索词,在所述预先存储的检索数据库中进行检索,判断所述待检索文本中是否包括检索数据库中的关键词。
[0005]本申请的一些实施例通过将检索数据库中多个关键词字符构建搜索树,采用不同的检索策略,根据待检索文本中的每一个字符在检索数据库中进行检索,从而待检索文本中是否包括检索数据库中的关键词,这样,将检索数据库中所有关键字只需要在待检索文本中检索一次,不需要消耗很长时间,提高检索效率。
[0006]可选地,所述根据所述待检索文本和在预先存储的检索数据库,确定与所述待检索文本对应的检索策略,包括:根据所述待检索文本的第一个检索词,从所述搜索树中的根节点开始搜索,若第一哈希表存在所述第一个检索词,则在第二哈希表中搜索待检索文本的第二个检索词;若所述第二哈希表中不存在所述第二个检索词,则确定与所述待检索文本对应的检索策略,其中,所述检索策略至少包括单词查找树检索策略或多模匹配算法的检索策略。
[0007]本申请的一些实施例通过根据待检索文本的每一个字符从搜索树中的每一个节点检索,根据不同的检索结果确定不同的检索策略,可以满足不同情况的需求。
[0008]可选地,所述若所述第二哈希表中不存在所述第二个检索词,则确定与所述待检索文本对应的检索策略,包括:若所述第二哈希表中不存在所述第二个检索词,则从当前的检索词回退到上一个检索词;根据上一个检索词,从所述搜索树中的根节点重新开始搜索。
[0009]本申请的一些实施例采用单词查找树检索策略时,当在数据库中未匹配到字符时,则从当前检索进行回退,然后继续从trie树的根节点去匹配。
[0010]可选地,所述若所述第二哈希表中不存在所述第二个检索词,则确定与所述待检索文本对应的检索策略,包括:若所述第二哈希表中不存在所述第二个检索词,通过指针跳转到当前检索词的下一个检索词;根据下一个检索词,从所述搜索树继续搜索。
[0011]本申请的一些实施例采用多模匹配算法的检索策略,在未匹配到数据库中的字符时,通过fail指针跳转,跳转到与当前检索词相同的节点,继续检索,检索词继续匹配不用回退到上一个检索词,直接继续往下匹配。
[0012]可选地,所述方法还包括:每隔预设时间段对所述检索数据库中的多个关键词构成的搜索树进行更新。
[0013]本申请的一些实施例每隔一段时间对检索数据库中的多个关键词进行更新,从而对关键词的字符构成的搜索树进行更新,提高检索的准确性。
[0014]可选地,所述方法还包括:根据所述待检索文本中的检索词,对所述检索数据库中的多个关键词构成的搜索树进行更新。
[0015]本申请的一些实施例,若待检索文本包括原来的检索数据库没有的关键词,则将待检索文本中的字符对检索数据库进行更新,从而对对关键词的字符构成的搜索树进行更新,丰富了数据库的关键词,提高检索的准确性。
[0016]第二方面,本申请的一些实施例提供了一种文本检索装置,包括:获取模块,用于获取待检索文本,并根据所述待检索文本,确定所述待检索文本中的每一个检索词;确定模块,用于根据所述待检索文本和在预先存储的检索数据库,确定与所述待检索文本对应的检索策略;其中,所述检索数据库中包括多个关键词构成的搜索树;检索模块,用于根据所述检索策略和所述待检索文本中的每一个检索词,在所述预先存储的检索数据库中进行检索,判断所述待检索文本中是否包括检索数据库中的关键
词。
[0017]本申请的一些实施例通过将检索数据库中多个关键词字符构建搜索树,采用不同的检索策略,根据待检索文本中的每一个字符在检索数据库中进行检索,从而待检索文本中是否包括检索数据库中的关键词,这样,将检索数据库中所有关键字只需要在待检索文本中检索一次,不需要消耗很长时间,提高检索效率。
[0018]可选地,所述确定模块,用于:根据所述待检索文本的第一个检索词,从所述搜索树中的根节点开始搜索,若第一哈希表存在所述第一个检索词,则在第二哈希表中搜索待检索文本的第二个检索词;若所述第二哈希表中不存在所述第二个检索词,则确定与所述待检索文本对应的检索策略,其中,所述检索策略至少包括单词查找树检索策略或多模匹配算法的检索策略。
[0019]本申请的一些实施例通过根据待检索文本的每一个字符从搜索树中的每一个节点检索,根据不同的检索结果确定不同的检索策略,可以满足不同情况的需求。
[0020]可选地,所述确定模块用于:若所述第二哈希表中不存在所述第二个检索词,则从当前的检索词回退到上一个检索词;根据上一个检索词,从所述搜索树中的根节点重新开始搜索。
[0021]本申请的一些实施例采用单词查找树检索策略时,当在数据库中未匹配到字符时,则从当前检索进行回退,然后继续从trie树的根节点去匹配。
[0022]可选地,所述确定模块用于:若所述第二哈希表中不存在所述第二个检索词,通过指针跳转到当前检索词的下一个检索词;根据下一个检索词,从所述搜索树继续搜索。
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本检索方法,其特征在于,所述方法包括:获取待检索文本,并根据所述待检索文本,确定所述待检索文本中的每一个检索词;根据所述待检索文本和在预先存储的检索数据库,确定与所述待检索文本对应的检索策略;其中,所述检索数据库中包括多个关键词构成的搜索树;根据所述检索策略和所述待检索文本中的每一个检索词,在所述预先存储的检索数据库中进行检索,判断所述待检索文本中是否包括检索数据库中的关键词。2.根据权利要求1所述的文本检索方法,其特征在于,所述根据所述待检索文本和在预先存储的检索数据库,确定与所述待检索文本对应的检索策略,包括:根据所述待检索文本的第一个检索词,从所述搜索树中的根节点开始搜索,若第一哈希表存在所述第一个检索词,则在第二哈希表中搜索待检索文本的第二个检索词;若所述第二哈希表中不存在所述第二个检索词,则确定与所述待检索文本对应的检索策略,其中,所述检索策略至少包括单词查找树检索策略或多模匹配算法的检索策略。3.根据权利要求2所述的文本检索方法,其特征在于,所述若所述第二哈希表中不存在所述第二个检索词,则确定与所述待检索文本对应的检索策略,包括:若所述第二哈希表中不存在所述第二个检索词,则从当前的检索词回退到上一个检索词;根据上一个检索词,从所述搜索树中的根节点重新开始搜索。4.根据权利要求2所述的文本检索方法,其特征在于,所述若所述第二哈希表中不存在所述第二个检索词,则确定与所述待检索文本对应的检索策略,包括:若所述第二哈希表中不存在所述第二个检索词,通过指针跳转到当前检索词的下一个检索词;根据下一个检索词,从所述搜索树继续搜索。5.根据权利要求1所述的文本检索方法,其特征在于,所述方法还包括:每隔预设时间段对所...

【专利技术属性】
技术研发人员:郑明阳
申请(专利权)人:北京轻松怡康信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1