【技术实现步骤摘要】
关键词搜索方法、装置、设备及计算机可读存储介质
[0001]本专利技术涉及人工智能领域,尤其涉及一种关键词搜索方法
、
装置
、
电子设备及可读存储介质
。
技术介绍
[0002]传统的关键词搜索方法主要包括爬取
、
解析
、
索引
、
检索和排序五个部分,其中最重要的就是索引和检索这两个部分
。
面对海量数据,如何快速找到用户想要查询的内容,索引是必不可少的核心模块之一,传统的搜索引擎采用倒排索引的办法,通过一次扫描提取文档关键词,建立文档关键词和文档的索引关系
。
在金融应用场景中,这种方法往往需要构建大规模的索引库,带来极大的空间开销,同时,在这种大规模索引上去进行检索也会导致与索引规模成正比的时间开销,大量的时间开销和空间开销导致运营成本居高不下,客户满意度也受到了影响
。
技术实现思路
[0003]本专利技术提供一种关键词搜索方法
、
装置
、 />电子设备及可读存本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.
一种关键词搜索方法,其特征在于,所述方法包括:对关键词词库中任意两个词组进行公共子串匹配,得到公共子串集;从所述公共子串集中选取符合预设条件的公共子串,根据选取的公共子串构建索引库;当接收到用户输入的搜索关键词时,将所述搜索关键词与所述索引库中的公共子串进行匹配,得到搜索词缀集;对所述搜索词缀集中的词组进行合并处理,得到合并词缀,并根据所述合并词缀从所述关键词词库中查找原始词组;根据所述原始词组进行搜索,得到所述搜索关键词对应的搜索结果
。2.
如权利要求1所述的关键词搜索方法,其特征在于,所述对关键词词库中任意两个词组进行公共子串匹配,得到公共子串集,包括:通过遍历操作选取关键词词库中的任意两个词组,并将选取的两个词组组成词组对;当所述词组对中任意相同位置的字词相同时,将所述相同的字词添加进预构建公共子串集中,当所述词组对中所有相同位置的字词都不相同时,判定所述词组对不存在公共子串,并返回上述通过遍历操作选取关键词词库中的任意两个词组,并将选取的两个词组组成词组对的步骤,继续遍历下一个词组对中的字词,直至遍历完所有的词组对,得到公共子串集
。3.
如权利要求1所述的关键词搜索方法,其特征在于,所述根据选取的公共子串构建索引库,包括:提取所述公共子串的数据特征,并根据所述数据特征及预设索引需求设置索引库结构;根据所述索引库结构,构建初始索引库;将所述公共子串导入所述初始索引库中,得到索引库
。4.
如权利要求1所述的关键词搜索方法,其特征在于,所述对所述搜索词缀集中的词组进行合并处理,得到合并词缀,包括:将所述搜索词缀集中各个词组与所述搜索关键词进行比对,确定所述搜索词缀集中各个词组的位置及间隔;根据所述位置及所述间隔,将所述搜索词缀集中各个词组进行拼接,得到合并词缀
。5.
如权利要求1所述的关键词搜索方法,其特征在于,所述根据所述合并词缀从所述关键词词库中查找原始词组,包括:将所述合并词缀与所述关键词词库中的关键词词组进行比对,并将符合所述合...
【专利技术属性】
技术研发人员:童雨洁,李弦,吴育人,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。