【技术实现步骤摘要】
一种相关检索方法、装置和设备
本说明书实施例涉及大数据
,特别涉及一种相关检索方法、装置和设备。
技术介绍
目前在大数据中进行检索时,主要是根据用户输入的内容的对关键词进行模糊匹配,但是采用这种方式进行检索容易遗漏未包含关键词的相关内容。因此,采用现有技术中的检索方案无法全面地检索到与用户输入的内容相关的信息。针对上述问题,目前尚未提出有效的解决方案。
技术实现思路
本说明书实施例提供了一种相关检索方法、装置和设备,以解决现有技术中无法全面地检索到与用户输入的内容相关的信息的问题。本说明书实施例提供了一种相关检索方法,包括:确定用户输入的检索内容的目标检索关键词;获取目标关联数据集;其中,所述目标关联数据集是利用关联分析算法构建的,所述关联数据集中包含多组数据,每组数据中包含一个关键词和对应的至少一个相关关键词;基于所述目标关联数据集,确定所述目标检索关键词对应的目标相关关键词;利用所述目标检索关键词和所述目标相关关键词进行检索,得到多个检索结果。本说明书实施例还提供了一种相关检索装置,包括:第一确定模块,用于确定用户输入的检索内容的目标检索关键词;获取模块,用于获取目标关联数据集;其中,所述目标关联数据集是利用关联分析算法构建的,所述关联数据集中包含多组数据,每组数据中包含一个关键词和对应的至少一个相关关键词;第二确定模块,用于基于所述目标关联数据集,确定所述目标检索关键词对应的目标相关关键词;检索模块,用于利用所述目标检索关键词和所述目标相关关键词进行检索,得到多 ...
【技术保护点】
1.一种相关检索方法,其特征在于,包括:/n确定用户输入的检索内容的目标检索关键词;/n获取目标关联数据集;其中,所述目标关联数据集是利用关联分析算法构建的,所述关联数据集中包含多组数据,每组数据中包含一个关键词和对应的至少一个相关关键词;/n基于所述目标关联数据集,确定所述目标检索关键词对应的目标相关关键词;/n利用所述目标检索关键词和所述目标相关关键词进行检索,得到多个检索结果。/n
【技术特征摘要】
1.一种相关检索方法,其特征在于,包括:
确定用户输入的检索内容的目标检索关键词;
获取目标关联数据集;其中,所述目标关联数据集是利用关联分析算法构建的,所述关联数据集中包含多组数据,每组数据中包含一个关键词和对应的至少一个相关关键词;
基于所述目标关联数据集,确定所述目标检索关键词对应的目标相关关键词;
利用所述目标检索关键词和所述目标相关关键词进行检索,得到多个检索结果。
2.根据权利要求1所述的方法,其特征在于,在获取目标关联数据集之前,还包括:
确定目标数据库中记录的各个内容对应的关键词;
建立所述各个内容与关键词之间的对应关系;
根据所述各个内容与关键词之间的对应关系,设置目标支持度;
利用关联分析算法,根据所述目标支持度构建各个关键词的频繁模式树;其中,所述频繁模式树中的每个节点表征一个关键词;
基于所述频繁模式树构建所述目标关联数据集。
3.根据权利要求2所述的方法,其特征在于,基于所述频繁模式树构建所述目标关联数据集,包括:
基于所述频繁模式树筛选出各个关键词的相关关键词;
建立各个关键词与相关关键词之间的对应关系,得到初始关联数据集;
获取相关词评分表;其中,所述相关词评分表用于表征任意两个关键词之间的相关度;
基于所述相关词评分表,对所述初始关联数据集进行优化处理,得到目标关联数据集;其中,所述优化处理包括添加相关关键词和删除相关关键词。
4.根据权利要求2所述的方法,其特征在于,确定目标数据库中记录的各个内容对应的关键词,包括:
在确定所述目标数据库中记录的目标内容有对应的关键词行的情况下,获取所述目标内容对应的关键词行;
对所述目标内容对应的关键词行进行预处理,得到所述目标内容对应的关键词;其中,所述预处理包括:根据分隔符拆分关键词行为多个关键词;
在确定所述目标数据库中记录的目标内容没有对应的关键词行的情况下,获取所述目标内容;
对所述目标内容进行预处理,得到所述目标内容对应的关键词;其中,所述预处理包括:分词和去停用词。
5.根据权利要求3所述的方法,其特征在于,基于所述相关词评分表,对所述初始关联数据集进行优化处理,得到目标关联数据集,包括:
基于所述相关词评分表,确定所述初始关联数据集中目标关键词对应的各个相关关键词的得分;
在目标关键词对应的第一相关关键词的得分小于等于第一预设阈值的情况下,删除所述第一相关关键词;
在所述相关词评分表中与所述目标关键词的相关度大于等于第二预设阈值的第二相关关键词在所述初始关联数据集中不存在的情况下,将所述第二相关关键词添加至与所述目标关键词对应的相关关键词中,得到所述目标关联数据集。
6.根据权利要求1所述的方法,其特征在于,在利用所述目标检索关键词和所述目标相关关键词进行检索,得到多个检索结果之后,还包括:
计算各个检索结果与所述目标检索关键词和所述目标相关关键词的相关程度;
根据所述各个检索结果与所述目标检索关键词和所述目标相关关键词的相关程度,对所述各个检索结果进行降序排列;
将降序排列后的各个检索结果展示给...
【专利技术属性】
技术研发人员:兰亭,徐琳玲,张闯,强锋,
申请(专利权)人:中国工商银行股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。