【技术实现步骤摘要】
一种查询词自动扩展方法、装置、设备及存储介质
本专利技术涉及搜索
,更具体地说,涉及一种查询词自动扩展方法、装置、设备及存储介质。
技术介绍
在搜索领域中,基于用户查询的关键词搜索因为速度快、体量轻及支持大规模并发一直作为信息搜索的主要依据,并广泛在各个搜索引擎中使用。然而在行业领域内,用户往往缺乏领域内的专业知识,因此容易在搜索相关信息时出现查询模糊、歧义以及查询缺失等情况,最终导致搜索结果不够准确;同时因为不同用户之间的表述不同,存在一词多义、一义多词的语义鸿沟,也会使搜索结果的准确率降低。
技术实现思路
本专利技术的目的是提供一种查询词自动扩展方法、装置、设备及存储介质,能够有效提高查询结果的准确性。为了实现上述目的,本专利技术提供如下技术方案:一种查询词自动扩展方法,包括:获取历史上用户输入的查询问题及可供用户查询的全部文档,获取所述查询问题及全部所述文档中的词均为备选语义扩展词;获取用户当前输入的查询关键词,分别计算所述查询关键词与每个所述备选语义扩展词的相 ...
【技术保护点】
1.一种查询词自动扩展方法,其特征在于,包括:/n获取历史上用户输入的查询问题及可供用户查询的全部文档,获取所述查询问题及全部所述文档中的词均为备选语义扩展词;/n获取用户当前输入的查询关键词,分别计算所述查询关键词与每个所述备选语义扩展词的相似度,基于计算所得相似度确定多个所述备选语义扩展词为第一扩展词;其中,所述第一扩展词对应相似度大于其他备选语义扩展词对应相似度;/n利用所述第一扩展词及所述查询关键词进行查询,得到相应的文档。/n
【技术特征摘要】
1.一种查询词自动扩展方法,其特征在于,包括:
获取历史上用户输入的查询问题及可供用户查询的全部文档,获取所述查询问题及全部所述文档中的词均为备选语义扩展词;
获取用户当前输入的查询关键词,分别计算所述查询关键词与每个所述备选语义扩展词的相似度,基于计算所得相似度确定多个所述备选语义扩展词为第一扩展词;其中,所述第一扩展词对应相似度大于其他备选语义扩展词对应相似度;
利用所述第一扩展词及所述查询关键词进行查询,得到相应的文档。
2.根据权利要求1所述的方法,其特征在于,利用所述第一扩展词及所述查询关键词进行查询之前,还包括:
利用所述查询关键词进行查询,确定查询所得文档中多个文档均为扩展用文档,获取所述扩展用文档中的词为备选反馈扩展词;
分别计算所述查询关键词与每个所述备选反馈扩展词的相关性,并基于计算所得相关性确定多个所述备选反馈扩展词为第二扩展词;其中,所述第二扩展词对应相关性大于其他备选语义扩展词对应相关性;
对应的,利用所述第一扩展词及所述查询关键词进行查询,包括:
获取所述第一扩展词组成的集合与所述第二扩展词组成的集合的并集,并利用所述并集中的词及所述查询关键词进行查询。
3.根据权利要求2所述的方法,其特征在于,分别计算所述查询关键词与每个所述备选反馈扩展词的相关性,包括:
按照下列公式计算所述查询关键词与任意备选反馈扩展词的相关性:
其中,rt表示计算所得相关性,t表示任意备选反馈扩展词,R表示所述扩展用文档的集合,D表示可供用户查询的全部文档的集合,p(t|R)表示t在R中出现的概率,p(t|D)表示t在D中出现的概率。
4.根据权利要求3所述的方法,其特征在于,利用所述第一扩展词及所述查询关键词进行查询或利用所述并集中的词及所述查询关键词进行查询,包括:
采用tf-idf算法或者BM25算法,利用所述第一扩展词及所述查询关键词进行查询或利用所述并集中的词及所述查询关键词进行查询。
5.根据权利要...
【专利技术属性】
技术研发人员:张浩,周期律,周鹏,王超,郑力,游佳川,徐欣欣,王璇,
申请(专利权)人:重庆农村商业银行股份有限公司,
类型:发明
国别省市:重庆;50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。