一种查询方法、装置、设备及存储介质制造方法及图纸

技术编号:33090895 阅读:24 留言:0更新日期:2022-04-15 11:04
本发明专利技术公开了一种查询方法、装置、设备及存储介质。该方法包括:获取用户输入的查询语句;对所述查询语句进行拆分,得到至少一个待查询词;根据所述至少一个待查询词查询第一数据库,得到每个待查询词对应的至少一个预测召回词;根据每个预测召回词相对于每个待查询词的相关性得分对所述至少一个预测召回词进行排序,并根据排序结果生成查询结果,通过本发明专利技术的技术方案,解决了现有搜索架构搜索结果不准确,无法进行模糊搜索,用户的足迹行为无法及时反馈,搜索系统无法得到合理反馈优化的问题,提升了用户搜索体验,新架构基于改进的BM25算法实现了模糊搜索,打分排序功能。通过用户足迹数据采集和分析,为用户提供个性化产品推荐。品推荐。品推荐。

【技术实现步骤摘要】
一种查询方法、装置、设备及存储介质


[0001]本专利技术实施例涉及计算机
,尤其涉及一种查询方法、装置、设备及存储介质。

技术介绍

[0002]现有手机银行搜索系统为非智能系统,后台为关系型数据库。
[0003]现有搜索架构搜索结果不准确,无法进行模糊搜索。用户的足迹行为无法及时反馈,搜索系统无法得到合理反馈优化,且不支持运营自定义搜索方案,搜索结果的扩展性被限制。

技术实现思路

[0004]本专利技术实施例提供一种查询方法、装置、设备及存储介质,既能够解决现有搜索架构搜索结果不准确,无法进行模糊搜索,用户的足迹行为无法及时反馈,搜索系统无法得到合理反馈优化的问题,又能够结果不支持运营自定义搜索方案,搜索结果的扩展性被限制的问题,提升了用户搜索体验,新架构基于改进的BM25算法实现了模糊搜索,打分排序功能。通过用户足迹数据采集和分析,为用户提供个性化产品推荐。
[0005]第一方面,本专利技术实施例提供了一种查询方法,包括:
[0006]获取用户输入的查询语句;
[0007]对所述查询语句进行拆分,得到至少一个待查询词;
[0008]根据所述至少一个待查询词查询第一数据库,得到每个待查询词对应的至少一个预测召回词;
[0009]根据每个预测召回词相对于每个待查询词的相关性得分对所述至少一个预测召回词进行排序,并根据排序结果生成查询结果。
[0010]进一步的,对所述查询语句进行拆分,得到至少一个待查询词,包括:
[0011]获取所述查询语句对应的拼音信息;
[0012]根据所述拼音信息确定第一文字信息集合;
[0013]若所述第一文字信息集合中存在和所述查询语句相同的文字信息,则对所述查询语句进行拆分,得到至少一个待查询词。
[0014]进一步的,还包括:
[0015]若所述第一文字信息集合中不存在和所述查询语句相同的文字信息,则生成提醒信息,并根据所述提醒信息进行提示。
[0016]进一步的,根据每个预测召回词相对于每个待查询词的相关性得分对所述至少一个预测召回词进行排序,并根据排序结果生成查询结果,包括:
[0017]获取每个待查询词在每个预测召回词中出现的频次、每个预测召回词在所述第一数据库中出现的频次、每个预测召回词对应的权重以及协调因子;
[0018]根据所述每个待查询词在每个预测召回词中出现的频次、每个预测召回词在所述
第一数据库中出现的频次、每个预测召回词对应的目标权重以及协调因子确定每个预测召回词相对于每个待查询词的相关性得分;
[0019]根据每个预测召回词相对于每个待查询词的相关性得分对所述至少一个预测召回词进行排序;
[0020]根据排序结果生成查询结果。
[0021]进一步的,在根据每个预测召回词相对于每个待查询词的相关性得分对所述至少一个预测召回词进行排序,并根据排序结果生成查询结果之前,还包括:
[0022]获取用户的历史查询行为信息;
[0023]将所述用户的历史查询行为信息输入第一模型,得到至少一个目标词对,其中,所述目标词对包括:历史查询词和与所述历史查询词关联的历史召回词;
[0024]获取每个目标词对出现的次数;
[0025]根据每个目标词对出现的次数确定每个目标词对中历史查询词和历史召回词的相关度。
[0026]进一步的,获取每个预测召回词对应的目标权重包括:
[0027]根据所述每个目标词对中历史查询词和历史召回词的相关度确定每个预测召回词对应的第一权重;
[0028]根据每个搜索词确定每个预测召回词对应的第二权重;
[0029]根据所述第一权重和所述第二权重确定目标权重。
[0030]进一步的,获取协调因子包括:
[0031]获取每个预测召回词的长度信息;
[0032]根据所述每个预测召回词的长度信息确定所述每个预测召回词对应的协调因子。
[0033]第二方面,本专利技术实施例还提供了一种查询装置,该查询装置包括:
[0034]获取模块,用于获取用户输入的查询语句;
[0035]拆分模块,用于对所述查询语句进行拆分,得到至少一个待查询词;
[0036]查询模块,用于根据所述至少一个待查询词查询第一数据库,得到每个待查询词对应的至少一个预测召回词;
[0037]生成模块,用于根据每个预测召回词相对于每个待查询词的相关性得分对所述至少一个预设召回词进行排序,并根据排序结果生成查询结果。
[0038]进一步的,所述拆分模块具体用于:
[0039]获取所述查询语句对应的拼音信息;
[0040]根据所述拼音信息确定第一文字信息集合;
[0041]若所述第一文字信息集合中存在和所述查询语句相同的文字信息,则对所述查询语句进行拆分,得到至少一个待查询词。
[0042]进一步的,所述拆分模块还用于:
[0043]若所述第一文字信息集合中不存在和所述查询语句相同的文字信息,则生成提醒信息,并根据所述提醒信息进行提示。
[0044]进一步的,所述生成模块具体用于:
[0045]获取每个待查询词在每个预测召回词中出现的频次、每个预测召回词在所述第一数据库中出现的频次、每个预测召回词对应的权重以及协调因子;
[0046]根据所述每个待查询词在每个预测召回词中出现的频次、每个预测召回词在所述第一数据库中出现的频次、每个预测召回词对应的目标权重以及协调因子确定每个预测召回词相对于每个待查询词的相关性得分;
[0047]根据每个预测召回词相对于每个待查询词的相关性得分对所述至少一个预测召回词进行排序;
[0048]根据排序结果生成查询结果。
[0049]进一步的,所述生成模块具体用于:
[0050]获取用户的历史查询行为信息;
[0051]将所述用户的历史查询行为信息输入第一模型,得到至少一个目标词对,其中,所述目标词对包括:历史查询词和与所述历史查询词关联的历史召回词;
[0052]获取每个目标词对出现的次数;
[0053]根据每个目标词对出现的次数确定每个目标词对中历史查询词和历史召回词的相关度。
[0054]进一步的,所述生成模块具体用于:
[0055]根据所述每个目标词对中历史查询词和历史召回词的相关度确定每个预测召回词对应的第一权重;
[0056]根据每个搜索词确定每个预测召回词对应的第二权重;
[0057]根据所述第一权重和所述第二权重确定目标权重。
[0058]进一步的,所述生成模块具体用于:
[0059]获取每个预测召回词的长度信息;
[0060]根据所述每个预测召回词的长度信息确定所述每个预测召回词对应的协调因子。
[0061]第三方面,本专利技术实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种查询方法,其特征在于,包括:获取用户输入的查询语句;对所述查询语句进行拆分,得到至少一个待查询词;根据所述至少一个待查询词查询第一数据库,得到每个待查询词对应的至少一个预测召回词;根据每个预测召回词相对于每个待查询词的相关性得分对所述至少一个预测召回词进行排序,并根据排序结果生成查询结果。2.根据权利要求1所述的方法,其特征在于,对所述查询语句进行拆分,得到至少一个待查询词,包括:获取所述查询语句对应的拼音信息;根据所述拼音信息确定第一文字信息集合;若所述第一文字信息集合中存在和所述查询语句相同的文字信息,则对所述查询语句进行拆分,得到至少一个待查询词。3.根据权利要求2所述的方法,其特征在于,还包括:若所述第一文字信息集合中不存在和所述查询语句相同的文字信息,则生成提醒信息,并根据所述提醒信息进行提示。4.根据权利要求1所述的方法,其特征在于,根据每个预测召回词相对于每个待查询词的相关性得分对所述至少一个预测召回词进行排序,并根据排序结果生成查询结果,包括:获取每个待查询词在每个预测召回词中出现的频次、每个预测召回词在所述第一数据库中出现的频次、每个预测召回词对应的权重以及协调因子;根据所述每个待查询词在每个预测召回词中出现的频次、每个预测召回词在所述第一数据库中出现的频次、每个预测召回词对应的目标权重以及协调因子确定每个预测召回词相对于每个待查询词的相关性得分;根据每个预测召回词相对于每个待查询词的相关性得分对所述至少一个预测召回词进行排序;根据排序结果生成查询结果。5.根据权利要求4所述的方法,其特征在于,在根据每个预测召回词相对于每个待查询词的相关性得分对所述至少一个预测召回词进行排序,并根据排序结果生成查询结果之前,还包...

【专利技术属性】
技术研发人员:陈欣然李霁伦万斌刘熙樊婧竹顾晗霞
申请(专利权)人:上海浦东发展银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1