【技术实现步骤摘要】
用于语义检索的人工智能系统和方法
本申请一般涉及用于语义检索的人工智能系统和方法,更具体地说,涉及基于深度学习的用于语义检索的人工智能系统和方法。
技术介绍
在线上到线下服务期间,当用户想要检索感兴趣的地点(pointofinterest,POI)时,用户可以将与位置有关的查询词输入到在用户终端设备上实现的线上线下服务应用的搜索框中。线上到线下系统可以基于输入的查询词的语义向用户推荐至少一个位置。至少一个推荐位置可以帮助用户快速找出用户想要检索的POI。在用于语义搜索的现有方法中,线上到线下系统可以解析查询词,并且遍历至少两个召回策略以为用户检索至少一个推荐位置。然而,现有方法的问题在于搜索策略复杂,导致搜索效率低和搜索成本高。因此,希望提供直接基于用户输入的查询词的用于语义检索的人工智能系统和方法,更具体地,根据深度学习算法检索POI。
技术实现思路
本申请的一个方面是介绍一种用于语义检索的系统,该系统可以包括至少一个包括一组指令的存储介质。该系统可以包括通信地连接到网络的数据交换端口。该系统还可以包括 ...
【技术保护点】
1.一种用于语义检索的人工智能系统,其特征在于,包括:/n查询词获取模块,被配置为通过所述数据交换端口从用户终端获取查询词;/n查询词向量变换模块,被配置为使用预先生成的模型将所述查询词变换为查询词向量;/nPOI向量集获取模块,被配置为使用乘积量化算法,根据所述查询词向量,从检索库检索一组POI向量;以及/n推荐的POI确定模块,被配置为响应于所述查询词,基于所述一组POI向量确定至少一个POI,用于向用户推荐。/n
【技术特征摘要】
1.一种用于语义检索的人工智能系统,其特征在于,包括:
查询词获取模块,被配置为通过所述数据交换端口从用户终端获取查询词;
查询词向量变换模块,被配置为使用预先生成的模型将所述查询词变换为查询词向量;
POI向量集获取模块,被配置为使用乘积量化算法,根据所述查询词向量,从检索库检索一组POI向量;以及
推荐的POI确定模块,被配置为响应于所述查询词,基于所述一组POI向量确定至少一个POI,用于向用户推荐。
2.根据权利要求1所述的系统,其特征在于,还包括模型训练模块,被配置为通过以下步骤基于检索词语义与POI之间的相关性训练所述预先生成的模型:
获得初始模型;
获得至少两个历史检索词-POI对,所述至少两个历史检索词-POI对中的每一个包含一个历史查询词和相应的历史POI;
对于所述至少两个历史检索词-POI对中的每一个,
解析所述至少一个历史查询词或所述至少一个相应的历史POI到一个或以上的片段,以及
基于所述解析为所述历史检索词-POI对生成一个或以上文本表达;以及
使用深度学习方法基于所述至少两个历史检索词-POI对的所述文本表达训练所述初始模型来获得所述预先生成的模型。
3.根据权利要求2所述的系统,其特征在于,所述预先生成的模型包括深度POI语义模型DPSM模型。
4.根据权利要求1至3任一项所述的系统,其特征在于,为使用乘积量化算法,根据所述查询词向量,从检索库检索该组POI向量,所述POI向量集获取模块进一步被配置为:
获取POI数据库中至少两个POI的索引;
从所述查询词获取至少一个目标位置;以及
根据所述索引、所述查询词向量和所述至少一个目标位置,从所述检索库中确定所述一组POI向量,所述一组POI向量与所述查询词有关。
5.根据权利要求4所述的系统,其特征在于,为获取POI数据库中至少两个POI的索引,所述POI向量集获取模块进一步被配置为:
从所述POI数据库中获取所述至少两个POI;
使用所述预先生成的模型将所述至少两个POI变换为所述至少两个POI向量;以及
使用图形处理单元GPU基于所述至少两个POI向量,生成所述至少两个POI的所述索引。
6.根据权利要求1所述的系统,其特征在于,为响应于所述查询词,基于所述一组POI向量确定所述至少一个POI,用于向用户推荐,所述推荐的POI确定模块进一步被配置为:
基于所述一组POI向量生成标识符ID列表,所述ID列表包括一组ID,每个ID指向一个候选POI;
使用训练好的质检模型确定对应于所述一组POI向量的一组候选POI的一组相似值,每个相似值表示相应的POI与所述查询词的相关等级;
排序所述一组候选POI的所述相似值;以及
根据所述一组相似值的所述排序,从所述一组候选POI中确定所述至少一个POI。
7.根据权利要求6所述的系统,其特征在于,所述训练好的质检模型是梯度提升决策树GBDT模型。
8.根据权利要求6所述的系统,其特征在于,为排序所述一组候选POI的所述相似值,所述推荐的POI确定模块进一步被配置为:
对于所述一组候选POI中的每一个,确定所述对应的相似值是否大于得分阈值;
获得一个或以上相关的候选POI,其相似值大于所述得分阈值;以及
基于训练好的排序模型排序所述一个或以上相关的候选POI。
9.根据权利要求8所述的系统,其特征在于,所述训练好的排序模型是通过排序学习learntorank方法获得的。
10.一种用于在计算设备上实现的语义检索的人工智能方法,所述方法包括:
从用户终端获取查询词;
...
【专利技术属性】
技术研发人员:余鹏,郑万吉,赵骥,陈欢,宋奇,马利,
申请(专利权)人:北京嘀嘀无限科技发展有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。