【技术实现步骤摘要】
搜索方法、模型训练方法、装置、电子设备及存储介质
[0001]本公开涉及人工智能
,尤其涉及智能搜索领域,具体涉及搜索方法、模型训练方法、装置、电子设备及存储介质。
技术介绍
[0002]传统的AI(ArtificialIntelligence,人工智能)模型开发成本高、周期长、迭代慢,无法适配企业敏捷创新的业务需求。随着AI技术从高频主流场景到低频长尾场景的渗透,场景碎片化与“手工作坊式”开发的矛盾日益加剧,对AI技术提出了挑战,也限制了AI的产业化进程。
[0003]现有技术中内搜产品所使用的排序模型作为传统AI模型的一种,也存在上述问题。此外,传统的排序模型较为轻量,排序准确度不足够,模型语义泛化能力不强,存在无法提供语义召回,不具备语义搜索能力的痛点。
技术实现思路
[0004]本公开提供了一种搜索方法、模型训练方法、搜索装置、模型训练装置、电子设备及存储介质。
[0005]根据本公开的第一方面,提供了一种搜索方法,包括:
[0006]获取目标查询信息,以及与所述目标查询信息关联的搜索文本;
[0007]基于所述目标查询信息和所述搜索文本进行向量化处理后,进行语义召回得到包括多个所述搜索文本的第一候选集合,并对所述第一候选集合中的多个所述搜索文本进行排序得到第一搜索结果;
[0008]基于所述目标查询信息和所述搜索文本进行关键词召回得到包括多个所述搜索文本的第二候选集合,并对所述第二候选集合中的多个所述搜索文本进行排序得到第二搜索结果;
[ ...
【技术保护点】
【技术特征摘要】
1.一种搜索方法,包括:获取目标查询信息,以及与所述目标查询信息关联的搜索文本;基于所述目标查询信息和所述搜索文本进行向量化处理后,进行语义召回得到包括多个所述搜索文本的第一候选集合,并对所述第一候选集合中的多个所述搜索文本进行排序得到第一搜索结果;基于所述目标查询信息和所述搜索文本进行关键词召回得到包括多个所述搜索文本的第二候选集合,并对所述第二候选集合中的多个所述搜索文本进行排序得到第二搜索结果;对所述第一搜索结果和所述第二搜索结果进行融合得到第三搜索结果。2.根据权利要求1所述的方法,其中,所述基于所述目标查询信息和所述搜索文本进行向量化处理后,进行语义召回得到包括多个所述搜索文本的第一候选集合,并对所述第一候选集合中的多个所述搜索文本进行排序得到第一搜索结果包括:对所述目标查询信息进行向量化处理得到目标查询信息向量,并对所述搜索文本进行向量化处理得到多个搜索文本向量;计算所述目标查询信息向量和每个所述搜索文本向量之间的语义相似度,召回所述语义相似度符合预设条件的所述搜索文本向量对应的所述搜索文本作为所述第一候选集合;基于所述语义相似度、所述目标查询信息的特征以及所述搜索文本的特征对所述第一候选集合中的所述搜索文本进行排序,得到所述第一搜索结果。3.根据权利要求1所述的方法,其中,所述基于所述目标查询信息和所述搜索文本进行关键词召回得到包括多个所述搜索文本的第二候选集合,并对所述第二候选集合中的多个所述搜索文本进行排序得到第二搜索结果包括:基于所述目标查询信息提取关键词;基于所述关键词遍历所述搜索文本,召回所述关键词命中的所述搜索文本作为所述第二候选集合;对所述第二候选集合中的所述搜索文本进行排序得到所述第二搜索结果。4.根据权利要求1
‑
3中任意一项所述的方法,其中,所述对所述第一搜索结果和所述第二搜索结果进行融合得到第三搜索结果包括:基于预设的过滤规则对所述第一搜索结果进行过滤处理;对所述过滤处理后的所述第一搜索结果和所述第二搜索结果进行内容去重处理;基于所述内容去重处理后的所述第一搜索结果和所述第二搜索结果得到所述第三搜索结果。5.根据权利要求4所述的方法,其中,所述预设的过滤规则包括以下至少一项:基于预设模型阈值对置信度低于所述预设模型阈值的所述第一搜索结果进行过滤;判断所述目标查询信息的类别,对所述类别为非语义场景的所述目标查询信息对应的所述第一搜索结果进行过滤;基于所述第一搜索结果的时效性进行过滤。6.一种模型训练方法,包括:将内搜日志作为训练样本对基础模型进行训练;对训练后得到的所述基础模型进行模型蒸馏得到语义搜索模型;所述语义搜索模型应
用于如权利要求1
‑
5中任意一项所述的搜索方法,用于基于所述目标查询信息和所述搜索文本得到所述第一搜索结果。7.一种搜索装置,包括:获取模块,被配置为获取目标查询信息,以及与所述目标查询信息关联的搜索文本;语义搜索模块,被配置为基于所述目标查询信息和所述搜索文本进行向量化处理后,进行语义召回得到包括多个所述搜索文本的第一候选集合,并对所述第一候选集合中的多个所述搜索文本进行排序得到第...
【专利技术属性】
技术研发人员:何欣燃,潘秋桐,何伯磊,安叶嵩,
申请(专利权)人:百度中国有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。