调整方法、搜索方法、电子设备、存储介质及程序产品技术

技术编号:33730769 阅读:91 留言:0更新日期:2022-06-08 21:26
本申请实施例提供了一种调整方法、搜索方法、电子设备、存储介质及程序产品,语言模型的调整方法,包括:获得多个样本数据,样本数据包括多个样本字符串、每个样本字符串对应的多个样本命名实体、每个样本命名实体对应的匹配标记,匹配标记用于标识样本搜索字符串与命名实体的匹配结果;通过预训练的语言模型,将若干个样本命名实体与对应的样本字符串进行语义匹配,得到若干个样本命名实体分别与样本字符串的预测语义匹配结果;根据多个样本命名实体各自的预测语义匹配结果以及匹配标记表征的匹配结果之间的差异,调整预训练的语言模型。调整预训练的语言模型。调整预训练的语言模型。

【技术实现步骤摘要】
调整方法、搜索方法、电子设备、存储介质及程序产品


[0001]本申请实施例涉及计算机
,尤其涉及一种语言模型的调整方法、搜索方法、电子设备、存储介质及程序产品。

技术介绍

[0002]在搜索领域,准确地理解搜索字符串对应的实体是理解用户核心需求的基础。一般情况下,会根据搜索字符串中包括的多个词分别进行理解得到对应的实体。但是这种情况仅适用于用户输入的搜索字符串较为精准的情况。
[0003]若用户输入的搜索字符串的精准程度较差导致根据搜索字符串不能准确地定位到对应的实体,进而导致为用户提供的搜索结果的命中率较低。

技术实现思路

[0004]有鉴于此,本申请实施例提供一种语言模型的调整方案、搜索方案,以至少部分解决上述问题。
[0005]根据本申请实施例的第一方面,提供了一种语言模型的调整方法,包括:获得多个样本数据,所述样本数据包括多个样本字符串、每个所述样本字符串对应的多个样本命名实体、每个样本命名实体对应的匹配标记,所述匹配标记用于标识所述样本搜索字符串与所述命名实体的匹配结果;通过预训练的语言模型,将若本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种语言模型的调整方法,包括:获得多个样本数据,所述样本数据包括多个样本字符串、每个所述样本字符串对应的多个样本命名实体、每个样本命名实体对应的匹配标记,所述匹配标记用于标识所述样本搜索字符串与所述命名实体的匹配结果;通过预训练的语言模型,将若干个样本命名实体与对应的所述样本字符串进行语义匹配,得到若干个所述样本命名实体分别与所述样本字符串的预测语义匹配结果;根据多个样本命名实体各自的预测语义匹配结果以及所述匹配标记表征的匹配结果之间的差异,调整预训练的所述语言模型,其中,所述语言模型用于将若干个候选命名实体与搜索字符串进行语义匹配,得到若干个所述候选命名实体分别与所述搜索字符串的语义匹配结果,以根据语义匹配结果得到所述搜索字符串对应的目标命名实体,所述候选命名实体通过对搜索字符串的历史搜索结果进行命名实体识别得到。2.根据权利要求1所述的方法,其中,所述通过预训练的语言模型,将若干个样本命名实体与对应的所述样本字符串进行语义匹配,得到若干个所述样本命名实体分别与所述样本字符串的预测语义匹配结果,包括:将所述多个样本命名实体分别与各自对应的样本搜索字符串进行拼接,将拼接结果输入至语言模型的语言模型主体部分,通过所述语言模型主体部分进行语义匹配,输出对应的预测匹配向量;通过与所述语言模型的输出层部分,根据所述预测匹配向量确定多个样本命名实体各自的预测匹配分数,作为所述预测语义匹配结果。3.一种搜索方法,包括:接收搜索字符串,并将所述搜索字符串与搜索历史进行匹配,获得与搜索字符串对应的历史搜索结果;对所述历史搜索结果进行命名实体识别,获得若干个候选命名实体;通过语言模型,将所述若干个候选命名实体与所述搜索字符串进行语义匹配,得到若干个所述候选命名实体分别与所述搜索字符串的语义匹配结果;根据所述语义匹配结果,从所述若干个候选命名实体中确定出与所述搜索字符串匹配的目标命名实体;执行所述目标命名实体与所述搜索字符串对应的搜索操作。4.根据权利要求3所述的方法,其中,所述将所述搜索字符串与搜索历史进行匹配,获得与搜索字符串对应的历史搜索结果,包括:获得所述搜索历史,所述搜索历史...

【专利技术属性】
技术研发人员:蒋勇张月李辰王涛黄忠强谢朋峻
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1