搜索意图确定方法、装置、设备以及存储介质制造方法及图纸

技术编号:32636711 阅读:25 留言:0更新日期:2022-03-12 18:11
本公开提供一种搜索意图确定方法、装置、设备以及存储介质,涉及人工智能技术领域,以至少解决现有技术中确定的搜索意向准确率低的问题。该方法包括:获取搜索会话序列,搜索会话序列包括至少两个连续的搜索会话;针对搜索会话序列中的每个搜索会话,获取搜索会话对应的维度特征,维度特征包括目标特征;目标特征为基于搜索会话对应的账户的历史搜索会话的停顿时间,对搜索会话的搜索意图进行预估得到的;根据搜索会话对应的维度特征,确定搜索会话的意图标签;意图标签用于表征搜索会话的搜索意图与相邻搜索会话的搜索意图之间的连续性。性。性。

【技术实现步骤摘要】
搜索意图确定方法、装置、设备以及存储介质


[0001]本公开涉及人工智能
,尤其涉及一种搜索意图确定方法、装置、设备以及存储介质。

技术介绍

[0002]通常情况下,当用户需要了解某些信息时,会通过在网络上搜索得到对应信息。其中,对应信息是根据用户的搜索意图确定出的。
[0003]相关技术中,用户的搜索意图大多是通过用户的查询时间或查询词确定的。这种确定方式使用的特征较为单一,使得最终得到的搜索意图不太准确。

技术实现思路

[0004]本公开提供一种搜索意图确定方法、装置、设备以及存储介质,以至少解决现有技术中确定的搜索意图准确率低的问题。
[0005]本公开的技术方案如下:
[0006]根据本公开的第一方面,提供一种搜索意图确定方法,该搜索意图确定方法包括:搜索意图确定装置获取搜索会话序列,搜索会话序列包括至少两个连续的搜索会话;针对搜索会话序列中的每个搜索会话,获取搜索会话对应的维度特征,维度特征包括目标特征;目标特征为基于搜索会话对应的账户的历史搜索会话的停顿时间,对搜索会话的搜索意图进行预估本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种搜索意图确定方法,其特征在于,包括:获取搜索会话序列,所述搜索会话序列包括至少两个连续的搜索会话;针对所述搜索会话序列中的每个搜索会话,获取所述搜索会话对应的维度特征,所述维度特征包括目标特征;所述目标特征为基于所述搜索会话对应的账户的历史搜索会话的停顿时间,对所述搜索会话的搜索意图进行预估得到的;根据所述搜索会话对应的维度特征,确定所述搜索会话的意图标签;所述意图标签用于表征所述搜索会话的搜索意图与相邻搜索会话的搜索意图之间的连续性。2.根据权利要求1所述的方法,其特征在于,所述搜索会话对应的维度特征还包括下述至少一个:公共词长度特征、分词后的重合度特征和相似度特征;所述公共词长度特征包括:第一长度参数或第二长度参数,所述第一长度参数用于表征公共词的长度值相对于所述相邻搜索会话的词的长度值的占比,所述第二长度参数用于表征公共词的长度值相对于所述搜索会话的词的长度值的占比;所述公共词为所述搜索会话和所述相邻搜索会话中共有的词;所述分词后的重合度特征包括:第一重合度参数或第二重合度参数,所述第一重合度参数用于表征公共语素相对于所述相邻搜索会话对应的分词的重合程度,所述第二重合度参数用于表征所述公共语素相对于所述搜索会话的分词的重合程度;所述公共语素为对所述搜索会话和所述相邻搜索会话中具备相同属性的词;所述相似度特征包括:所述搜索会话和所述相邻搜索会话的文本余弦距离。3.根据权利要求2所述的方法,其特征在于,在所述相邻搜索会话包括所述搜索会话的前一个搜索会话的情况下,所述维度特征包括第一时间间隔,所述第一时间间隔为所述搜索会话与所述前一个搜索会话的时间间隔;在所述相邻搜索会话包括所述搜索会话的后一个搜索会话的情况下,所述维度特征包括第二时间间隔,所述第二时间间隔为所述搜索会话与所述后一个搜索会话的时间间隔。4.根据权利要求1至3中任一项所述的方法,其特征在于,所述根据所述每个搜索会话对应的维度特征,确定所述每个搜索会话的意图标签,包括:将所述每个搜索会话对应的维度特征输入搜索意图确定模型,得到所述每个搜索会话的意图标签,所述搜索意图确定模型为梯度提升决策树模型。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取搜索会话序列样本和所述搜索会话序列样本中每个搜索会话样本的标准意图标签;其中,所述标准...

【专利技术属性】
技术研发人员:朱晓旭王建强
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1