搜索方法、装置及电子设备制造方法及图纸

技术编号:24353843 阅读:47 留言:0更新日期:2020-06-03 02:08
公开一种搜索方法及装置、电子设备,该方法可以包括:获取用户输入的搜索数据样本,在用户的每次字符输入时为用户推荐的搜索模式,以及与所述搜索数据样本对应的搜索时长;将所述搜索数据样本中的输入字符作为状态,在用户输入该输入字符时为用户推荐的搜索模式作为动作,生成状态动作对,并将所述搜索时长作为与所述状态动作对对应的回报,对预设的强化学习模型进行强化学习训练,得到搜索决策模型;响应于用户输入的搜索数据,将用户每次输入的输入字符输入训练完成的所述搜索模式决策模型进行推荐计算,并将当前的搜索模式切换为所述搜索模式决策模型输出的搜索模式,以使用户基于所述搜索模式决策模型输出的搜索模式执行搜索。

Search methods, devices and electronic equipment

【技术实现步骤摘要】
搜索方法、装置及电子设备
本申请涉及计算机应用
,尤其涉及搜索方法、装置及电子设备。
技术介绍
随着互联网技术的发展和普及应用,用户可以通过在业务系统中输入关键词进行搜索,得到业务系统返回的搜索结果;用户可以进一步根据该搜索结果,执行下一步业务操作。
技术实现思路
本说明书提出一种搜索方法,所述方法包括:获取用户输入的搜索数据样本,在用户的每次字符输入时为用户推荐的搜索模式,以及与所述搜索数据样本对应的搜索时长;其中,所述搜索数据样本包括按照输入时刻排序的输入字符序列;所述搜索模式包括直接搜索模式和建议词搜索模式;所述搜索时长表征从用户开始输入字符到得到搜索结果的时间差;将所述搜索数据样本中的输入字符作为状态,在用户输入该输入字符时为用户推荐的搜索模式作为动作,生成状态动作对,并将所述搜索时长作为与所述状态动作对对应的回报,对预设的强化学习模型进行强化学习训练,得到搜索决策模型;响应于用户输入的搜索数据,将用户每次输入的输入字符输入训练完成的所述搜索模式决策模型进行推荐计算,并将当前的搜索模式切本文档来自技高网...

【技术保护点】
1.一种搜索方法,所述方法包括:/n获取用户输入的搜索数据样本,在用户的每次字符输入时为用户推荐的搜索模式,以及与所述搜索数据样本对应的搜索时长;其中,所述搜索数据样本包括按照输入时刻排序的输入字符序列;所述搜索模式包括直接搜索模式和建议词搜索模式;所述搜索时长表征从用户开始输入字符到得到搜索结果的时间差;/n将所述搜索数据样本中的输入字符作为状态,在用户输入该输入字符时为用户推荐的搜索模式作为动作,生成状态动作对,并将所述搜索时长作为与所述状态动作对对应的回报,对预设的强化学习模型进行强化学习训练,得到搜索决策模型;/n响应于用户输入的搜索数据,将用户每次输入的输入字符输入训练完成的所述搜索...

【技术特征摘要】
1.一种搜索方法,所述方法包括:
获取用户输入的搜索数据样本,在用户的每次字符输入时为用户推荐的搜索模式,以及与所述搜索数据样本对应的搜索时长;其中,所述搜索数据样本包括按照输入时刻排序的输入字符序列;所述搜索模式包括直接搜索模式和建议词搜索模式;所述搜索时长表征从用户开始输入字符到得到搜索结果的时间差;
将所述搜索数据样本中的输入字符作为状态,在用户输入该输入字符时为用户推荐的搜索模式作为动作,生成状态动作对,并将所述搜索时长作为与所述状态动作对对应的回报,对预设的强化学习模型进行强化学习训练,得到搜索决策模型;
响应于用户输入的搜索数据,将用户每次输入的输入字符输入训练完成的所述搜索模式决策模型进行推荐计算,并将当前的搜索模式切换为所述搜索模式决策模型输出的搜索模式,以使用户基于所述搜索模式决策模型输出的搜索模式执行搜索。


2.根据权利要求1所述的方法,所述在用户的每次字符输入时为用户推荐的搜索模式,为在用户的每次字符输入时为用户随机推荐的搜索模式。


3.根据权利要求1所述的方法,所述强化学习模型的回报函数的回报衰减因子为动态值。


4.根据权利要求3所述的方法,所述强化学习模型的回报函数的回报衰减因子,为基于所述搜索数据中的所有字符输入完成时的最大输入次数确定出的动态值。


5.根据权利要求4所述的方法,所述强化学习模型为深度强化学习模型;其中,所述深度强化学习模型包括用于拟合回报函数的衰减因子的深度学习网络;
所述对预设的强化学习模型进行强化学习训练,包括:
基于所述状态动作对和所述搜索时长构建训练样本,基于构建的训练样本对预设的强化学习模型进行强化学习训练,确定所述强化学习模型的回报函数中的模型参数;以及,
确定所述搜索数据样本中的最大字符输入次数,至少将所述最大字符输入次数作为输入数据输入至所述深度学习网络进行数据拟合,确定所述回报函数中的衰减因子。


6.根据权利要求5所述的方法,所述回报函数基于以下公式表征:



其中,为j时刻对应状态动作对的搜索时长;为j+1时刻状态;表征该深度强
化学习模型的模型参数;a′表征j时刻状态到j+1时刻状态所对应选择的动作,该动作为搜
索模式,该搜索模式可以为直接搜索模式或者建议词搜索模式;f为用于表征拟合替代回报
函数的衰减因子的深度学习网络;index表征用户输入搜索数据过程中的第index次输入,
max_index表征用户完成输入搜索数据中的所有字符输入时的最大输入次数。


7.根据权利要求1所述的方法,还包括:
在用户输入的搜索数据前,将当前的搜索模式默认设置为建议词搜索模式。


8.根据权利要求1所述的方法,所述响应于用户输入的搜索数据,将用户每次输入的输入字符输入训练完成的所述搜索模式决策模型进行推荐计算,并将当前的搜索模式切换为所述搜索模式决策模型输出的搜索模式,以使用户基于所述搜索模式决策模型输出的搜索模式执行搜索,包括:
响应于用户输入的搜索数据,将用户每次输入的输入字符输入训练完成的所述搜索模式决策模型进行推荐计算,在当前的搜索模式为建议词搜索模式且所述搜索模式决策模型输出的搜索模式为直接搜索模式时,并将当前的搜索模式从建议词搜索模式切换为直接搜索模式,以使用户基于切换后的直接搜索模式直接获得对应的搜索结果。


9.根据权利要求8所述的方法,还包括:
响应于用户输入的搜索数据,将用户每次输入的输入字符输入训练完成的所述搜索模式决策模型进行推荐计算,在当前的搜索模式为直接搜索模式且所述搜索模式决策模型输出的搜索模式为建议词搜索模式时,并将当前的搜索模式从直接搜索模式切换为建议词搜索模式,以使用户基于建议词搜索模式选择建议词后执行对应搜索。


10.根据权利要求1所述的方法,所述建议词搜索模式为在用户输入搜索数据的过程中,向用户输出与输入字符相关的建议词,并在用户选择该建议词后基于该建议词发起数据搜索的搜索模式;所述直接搜索模式为在用户输入搜索数据的过程中,向用户输出与已输入字符对应的实时搜索结果的搜索模式。


11.一种搜索装置,所述装置包括:
...

【专利技术属性】
技术研发人员:郑培祥段超蔡明宸刘忠义张翼李涛
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1