搜索方法、装置、存储介质以及终端制造方法及图纸

技术编号:26791323 阅读:30 留言:0更新日期:2020-12-22 17:06
本申请公开了一种搜索方法、装置、存储介质以及终端,涉及数据处理技术领域。首先获取历史搜索数据,基于预设标注规则标注出历史搜索数据中与所有应用程序相关的样本搜索语句;然后从历史搜索数据中获取用户关于同一搜索需求的共现搜索语句;最后将样本搜索语句以及共现搜索语句输入训练模型进行训练,将训练后的训练模型作为搜索词典。由于用户的历史搜索数据包含了用户的实际搜索应用程序情况,而共现搜索语句可以反映出用户的搜索需求,将样本搜索语句以及共现搜索语句输入训练模型进行训练后可以得到用于应用程序识别的搜索词典,基于该搜索词典可以准确地识别出用户关于应用程序的搜索意图。

【技术实现步骤摘要】
搜索方法、装置、存储介质以及终端
本申请涉及数据处理
,尤其涉及一种搜索方法、装置、存储介质以及终端。
技术介绍
随着科学技术的发展,数据呈现多样性、复杂性等特点,人们对于追求事物的认知也渐渐变得更加复杂多样。在日常生活中,搜索渐渐成为人们认知新事物的一种技能方式,因此搜索方法也成本本领域人员研究的重点之一。在相关技术中,用户的搜索需求中关于应用程序的搜索需求占据了很大比例,为了满足不同用户对应用程序下载的意图需求,搜索引擎面临着技术挑战,然而大部分搜索引擎采用规则解析方式进行意图的召回逻辑,使得对应用程序下载的意图需求识别准确率较低。
技术实现思路
本申请提供一种搜索方法、装置、存储介质以及终端,可以解决相关技术中对应用程序下载的意图需求识别准确率较低的技术问题。第一方面,本申请提供一种搜索方法,该方法包括:获取历史搜索数据,基于预设标注规则标注出所述历史搜索数据中与所有应用程序相关的样本搜索语句;从所述历史搜索数据中获取用户关于同一搜索需求的共现搜索语句;将所述样本搜索语句以本文档来自技高网...

【技术保护点】
1.一种搜索方法,其特征在于,所述方法包括:/n获取历史搜索数据,基于预设标注规则标注出所述历史搜索数据中与所有应用程序相关的样本搜索语句;/n从所述历史搜索数据中获取用户关于同一搜索需求的共现搜索语句;/n将所述样本搜索语句以及所述共现搜索语句输入训练模型进行训练,将训练后的所述训练模型作为搜索词典;/n其中,所述搜索词典用于当获取用户输入的实时搜索语句后,输出所述实时搜索语句对应的应用程序的内容。/n

【技术特征摘要】
1.一种搜索方法,其特征在于,所述方法包括:
获取历史搜索数据,基于预设标注规则标注出所述历史搜索数据中与所有应用程序相关的样本搜索语句;
从所述历史搜索数据中获取用户关于同一搜索需求的共现搜索语句;
将所述样本搜索语句以及所述共现搜索语句输入训练模型进行训练,将训练后的所述训练模型作为搜索词典;
其中,所述搜索词典用于当获取用户输入的实时搜索语句后,输出所述实时搜索语句对应的应用程序的内容。


2.根据权利要求1所述的方法,其特征在于,所述基于预设标注规则标注出所述历史搜索数据中与所有应用程序相关的样本搜索语句,包括:
基于小样本标注规则从所述历史搜索数据中,抽取与预设应用程序相关的小样本搜索语句;
基于所述小样本搜索语句中的异常搜索语句对所述小样本标注规则进行修正以及多次迭代,得到预设标注规则;
基于所述预设标注规则标注出所述历史搜索数据中与所有应用程序相关的样本搜索语句。


3.根据权利要求1所述的方法,其特征在于,所述从所述历史搜索数据中获取用户关于同一搜索需求的共现搜索语句,包括:
基于不同用户的用户标识,获取所述历史搜索数据中多个用户的用户历史搜索数据;
基于各用户的所述用户历史搜索数据中的搜索直达日志,将各用户在预设时间内关于各自同一搜索需求输入的搜索语句作为共现搜索语句。


4.根据权利要求3所述的方法,其特征在于,所述从所述历史搜索数据中获取用户关于同一搜索需求的共现搜索语句之后,包括:
基于各用户的所述用户历史搜索数据,获取各共现搜索语句的用户浏览量以及搜索用户量。


5.根据权利要求4所述的方法,其特征在于,所述将所述样本搜索语句以及所述共现搜索语句输入训练模型进行训练,将训练后的所述训练模型作为搜索词典,包括:
将所述共现搜索语句按照出现次数进行降序排列;
将...

【专利技术属性】
技术研发人员:高建超姜罕
申请(专利权)人:深圳市欢太科技有限公司OPPO广东移动通信有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1