应用检索方法、装置、存储介质以及终端制造方法及图纸

技术编号:18398707 阅读:40 留言:0更新日期:2018-07-08 19:26
本发明专利技术提供一种应用检索方法、装置、存储介质以及终端,应用于互联网技术领域,其中方法包括步骤:根据第一用户输入的搜索词获得候选应用集;生成用于表征第一用户输入的搜索词与所述候选应用集中各个应用之间关系的各个第一特征;将所述各个第一特征输入预测模型,得到所述候选应用集中各个应用的预估点击率,其中,所述预测模型用于表征特征与应用的预估点击率之间的关联关系;根据所述预估点击率对所述候选应用集中各个应用进行降序排序,按照降序排序后的顺序将所述候选应用集中各个应用展示给第一用户,本发明专利技术实施例能够提高应用检索的效果。

【技术实现步骤摘要】
应用检索方法、装置、存储介质以及终端
本专利技术涉及互联网
,具体而言,本专利技术涉及一种应用检索方法、装置、存储介质以及终端。
技术介绍
随着技术的发展,各种应用层出不穷,因此在应用商店中会提供一个检索应用的功能,用以用户查找想要的应用。在进行应用检索时,传统技术中的方法一般是通过tf-idf(termfrequency–inversedocumentfrequency)算法实现检索功能,但这种方法只是从内容的角度出发检索内容,效果方面很难保障。
技术实现思路
本专利技术针对现有方式的缺点,提出一种应用检索方法、装置、存储介质以及终端,用以解决现有技术中存在的应用检索效果较差的问题,以提高应用检索的效果。本专利技术的实施例根据第一个方面,提供了一种应用检索方法,包括步骤:根据第一用户输入的搜索词获得候选应用集;生成用于表征第一用户输入的搜索词与所述候选应用集中各个应用之间关系的各个第一特征;将所述各个第一特征输入预测模型,得到所述候选应用集中各个应用的预估点击率,其中,所述预测模型用于表征特征与应用的预估点击率之间的关联关系;根据所述预估点击率对所述候选应用集中各个应用进行降序排序,按照降序排序后的顺序将所述候选应用集中各个应用展示给第一用户。在一个实施例中,所述得到所述候选应用集中各个应用的预估点击率之前,还包括:获取各个第二用户的历史搜索记录,其中,所述历史搜索记录包括输入的搜索词、基于搜索词获得的各个应用以及各个应用是否下载的信息;生成用于表征各个第二用户输入的搜索词与对应各个应用之间关系的各个第二特征;将所述各个第二特征输入预设模型进行训练,生成预测模型。在一个实施例中,所述第二特征包括相关性特征,通过以下步骤生成:从各个第二用户输入的搜索词中选取一个搜索词作为当前搜索词,从基于所述当前搜索词获得的各个应用中选取一个应用作为当前应用;对所述当前搜索词进行分词,并计算分词在所述当前搜索词中出现的词频以及逆文档频率,根据词频和逆文档频率获得所述当前搜索词的特征向量;对所述当前应用的文本信息进行分词,并计算分词在所述文本信息中出现的词频以及逆文档频率,根据词频和逆文档频率获得所述文本信息的特征向量,其中,所述文本信息包括标题和/或描述信息;将所述当前搜索词的特征向量和所述文本信息的特征向量的夹角的余弦值作为对应的相关性特征;返回从各个第二用户输入的搜索词中选取一个搜索词作为当前搜索词,从基于所述当前搜索词获得的各个应用中选取一个应用作为当前应用的步骤,直至生成所有的相关性特征。在一个实施例中,所述历史搜索记录还包括各个应用下载的时间;所述第二特征还包括相关性与热度交叉的特征,通过以下步骤生成:根据所述相关性特征对基于所述当前搜索词获得的各个应用进行降序排序,获得所述当前应用在所有应用中的相关性排名;根据所述历史搜索记录统计基于所述当前搜索词获得的各个应用在预设时间内的下载量,根据所述下载量对基于所述当前搜索词获得的各个应用进行降序排序,获得所述当前应用在所有应用中的热度排名;将所述相关性排名和所述热度排名进行交叉,得到对应的相关性和热度交叉的特征;返回从各个第二用户输入的搜索词中选取一个搜索词作为当前搜索词,从基于所述当前搜索词获得的各个应用中选取一个应用作为当前应用的步骤,直至生成所有的相关性和热度交叉的特征。在一个实施例中,所述第二特征还包括历史收益特征,通过以下步骤生成:从各个第二用户输入的搜索词中选取一个搜索词作为当前搜索词,从基于所述当前搜索词获得的各个应用中选取一个应用作为当前应用;根据所述历史搜索记录,统计所有输入所述当前搜索词的第二用户中下载所述当前应用的用户数,以及所有输入所述当前搜索词的第二用户的搜索列表中展示所述当前应用的次数;将所述用户数和所述次数的比值作为对应的历史收益特征;返回从各个第二用户输入的搜索词中选取一个搜索词作为当前搜索词,从基于所述当前搜索词获得的各个应用中选取一个应用作为当前应用的步骤,直至生成所有的历史收益特征。在一个实施例中,所述第二特征还包括精准匹配特征,通过以下步骤生成:从各个第二用户输入的搜索词中选取一个搜索词作为当前搜索词,从基于所述当前搜索词获得的各个应用中选取一个应用作为当前应用;检测所述当前应用的标题与所述当前搜索词是否完全一致;若是,将第一设定值作为对应的精准匹配特征,否则,将第二设定值作为对应的精准匹配特征;返回从各个第二用户输入的搜索词中选取一个搜索词作为当前搜索词,从基于所述当前搜索词获得的各个应用中选取一个应用作为当前应用的步骤,直至生成所有的精准匹配特征。在一个实施例中,所述第二特征还包括分词到应用特征,通过以下步骤生成:从各个第二用户输入的搜索词中选取一个搜索词作为当前搜索词,从基于所述当前搜索词获得的各个应用中选取一个应用作为当前应用;对所述当前搜索词进行分词;将由所述当前搜索词的分词与所述当前应用的标题构成的组合作为对应的分词到应用特征;返回从各个第二用户输入的搜索词中选取一个搜索词作为当前搜索词,从基于所述当前搜索词获得的各个应用中选取一个应用作为当前应用的步骤,直至生成所有的分词到应用特征。在一个实施例中,所述第一特征采用one-hot编码。本专利技术的实施例根据第二个方面,还提供了一种应用检索装置,包括:候选应用集获得模块,用于根据第一用户输入的搜索词获得候选应用集;第一特征生成模块,用于生成用于表征第一用户输入的搜索词与所述候选应用集中各个应用之间关系的各个第一特征;预估点击率获得模块,用于将所述各个第一特征输入预测模型,得到所述候选应用集中各个应用的预估点击率,其中,所述预测模型用于表征特征与应用的预估点击率之间的关联关系;应用展示模块,用于根据所述预估点击率对所述候选应用集中各个应用进行降序排序,按照降序排序后的顺序将所述候选应用集中各个应用展示给第一用户。本专利技术的实施例根据第三个方面,还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前述任意一项所述的应用检索方法。本专利技术的实施例根据第四个方面,还提供了一种终端,所述终端包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现前述任意一项所述的应用检索方法。上述的应用检索方法、装置、存储介质以及终端,首先根据用户输入的搜索词召回各个应用,满足了检索内容匹配度,然后通过将生成的各个第一特征输入预测模型获得各个应用的预估点击率,根据预估点击率确定召回的各个应用的展示顺序,用户根据该展示顺序可以快速找到预估点击率高的应用,提高了用户选择所需应用的效率,在点击率等指标的效果上比传统的tf-idf算法有大幅提升。进一步的,提出一种结合内容、应用热度(相关性与热度交叉的特征)、用户反馈(历史收益特征)的应用检索方式,不仅满足检索内容匹配度,而且在效果上比传统方法有大幅度提升,更好的满足用户的需求。本专利技术附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1为本专利技术一个实施例的应用检索方法的流程示意图;图2为本专利技术一个实施例的本文档来自技高网...

【技术保护点】
1.一种应用检索方法,其特征在于,包括步骤:根据第一用户输入的搜索词获得候选应用集;生成用于表征第一用户输入的搜索词与所述候选应用集中各个应用之间关系的各个第一特征;将所述各个第一特征输入预测模型,得到所述候选应用集中各个应用的预估点击率,其中,所述预测模型用于表征特征与应用的预估点击率之间的关联关系;根据所述预估点击率对所述候选应用集中各个应用进行降序排序,按照降序排序后的顺序将所述候选应用集中各个应用展示给第一用户。

【技术特征摘要】
1.一种应用检索方法,其特征在于,包括步骤:根据第一用户输入的搜索词获得候选应用集;生成用于表征第一用户输入的搜索词与所述候选应用集中各个应用之间关系的各个第一特征;将所述各个第一特征输入预测模型,得到所述候选应用集中各个应用的预估点击率,其中,所述预测模型用于表征特征与应用的预估点击率之间的关联关系;根据所述预估点击率对所述候选应用集中各个应用进行降序排序,按照降序排序后的顺序将所述候选应用集中各个应用展示给第一用户。2.根据权利要求1所述的应用检索方法,其特征在于,所述得到所述候选应用集中各个应用的预估点击率之前,还包括:获取各个第二用户的历史搜索记录,其中,所述历史搜索记录包括输入的搜索词、基于搜索词获得的各个应用以及各个应用是否下载的信息;生成用于表征各个第二用户输入的搜索词与对应各个应用之间关系的各个第二特征;将所述各个第二特征输入预设模型进行训练,生成预测模型。3.根据权利要求2所述的应用检索方法,其特征在于,所述第二特征包括相关性特征,通过以下步骤生成:从各个第二用户输入的搜索词中选取一个搜索词作为当前搜索词,从基于所述当前搜索词获得的各个应用中选取一个应用作为当前应用;对所述当前搜索词进行分词,并计算分词在所述当前搜索词中出现的词频以及逆文档频率,根据词频和逆文档频率获得所述当前搜索词的特征向量;对所述当前应用的文本信息进行分词,并计算分词在所述文本信息中出现的词频以及逆文档频率,根据词频和逆文档频率获得所述文本信息的特征向量,其中,所述文本信息包括标题和/或描述信息;将所述当前搜索词的特征向量和所述文本信息的特征向量的夹角的余弦值作为对应的相关性特征;返回从各个第二用户输入的搜索词中选取一个搜索词作为当前搜索词,从基于所述当前搜索词获得的各个应用中选取一个应用作为当前应用的步骤,直至生成所有的相关性特征。4.根据权利要求3所述的应用检索方法,其特征在于,所述历史搜索记录还包括各个应用下载的时间;所述第二特征还包括相关性与热度交叉的特征,通过以下步骤生成:根据所述相关性特征对基于所述当前搜索词获得的各个应用进行降序排序,获得所述当前应用在所有应用中的相关性排名;根据所述历史搜索记录统计基于所述当前搜索词获得的各个应用在预设时间内的下载量,根据所述下载量对基于所述当前搜索词获得的各个应用进行降序排序,获得所述当前应用在所有应用中的热度排名;将所述相关性排名和所述热度排名进行交叉,得到对应的相关性和热度交叉的特征;返回从各个第二用户输入的搜索词中选取一个搜索词作为当前搜索词,从基于所述当前搜索词获得的各个应用中选取一个应用作为当前应用的步骤,直至生成所有的相关性和热度交叉的特征。5.根据权利要求2至4任意一项所述的应用检索方法,其特征在于,所述第二特征还包括历史收益特征,通过以下步骤生成:从各个第二用户输入的搜索词中选取一个搜索词作为...

【专利技术属性】
技术研发人员:潘岸腾
申请(专利权)人:广州优视网络科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1