标签确定方法及装置制造方法及图纸

技术编号:15254903 阅读:106 留言:0更新日期:2017-05-02 22:10
本公开揭示了一种标签确定方法及装置,属于计算机技术领域。该方法包括:获取目标应用程序对应的目标关键词集合,目标关键词集合中包括第一类关键词;获取参考应用程序对应的参考关键词集合,参考关键词集合中包括第一类关键词和/或第二类关键词;根据目标关键词集合和参考关键词集合按照预定算法确定目标应用程序对应的标签,和/或,根据目标关键词集合和参考关键词集合按照主题分析模型确定目标应用程序对应的标签;由于目标应用程序对应的标签并不是由推广人员和/或开发人员根据主观判断确定的,而是由服务器根据收集到的各个关键词集合按照预定算法和/或主题分析模型客观分析得到的,因此,确定得到的标签更准确。

Label determining method and device

The invention discloses a method and a device for identifying labels, which belongs to the technical field of computer. The method comprises: acquiring the target application target keywords corresponding to the set target keywords set includes a first type of keywords; keywords reference to obtain reference corresponding to the application set, reference set of keywords includes a first type of keywords and / or second key words; according to the target set of keywords and keyword reference set the target application corresponding labels according to a predetermined algorithm, and / or, according to the target set of keywords and reference set of keywords in accordance with the theme analysis model to determine the target application corresponding to the label; due to target application corresponding to the label and not by the promotion personnel and / or developers according to subjective judgment determined by the server, but each keyword according to the collected in accordance with the objective set analysis of predetermined algorithms and / or theme analysis model, therefore, determine Get more accurate labels.

【技术实现步骤摘要】

本公开涉及计算机
,特别涉及一种标签确定方法及装置。
技术介绍
随着智能终端的发展和普及,智能终端中的应用程序也越来越多,为了方便对应用程序的查询和推广,通常会为应用程序添加描述性的词语作为该应用程序的标签以反映该应用程序所属的类别。目前通常是由开发人员在开发时为应用程序添加标签,或者,由推广人员在推广时为应用程序添加标签,开发人员和/或推广人员通常是通过主观判断确定并添加应用程序的标签的,人为添加的标签通常不够准确。
技术实现思路
为了解决由推广人员和/或开发人员人工地为应用程序添加的标签不够准确的问题,本公开提供一种标签确定方法及装置。所述技术方案如下:第一方面,提供一种标签确定方法,该方法包括:获取目标应用程序对应的目标关键词集合,目标关键词集合中包括第一类关键词;获取参考应用程序对应的参考关键词集合,参考关键词集合中包括第一类关键词和/或第二类关键词;根据目标关键词集合和参考关键词集合按照预定算法确定目标应用程序对应的标签,和/或,根据目标关键词集合和参考关键词集合按照主题分析模型确定目标应用程序对应的标签;其中,第一类关键词是直接与目标应用程序存在对应关系的关键词,第二类关键词是通过至少一个关联元素与目标应用程序存在对应关系的关键词。可选的,至少一个关联元素至少包括参考应用程序,以及目标关键词集合中与参考应用程序存在对应关系的第一类关键词;根据目标关键词集合和参考关键词集合按照预定算法确定目标应用程序对应的标签,包括:对于目标关键词集合和参考关键词集合中的每个第一类关键词,获取第一类关键词与目标应用程序之间的相似度;对于参考关键词集合中的每个第二类关键词,按照预定算法根据目标关键词集合和第二类关键词对应的应用程序集合之间的相似度计算第二类关键词与目标应用程序之间的相似度,应用程序集合是直接与第二类关键词存在对应关系的各个应用程序的集合;确定目标关键词集合和参考关键词集合中与目标应用程序之间的相似度大于预设相似度的关键词为目标应用程序对应的标签。可选的,按照预定算法根据目标关键词集合和第二类关键词对应的应用程序集合之间的相似度计算第二类关键词与目标应用程序之间的相似度,包括计算:其中,s(x,y)表示x与y之间的相似度,a表示目标应用程序,b表示第二类关键词,I(a)是目标关键词集合,I(b)是第二类关键词对应的应用程序集合,c是预设衰减因子。可选的,至少一个关联元素包括目标关键词集合中与第二类关键词属于同一个主题的第一类关键词;根据目标关键词集合和参考关键词集合按照主题分析模型确定目标应用程序对应的标签,包括:根据主题分析模型确定目标关键词集合中包括的第一类关键词对应的各个主题;确定在目标关键词集合中所占的比例达到第一比例阈值的目标主题;确定目标关键词集合和参考关键词集合中,属于目标主题且在目标主题中所占的比例达到第二比例阈值的关键词为目标应用程序对应的标签。可选的,获取目标应用程序对应的目标关键词集合,包括:获取历史搜索目标应用程序的搜索请求中包括的第一类关键词;和/或,通过网络爬虫获取目标应用程序对应的第一类关键词;和/或,获取目标应用程序的描述信息中包括的第一类关键词。第二方面,提供一种标签确定装置,该装置包括:第一获取模块,被配置为获取目标应用程序对应的目标关键词集合,目标关键词集合中包括第一类关键词;第二获取模块,被配置为获取参考应用程序对应的参考关键词集合,参考关键词集合中包括第一类关键词和/或第二类关键词;确定模块,被配置为根据目标关键词集合和参考关键词集合按照预定算法确定目标应用程序对应的标签,和/或,根据目标关键词集合和参考关键词集合按照主题分析模型确定目标应用程序对应的标签;其中,第一类关键词是直接与目标应用程序存在对应关系的关键词,第二类关键词是通过至少一个关联元素与目标应用程序存在对应关系的关键词。可选的,至少一个关联元素至少包括参考应用程序,以及目标关键词集合中与参考应用程序存在对应关系的第一类关键词;确定模块,包括:获取子模块,被配置为对于目标关键词集合和参考关键词集合中的每个第一类关键词,获取第一类关键词与目标应用程序之间的相似度;计算子模块,被配置为对于参考关键词集合中的每个第二类关键词,按照预定算法根据目标关键词集合和第二类关键词对应的应用程序集合之间的相似度计算第二类关键词与目标应用程序之间的相似度,应用程序集合是直接与第二类关键词存在对应关系的各个应用程序的集合;第一确定子模块,被配置为确定目标关键词集合和参考关键词集合中与目标应用程序之间的相似度大于预设相似度的关键词为目标应用程序对应的标签。可选的,计算子模块,被配置为计算:其中,s(x,y)表示x与y之间的相似度,a表示目标应用程序,b表示第二类关键词,I(a)是目标关键词集合,I(b)是第二类关键词对应的应用程序集合,c是预设衰减因子。可选的,至少一个关联元素包括目标关键词集合中与第二类关键词属于同一个主题的第一类关键词;确定模块,包括:第二确定子模块,被配置为根据主题分析模型确定目标关键词集合中包括的第一类关键词对应的各个主题;第三确定子模块,被配置为确定在目标关键词集合中所占的比例达到第一比例阈值的目标主题;第四确定子模块,被配置为确定目标关键词集合和参考关键词集合中,属于目标主题且在目标主题中所占的比例达到第二比例阈值的关键词为目标应用程序对应的标签。可选的,第一获取模块,还被配置为:获取历史搜索目标应用程序的搜索请求中包括的第一类关键词;和/或,通过网络爬虫获取目标应用程序对应的第一类关键词;和/或,获取目标应用程序的描述信息中包括的第一类关键词。第三方面,提供一种标签确定装置,该装置包括:处理器;用于存储处理器可执行指令的存储器;其中,处理器被配置为:获取目标应用程序对应的目标关键词集合,目标关键词集合中包括第一类关键词;获取参考应用程序对应的参考关键词集合,参考关键词集合中包括第一类关键词和/或第二类关键词;根据目标关键词集合和参考关键词集合按照预定算法确定目标应用程序对应的标签,和/或,根据目标关键词集合和参考关键词集合按照主题分析模型确定目标应用程序对应的标签;其中,第一类关键词是直接与目标应用程序存在对应关系的关键词,第二类关键词是通过至少一个关联元素与目标应用程序存在对应关系的关键词。本公开的实施例提供的技术方案可以包括以下有益效果:通过获取目标应用程序和参考应用程序对应的关键词集合,根据获取到的各个关键词集合按照预定算法或者主题分析模型确定目标应用程序对应的标签,由于目标应用程序对应的标签并不是由推广人员和/或开发人员根据主观判断得到的,而是由服务器根据收集到的各个关键词集合按照预定算法和/或主题分析模型客观分析确定的,因此,服务器确定得到的标签更准确。应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并于说明书一起用于解释本公开的原理。图1是本公开各个实施例涉及的一种实施环境的示意图;图2是本公开一示例性实施例公开的一种标签确定方法的流程图;图3是本公开另一示例性实施例公开的一种标签确定方法的流程图;图4是本公开另一示例性本文档来自技高网...

【技术保护点】
一种标签确定方法,其特征在于,所述方法包括:获取目标应用程序对应的目标关键词集合,所述目标关键词集合中包括第一类关键词;获取参考应用程序对应的参考关键词集合,所述参考关键词集合中包括所述第一类关键词和/或第二类关键词;根据所述目标关键词集合和所述参考关键词集合按照预定算法确定所述目标应用程序对应的标签,和/或,根据所述目标关键词集合和所述参考关键词集合按照主题分析模型确定所述目标应用程序对应的所述标签;其中,所述第一类关键词是直接与所述目标应用程序存在对应关系的关键词,所述第二类关键词是通过至少一个关联元素与所述目标应用程序存在对应关系的关键词。

【技术特征摘要】
1.一种标签确定方法,其特征在于,所述方法包括:获取目标应用程序对应的目标关键词集合,所述目标关键词集合中包括第一类关键词;获取参考应用程序对应的参考关键词集合,所述参考关键词集合中包括所述第一类关键词和/或第二类关键词;根据所述目标关键词集合和所述参考关键词集合按照预定算法确定所述目标应用程序对应的标签,和/或,根据所述目标关键词集合和所述参考关键词集合按照主题分析模型确定所述目标应用程序对应的所述标签;其中,所述第一类关键词是直接与所述目标应用程序存在对应关系的关键词,所述第二类关键词是通过至少一个关联元素与所述目标应用程序存在对应关系的关键词。2.根据权利要求1所述的方法,其特征在于,所述至少一个关联元素至少包括所述参考应用程序,以及所述目标关键词集合中与所述参考应用程序存在对应关系的第一类关键词;所述根据所述目标关键词集合和所述参考关键词集合按照预定算法确定所述目标应用程序对应的标签,包括:对于所述目标关键词集合和所述参考关键词集合中的每个所述第一类关键词,获取所述第一类关键词与所述目标应用程序之间的相似度;对于所述参考关键词集合中的每个所述第二类关键词,按照所述预定算法根据所述目标关键词集合和所述第二类关键词对应的应用程序集合之间的相似度计算所述第二类关键词与所述目标应用程序之间的相似度,所述应用程序集合是直接与所述第二类关键词存在对应关系的各个应用程序的集合;确定所述目标关键词集合和所述参考关键词集合中与所述目标应用程序之间的相似度大于预设相似度的关键词为所述目标应用程序对应的所述标签。3.根据权利要求2所述的方法,其特征在于,所述按照所述预定算法根据所述目标关键词集合和所述第二类关键词对应的应用程序集合之间的相似度计算所述第二类关键词与所述目标应用程序之间的相似度,包括计算:s(a,b)=1,a=bc|I(a)||I(b)|Σi|I(a)|Σj|I(b)|s(Ii(a),Ij(b)),a≠b,I(a)≠φ,I(b)≠φ0,otherwise]]>其中,s(x,y)表示x与y之间的相似度,a表示所述目标应用程序,b表示所述第二类关键词,I(a)是所述目标关键词集合,I(b)是所述第二类关键词对应的所述应用程序集合,c是预设衰减因子。4.根据权利要求1所述的方法,其特征在于,所述至少一个关联元素包括所述目标关键词集合中与所述第二类关键词属于同一个主题的第一类关键词;所述根据所述目标关键词集合和所述参考关键词集合按照主题分析模型确定所述目标应用程序对应的所述标签,包括:根据所述主题分析模型确定所述目标关键词集合中包括的所述第一类关键词对应的各个主题;确定在所述目标关键词集合中所占的比例达到第一比例阈值的目标主题;确定所述目标关键词集合和所述参考关键词集合中,属于所述目标主题且在所述目标主题中所占的比例达到第二比例阈值的关键词为所述目标应用程序对应的所述标签。5.根据权利要求1至4任一所述的方法,其特征在于,所述获取目标应用程序对应的目标关键词集合,包括:获取历史搜索所述目标应用程序的搜索请求中包括的所述第一类关键词;和/或,通过网络爬虫获取所述目标应用程序对应的所述第一类关键词;和/或,获取所述目标应用程序的描述信息中包括的所述第一类关键词。6.一种标签确定装置,其特征在于,所述装置包括:第一获取模块,被配置为获取目标应用程序对应的目标关键词集合,所述目标关键词集合中包括第一类关键词;第二获取模块,被配置为获取参考应用程序对应的参考关键词集合,所述参考关键词集合中包括所述第一类关键词和/或第二类关键词...

【专利技术属性】
技术研发人员:陆子龙张卫吴宏刚闫铭
申请(专利权)人:北京小米移动软件有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1