The invention provides an application labelling label method, device, storage medium and computer equipment. The method includes: participle the description information to be tagged and obtain the set of participle; generate the real vector of the description information according to the set of participle; input the real vector into the pre-generated tag generation model to obtain the tag prediction vector; and the tag generation model is used to represent the tag. The relationship between the real number vector and the label prediction vector is described; the element whose prediction value is greater than the threshold value in the label prediction vector is acquired, and the participle corresponding to the element is used as the label for the label to be labeled. The tagging method is applied to automatically label the application of new storage.
【技术实现步骤摘要】
应用标注标签方法、装置、存储介质及计算机设备
本专利技术涉及互联网
,具体而言,本专利技术涉及一种应用标注标签方法、装置、存储介质及计算机设备。
技术介绍
在应用商店的运营过程中,对于一个新入库的应用,需要给应用打上标签,然后把新入库应用放到相应的标签类目下面,从而方便用户在通过分类信息找到该应用。传统给新入库的应用打标签的方法:通过人工对新入库进行打标签,这样的方式一方面需要耗费大量的人力成本,另一方面人工评测受主观性影响,应用标签的质量无法确保。
技术实现思路
本专利技术的目的旨在提供一种应用标注标签方法、装置、存储介质及计算机设备,以实现对新入库的应用进行自动化标注标签。本专利技术提供以下方案:一种应用标注标签方法,包括以下步骤:将待标注标签应用的描述信息进行分词,获得分词集合;根据所述分词集合生成所述描述信息的实数向量;将所述实数向量输入预生成的标签生成模型中,得到标签预测向量;其中,所述标签生成模型用于表征所述实数向量与所述标签预测向量之间的关联关系;获取所述标签预测向量中预测值大于阈值的元素,将该元素对应的分词作为所述待标注标签应用的标签。在其中一个实施例中,所述根据所述分词集合生成所述描述信息的实数向量,包括:获取所述分词集合中每个分词的价值;根据所述每个分词的价值获取预设数量的分词;根据所述预设数量的分词生成特征向量;根据所述特征向量生成所述描述信息的实数向量。在其中一个实施例中,所述根据所述每个分词的价值获取预设数量的分词,包括:按照分词价值从大到小的顺序对所述分词集合中的分词进行排序;获取排序在前的预设数量的分词。在其中一个实施例中, ...
【技术保护点】
1.一种应用标注标签方法,其特征在于,包括以下步骤:将待标注标签应用的描述信息进行分词,获得分词集合;根据所述分词集合生成所述描述信息的实数向量;将所述实数向量输入预生成的标签生成模型中,得到标签预测向量;其中,所述标签生成模型用于表征所述实数向量与所述标签预测向量之间的关联关系;获取所述标签预测向量中预测值大于阈值的元素,将该元素对应的分词作为所述待标注标签应用的标签。
【技术特征摘要】
1.一种应用标注标签方法,其特征在于,包括以下步骤:将待标注标签应用的描述信息进行分词,获得分词集合;根据所述分词集合生成所述描述信息的实数向量;将所述实数向量输入预生成的标签生成模型中,得到标签预测向量;其中,所述标签生成模型用于表征所述实数向量与所述标签预测向量之间的关联关系;获取所述标签预测向量中预测值大于阈值的元素,将该元素对应的分词作为所述待标注标签应用的标签。2.根据权利要求1所述的方法,其特征在于,所述根据所述分词集合生成所述描述信息的实数向量,包括:获取所述分词集合中每个分词的价值;根据所述每个分词的价值获取预设数量的分词;根据所述预设数量的分词生成特征向量;根据所述特征向量生成所述描述信息的实数向量。3.根据权利要求2所述的方法,其特征在于,所述根据所述每个分词的价值获取预设数量的分词,包括:按照分词价值从大到小的顺序对所述分词集合中的分词进行排序;获取排序在前的预设数量的分词。4.根据权利要求2所述的方法,其特征在于,所述根据所述特征向量生成所述描述信息的实数向量,包括:获取所述特征向量中每个元素的字符串的哈希值;根据所述哈希值生成所述应用描述信息的实数向量。5.根据权利要求2所述的方法,其特征在于,所述分词的价值通过以下方式获得:将样本应用的描述信息进行分词;统计每个分词出现的次数,根据分词出现的次数得到该分词的价值。6.根据权利要求1所述的方法,其特征在于,所述标签生成模型通过以下步骤生成:获取样本应用和其标签向量;将样本应用的描述信息进行分词,获得样本分词集合;根据所述样本分词集合生成样本...
【专利技术属性】
技术研发人员:潘岸腾,
申请(专利权)人:广州优视网络科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。