一种标签生成方法、装置、服务器及存储介质制造方法及图纸

技术编号:24996836 阅读:40 留言:0更新日期:2020-07-24 17:59
本申请实施例公开了一种标签生成方法、装置、服务器及存储介质,用于生成多媒体数据的作品标签。该方法可以包括:服务器获取用户上传的第一多媒体数据和与第一多媒体数据对应的第一文本信息,根据第一文本信息生成至少一个文字标签,通过文字标签和预先生成的多个第一用户标签,生成与第一多媒体数据对应的作品标签。通过第一用户标签和多媒体数据中的文本信息,生成与多媒体数据对应的作品标签,可以准确的描述用户上传的多媒体数据,同时可以避免使用深度学习生成作品标签时,耗费的计算资源较多,耗时较长,难以满足实时性需求的问题。

【技术实现步骤摘要】
一种标签生成方法、装置、服务器及存储介质
本申请涉及计算机
,尤其涉及一种标签生成方法、装置、服务器及存储介质。
技术介绍
在UGC(User-GeneratedContent,用户原创内容)平台中,针对用户上传的多媒体数据,需要生成与多媒体数据对应的标签,以方便服务器对多媒体数据进行处理,例如根据多媒体数据的标签,将多媒体数据推送给不同的人群。现有技术中,主要采用深度学习生成与多媒体数据对应的标签,即在用户上传多媒体数据后,采用深度学习对用户上传的多媒体数据进行识别,根据识别结果生成与多媒体数据对应的至少一个标签。但是,采用深度学习生成标签时,需要耗费较多的计算资源,并且标签的生成速度比较慢,难以满足实时性需求。
技术实现思路
本申请实施例提供了一种标签生成方法、装置、服务器及存储介质,以解决多媒体数据的标签生成过程中,耗费的计算资源较多,标签生成速度较慢的问题。有鉴于此,本申请第一方面提供了一种标签生成方法,包括:获取用户上传的第一多媒体数据,以及与所述第一多媒体数据对应的第一文本信息;根据所述第一文本信息生成至少一个文字标签;根据所述至少一个文字标签和预先生成的所述用户的多个第一用户标签,生成至少一个与所述第一多媒体数据对应的作品标签。可选的,所述根据所述至少一个文字标签和预先生成的所述用户的多个第一用户标签,生成至少一个与所述第一多媒体数据对应的作品标签之前,还包括:生成与所述用户对应的至少一个第二用户标签;获取每个所述第二用户标签的关联标签,将所有所述第二用户标签和所述关联标签作为所述第一用户标签。可选的,所述获取每个所述第二用户标签的关联标签,包括:通过词向量模型确定目标用户标签对应的目标词向量,所述目标用户标签为所述至少一个第二用户标签中的任意一个;计算所述目标词向量与所述词向量模型对应的词向量空间中除所述目标词向量之外的其他词向量之间的距离值;根据所述距离值,从所述词向量空间中确定与所述目标词向量相关联的关联词向量;从与所述词向量模型对应的单词集合中确定每个所述关联词向量对应的第一词汇,将所述第一词汇作为所述目标用户标签的关联标签。可选的,所述根据所述距离值,从所述词向量空间中确定与所述目标词向量相关联的关联词向量,包括:从所述词向量空间中确定与所述目标词向量之间的距离值小于预设距离值的词向量作为所述关联词向量;或者,从所有所述距离值中的最小距离值对应的词向量开始,依次从所述其他词向量中确定预设个数的词向量作为所述关联词向量,最小距离值对应的一个词向量为所述其他词向量中的词向量。可选的,所述生成与所述用户对应的至少一个第二用户标签,包括:获取所述用户上传的多个第二多媒体数据;根据所述多个第二多媒体数据的上传顺序,从所述多个第二多媒体数据中确定至少一个目标多媒体数据;获取每个所述目标多媒体数据对应的第二文本信息;根据所有所述第二文本信息,生成至少一个所述第二用户标签。可选的,所述根据所有所述第二文本信息,生成至少一个所述第二用户标签,包括:对所有所述第二文本信息进行分词,得到多个第二词汇;根据每个所述第二词汇出现的频率,从所述多个第二词汇中确定至少一个目标词汇,将所述目标词汇作为所述第二用户标签。本申请实施例第二方面提供了一种标签生成装置,包括:第一获取模块,被配置为获取用户上传的第一多媒体数据,以及与所述第一多媒体数据对应的第一文本信息;第一生成模块,被配置为根据所述第一文本信息生成至少一个文字标签;第二生成模块,被配置为根据所述至少一个文字标签和预先生成的所述用户的多个第一用户标签,生成至少一个与所述第一多媒体数据对应的作品标签。可选的,还包括:第三生成模块,被配置为生成与所述用户对应的至少一个第二用户标签;第二获取模块,被配置为获取每个所述第二用户标签的关联标签,将所有所述第二用户标签和所述关联标签作为所述第一用户标签。可选的,所述第二获取模块包括:第一确定单元,被配置为通过词向量模型确定目标用户标签对应的目标词向量,所述目标用户标签为所述至少一个第二用户标签中的任意一个;计算单元,被配置为计算所述目标词向量与所述词向量模型对应的词向量空间中除所述目标词向量之外的其他词向量之间的距离值;第二确定单元,被配置为根据所述距离值,从所述词向量空间中确定与所述目标词向量相关联的关联词向量;第三确定单元,被配置为从与所述词向量模型对应的单词集合中确定每个所述关联词向量对应的第一词汇,将所述第一词汇作为所述目标用户标签的关联标签。可选的,所述第二确定单元,具体被配置为从所述词向量空间中确定与所述目标词向量之间的距离值小于预设距离值的词向量作为所述关联词向量;或者,从所有所述距离值中的最小距离值对应的词向量开始,依次从所述其他词向量中确定预设个数的词向量作为所述关联词向量,最小距离值对应的一个词向量为所述其他词向量中的词向量。可选的,所述第三生成模块包括:第一获取单元,被配置为获取所述用户上传的多个第二多媒体数据;确定单元,被配置为根据所述多个第二多媒体数据的上传顺序,从所述多个第二多媒体数据中确定至少一个目标多媒体数据;第二获取单元,被配置为获取每个所述目标多媒体数据对应的第二文本信息;生成单元,被配置为根据所有所述第二文本信息,生成至少一个所述第二用户标签。可选的,所述生成单元,具体被配置为对所有所述第二文本信息进行分词,得到多个第二词汇;根据每个所述第二词汇出现的频率,从所述多个第二词汇中确定至少一个目标词汇,将所述目标词汇作为所述第二用户标签。本申请实施例第三方面提供一种服务器,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行如本申请第一方面或第一方面任一可选实现方式中所述的标签生成方法。本申请实施例第四方面提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由服务器的处理器执行时,使得所述服务器能够执行如本申请第一方面或第一方面任一可选实现方式中所述的标签生成方法。本申请实施例第五方面提供一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行如本申请第一方面或第一方面任一可选实现方式中所述的标签生成方法。从以上技术方案可以看出,本申请实施例具有以下优点:在本申请实施例中,服务器获取用户上传的第一多媒体数据和与第一多媒体数据对应的第一文本信息,根据第一文本信息生成至少一个文字标签,通过文字标签和预先生成的多个第一用户标签,生成与第一多媒体数据对应的作品标签。通过第一用户标签和多媒体数据中的文本信息,生成与多媒体数据对应的作品标签,可以准确的描述用户上传的多媒体数据,同时可以避免使用深度学习生成作品标签时,耗费的计算资源较多,耗时较长,难以满足实时性需求的问题。附图说明本文档来自技高网...

【技术保护点】
1.一种标签生成方法,其特征在于,包括:/n获取用户上传的第一多媒体数据,以及与所述第一多媒体数据对应的第一文本信息;/n根据所述第一文本信息生成至少一个文字标签;/n根据所述至少一个文字标签和预先生成的所述用户的多个第一用户标签,生成至少一个与所述第一多媒体数据对应的作品标签。/n

【技术特征摘要】
1.一种标签生成方法,其特征在于,包括:
获取用户上传的第一多媒体数据,以及与所述第一多媒体数据对应的第一文本信息;
根据所述第一文本信息生成至少一个文字标签;
根据所述至少一个文字标签和预先生成的所述用户的多个第一用户标签,生成至少一个与所述第一多媒体数据对应的作品标签。


2.根据权利要求1所述的方法,其特征在于,所述根据所述至少一个文字标签和预先生成的所述用户的多个第一用户标签,生成至少一个与所述第一多媒体数据对应的作品标签之前,还包括:
生成与所述用户对应的至少一个第二用户标签;
获取每个所述第二用户标签的关联标签,将所有所述第二用户标签和所述关联标签作为所述第一用户标签。


3.根据权利要求2所述的方法,其特征在于,所述获取每个所述第二用户标签的关联标签,包括:
通过词向量模型确定目标用户标签对应的目标词向量,所述目标用户标签为所述至少一个第二用户标签中的任意一个;
计算所述目标词向量与所述词向量模型对应的词向量空间中除所述目标词向量之外的其他词向量之间的距离值;
根据所述距离值,从所述词向量空间中确定与所述目标词向量相关联的关联词向量;
从与所述词向量模型对应的单词集合中确定每个所述关联词向量对应的第一词汇,将所述第一词汇作为所述目标用户标签的关联标签。


4.根据权利要求3所述的方法,其特征在于,所述根据所述距离值,从所述词向量空间中确定与所述目标词向量相关联的关联词向量,包括:
从所述词向量空间中确定与所述目标词向量之间的距离值小于预设距离值的词向量作为所述关联词向量;或者,
从所有所述距离值中的最小距离值对应的词向量开始,依次从所述其他词向量中确定预设个数的词向量作为所述关联词向量,最小距离值对应的一个词向量为所述其他词向量中的词向量。

【专利技术属性】
技术研发人员:张志伟吴丽军王希爱
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1