歌曲标签预测方法、装置、服务器及存储介质制造方法及图纸

技术编号:21454007 阅读:16 留言:0更新日期:2019-06-26 04:48
本发明专利技术公开一种歌曲标签预测方法、装置、服务器及存储介质,所述方法包括:获取待预测歌曲的目标歌词文本,所述目标歌词文本中包括若干目标词语;根据所述预设样本词语库中各个词语和词向量之间的映射关系,以及所述预设样本词语库中各个词语的笔画元素和笔画向量之间的映射关系,确定所述目标词语的目标词向量;根据所述目标歌词文本、所述目标词向量、以及已训练的文本分类模型,获得文本分类结果,所述文本分类结果为所述目标歌词文本对应的歌曲标签。上述方案中,能够获取目标歌词文本中每个目标词语的目标词向量,这样,在标签预测时可以全面考虑到歌词文本中的每个目标词语的含义,提高了歌曲的标签预测的准确率。

【技术实现步骤摘要】
歌曲标签预测方法、装置、服务器及存储介质
本专利技术涉及计算机
,尤其涉及一种歌曲标签预测方法、装置、服务器及存储介质。
技术介绍
现有技术中,在线音乐平台的歌曲库中包含有数量庞大的歌曲,为了能够实现歌曲推荐的个性化,可以对歌曲进行标签标记,例如,将歌曲按照风格、年代、情感等元素进行分类。通常来说,歌曲的标签是通过人工进行标记的,例如,通过音乐平台的用户来标记。当用户在使用音乐平台欣赏歌曲时,可以根据自己的判断对歌曲进行添加标签的操作。但是,由于歌曲库中的歌曲数量庞大,无法保证人工标记对每首歌曲都添加了标签,且人工标记存在耗时长、效率低的缺点。
技术实现思路
本说明书实施例提供及一种歌曲标签预测方法、装置、服务器及存储介质。第一方面,本说明书实施例提供一种歌曲标签预测方法,包括:获取待预测歌曲的目标歌词文本,所述目标歌词文本中包括若干目标词语;当所述目标词语包含在预设样本词语库中时,根据所述预设样本词语库中各个词语和词向量之间的映射关系,确定所述目标词语的目标词向量;当所述目标词语未包含在所述预设样本词语库中时,根据所述预设样本词语库中各个词语的笔画元素和笔画向量之间的映射关系,确定所述目标词语的笔画元素对应的目标笔画向量,并基于所述目标笔画向量构建所述目标词语的所述目标词向量;根据所述目标歌词文本、所述目标词向量、以及已训练的文本分类模型,获得文本分类结果,所述文本分类结果为所述目标歌词文本对应的歌曲标签。第二方面,本说明书实施例提供一种歌曲标签预测装置,包括:获取模块,用于获取待预测歌曲的目标歌词文本,所述目标歌词文本中包括若干目标词语;词向量确定模块,用于当所述目标词语包含在预设样本词语库中时,根据所述预设样本词语库中各个词语和词向量之间的映射关系,确定所述目标词语的目标词向量;当所述目标词语未包含在所述预设样本词语库中时,根据所述预设样本词语库中各个词语的笔画元素和笔画向量之间的映射关系,确定所述目标词语的笔画元素对应的目标笔画向量,并基于所述目标笔画向量构建所述目标词语的所述目标词向量;标签确定模块,用于根据所述目标歌词文本、所述目标词向量、以及已训练的文本分类模型,获得文本分类结果,所述文本分类结果为所述目标歌词文本对应的歌曲标签。第三方面,本说明书实施例提供一种服务器,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行上述第一方面所述方法的步骤。第四方面,本说明书实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一项所述方法的步骤。本说明书实施例有益效果如下:本说明实施例中的方案,在获取待预测歌曲的目标歌词文本之后,确定目标歌词文本中包含的各个目标词语是否在预设样本词语库中,若是,则根据预设样本词语库中各个词语和词向量之间的映射关系,确定目标词语的目标词向量,若否,则根据预设样本词语库中各个词语的笔画元素和笔画向量之间的映射关系,确定目标词语的笔画元素对应的目标笔画向量,并基于目标笔画向量构建目标词语的目标词向量。进一步的,根据目标歌词文本、目标词向量以及已训练的文本分类模型,获得文本分类结果,并将文本分类结果作为目标歌词文本对应的歌曲标签。上述方案中,由于歌词文本能够表达歌曲的内容,将歌词文本作为信息的载体,并通过将歌词文本转换为词向量,并基于词向量来进行文本分类,有效的实现了对歌曲的标签预测,提高了标签添加的效率。另外,对于未包含在预设样本词语库中的目标词语,可以通过预设样本词语库中各个词语的笔画向量来构建目标词语的目标词向量,因此,本说明书实施例中的方案能够获取目标歌词文本中每个目标词语的目标词向量,这样,在标签预测时可以全面考虑到歌词文本中的每个目标词语的含义,提高了歌曲的标签预测的准确率。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1为本说明书实施例第一方面提供的一种歌曲标签预测方法的流程图;图2为本说明书实施例第二方面提供的一种歌曲标签预测装置的示意图;图3为本说明书实施例第三方面提供的服务器的示意图。具体实施方式为了更好的理解上述技术方案,下面通过附图以及具体实施例对本说明书实施例的技术方案做详细的说明,应当理解本说明书实施例以及实施例中的具体特征是对本说明书实施例技术方案的详细的说明,而不是对本说明书技术方案的限定,在不冲突的情况下,本说明书实施例以及实施例中的技术特征可以相互组合。第一方面,本说明书实施例提供一种歌曲标签预测方法,该方法可以应用于在线音乐平台中,对在线音乐平台的歌曲库中的歌曲进行标签预测。如图1所示,为本说明书实施例提供的一种歌曲标签预测方法,该方法包括以下步骤:步骤S11:获取待预测歌曲的目标歌词文本,所述目标歌词文本中包括若干目标词语;步骤S12:当所述目标词语包含在预设样本词语库中时,根据所述预设样本词语库中各个词语和词向量之间的映射关系,确定所述目标词语的目标词向量;当所述目标词语未包含在所述预设样本词语库中时,根据所述预设样本词语库中各个词语的笔画元素和笔画向量之间的映射关系,确定所述目标词语的笔画元素对应的目标笔画向量,并基于所述目标笔画向量构建所述目标词语的所述目标词向量;步骤S13:根据所述目标歌词文本、所述目标词向量、以及已训练的文本分类模型,获得文本分类结果,所述文本分类结果为所述目标歌词文本对应的歌曲标签。上述方案中,由于歌词文本能够表达歌曲的内容,将歌词文本作为信息的载体,并通过将歌词文本中的各个词语转换为词向量,并基于词向量来进行文本分类,有效的实现了对歌曲的标签预测,提高了标签添加的效率。另外,本说明书实施例中,可以根据预设样本词语库中各个词语和词向量之间的映射关系、以及预设样本词语库中各个词语的笔画元素和笔画向量之间的映射关系,获取歌词文本中所有目标词语的目标词向量,这样,在进行标签预测时可以全面考虑到歌词文本中的每个词语的含义,提高了歌曲的标签预测的准确率。首先,在步骤S11中,待预测歌曲可以是在线音乐平台中歌曲库中未进行标签标记的歌曲。待预测歌曲的目标歌词文本可以通过多种方式进行获取,例如,可以根据与待预测歌曲关联好的歌词信息来获取目标歌词文本;还可以根据待预测歌曲的信息在音乐平台的歌词库中确定,如,根据待预测歌曲的歌名、演唱者等信息在歌词库中查找对应的歌词文本;还可以根据待预测歌曲的信息在互联网上查找对应的歌词文本。当然,还可以根据其他方式来获取,这里不做确定。在确定了待预测歌曲的目标歌词文本之后,进一步通过步骤S12来确定目标歌词文本中的目标词语所对应的目标词向量。目标词语可以是目标歌词文本中包含的全部词语,也可以是目标歌词文本中包含的部分词语,这里不做限定。为了得到目标歌词文本中的目标词语,可以对目标歌词文本进行分词处理,例如,对目标歌词文本的每句歌词都进行分词,将分词结果作为目标词语。举例来讲,对于歌词“一闪一闪亮晶晶”,其分词结果可以为“一闪”、“一闪”、“亮晶晶”,可以将这三个词语作为该句歌词对应的目标词语。由于一首歌曲的歌词文本由很多句歌词构成,通过对本文档来自技高网...

【技术保护点】
1.一种歌曲标签预测方法,所述方法包括:获取待预测歌曲的目标歌词文本,所述目标歌词文本中包括若干目标词语;当所述目标词语包含在预设样本词语库中时,根据所述预设样本词语库中各个词语和词向量之间的映射关系,确定所述目标词语的目标词向量;当所述目标词语未包含在所述预设样本词语库中时,根据所述预设样本词语库中各个词语的笔画元素和笔画向量之间的映射关系,确定所述目标词语的笔画元素对应的目标笔画向量,并基于所述目标笔画向量构建所述目标词语的所述目标词向量;根据所述目标歌词文本、所述目标词向量、以及已训练的文本分类模型,获得文本分类结果,所述文本分类结果为所述目标歌词文本对应的歌曲标签。

【技术特征摘要】
1.一种歌曲标签预测方法,所述方法包括:获取待预测歌曲的目标歌词文本,所述目标歌词文本中包括若干目标词语;当所述目标词语包含在预设样本词语库中时,根据所述预设样本词语库中各个词语和词向量之间的映射关系,确定所述目标词语的目标词向量;当所述目标词语未包含在所述预设样本词语库中时,根据所述预设样本词语库中各个词语的笔画元素和笔画向量之间的映射关系,确定所述目标词语的笔画元素对应的目标笔画向量,并基于所述目标笔画向量构建所述目标词语的所述目标词向量;根据所述目标歌词文本、所述目标词向量、以及已训练的文本分类模型,获得文本分类结果,所述文本分类结果为所述目标歌词文本对应的歌曲标签。2.根据权利要求1所述的方法,所述预设样本词语库中各个词语和词向量之间的映射关系,以及所述预设样本词语库中各个词语的笔画元素和笔画向量之间的映射关系通过以下方式获取:获取所述预设样本词语库;根据预设的词向量生成模型对所述预设样本词语库中各个词语的初始词向量、以及所述各个词语的笔画元素的初始笔画向量进行训练,获得训练好的所述各个词语的最终词向量、以及训练好的所述各个词语的笔画元素的最终笔画向量;其中,将所述各个词语与所述最终词向量之间的对应关系作为所述预设样本词语库中各个词语和词向量之间的映射关系,将所述各个词语的笔画元素与所述最终笔画向量之间的对应关系作为所述预设样本词语库中各个词语的笔画元素和笔画向量的映射关系。3.根据权利要求2所述的方法,所述获取所述预设样本词语库,包括:在预设歌曲库中选取带有标签的歌曲作为歌曲样本;对所述歌曲样本的歌词文本进行分词处理,获得分词结果,并基于所述分词结果构建所述预设样本词语库。4.根据权利要求2所述的方法,所述根据预设的词向量生成模型对所述预设样本词语库中各个词语的初始词向量、以及所述各个词语的笔画元素的初始笔画向量进行训练,获得训练好的所述各个词语的最终词向量、以及训练好的所述各个词语的笔画元素的最终笔画向量,包括:将所述各个词语进行笔画拆分,获得所述各个词语的笔画拆分结果;根据预设的笔画与编码之间的对应关系,确定与所述各个词语的笔画拆分结果对应的编码序列;根据所述编码序列,构建所述各个词语的笔画元素集合,其中,所述笔画元素集合中的每个笔画元素由所述编码序列中的多个编码元素组成;通过所述预设的词向量生成模型,对所述笔画元素集合中的每个笔画元素的初始笔画向量以及所述各个词语的初始词向量进行训练,获得所述各个词语的最终词向量以及所述各个词语的每个笔画元素的最终笔画向量。5.根据权利要求1所述的方法,所述当所述目标词语未包含在所述预设样本词语库中时,根据所述预设样本词语库中各个词语的笔画元素和笔画向量之间的映射关系,确定所述目标词语的笔画元素对应的目标笔画向量,并基于所述目标笔画向量构建所述目标词语的所述目标词向量,包括:根据预设的笔画与编码之间的对应关系,确定与所述目标词语的笔画拆分结果对应的目标编码序列;根据所述目标编码序列,构建所述目标词语的笔画元素集合,所述目标词语的笔画元素集合由所述目标编码序列中的多个编码元素组成;针对所述目标笔画元素集合中的每个笔画元素,执行以下步骤:在所述预设样本词语库中各个词语的笔画元素和笔画向量之间的映射关系中查找与该笔画元素对应的M个笔画向量;将所述M个笔画向量进行平均处理,并将平均处理得到的平均笔画向量作为该笔画元素的目标笔画向量,M为正整数;基于所述每个笔画元素对应的目标笔画向量,构建所述目标词语对应的目标词向量。6.根据权利要求1所述的方法,所述根据所述目标歌词文本、所述目标词向量、以及已训练的文本分类模型,获得文本分类结果,包括:将所述目标歌词文本、所述目标词向量输入至所述已训练的文本分类模型,获得所述文本分类结果。7.根据权利要求1所述的方法,所述方法还包括:将所述目标歌词文本、所述预设样本词语库中各个词语和词向量之间的映射关系、以及所述预设样本词语库中各个词语的笔画元素和笔画向量之间的映射关系作为所述已训练的文本分类模型的输入数据,所述已训练的文本分类模型基于所述输入数据确定所述目标词语的所述目标词向量;所述根据所述目标歌词文本、所述目标词向量、以及已训练的文本分类模型,获得文本分类结果,包括:所述已训练的文本分类基于所述目标歌词文本,以及所述目标词向量,输...

【专利技术属性】
技术研发人员:曹绍升杨轶斐
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1