歌曲标签预测方法、装置、服务器及存储介质制造方法及图纸

技术编号：21454007 阅读：16 留言：0更新日期：2019-06-26 04:48

本发明专利技术公开一种歌曲标签预测方法、装置、服务器及存储介质，所述方法包括：获取待预测歌曲的目标歌词文本，所述目标歌词文本中包括若干目标词语；根据所述预设样本词语库中各个词语和词向量之间的映射关系，以及所述预设样本词语库中各个词语的笔画元素和笔画向量之间的映射关系，确定所述目标词语的目标词向量；根据所述目标歌词文本、所述目标词向量、以及已训练的文本分类模型，获得文本分类结果，所述文本分类结果为所述目标歌词文本对应的歌曲标签。上述方案中，能够获取目标歌词文本中每个目标词语的目标词向量，这样，在标签预测时可以全面考虑到歌词文本中的每个目标词语的含义，提高了歌曲的标签预测的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
歌曲标签预测方法、装置、服务器及存储介质
本专利技术涉及计算机
，尤其涉及一种歌曲标签预测方法、装置、服务器及存储介质。
技术介绍
现有技术中，在线音乐平台的歌曲库中包含有数量庞大的歌曲，为了能够实现歌曲推荐的个性化，可以对歌曲进行标签标记，例如，将歌曲按照风格、年代、情感等元素进行分类。通常来说，歌曲的标签是通过人工进行标记的，例如，通过音乐平台的用户来标记。当用户在使用音乐平台欣赏歌曲时，可以根据自己的判断对歌曲进行添加标签的操作。但是，由于歌曲库中的歌曲数量庞大，无法保证人工标记对每首歌曲都添加了标签，且人工标记存在耗时长、效率低的缺点。
技术实现思路
本说明书实施例提供及一种歌曲标签预测方法、装置、服务器及存储介质。第一方面，本说明书实施例提供一种歌曲标签预测方法，包括：获取待预测歌曲的目标歌词文本，所述目标歌词文本中包括若干目标词语；当所述目标词语包含在预设样本词语库中时，根据所述预设样本词语库中各个词语和词向量之间的映射关系，确定所述目标词语的目标词向量；当所述目标词语未包含在所述预设样本词语库中时，根据所述预设样本词语库中各个词语的笔画元素和笔画向量之间的映射关系，确定所述目标词语的笔画元素对应的目标笔画向量，并基于所述目标笔画向量构建所述目标词语的所述目标词向量；根据所述目标歌词文本、所述目标词向量、以及已训练的文本分类模型，获得文本分类结果，所述文本分类结果为所述目标歌词文本对应的歌曲标签。第二方面，本说明书实施例提供一种歌曲标签预测装置，包括：获取模块，用于获取待预测歌曲的目标歌词文本，所述目标歌词文本中包括若干目标词语；词向量确定模...

【技术保护点】
1.一种歌曲标签预测方法，所述方法包括：获取待预测歌曲的目标歌词文本，所述目标歌词文本中包括若干目标词语；当所述目标词语包含在预设样本词语库中时，根据所述预设样本词语库中各个词语和词向量之间的映射关系，确定所述目标词语的目标词向量；当所述目标词语未包含在所述预设样本词语库中时，根据所述预设样本词语库中各个词语的笔画元素和笔画向量之间的映射关系，确定所述目标词语的笔画元素对应的目标笔画向量，并基于所述目标笔画向量构建所述目标词语的所述目标词向量；根据所述目标歌词文本、所述目标词向量、以及已训练的文本分类模型，获得文本分类结果，所述文本分类结果为所述目标歌词文本对应的歌曲标签。

【技术特征摘要】
1.一种歌曲标签预测方法，所述方法包括：获取待预测歌曲的目标歌词文本，所述目标歌词文本中包括若干目标词语；当所述目标词语包含在预设样本词语库中时，根据所述预设样本词语库中各个词语和词向量之间的映射关系，确定所述目标词语的目标词向量；当所述目标词语未包含在所述预设样本词语库中时，根据所述预设样本词语库中各个词语的笔画元素和笔画向量之间的映射关系，确定所述目标词语的笔画元素对应的目标笔画向量，并基于所述目标笔画向量构建所述目标词语的所述目标词向量；根据所述目标歌词文本、所述目标词向量、以及已训练的文本分类模型，获得文本分类结果，所述文本分类结果为所述目标歌词文本对应的歌曲标签。2.根据权利要求1所述的方法，所述预设样本词语库中各个词语和词向量之间的映射关系，以及所述预设样本词语库中各个词语的笔画元素和笔画向量之间的映射关系通过以下方式获取：获取所述预设样本词语库；根据预设的词向量生成模型对所述预设样本词语库中各个词语的初始词向量、以及所述各个词语的笔画元素的初始笔画向量进行训练，获得训练好的所述各个词语的最终词向量、以及训练好的所述各个词语的笔画元素的最终笔画向量；其中，将所述各个词语与所述最终词向量之间的对应关系作为所述预设样本词语库中各个词语和词向量之间的映射关系，将所述各个词语的笔画元素与所述最终笔画向量之间的对应关系作为所述预设样本词语库中各个词语的笔画元素和笔画向量的映射关系。3.根据权利要求2所述的方法，所述获取所述预设样本词语库，包括：在预设歌曲库中选取带有标签的歌曲作为歌曲样本；对所述歌曲样本的歌词文本进行分词处理，获得分词结果，并基于所述分词结果构建所述预设样本词语库。4.根据权利要求2所述的方法，所述根据预设的词向量生成模型对所述预设样本词语库中各个词语的初始词向量、以及所述各个词语的笔画元素的初始笔画向量进行训练，获得训练好的所述各个词语的最终词向量、以及训练好的所述各个词语的笔画元素的最终笔画向量，包括：将所述各个词语进行笔画拆分，获得所述各个词语的笔画拆分结果；根据预设的笔画与编码之间的对应关系，确定与所述各个词语的笔画拆分结果对应的编码序列；根据所述编码序列，构建所述各个词语的笔画元素集合，其中，所述笔画元素集合中的每个笔画元素由所述编码序列中的多个编码元素组成；通过所述预设的词向量生成模型，对所述笔画元素集合中的每个笔画元素的初始笔画向量以及所述各个词语的初始词向量进行训练，获得所述各个词语的最终词向量以及所述各个词语的每个笔画元素的最终笔画向量。5.根据权利要求1所述的方法，所述当所述目标词语未包含在所述预设样本词语库中时，根据所述预设样本词语库中各个词语的笔画元素和笔画向量之间的映射关系，确定所述目标词语的笔画元素对应的目标笔画向量，并基于所述目标笔画向量构建所述目标词语的所述目标词向量，包括：根据预设的笔画与编码之间的对应关系，确定与所述目标词语的笔画拆分结果对应的目标编码序列；根据所述目标编码序列，构建所述目标词语的笔画元素集合，所述目标词语的笔画元素集合由所述目标编码序列中的多个编码元素组成；针对所述目标笔画元素集合中的每个笔画元素，执行以下步骤：在所述预设样本词语库中各个词语的笔画元素和笔画向量之间的映射关系中查找与该笔画元素对应的M个笔画向量；将所述M个笔画向量进行平均处理，并将平均处理得到的平均笔画向量作为该笔画元素的目标笔画向量，M为正整数；基于所述每个笔画元素对应的目标笔画向量，构建所述目标词语对应的目标词向量。6.根据权利要求1所述的方法，所述根据所述目标歌词文本、所述目标词向量、以及已训练的文本分类模型，获得文本分类结果，包括：将所述目标歌词文本、所述目标词向量输入至所述已训练的文本分类模型，获得所述文本分类结果。7.根据权利要求1所述的方法，所述方法还包括：将所述目标歌词文本、所述预设样本词语库中各个词语和词向量之间的映射关系、以及所述预设样本词语库中各个词语的笔画元素和笔画向量之间的映射关系作为所述已训练的文本分类模型的输入数据，所述已训练的文本分类模型基于所述输入数据确定所述目标词语的所述目标词向量；所述根据所述目标歌词文本、所述目标词向量、以及已训练的文本分类模型，获得文本分类结果，包括：所述已训练的文本分类基于所述目标歌词文本，以及所述目标词向量，输...

【专利技术属性】
技术研发人员：曹绍升，杨轶斐，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：开曼群岛,KY

全部详细技术资料下载我是这个专利的主人