【技术实现步骤摘要】
一种数据处理方法及装置
本专利技术涉及数据处理
,尤其涉及一种数据处理方法及装置。
技术介绍
歌曲的风格和类别有很多种,由于旋律的不同或者演唱者的声音的特点,不同歌曲的演唱难度也有差别。全民K歌系统提供歌曲给用户演唱的同时提供了打分系统,但由于不同歌曲的难度不同,为实现不同歌曲的横向比较,需要为每首歌曲标注难度系数,以便用户分类选择演唱并实现演唱不同歌曲时能进行横向的水平对比。现有技术中歌曲的难度系数都是采用人工标注的方式,但是,采用此方式不但成本高、时效性低,还会产生由于人工主观判断标准不同导致不同人针对同一首歌曲给出的难度系数不一致的问题。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例所要解决的技术问题在于,提供一种歌曲难度系数的生成方法及装置。可高效地确定歌曲的难度系数。为了解决上述技术问题,本专利技术实施例提供了一种数据处理方法,所述方法包括:获取歌曲数据库中目标歌曲的音频集合,所述音频集合包括多个音频数据;计算所述音频集合中每两个音频数据之间的距离,并将任一所述音频数据与所述音频集合中的各个音频数据之间的距离进行相加,得到所述音频数据的距离总和;在所述音频集合中获取距离总和按从小到大排序后排在前N位的目标音频数据,所述N为正整数;根据所述目标音频数据中每两个音频数据之间的距离,计算所述目标歌曲的数据发散度;根据计算得到的所述目标歌曲的数据发散度,确定所述目标歌曲的难度系数。相应地,本专利技术实施例还提供了一种数据处理装置,所述装置包括:获取模块,用于获取歌曲数据库中目标歌曲的音频集合,所述音频集合包括多个音频数据; ...
【技术保护点】
一种数据处理方法,其特征在于,所述方法包括:获取歌曲数据库中目标歌曲的音频集合,所述音频集合包括多个音频数据;计算所述音频集合中每两个音频数据之间的距离,并将任一所述音频数据与所述音频集合中的各个音频数据之间的距离进行相加,得到所述音频数据的距离总和;在所述音频集合中获取距离总和按从小到大排序后排在前N位的目标音频数据,所述N为正整数;根据所述目标音频数据中每两个音频数据之间的距离,计算所述目标歌曲的数据发散度;根据计算得到的所述目标歌曲的数据发散度,确定所述目标歌曲的难度系数。
【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:获取歌曲数据库中目标歌曲的音频集合,所述音频集合包括多个音频数据;计算所述音频集合中每两个音频数据之间的距离,并将任一所述音频数据与所述音频集合中的各个音频数据之间的距离进行相加,得到所述音频数据的距离总和;在所述音频集合中获取距离总和按从小到大排序后排在前N位的目标音频数据,所述N为正整数;根据所述目标音频数据中每两个音频数据之间的距离,计算所述目标歌曲的数据发散度;根据计算得到的所述目标歌曲的数据发散度,确定所述目标歌曲的难度系数。2.根据权利要求1所述的方法,其特征在于,所述计算所述音频集合中每两个音频数据之间的距离,包括:提取所述音频集合中各个音频数据的基频序列;针对所述音频集合中的各个音频数据,计算第一音频数据的第一基频序列中第一基频点与第二音频数据的第二基频序列中第二基频点之间的距离;根据所述第一基频点与所述第二基频点之间的距离获取所述第一音频数据与所述第二音频数据之间的距离;其中,所述第一音频数据以及所述第二音频数据为所述音频集合中的任一音频数据,所述第一基频点为所述第一基频序列中任一基频点,所述第二基频点在所述第二基频序列中的位置与所述第一基频点在所述第一基频序列中的位置相同。3.根据权利要求2所述的方法,其特征在于,所述根据所述目标音频数据中每两个音频数据之间的距离,计算所述目标歌曲的数据发散度,包括:获取所述目标音频数据中第三音频数据与第四音频数据之间的距离;将所述第三音频数据与所述第四音频数据之间的距离除以所述第三音频数据的第三基频序列所包含的第三基频点的数量,得到所述第三音频数据与所述第四音频数据之间的平均距离;根据所述第三音频数据与所述第四音频数据之间的平均距离,计算所述目标歌曲的数据发散度;其中,所述第三音频数据以及所述第四音频数据为所述目标音频数据中的任一音频数据,所述第三基频点为所述第三基频序列中任一基频点。4.根据权利要求3所述的方法,其特征在于,所述根据所述第三音频数据与所述第四音频数据之间的平均距离,计算所述目标歌曲的数据发散度,包括:将所述第三音频数据与所述目标音频数据中的各个音频数据之间的平均距离进行相加,得到第一相加结果;将所述第一相加结果除以所述目标音频数据所包含的音频数据的数量,得到所述第三音频数据的平均距离总和;将所述目标音频数据中的各个音频数据的平均距离总和进行相加,得到第二相加结果;将所述第二相加结果除以所述目标音频数据所包含的音频数据的数量,得到所述目标歌曲的数据发散度。5.根据权利要求1至4任一项所述的方法,其特征在于,所述根据计算得到的所述目标歌曲的数据发散度,确定所述目标歌曲的难度系数,包括:获取所述歌曲数据库中所有歌曲的数据发散度;将所述歌曲数据库中的各个歌曲的数据发散度进行相加,得到数据发散度总和;将所述目标歌曲的数据发散度除以所述数据发散度总和,得到所述目标歌曲的难度系数。6.根据权利要求5所述的方法,其特征在于,所述计算所述音频集合中每两个音频数据之间的距离之前,所述方法还包括:对所述音频集合中的任一音频数据所包含的伴奏音频数据进行采样,并获取所述伴奏音频数据的多个采样点;将各个所述采样点的能量进行相加,得到能量总和;将所述能量总和除以所述采样点的数量,得到所述伴奏音频数据的平均能量;若所述伴奏音频数据的平均能量大于预设阈值,则删除所述伴奏音频数据所属的音频数据。7.一种数据处理装置,其特征在于,所述装置包括:获取模...
【专利技术属性】
技术研发人员:孔令城,
申请(专利权)人:腾讯音乐娱乐深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。