一种数据处理方法及装置制造方法及图纸

技术编号:16153209 阅读:30 留言:0更新日期:2017-09-06 18:28
本发明专利技术实施例公开了一种数据处理方法及装置,其中方法包括:获取歌曲数据库中目标歌曲的音频集合,所述音频集合包括多个音频数据;计算所述音频集合中每两个音频数据之间的距离,并将任一所述音频数据与所述音频集合中的各个音频数据之间的距离进行相加,得到所述音频数据的距离总和;在所述音频集合中获取距离总和按从小到大排序后排在前N位的目标音频数据,所述N为正整数;根据所述目标音频数据中每两个音频数据之间的距离,计算所述目标歌曲的数据发散度;根据计算得到的所述目标歌曲的数据发散度,确定所述目标歌曲的难度系数。采用本发明专利技术实施例,可高效地确定歌曲的难度系数,实现确定歌曲难度系数的智能化以及自动化。

【技术实现步骤摘要】
一种数据处理方法及装置
本专利技术涉及数据处理
,尤其涉及一种数据处理方法及装置。
技术介绍
歌曲的风格和类别有很多种,由于旋律的不同或者演唱者的声音的特点,不同歌曲的演唱难度也有差别。全民K歌系统提供歌曲给用户演唱的同时提供了打分系统,但由于不同歌曲的难度不同,为实现不同歌曲的横向比较,需要为每首歌曲标注难度系数,以便用户分类选择演唱并实现演唱不同歌曲时能进行横向的水平对比。现有技术中歌曲的难度系数都是采用人工标注的方式,但是,采用此方式不但成本高、时效性低,还会产生由于人工主观判断标准不同导致不同人针对同一首歌曲给出的难度系数不一致的问题。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例所要解决的技术问题在于,提供一种歌曲难度系数的生成方法及装置。可高效地确定歌曲的难度系数。为了解决上述技术问题,本专利技术实施例提供了一种数据处理方法,所述方法包括:获取歌曲数据库中目标歌曲的音频集合,所述音频集合包括多个音频数据;计算所述音频集合中每两个音频数据之间的距离,并将任一所述音频数据与所述音频集合中的各个音频数据之间的距离进行相加,得到所述音频数据的距离总和;在所述音频集合中获取距离总和按从小到大排序后排在前N位的目标音频数据,所述N为正整数;根据所述目标音频数据中每两个音频数据之间的距离,计算所述目标歌曲的数据发散度;根据计算得到的所述目标歌曲的数据发散度,确定所述目标歌曲的难度系数。相应地,本专利技术实施例还提供了一种数据处理装置,所述装置包括:获取模块,用于获取歌曲数据库中目标歌曲的音频集合,所述音频集合包括多个音频数据;处理模块,用于计算所述音频集合中每两个音频数据之间的距离,并将任一所述音频数据与所述音频集合中的各个音频数据之间的距离进行相加,得到所述音频数据的距离总和;所述获取模块,还用于在所述音频集合中获取距离总和按从小到大排序后排在前N位的目标音频数据,所述N为正整数;所述处理模块,还用于根据所述目标音频数据中每两个音频数据之间的距离,计算所述目标歌曲的数据发散度;确定模块,用于根据计算得到的所述目标歌曲的数据发散度,确定所述目标歌曲的难度系数。实施本专利技术实施例,具有如下有益效果:本专利技术实施例通过在获取到歌曲数据库中目标歌曲的音频集合之后,计算该音频集合中各个音频数据的距离总和,然后在该音频集合中获取距离总和按从小到大排序后排在前N位的目标音频数据,并根据该目标音频数据中每两个音频数据之间的距离,计算该目标歌曲的数据发散度,最后根据计算得到的该目标歌曲的数据发散度,确定该目标歌曲的难度系数,从而可以高效地确定歌曲的难度系数,实现确定歌曲难度系数的智能化以及自动化。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的一种数据处理方法的示意流程图;图2是本专利技术实施例提供的一种歌词文件格式的示意图;图3是本专利技术实施例提供的另一种数据处理方法的示意流程图;图4是本专利技术实施例提供的一种数据处理装置的示意性框图;图5是本专利技术实施例提供的另一种数据处理装置的示意性框图;图6是本专利技术实施例提供的一种装置的示意性框图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述。本专利技术实施例公开了一种数据处理方法及装置,能够高效地确定歌曲的难度系数。以下分别详细说明。参见图1,图1是本专利技术实施例提供的一种数据处理方法的示意流程图。本专利技术实施例所描述的一种数据处理方法可包括以下步骤:S101、数据处理装置获取歌曲数据库中目标歌曲的音频集合,所述音频集合包括多个音频数据。本专利技术实施例中,数据处理装置可以应用于客户端、全民K歌系统及其相关产品、唱歌类应用的服务器等。其中,客户端可以为唱歌类应用、可以为音乐播放器应用、也可以为安装唱歌类应用或者安装音乐播放器应用的终端设备,该终端设备可以是智能手机(如Android手机、iOS手机、WindowsPhone手机等)、掌上电脑、笔记本电脑、平板电脑、移动互联网设备(MobileInternetDevices,MID)等,本专利技术实施例不做限定。本专利技术实施例中,目标歌曲是指待确定难度系数的歌曲,可以是用户指定的歌曲,也可以是该歌曲数据库中的任一首歌曲,本专利技术实施例不做限定。其中,音频数据指的是歌曲数据库中存储的广大用户针对目标歌曲上传的清唱数据,音频集合包括多个音频数据,广大用户针对目标歌曲上传的多个清唱数据(即音频数据)以音频集合的形式存储在歌曲数据库中。本专利技术实施例中,该歌曲数据库可以是云端服务器的数据库,也可以是该数据处理装置的数据库,本专利技术实施例不做限定。广大用户可以针对目标歌曲进行清唱,从而将针对目标歌曲的清唱数据上传到歌曲数据库中,数据处理装置从而可以从歌曲数据库中获取到该目标歌曲的音频集合,从而获取到该目标歌曲的多个音频数据,每个音频数据为某个用户针对该目标歌曲上传的清唱数据。S102、所述数据处理装置计算所述音频集合中每两个音频数据之间的距离,并将任一所述音频数据与所述音频集合中的各个音频数据之间的距离进行相加,得到所述音频数据的距离总和。具体地,数据处理装置首先提取该音频集合中各个音频数据的基频序列;然后针对该音频集合中的各个音频数据,计算第一音频数据的第一基频序列中第一基频点与第二音频数据的第二基频序列中第二基频点之间的距离;接着根据该第一基频点与该第二基频点之间的距离获取该第一音频数据与该第二音频数据之间的距离;最后将任一音频数据与该音频集合中的各个音频数据之间的距离进行相加,得到该任一音频数据的距离总和。其中,该第一音频数据以及该第二音频数据为该音频集合中的任一音频数据,该第一基频点为该第一基频序列中任一基频点,该第二基频点在该第二基频序列中的位置与该第一基频点在该第一基频序列中的位置相同。在一些可行的实施方式中,数据处理装置提取该音频集合中各个音频数据的基频序列的具体方式可以为:首先将获取到的该目标歌曲的音频集合中的多个音频数据的格式规整为统一的格式,如16k16bitpcm格式,本专利技术实施例不做限定。进一步的,将该多个音频数据中的各个音频数据的格式统一后,针对该多个音频数据中的各个音频数据,提取该各个音频数据的基频信息,得到该各个音频数据的基频集合,并按照指定的帧移和帧长提取基频点,该基频集合中包括多个基频点。其中,指定的帧移可以是10ms,指定的帧长可以为30ms,本专利技术实施例不做限定。由于用户在发声时声带震动产生的频率经过声道过滤后会产生大量泛音,为了便于后续操作,数据处理装置需要从用户上传的音频数据中提取出直接表现声带震动频率的基音,基音也决定了整个音符的音高。然后,数据处理装置将该各个音频数据对应的伴奏部分的基频点进行奇异基频点置零,即,对于伴奏部分的基频段中,根据与前后基频点的基频值的差异检测出奇异基频点,并将奇异基频点置零;将该各个音频数据对应的非伴奏部分的基频点进行中值滤波,例如,如果非伴奏部分的基频段的长度小于指定数量的帧,如35帧,可以本文档来自技高网...
一种数据处理方法及装置

【技术保护点】
一种数据处理方法,其特征在于,所述方法包括:获取歌曲数据库中目标歌曲的音频集合,所述音频集合包括多个音频数据;计算所述音频集合中每两个音频数据之间的距离,并将任一所述音频数据与所述音频集合中的各个音频数据之间的距离进行相加,得到所述音频数据的距离总和;在所述音频集合中获取距离总和按从小到大排序后排在前N位的目标音频数据,所述N为正整数;根据所述目标音频数据中每两个音频数据之间的距离,计算所述目标歌曲的数据发散度;根据计算得到的所述目标歌曲的数据发散度,确定所述目标歌曲的难度系数。

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:获取歌曲数据库中目标歌曲的音频集合,所述音频集合包括多个音频数据;计算所述音频集合中每两个音频数据之间的距离,并将任一所述音频数据与所述音频集合中的各个音频数据之间的距离进行相加,得到所述音频数据的距离总和;在所述音频集合中获取距离总和按从小到大排序后排在前N位的目标音频数据,所述N为正整数;根据所述目标音频数据中每两个音频数据之间的距离,计算所述目标歌曲的数据发散度;根据计算得到的所述目标歌曲的数据发散度,确定所述目标歌曲的难度系数。2.根据权利要求1所述的方法,其特征在于,所述计算所述音频集合中每两个音频数据之间的距离,包括:提取所述音频集合中各个音频数据的基频序列;针对所述音频集合中的各个音频数据,计算第一音频数据的第一基频序列中第一基频点与第二音频数据的第二基频序列中第二基频点之间的距离;根据所述第一基频点与所述第二基频点之间的距离获取所述第一音频数据与所述第二音频数据之间的距离;其中,所述第一音频数据以及所述第二音频数据为所述音频集合中的任一音频数据,所述第一基频点为所述第一基频序列中任一基频点,所述第二基频点在所述第二基频序列中的位置与所述第一基频点在所述第一基频序列中的位置相同。3.根据权利要求2所述的方法,其特征在于,所述根据所述目标音频数据中每两个音频数据之间的距离,计算所述目标歌曲的数据发散度,包括:获取所述目标音频数据中第三音频数据与第四音频数据之间的距离;将所述第三音频数据与所述第四音频数据之间的距离除以所述第三音频数据的第三基频序列所包含的第三基频点的数量,得到所述第三音频数据与所述第四音频数据之间的平均距离;根据所述第三音频数据与所述第四音频数据之间的平均距离,计算所述目标歌曲的数据发散度;其中,所述第三音频数据以及所述第四音频数据为所述目标音频数据中的任一音频数据,所述第三基频点为所述第三基频序列中任一基频点。4.根据权利要求3所述的方法,其特征在于,所述根据所述第三音频数据与所述第四音频数据之间的平均距离,计算所述目标歌曲的数据发散度,包括:将所述第三音频数据与所述目标音频数据中的各个音频数据之间的平均距离进行相加,得到第一相加结果;将所述第一相加结果除以所述目标音频数据所包含的音频数据的数量,得到所述第三音频数据的平均距离总和;将所述目标音频数据中的各个音频数据的平均距离总和进行相加,得到第二相加结果;将所述第二相加结果除以所述目标音频数据所包含的音频数据的数量,得到所述目标歌曲的数据发散度。5.根据权利要求1至4任一项所述的方法,其特征在于,所述根据计算得到的所述目标歌曲的数据发散度,确定所述目标歌曲的难度系数,包括:获取所述歌曲数据库中所有歌曲的数据发散度;将所述歌曲数据库中的各个歌曲的数据发散度进行相加,得到数据发散度总和;将所述目标歌曲的数据发散度除以所述数据发散度总和,得到所述目标歌曲的难度系数。6.根据权利要求5所述的方法,其特征在于,所述计算所述音频集合中每两个音频数据之间的距离之前,所述方法还包括:对所述音频集合中的任一音频数据所包含的伴奏音频数据进行采样,并获取所述伴奏音频数据的多个采样点;将各个所述采样点的能量进行相加,得到能量总和;将所述能量总和除以所述采样点的数量,得到所述伴奏音频数据的平均能量;若所述伴奏音频数据的平均能量大于预设阈值,则删除所述伴奏音频数据所属的音频数据。7.一种数据处理装置,其特征在于,所述装置包括:获取模...

【专利技术属性】
技术研发人员:孔令城
申请(专利权)人:腾讯音乐娱乐深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1