一种语音数据的评价方法及系统技术方案

技术编号:14907659 阅读:101 留言:0更新日期:2017-03-29 22:43
本发明专利技术实施例公开了语音数据的评价方法及系统,应用于信息处理技术领域。在本实施例的方法中,语音数据的评价系统会对一个伴奏的多条声音数据所包含的语音数据分别进行量化,然后根据多条量化后的语音数据获取一个伴奏的最优语音数据并储存,这样就实现了由语音数据的评价系统自动生成预置的标准数据即最优语音数据,以方便系统对一个伴奏的待评价语音数据进行评价,和现有技术中需要通过人工离线制作并预置标准数据到系统中相比,本实施例的方法成本低,难度小,且时效性比较高。

【技术实现步骤摘要】

本专利技术涉及信息处理
,特别涉及一种语音数据的评价方法及系统。
技术介绍
现有的语音数据(比如歌曲)的评价系统可以对用户上传的语音数据进行评价,并通过打分的方式将语音数据的评价结果提供给用户,具体是系统根据预置的标准数据与上传的语音数据进行比较,根据比较结果进行打分。但是传统的语音数据的评价系统中预置的标准数据都是通过人工离线制作并预置到系统中,这样不但成本高,难度大,且时效性还比较低。
技术实现思路
本专利技术实施例提供一种语音数据的评价方法及系统,实现了由语音数据的评价系统自动生成预置的标准数据。本专利技术实施例提供一种语音数据的评价方法,包括:对一个伴奏的多条声音数据所包含的语音数据分别进行量化得到多条量化后的语音数据;对所述多条量化后的语音数据进行聚类,获取所述一个伴奏的最优语音数据;储存所述一个伴奏的最优语音数据,所述最优语音数据用于对所述一个伴奏的待评价语音数据进行评价。本专利技术实施例还提供一种语音数据的评价系统,包括:第一量化单元,用于对一个伴奏的多条声音数据所包含的语音数据分别进行量化得到多条量化后的语音数据;最优获取单元,用于对所述第一量化单元得到的多条量化后的语音数据进行聚类,获取所述一个伴奏的最优语音数据;储存单元,用于储存所述最优获取单元获取的一个伴奏的最优语音数据,所述最优语音数据用于对所述一个伴奏的待评价语音数据进行评价。可见,在本实施例的方法中,语音数据的评价系统会对一个伴奏的多条声音数据所包含的语音数据分别进行量化,然后根据多条量化后的语音数据获取一个伴奏的最优语音数据并储存,这样就实现了由语音数据的评价系统自动生成预置的标准数据即最优语音数据,以方便系统对一个伴奏的待评价语音数据进行评价,和现有技术中需要通过人工离线制作并预置标准数据到系统中相比,本实施例的方法成本低,难度小,且时效性比较高。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的一种语音数据的评价方法中预置标准数据的方法流程图;图2是本专利技术实施例中对语音数据评价的方法流程图;图3是本专利技术实施例中量化声音数据所包含的语音数据的方法流程图;图4是本专利技术实施例中获取最优语音数据的方法流程图;图5是本专利技术实施例提供的一种语音数据的评价系统的结构示意图;图6是本专利技术实施例提供的另一种语音数据的评价系统的结构示意图;图7是本专利技术实施例提供的另一种语音数据的评价系统的结构示意图;图8是本专利技术实施例提供的另一种语音数据的评价系统的结构示意图;图9是本专利技术应用实施例中从声音数据中提取语音数据的方法流程图;图10是本专利技术应用实施例中对多个基频子序列规整的方法流程图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排它的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。本专利技术实施例提供一种语音数据的评价方法,主要是语音数据的评价系统所执行的方法,流程图如图1所示,包括:步骤101,对一个伴奏的多条声音数据所包含的语音数据分别进行量化得到多条量化后的语音数据。可以理解,对于一个伴奏来说,任一用户都可以跟随一段伴奏进行至少一次演唱并得到至少一条声音数据,而一条声音数据中就包含了伴奏音乐及用户的演唱数据(即语音数据)。在本实施例中,各个用户可以通过操作语音数据的评价系统将各自的声音数据上传到语音数据的评价系统,则语音数据的评价系统会分别对各个用户的声音数据中包含的语音数据进行处理。因此,语音数据的评价系统需要先将声音数据中的语音数据提取出来,然后再进行量化,这里的量化处理是将语音数据标准化,将语音数据的评价系统默认的标准化数据表示出来,以方便之后的处理。步骤102,对多条量化后的语音数据进行聚类,获取一个伴奏的最优语音数据。这里的聚类是指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程,具体实现时,对于其中任一条量化后的语音数据,分别计算该条量化后的语音数据与其它条量化后的语音数据的距离,然后就可以根据计算的距离即可获取了最优语音数据。步骤103,储存一个伴奏的最优语音数据,该最优语音数据即为评价语音数据的标准数据,主要用于对该一个伴奏的待评价语音数据进行评价。通过上述步骤101到103,系统就自动地预置了对语音数据进行评价的标准数据。进一步地,参考图2所示,在对这一段伴奏的待评价语音数据进行评价时,具体可以按照如下步骤来实现:步骤201,对一个伴奏的待评价语音数据进行量化得到量化后的待评价语音数据,具体地,当某一用户根据一个伴奏演唱后得到一条声音数据,并上传到语音数据的评价系统中等待该评价系统的评价,则该评价系统就可以先从上传的声音数据中提取出待评价语音数据,然后可以按照上述步骤101的方法对待评价语音数据进行量化。步骤202,计算步骤201得到的量化后的待评价语音数据与最优语音数据的第一距离,该第一距离可以是欧式距离。步骤203,根据上述步骤202计算的第一距离确定待评价语音数据的评价分值。具体地,语音数据的评价系统可以将上述第一距离量化到0到100之间的分数作为评价分值,具体地,可以先获取上述步骤101得到的多条量化后的语音数据中,与上述步骤102得到的最优语音数据的距离最大的第二距离,假设上述第一距离为k,第二距离为m,则语音数据的评价系统确定的评价分值为100*(m-k)/m。进一步地,语音数据的评价系统还可以输出该评价分值,且进一步地输出待评价语音数据与最优语音数据不一致的位置,这样用户就可以直观地知道自己演唱的缺陷,从而可以针对性地提升自身的演唱水平。其中,由于在获取最优语音数据的过程中,会计算待评价语音数据各个位置与最优语音数据各个位置之间距离,如果某一位置对应的距离大于预置的值,则在该位置上待评价语音数据与最优语音数据不一致。可见,在本实施例的方法中,语音数据的评价系统会对一个伴奏的多条声音数据所包含的语音数据分别进行量化,然后根据多条量化后的语音数据获取该伴奏的最优语音数据并储存,这样就实现了由语音数据的评价系统自动生成预置的标准数据即最优语音数据,以方便系统对该伴奏的待评价语音数据进行评价,和现有技术中需要通过人工离线制作并预置标准数据到系统中相比,本实施例的方法成本低,难度本文档来自技高网...

【技术保护点】
一种语音数据的评价方法,其特征在于,包括:对一个伴奏的多条声音数据所包含的语音数据分别进行量化得到多条量化后的语音数据;对所述多条量化后的语音数据进行聚类,获取所述一个伴奏的最优语音数据;储存所述一个伴奏的最优语音数据,所述最优语音数据用于对所述一个伴奏的待评价语音数据进行评价。

【技术特征摘要】
1.一种语音数据的评价方法,其特征在于,包括:对一个伴奏的多条声音数据所包含的语音数据分别进行量化得到多条量化后的语音数据;对所述多条量化后的语音数据进行聚类,获取所述一个伴奏的最优语音数据;储存所述一个伴奏的最优语音数据,所述最优语音数据用于对所述一个伴奏的待评价语音数据进行评价。2.如权利要求1所述的方法,其特征在于,对一条声音数据所包含的语音数据进行量化得到一条量化后的语音数据,具体包括:提取所述声音数据的基频信息;对所述基频信息进行转化,使得转化后的基频信息中包括的基频值为小范围数值;将所述转化后的基频信息量化为音符序列,或将对所述转化后的基频信息进行第一预处理后的基频信息量化为音符序列,所述一条量化后的语音数据包括所述音符序列的信息;所述音符序列的信息包括所述多个音符中每个音符的起始时间,时长及对应的音高值,其中,所述起始时间为所述转化后的基频信息或进行第一预处理后的基频信息中包括的一个基频子序列的起始时间,所述时长为规整后的所述一个基频子序列的长度,所述音高值为规整后的所述一个基频子序列的频率值。3.如权利要求2所述的方法,其特征在于,所述语音数据的基频信息包括多个基频值,则所述对所述基频信息进行转化,使得转化后的基频信息中包括的基频值为小范围数值,具体包括:直接将所述多个基频值转化为小范围数值;或,将所述基频信息进行第二预处理,将进行所述第二预处理后的基频信息中包括的基频值转化为小范围数值。4.如权利要求3所述的方法,其特征在于,所述第二预处理包括如下至少一种处理方式:低通滤波,压缩,奇异基频点置零和零基频点填充;所述第一预处理包括如下至少一种处理方式:低通滤波和三点平滑。5.如权利要求1所述的方法,其特征在于,所述量化后的语音数据有n条,所述n为大于1的正整数,则所述对所述多条量化后的语音数据进行聚类,获取所述一个伴奏的最优语音数据,具体包括:分别计算所述n条量化后的语音数据中任意两条量化后的语音数据的距离;分别计算所述n条量化后的语音数据中每一条量化后的语音数据,分别与其它n-1条量化后的语音数据的距离之和,将最小距离之和对应的一条量化后的语音数据作为所述最优语音数据。6.如权利要求5所述的方法,其特征在于,一条量化后的语音数据中包括音符序列的信息,所述音符序列的信息包括多个音符中各个音符的时长及音高值;所述n条量化后的语音数据中第一条量化后的语音数据中的音符Si,与第二条量化后的语音数据中的音符Sj的距离D(Si,Sj),具体为:其中:所述Δp为表示音符Si与Sj的音高差,Δp=min(abs(pi-pj),abs(pi-pj-24)+1.0,abs(pi-pj+24)+1.0),所述pi为音符Si的音高值,pj为音符Sj的音高值;所述Δd为音符Si与Sj的时间差,所述σ为所述时间差的权重值;则所述第一条量化后的语音数据与第二条量化后的语音数据的距离为:所述第一条量化后的语音数据的音符与所述第二条量化后的语音数据的音符之间的最大距离。7.如权利要求1至6任一项所述的方法,其特征在于,所述方法还包括:对所述一个伴奏的待评价语音数据进行量化得到量化后的待评价语音数据;计算所述量化后的待评价语音数据与所述最优语音数据的第一距离;根据计算的所述第一距离确定所述待评价语音数据的评价分值。8.如权利要求7所述的方法,其特征在于,所述根据计算的所述第一距离确定所述待评价语音数据的评价分值,具体包括:获取所述多条量化后的语音数据中,与所述最优语音数据的距离最大的第二距离,所述第一距离为k,所述第二距离为m;确定所述评价分值为100*(m-k)/m。9.如权利要求1至6任一项所述的方法,其特征在于,所述方法还包括:输出所述待评价语音数据与所述最优语音数据不一致的位置。10.一种语音数据的评价系统,其特征在于,包括:第一量化单元,用于对一个伴奏的多条声音数据所包含的语音数据分别进行量化得到多条量...

【专利技术属性】
技术研发人员:傅鸿城
申请(专利权)人:广州酷狗计算机科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1