一种语音数据的评价方法及系统技术方案

技术编号：14907659 阅读：101 留言：0更新日期：2017-03-29 22:43

本发明专利技术实施例公开了语音数据的评价方法及系统，应用于信息处理技术领域。在本实施例的方法中，语音数据的评价系统会对一个伴奏的多条声音数据所包含的语音数据分别进行量化，然后根据多条量化后的语音数据获取一个伴奏的最优语音数据并储存，这样就实现了由语音数据的评价系统自动生成预置的标准数据即最优语音数据，以方便系统对一个伴奏的待评价语音数据进行评价，和现有技术中需要通过人工离线制作并预置标准数据到系统中相比，本实施例的方法成本低，难度小，且时效性比较高。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及信息处理
，特别涉及一种语音数据的评价方法及系统。
技术介绍
现有的语音数据(比如歌曲)的评价系统可以对用户上传的语音数据进行评价，并通过打分的方式将语音数据的评价结果提供给用户，具体是系统根据预置的标准数据与上传的语音数据进行比较，根据比较结果进行打分。但是传统的语音数据的评价系统中预置的标准数据都是通过人工离线制作并预置到系统中，这样不但成本高，难度大，且时效性还比较低。
技术实现思路
本专利技术实施例提供一种语音数据的评价方法及系统，实现了由语音数据的评价系统自动生成预置的标准数据。本专利技术实施例提供一种语音数据的评价方法，包括：对一个伴奏的多条声音数据所包含的语音数据分别进行量化得到多条量化后的语音数据；对所述多条量化后的语音数据进行聚类，获取所述一个伴奏的最优语音数据；储存所述一个伴奏的最优语音数据，所述最优语音数据用于对所述一个伴奏的待评价语音数据进行评价。本专利技术实施例还提供一种语音数据的评价系统，包括：第一量化单元，用于对一个伴奏的多条声音数据所包含的语音数据分别进行量化得到多条量化后的语音数据；最优获取单元，用于对所述第一量化单元得到的多条量化后的语音数据进行聚类，获取所述一个伴奏的最优语音数据；储存单元，用于储存所述最优获取单元获取的一个伴奏的最优语音数据，所述最优语音数据用于对所述一个伴奏的待评价语音数据进行评价。可见，在本实施例的方法中，语音数据的评价系统会对一个伴奏的多条声音数据所包含的语音数据分别进行量化，然后根据多条量化后的语音数据获取一个伴奏的最优语音数据并储存，这样就实现了由语音数据的评价系统自动生成...

【技术保护点】
一种语音数据的评价方法，其特征在于，包括：对一个伴奏的多条声音数据所包含的语音数据分别进行量化得到多条量化后的语音数据；对所述多条量化后的语音数据进行聚类，获取所述一个伴奏的最优语音数据；储存所述一个伴奏的最优语音数据，所述最优语音数据用于对所述一个伴奏的待评价语音数据进行评价。

【技术特征摘要】
1.一种语音数据的评价方法，其特征在于，包括：对一个伴奏的多条声音数据所包含的语音数据分别进行量化得到多条量化后的语音数据；对所述多条量化后的语音数据进行聚类，获取所述一个伴奏的最优语音数据；储存所述一个伴奏的最优语音数据，所述最优语音数据用于对所述一个伴奏的待评价语音数据进行评价。2.如权利要求1所述的方法，其特征在于，对一条声音数据所包含的语音数据进行量化得到一条量化后的语音数据，具体包括：提取所述声音数据的基频信息；对所述基频信息进行转化，使得转化后的基频信息中包括的基频值为小范围数值；将所述转化后的基频信息量化为音符序列，或将对所述转化后的基频信息进行第一预处理后的基频信息量化为音符序列，所述一条量化后的语音数据包括所述音符序列的信息；所述音符序列的信息包括所述多个音符中每个音符的起始时间，时长及对应的音高值，其中，所述起始时间为所述转化后的基频信息或进行第一预处理后的基频信息中包括的一个基频子序列的起始时间，所述时长为规整后的所述一个基频子序列的长度，所述音高值为规整后的所述一个基频子序列的频率值。3.如权利要求2所述的方法，其特征在于，所述语音数据的基频信息包括多个基频值，则所述对所述基频信息进行转化，使得转化后的基频信息中包括的基频值为小范围数值，具体包括：直接将所述多个基频值转化为小范围数值；或，将所述基频信息进行第二预处理，将进行所述第二预处理后的基频信息中包括的基频值转化为小范围数值。4.如权利要求3所述的方法，其特征在于，所述第二预处理包括如下至少一种处理方式：低通滤波，压缩，奇异基频点置零和零基频点填充；所述第一预处理包括如下至少一种处理方式：低通滤波和三点平滑。5.如权利要求1所述的方法，其特征在于，所述量化后的语音数据有n条，所述n为大于1的正整数，则所述对所述多条量化后的语音数据进行聚类，获取所述一个伴奏的最优语音数据，具体包括：分别计算所述n条量化后的语音数据中任意两条量化后的语音数据的距离；分别计算所述n条量化后的语音数据中每一条量化后的语音数据，分别与其它n-1条量化后的语音数据的距离之和，将最小距离之和对应的一条量化后的语音数据作为所述最优语音数据。6.如权利要求5所述的方法，其特征在于，一条量化后的语音数据中包括音符序列的信息，所述音符序列的信息包括多个音符中各个音符的时长及音高值；所述n条量化后的语音数据中第一条量化后的语音数据中的音符Si，与第二条量化后的语音数据中的音符Sj的距离D(Si,Sj)，具体为：其中：所述Δp为表示音符Si与Sj的音高差，Δp＝min(abs(pi-pj)，abs(pi-pj-24)+1.0，abs(pi-pj+24)+1.0)，所述pi为音符Si的音高值，pj为音符Sj的音高值；所述Δd为音符Si与Sj的时间差，所述σ为所述时间差的权重值；则所述第一条量化后的语音数据与第二条量化后的语音数据的距离为：所述第一条量化后的语音数据的音符与所述第二条量化后的语音数据的音符之间的最大距离。7.如权利要求1至6任一项所述的方法，其特征在于，所述方法还包括：对所述一个伴奏的待评价语音数据进行量化得到量化后的待评价语音数据；计算所述量化后的待评价语音数据与所述最优语音数据的第一距离；根据计算的所述第一距离确定所述待评价语音数据的评价分值。8.如权利要求7所述的方法，其特征在于，所述根据计算的所述第一距离确定所述待评价语音数据的评价分值，具体包括：获取所述多条量化后的语音数据中，与所述最优语音数据的距离最大的第二距离，所述第一距离为k，所述第二距离为m；确定所述评价分值为100*(m-k)/m。9.如权利要求1至6任一项所述的方法，其特征在于，所述方法还包括：输出所述待评价语音数据与所述最优语音数据不一致的位置。10.一种语音数据的评价系统，其特征在于，包括：第一量化单元，用于对一个伴奏的多条声音数据所包含的语音数据分别进行量化得到多条量...

【专利技术属性】
技术研发人员：傅鸿城，
申请(专利权)人：广州酷狗计算机科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人