歌唱者识别方法和装置制造方法及图纸

技术编号:20285847 阅读:36 留言:0更新日期:2019-02-10 18:08
本申请实施例公开了歌唱者识别方法和装置。该方法的一具体实施方式包括:采用已训练的人声分离模型对待识别的音乐数据进行处理,得到待识别的音乐数据中的人声数据;将待识别的音乐数据中的人声数据输入已训练的歌唱者识别模型,得到待识别的音乐数据的歌唱者识别结果。该实施方式提升了歌唱者识别的准确度。

Method and Device for Singer Recognition

The embodiment of this application discloses a singer identification method and device. One specific implementation of the method includes: using the trained voice separation model to process the identified music data and get the voice data in the music data to be recognized; input the voice data in the music data to be recognized into the trained singer recognition model, and get the singer recognition result of the music data to be recognized. The implementation method improves the accuracy of singer recognition.

【技术实现步骤摘要】
歌唱者识别方法和装置
本申请实施例涉及计算机
,具体涉及语音
,尤其涉及歌唱者识别方法和装置。
技术介绍
歌唱者识别,是从歌曲中识别出歌唱者的身份。歌唱者识别属于说话人识别的范畴,现有的歌唱者识别方法是直接将歌曲输入用于识别说话人的语音识别引擎,语音识别引擎根据歌曲中的语音学特征对歌唱者的身份进行识别。通常歌曲中除了包含歌唱者的声音之外,还包含伴奏音乐,则从歌曲中提取出的语音学特征既包含歌唱者的声学特征,也包含伴奏音乐的声学特征,所以歌唱者识别相较于说话人识别,具有一定的难度。并且,歌唱者在唱歌时的发音方式与说话时的发音方式不同,也给歌唱者识别带来了一定的难度。
技术实现思路
本申请实施例提出了歌唱者识别方法和装置。第一方面,本申请实施例提供了一种歌唱者识别方法,包括:采用已训练的人声分离模型对待识别的音乐数据进行处理,得到待识别的音乐数据中的人声数据;将待识别的音乐数据中的人声数据输入已训练的歌唱者识别模型,得到待识别的音乐数据的歌唱者识别结果。在一些实施例中,上述方法还包括:基于第一样本音乐数据训练得出已训练的人声分离模型。在一些实施例中,上述基于第一样本音乐数据训练得出本文档来自技高网...

【技术保护点】
1.一种歌唱者识别方法,包括:采用已训练的人声分离模型对待识别的音乐数据进行处理,得到待识别的音乐数据中的人声数据;将待识别的音乐数据中的人声数据输入已训练的歌唱者识别模型,得到所述待识别的音乐数据的歌唱者识别结果。

【技术特征摘要】
1.一种歌唱者识别方法,包括:采用已训练的人声分离模型对待识别的音乐数据进行处理,得到待识别的音乐数据中的人声数据;将待识别的音乐数据中的人声数据输入已训练的歌唱者识别模型,得到所述待识别的音乐数据的歌唱者识别结果。2.根据权利要求1所述的方法,其中,所述方法还包括:基于第一样本音乐数据训练得出所述已训练的人声分离模型。3.根据权利要求2所述的方法,其中,所述基于第一样本音乐数据训练得出所述已训练的人声分离模型,包括:提取所述第一样本音乐数据的频谱特征,并基于所述第一样本音乐数据的频谱特征从第一样本音乐数据中分离出样本人声数据;基于高斯混合模型构建待训练的人声分离模型,将所述样本人声数据作为所述待训练的人声分离模型对第一样本音乐数据进行人声分离得到第一样本音乐数据中的人声数据的期望结果,训练得出所述已训练的人声分离模型。4.根据权利要求2所述的方法,其中,所述基于第一样本音乐数据训练得出所述已训练的人声分离模型,包括:提取所述第一样本音乐数据的频谱特征,基于第一样本音乐数据的频率特征将从样本音乐数据分解为样本人声数据和样本伴奏数据;基于高斯混合模型构建待训练的人声分离模型,将所述样本人声数据作为所述待训练的人声分离模型对第一样本音乐数据进行人声分离得到第一样本音乐数据中的人声数据的期望结果,并且将所述样本伴奏数据作为所述待训练的人声分离模型对第一样本音乐数据进行人声分离得到第一样本音乐数据中的伴奏数据的期望结果,训练得出所述已训练的人声分离模型。5.根据权利要求1-4任一项所述的方法,其中,所述方法还包括:基于具有对应的歌唱者标注信息的第二样本音乐数据训练得出所述已训练的歌唱者识别模型,包括:将所述第二样本音乐数据输入所述已训练的人声分离模型,得到第二样本音乐数据中的人声数据;基于高斯混合模型构建待训练的歌唱者识别模型,利用所述第二样本音乐数据中的人声数据,将所述第二样本音乐数据的歌唱者标注信息作为待训练的歌唱者识别模型对第二样本音乐数据中的人声数据的歌唱者识别的期望结果,对所述待训练的歌唱者模型进行训练,得到所述已训练的歌唱者识别模型。6.一种歌唱者识别装置,包括:分离单元,被配置为采用已训练的人声分离模型对待识别的音乐数据进行处理,得到待识别的音乐数据中的人声数据;识别单元,被配置为将待识别的音乐数据中的人声数据输入已训练的歌唱者识别模型,得到所述待识别的音乐...

【专利技术属性】
技术研发人员:陈建哲钟思思贺学焱
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1