【技术实现步骤摘要】
语音训练样本的获取方法、装置、计算机设备和存储介质
本申请涉及计算机神经网络训练领域,特别是涉及到语音训练样本的获取方法、装置、计算机设备和存储介质。
技术介绍
语音识别身份,即声纹识别,是人工智能领域的重要方向,是人工智能技术在生物特征识别场景中的重要应用。虽然在实验室条件下,声纹识别的准确率一直突破新高,但在实际业务场景中,由于语音传输依赖传输信道,如电话、宽带网络等传输信道,接收到的语音会被信道所影响,所以声纹识别的准确率仍然不高。因为说话语音和信道是无法完全切分开的,所以在声纹识别的过程中,提取出来的说话人声音特征中都不可避免的存在信道特征,如电话录音的说话人A和网络语音中的说话A提取出来的特征中分别附带了电话信道和网络信道的特征,会造成其声纹识别的判定误差。因此在声纹识别领域里,跨信道问题迄今为止仍是一个难题。目前业界的主流解决方法是采集各信道的语音数据,要么训练一种信道间特征转换的模型,要么用采集的跨信道数据扩充原模型的训练集。其核心都是收集到足够多的跨信道数据作为样本。而实际生产中,由于采集样本 ...
【技术保护点】
1.一种语音训练样本的获取方法,其特征在于,包括:/n对语音信号进行处理,得到所述语音信号的声音频谱图;/n在所述声音频谱图上的时间方向上随机选择时间点;/n以所述时间点为撕裂点,将所述撕裂点两侧的声音频谱图在时间方向上进行分离,完成对所述声音频谱图的撕裂处理,并在断裂处按照预设规则添加过度信息,得到撕裂频谱图,并将所述撕裂频谱图作为所述语音训练样本,其中,所述撕裂点两侧的声音频谱图的分离距离为s,所述s是从[0,S]的均匀分布中随机选取的数字,S为时间变形参数。/n
【技术特征摘要】
1.一种语音训练样本的获取方法,其特征在于,包括:
对语音信号进行处理,得到所述语音信号的声音频谱图;
在所述声音频谱图上的时间方向上随机选择时间点;
以所述时间点为撕裂点,将所述撕裂点两侧的声音频谱图在时间方向上进行分离,完成对所述声音频谱图的撕裂处理,并在断裂处按照预设规则添加过度信息,得到撕裂频谱图,并将所述撕裂频谱图作为所述语音训练样本,其中,所述撕裂点两侧的声音频谱图的分离距离为s,所述s是从[0,S]的均匀分布中随机选取的数字,S为时间变形参数。
2.根据权利要求1所述的语音训练样本的获取方法,其特征在于,所述在撕裂处按照预设规则添加过度信息的步骤,包括:
对所述撕裂频谱图的断裂处随机添加所述过度信息。
3.根据权利要求1所述的语音训练样本的获取方法,其特征在于,所述在所述声音频谱图上的时间方向上随机选择时间点的步骤之前,包括:
获取所述声音频谱图的时间长度;
根据所述时间长度确定对所述声音频谱图的撕裂处理次数;
选择与所述撕裂处理次数相同个数的时间点,以对所述声音频谱图进行不同次的撕裂处理。
4.根据权利要求3所述的语音训练样本的获取方法,其特征在于,所述选择与所述撕裂处理次数相同个数的时间点,以对所述声音频谱图进行不同次的撕裂处理的步骤包括:
在所述时间长度上平均分配所述撕裂处理次数对应数量的时间点,以对所述声音频谱图进行不同次的撕裂处理。
5.根据权利要求1所述的语音训练样本的获取方法,其特征在于,所述以所述时间点为撕裂点,将所述撕裂点两侧的声音频谱图在时间方向上进行分离,完成对所述声音频谱图的撕裂处理,并在断裂处按照预设规则添加过度信息,得到撕裂频谱图的步骤之后,包括:
在所述撕裂频谱图上,在时间方向上选择出多个间隔设置的第一频谱块;<...
【专利技术属性】
技术研发人员:马坤,赵之砚,施奕明,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。