语音训练样本的获取方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:24760276 阅读:36 留言:0更新日期:2020-07-04 10:07
本申请揭示了一种语音训练样本的获取方法、装置、计算机设备和存储介质,其中方法包括:对语音信号进行处理,得到所述语音信号的声音频谱图;在所述声音频谱图上的时间方向上随机选择时间点;以所述时间点为撕裂点,将所述撕裂点两侧的声音频谱图在时间方向上进行分离,完成对所述声音频谱图的撕裂处理,并在断裂处按照预设规则添加过度信息,得到撕裂频谱图,并将所述撕裂频谱图作为所述语音训练样本。本申请将一个原始的语音信号转换成声音频谱图后,通过撕裂、掩码的处理,将一个声音频谱图衍生出大量的撕裂频谱图、第一掩码频谱图和第二掩码频谱图,从而可以解决现有技术中训练声纹识别模型的样本量较少无法得到准确的声纹识别模型的问题。

Acquisition method, device, computer equipment and storage medium of speech training sample

【技术实现步骤摘要】
语音训练样本的获取方法、装置、计算机设备和存储介质
本申请涉及计算机神经网络训练领域,特别是涉及到语音训练样本的获取方法、装置、计算机设备和存储介质。
技术介绍
语音识别身份,即声纹识别,是人工智能领域的重要方向,是人工智能技术在生物特征识别场景中的重要应用。虽然在实验室条件下,声纹识别的准确率一直突破新高,但在实际业务场景中,由于语音传输依赖传输信道,如电话、宽带网络等传输信道,接收到的语音会被信道所影响,所以声纹识别的准确率仍然不高。因为说话语音和信道是无法完全切分开的,所以在声纹识别的过程中,提取出来的说话人声音特征中都不可避免的存在信道特征,如电话录音的说话人A和网络语音中的说话A提取出来的特征中分别附带了电话信道和网络信道的特征,会造成其声纹识别的判定误差。因此在声纹识别领域里,跨信道问题迄今为止仍是一个难题。目前业界的主流解决方法是采集各信道的语音数据,要么训练一种信道间特征转换的模型,要么用采集的跨信道数据扩充原模型的训练集。其核心都是收集到足够多的跨信道数据作为样本。而实际生产中,由于采集样本成本和采集条件的限制本文档来自技高网...

【技术保护点】
1.一种语音训练样本的获取方法,其特征在于,包括:/n对语音信号进行处理,得到所述语音信号的声音频谱图;/n在所述声音频谱图上的时间方向上随机选择时间点;/n以所述时间点为撕裂点,将所述撕裂点两侧的声音频谱图在时间方向上进行分离,完成对所述声音频谱图的撕裂处理,并在断裂处按照预设规则添加过度信息,得到撕裂频谱图,并将所述撕裂频谱图作为所述语音训练样本,其中,所述撕裂点两侧的声音频谱图的分离距离为s,所述s是从[0,S]的均匀分布中随机选取的数字,S为时间变形参数。/n

【技术特征摘要】
1.一种语音训练样本的获取方法,其特征在于,包括:
对语音信号进行处理,得到所述语音信号的声音频谱图;
在所述声音频谱图上的时间方向上随机选择时间点;
以所述时间点为撕裂点,将所述撕裂点两侧的声音频谱图在时间方向上进行分离,完成对所述声音频谱图的撕裂处理,并在断裂处按照预设规则添加过度信息,得到撕裂频谱图,并将所述撕裂频谱图作为所述语音训练样本,其中,所述撕裂点两侧的声音频谱图的分离距离为s,所述s是从[0,S]的均匀分布中随机选取的数字,S为时间变形参数。


2.根据权利要求1所述的语音训练样本的获取方法,其特征在于,所述在撕裂处按照预设规则添加过度信息的步骤,包括:
对所述撕裂频谱图的断裂处随机添加所述过度信息。


3.根据权利要求1所述的语音训练样本的获取方法,其特征在于,所述在所述声音频谱图上的时间方向上随机选择时间点的步骤之前,包括:
获取所述声音频谱图的时间长度;
根据所述时间长度确定对所述声音频谱图的撕裂处理次数;
选择与所述撕裂处理次数相同个数的时间点,以对所述声音频谱图进行不同次的撕裂处理。


4.根据权利要求3所述的语音训练样本的获取方法,其特征在于,所述选择与所述撕裂处理次数相同个数的时间点,以对所述声音频谱图进行不同次的撕裂处理的步骤包括:
在所述时间长度上平均分配所述撕裂处理次数对应数量的时间点,以对所述声音频谱图进行不同次的撕裂处理。


5.根据权利要求1所述的语音训练样本的获取方法,其特征在于,所述以所述时间点为撕裂点,将所述撕裂点两侧的声音频谱图在时间方向上进行分离,完成对所述声音频谱图的撕裂处理,并在断裂处按照预设规则添加过度信息,得到撕裂频谱图的步骤之后,包括:
在所述撕裂频谱图上,在时间方向上选择出多个间隔设置的第一频谱块;<...

【专利技术属性】
技术研发人员:马坤赵之砚施奕明
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1