语音人声分离方法、装置、终端及存储介质制造方法及图纸

技术编号:25552197 阅读:72 留言:0更新日期:2020-09-08 18:52
本申请公开了一种语音人声分离方法、装置、终端和计算机可读存储介质,语音人声分离方法通过在接收到语音人声分离请求时,获取待分离语音数据;将所述待分离语音数据按照获取时间顺序,进行有序存储;识别所述待分离语音数据中的噪声单元和人声单元;冻结各所述噪声单元,并从所述待分离语音数据中分离所述人声单元,由于在语音人声分离过程中冻结了无效的噪声,只将人声从待分离语音数据分离出来,从而不仅减少了分离过程中语音数据的处理量,而且提高了语音人声分离的效率和准确率。

【技术实现步骤摘要】
语音人声分离方法、装置、终端及存储介质
本申请涉及语音处理
,尤其涉及一种语音人声分离方法、装置、终端及计算机可读存储介质。
技术介绍
目前在一些支持语音操作的智能终端中往往需要用到语音识别的功能,即通过识别说话人的声纹以及语句得到智能终端能够执行的指令,进而根据该指令执行相应的操作。由于说话人发出的声音在传播过程中夹杂了外界的噪音和说话人在说话时产生的噪音,导致了说话人语音识别准确率低,因此需要先将说话人声音(说话人发出的声音)分离出来,再识别这部分分离出来的说话人声音,才能到达比较好的说话人声音识别效果。然而,目前说话人声音分离一般是通过识别并滤除噪声来实现语音人声分离,而噪声是不断变化的。由此可见,目前在语音人声分离过程中需要滤除噪声导致了数据处理量大,并且语音人声分离的效率和准确率低。
技术实现思路
本申请的主要目的在于提供一种语音人声分离方法、装置、终端及计算机存储介质,旨在解决现有技术中语音人声分离过程中数据处理量大、分离的效率和准确率低的技术问题。为实现上述目的,本申请实施例提供一种语音人声分离方法,所述语音人声分离方法的步骤包括:在接收到语音人声分离请求时,获取待分离语音数据;将所述待分离语音数据按照获取时间顺序,进行有序存储;识别所述待分离语音数据中的噪声单元和人声单元;冻结各所述噪声单元,并从所述待分离语音数据中分离所述人声单元。可选地,所述识别所述待分离语音数据中的噪声单元和人声单元的步骤包括:按照所述获取时间顺序,将所述待分离语音数据分割为预设个数的语音片段单元;基于各所述语音片段单元,识别所述待分离语音数据中的所述噪声单元和所述人声单元。可选地,所述基于各所述语音片段单元,识别所述待分离语音数据中的所述噪声单元和所述人声单元的步骤包括:依次将各所述语音片段单元与预设的噪声特征模型进行比对,获得各所述语音片段单元相对所述噪声特征模型的相似度;依次将各所述相似度和预设特征阈值进行比较;将所述相似度超过所述预设特征阈值的所述语音片段单元,确定为所述噪声单元;将所述相似度不超过所述预设特征阈值的所述语音片段单元,确定为所述人声单元。可选地,所述冻结各所述噪声单元,并从所述待分离语音数据中分离所述人声单元的步骤包括:按照所述获取时间顺序,生成所述语音片段单元的时间轴信息;从所述时间轴信息中提取所述噪声单元的第一时间轴标识和所述人声单元的第二时间轴标识;基于所述时间轴信息和所述第一时间轴标识,冻结各所述噪声单元;基于所述时间轴信息和所述第二时间轴标识,从所述待分离语音数据中分离所述人声单元。可选地,所述从所述时间轴信息中提取所述噪声单元的第一时间轴标识和所述人声单元的第二时间轴标识的步骤包括:获取所述噪声单元在所述语音片段单元的第一位置信息,将所述第一位置信息在所述时间轴信息中指向的时间点,确定为所述噪声单元的第一时间轴标识;获取所述人声单元在所述语音片段单元的第二位置信息,将所述第二位置信息在所述时间轴信息中指向的时间点,确定为所述人声单元的第二时间轴标识。可选地,所述基于所述时间轴信息和所述第一时间轴标识,冻结各所述噪声单元的步骤包括:从所述待分离语音数据中筛选出时间轴信息为所述第一时间轴标识的目标噪声;锁定各所述目标噪声。可选地,所述基于所述时间轴信息和所述第二时间轴标识,从所述待分离语音数据中分离所述人声单元的步骤包括:从所述待分离语音数据中提取时间轴信息为所述第二时间轴标识的目标人声;将各所述目标人声按照所述时间顺序进行重组,生成所述人声单元。本申请还提供一种语音人声分离装置,所述语音人声分离装置包括:获取模块,用于在接收到语音人声分离请求时,获取待分离语音数据;存储模块,用于将所述待分离语音数据按照获取时间顺序,进行有序存储;识别模块,用于识别所述待分离语音数据中的噪声单元和人声单元;分离模块,用于冻结各所述噪声单元,并从所述待分离语音数据中分离所述人声单元。可选地,所述识别模块包括:分割子模块,用于按照所述待分离语音数据的获取时间顺序,将所述待分离语音数据分割为预设个数的语音片段单元;识别子模块,用于基于各所述语音片段单元,识别所述待分离语音数据中的所述噪声单元和所述人声单元。可选地,所述识别子模块包括:比对单元,用于依次将各所述语音片段单元与预设的噪声特征模型进行比对,获得各所述语音片段单元相对所述噪声特征模型的相似度;比较单元,用于依次将各所述相似度和预设特征阈值进行比较;第一确定单元,用于将所述相似度超过所述预设特征阈值的所述语音片段单元,确定为所述噪声单元;第二确定单元,用于将所述相似度不超过所述预设特征阈值的所述语音片段单元,确定为所述人声单元。可选地,所述分离模块包括:生成子模块,用于按照所述获取时间顺序,生成所述语音片段单元的时间轴信息;获取子模块,用于从所述时间轴信息中提取所述噪声单元的第一时间轴标识和所述人声单元的第二时间轴标识;冻结子模块,用于基于所述时间轴信息和所述第一时间轴标识,冻结各所述噪声单元;分离子模块,用于基于所述时间轴信息和所述第二时间轴标识,从所述待分离语音数据中分离所述人声单元。可选地,所述获取子模块包括:第一获取单元,用于获取所述噪声单元在所述语音片段单元的第一位置信息,将所述第一位置信息在所述时间轴信息中指向的时间点,确定为所述噪声单元的第一时间轴标识;第二获取单元,获取所述人声单元在所述语音片段单元的第二位置信息,将所述第二位置信息在所述时间轴信息中指向的时间点,确定为所述人声单元的第二时间轴标识。可选地,所述冻结子模块包括:筛选单元,用于从所述待分离语音数据中筛选出时间轴信息为所述第一时间轴标识的目标噪声;锁定单元,用于锁定各所述目标噪声。可选地,所述分离子模块包括:提取单元,用于从所述待分离语音数据中提取时间轴信息为所述第二时间轴标识的目标人声;重组单元,用于将各所述目标人声按照所述时间顺序进行重组,生成所述人声单元。本申请还提供一种终端,所述终端包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的语音人声分离程序,所述语音人声分离程序被所述处理器执行时实现如上所述的语音人声分离方法的步骤。本申请还提供一种计算机存储介质,所述计算机存储介质上存储有语音人声分离程序,所述语音人声分离程序被处理器执行时实现如上所述的语音人声分离方法的步骤。本申请公开了一种语音人声分离方法、装置、终端和计算机可读存储介质,所述语音人声分离方法通过在接收到语音人声分离请求时,获取待分离语音数据;将所述待分离语音数据按照获取时间顺序,进行有序存储;识别所述待分离语音数据中的噪声单元和人声单元;冻结各所述噪声单元,并本文档来自技高网...

【技术保护点】
1.一种语音人声分离方法,其特征在于,所述语音人声分离方法包括以下步骤:/n在接收到语音人声分离请求时,获取待分离语音数据;/n将所述待分离语音数据按照获取时间顺序,进行有序存储;/n识别所述待分离语音数据中的噪声单元和人声单元;/n冻结各所述噪声单元,并从所述待分离语音数据中分离所述人声单元。/n

【技术特征摘要】
1.一种语音人声分离方法,其特征在于,所述语音人声分离方法包括以下步骤:
在接收到语音人声分离请求时,获取待分离语音数据;
将所述待分离语音数据按照获取时间顺序,进行有序存储;
识别所述待分离语音数据中的噪声单元和人声单元;
冻结各所述噪声单元,并从所述待分离语音数据中分离所述人声单元。


2.如权利要求1所述的语音人声分离方法,其特征在于,所述识别所述待分离语音数据中的噪声单元和人声单元的步骤包括:
按照所述获取时间顺序,将所述待分离语音数据分割为预设个数的语音片段单元;
基于各所述语音片段单元,识别所述待分离语音数据中的所述噪声单元和所述人声单元。


3.如权利要求2所述的语音人声分离方法,其特征在于,所述基于各所述语音片段单元,识别所述待分离语音数据中的所述噪声单元和所述人声单元的步骤包括:
依次将各所述语音片段单元与预设的噪声特征模型进行比对,获得各所述语音片段单元相对所述噪声特征模型的相似度;
依次将各所述相似度和预设特征阈值进行比较;
将所述相似度超过所述预设特征阈值的所述语音片段单元,确定为所述噪声单元;
将所述相似度不超过所述预设特征阈值的所述语音片段单元,确定为所述人声单元。


4.如权利要求3所述的语音人声分离方法,其特征在于,所述冻结各所述噪声单元,并从所述待分离语音数据中分离所述人声单元的步骤包括:
按照所述获取时间顺序,生成所述语音片段单元的时间轴信息;
从所述时间轴信息中提取所述噪声单元的第一时间轴标识和所述人声单元的第二时间轴标识;
基于所述时间轴信息和所述第一时间轴标识,冻结各所述噪声单元;
基于所述时间轴信息和所述第二时间轴标识,从所述待分离语音数据中分离所述人声单元。


5.如权利要求4所述的语音人声分离方法,其特征在于,所述从所述时间轴信息中提取所述噪声单元的第一时间轴标识和...

【专利技术属性】
技术研发人员:郑琳琳龙洪锋
申请(专利权)人:广州国音智能科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1