语音处理方法、装置、电子设备和计算机可读介质制造方法及图纸

技术编号:26422457 阅读:18 留言:0更新日期:2020-11-20 14:18
本公开的实施例公开了语音处理方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:将待处理语音分割成至少一个语音片段,其中,上述语音片段是同一声源的一段语音起始到语音结束的片段;基于上述至少一个语音片段的聚类结果,生成至少一个第一语音;以上过程可以对目标语音进行一定精度的语音分割,为以下生成第二语音奠定了基础。对上述至少一个第一语音中的每个第一语音进行提特征提取,得到每个上述第一语音对应的声纹特征矢量;基于上述声纹特征矢量生成第二语音,其中,第二语音是同一声源的未混合语音。通过对上述第一语音进行特征提取,以及对第一语音进一个语音分离,得到更准确的第二语音,从而提升整体语音分割效果。

【技术实现步骤摘要】
语音处理方法、装置、电子设备和计算机可读介质
本公开的实施例涉及计算机
,具体涉及语音处理方法、装置、设备和计算机可读介质。
技术介绍
目前,在语音分离过程中,往往需要在一段给定的语音中分离出目标语音。目前,相关的做法可以是采用分割聚类方法来从一段给定语音中,得到目标语音。然而,采用分割聚类方法所得到的目标语音准确率不高。
技术实现思路
本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。本公开的一些实施例提出了语音处理方法、装置、电子设备和计算机可读介质,来解决以上
技术介绍
部分提到的技术问题。第一方面,本公开的一些实施例提供了一种语音处理方法,该方法包括:将待处理语音分割成至少一个语音片段,其中,上述语音片段是同一声源的一段语音起始到语音结束的片段;基于上述至少一个语音片段的聚类结果,生成至少一个第一语音,其中,上述第一语音包含同一声源的至少一个语音片段;对上述至少一个第一语音中的每个第一语音进行提特征提取,得到每个上述第一语音对应的声纹特征矢量;基于上述声纹特征矢量生成第二语音,其中,第二语音是同一声源的未混合语音。第二方面,本公开的一些实施例提供了一种语音处理装置,装置包括:分割单元,被配置成将待处理语音分割成至少一个语音片段,其中,上述语音片段是同一声源的一段语音起始到语音结束的片段;第一生成单元,被配置成基于上述至少一个语音片段的聚类结果,生成至少一个第一语音,其中,上述第一语音包含同一声源的至少一个语音片段;特征提取单元,被配置成对上述至少一个第一语音中的每个第一语音进行提特征提取,得到每个上述第一语音对应的声纹特征矢量;第二生成单元,被配置成基于上述声纹特征矢量生成第二语音,其中,上述第二语音是同一声源的未混合语音。第三方面,本公开的一些实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一的方法。第四方面,本公开的一些实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,程序被处理器执行时实现如第一方面中任一的方法。本公开的上述各个实施例中的一个实施例具有如下有益效果:首先,将待处理语音分割成至少一个语音片段,其中,上述语音片段是同一声源的一段语音起始到语音结束的片段;然后,基于上述至少一个语音片段的聚类结果,生成至少一个第一语音,其中,上述第一语音包含同一声源的至少一个语音片段;通过以上过程,可以对目标语音进行一定精度的语音分割,为以下生成第二语音奠定了基础。进一步,对上述至少一个第一语音中的每个第一语音进行提特征提取,得到每个上述第一语音对应的声纹特征矢量;基于上述声纹特征矢量生成第二语音,其中,第二语音是同一声源的未混合语音。通过对上述第一语音进行特征提取,以及对第一语音进一个语音分离,得到更准确的第二语音,从而提升整体语音分割效果。附图说明结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,元件和元素不一定按照比例绘制。图1是根据本公开的一些实施例的语音处理方法的一个应用场景的示意图;图2是根据本公开的语音处理方法的一些实施例的流程图;图3是根据本公开的语音处理方法的另一些实施例的流程图;图4是根据本公开的一些实施例的语音处理方法的另一个应用场景的示意图;图5是根据本公开的语音处理装置的一些实施例的结构示意图;图6是适于用来实现本公开的一些实施例的电子设备的结构示意图。具体实施方式下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例。相反,提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。下面将参考附图并结合实施例来详细说明本公开。图1是根据本公开一些实施例的语音处理方法的一个应用场景的示意图。如图1中标记100所示,电子设备101将包含多个说话人的待处理语音102按照每个说话人语音的语音起始点和语音结束点分割成9个语音片段。如图中片段1、片段2、片段3、片段4、片段5、片段6片段7、片段8和片段9。基于9个语音片段的聚类结果103,可以生成4个第一语音,如图中的第一语音A,第一语音B、第一语音C和第一语音D。对于这4个第一语音中的每个第一语音,提取每个第一语音的声纹特征,进而得到4个声纹特征矢量。如图中的声纹特征矢量A、声纹特征矢量B、声纹特征矢量C和声纹特征矢量D。对于4个声纹特征矢量中的每个声纹特征矢量,可以生成声纹特征矢量对应的第二语音。如图中的第二语音A,第二语音B、第二语音C和第二语音D。可以理解的是,语音处理方法可以是由上述电子设备101来执行。其中,电子设备101可以是硬件,也可以是软件。当电子设备101为硬件时,可以是具有信息处理能力的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、膝上型便携计算机、台式计算机、服务器等等。当电子设备101为软件时,可以安装在上述所列举的电子设备中。其可以实现成例如用来提供分布式服务的多个软件或软件模块,也可以实现成单个软件或软件模块。在此不做具体限定。应该理解,图1中的电子设备数目仅仅是示意性的。根据实现需要,可以具有任意数目的电子设备。继续参考图2,示出了根据本公开的语音处理方法的一些实施例的流程200。该语音处理方法,包括以下步骤:步骤201,将待处理语音分割成至少一个语音片段,其中,上述语音片段是同一声源的一段语音起始到语音结束的片段。在一些实施例中,语音处理方法的执行主体(例如图1所示的电子设备)可以使用多种方式将目标语音分割成至少一个语音片段。其中,所述待处理语音可以是任意一段语音。实践中,待处理语音可以是某次会议上包括多个说话人声音的语音。作为示例,上述执行主体可以本文档来自技高网...

【技术保护点】
1.一种语音处理方法,包括:/n将待处理语音分割成至少一个语音片段,其中,所述语音片段是同一声源的一段语音起始到语音结束的片段;/n基于所述至少一个语音片段的聚类结果,生成至少一个第一语音,其中,所述第一语音包含同一声源的至少一个语音片段;/n对所述至少一个第一语音中的每个第一语音进行提特征提取,得到每个所述第一语音对应的声纹特征矢量;/n基于所述声纹特征矢量生成第二语音,其中,所述第二语音是同一声源的未混合语音。/n

【技术特征摘要】
1.一种语音处理方法,包括:
将待处理语音分割成至少一个语音片段,其中,所述语音片段是同一声源的一段语音起始到语音结束的片段;
基于所述至少一个语音片段的聚类结果,生成至少一个第一语音,其中,所述第一语音包含同一声源的至少一个语音片段;
对所述至少一个第一语音中的每个第一语音进行提特征提取,得到每个所述第一语音对应的声纹特征矢量;
基于所述声纹特征矢量生成第二语音,其中,所述第二语音是同一声源的未混合语音。


2.根据权利要求1所述的方法,其中,所述基于所述至少一个语音片段的聚类结果,生成至少一个第一语音,包括:
将所述至少一个语音片段的聚类结果中的每个语音片段簇中的语音片段拼接成初始第一语音,生成对应所述至少一个语音片段的至少一个初始第一语音。


3.根据权利要求2所述的方法,其中,所述基于所述至少一个语音片段的聚类结果,生成至少一个第一语音,包括:
对于至少一个初始第一语音中的每一个初始第一语音,对所述初始第一语音进行分帧,得到语音帧集合,将所述语音帧集合中语音帧的聚类结果中的每个语音帧簇中的语音帧拼接,生成所述至少一个第一语音。


4.根据权利要求1所述的方法,其中,所述至少一个第一语音中的每一个第一语音包括以下至少一项:未混合语音,混合语音。


5.根据权利要求1所述的方法,其中,所述第一语音对应的声纹特征...

【专利技术属性】
技术研发人员:蔡猛
申请(专利权)人:北京字节跳动网络技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1