语音信号的处理方法和装置制造方法及图纸

技术编号:13080255 阅读:40 留言:0更新日期:2016-03-30 13:26
本发明专利技术提出一种语音信号的处理方法和装置,其中所述方法包括以下步骤:采集噪声样本信号;根据噪声样本信号对预存的纯净语音样本信号进行处理,得到具有噪声的噪声语音样本信号;根据噪声语音样本信号和纯净语音样本信号训练语音模型。本发明专利技术实施例的语音信号的处理方法,通过该语音模型可以大大提高在噪声环境下的语音识别的准确性,提升语音识别服务的鲁棒性和语音识别服务的体验。

【技术实现步骤摘要】

本专利技术涉及语音识别
,尤其涉及一种语音信号的处理方法以及一种语音信号的处理装置。
技术介绍
语音识别是指通过机器将人的语音自动转换为相应的文本。近年来,语音识别技术发展较为迅速,特别是深度神经网络被应用到语音识别之后,识别系统的性能得到了大幅度提尚。相关技术中,语音识别过程通过对大量纯净语音样本进行训练,得到声学模型和语言模型。训练样本越大,精确度越高,得到的声学模型效果越好,语音识别的准确率也就越尚。但随着移动互联网的发展,语音输入方式越来越普遍,语音使用人群也越来越广泛,而且每个用户使用的环境有很大差异,特别是在噪声环境下,比如汽车行驶过程中的车载噪声,在餐厅或者其他人群密集的地方产生的人群噪声等。而现有语音识别的训练缺乏噪声语音样本,同时噪声语音样本与纯净语音样本的声学特征差异很大,因此相关技术中的声学模型在安静环境下的语音识别的准确率很高,而在噪声环境下的语音识别的准确率将大大降低。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的第一个目的在于提出一种语音信号的处理方法,该方法大大提高了在噪声环境下的语音识别的准确性,提升语音识别服务的鲁棒性和语音识别服务的体验。本专利技术的第二个目的在于提出一种语音信号的处理装置。为达上述目的,本专利技术第一方面实施例提出了一种语音信号的处理方法,包括以下步骤:采集噪声样本信号;根据所述噪声样本信号对预存的纯净语音样本信号进行处理,得到具有噪声的噪声语音样本信号;根据所述噪声语音样本信号和所述纯净语音样本信号训练语首t旲型。本专利技术实施例的语音信号的处理方法,根据不同场景的噪声样本和纯净语音样本生成噪声语音样本,并根据噪声语音样本和纯净语音样本训练语音模型,从而能够通过该语音模型将各种噪声环境下的语音信号转换成安静环境下的语音信号,从而大大提高了在噪声环境下的语音识别的准确性,提升语音识别服务的鲁棒性和语音识别服务的体验。为达上述目的,本专利技术第二方面实施例提出了一种语音信号的处理装置,包括:第一采集模块,用于采集噪声样本信号;第一处理模块,用于根据所述噪声样本信号对预存的纯净语音样本信号进行处理,得到具有噪声的噪声语音样本信号;第一训练模块,用于根据所述噪声语音样本信号和所述纯净语音样本信号训练语音模型。本专利技术实施例的语音信号的处理装置,根据不同场景的噪声样本和纯净语音样本生成噪声语音样本,并根据噪声语音样本和纯净语音样本训练语音模型,从而能够通过该语音模型将各种噪声环境下的语音信号转换成安静环境下的语音信号,从而大大提高了在噪声环境下的语音识别的准确性,提升语音识别服务的鲁棒性和语音识别服务的体验。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。【附图说明】本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1是本专利技术一个实施例的语音信号的处理方法的流程图;图2是本专利技术一个具体实施例的语音信号的处理方法的流程图;图3是本专利技术另一个具体实施例的语音信号的处理方法的流程图;图4是本专利技术一个实施例的语音信号的处理装置的结构示意图;图5是本专利技术一个具体实施例的语音信号的处理装置的结构示意图;图6是本专利技术另一个实施例的语音信号的处理装置的结构示意图。【具体实施方式】下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本专利技术的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本专利技术的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本专利技术的实施例所属
的技术人员所理解。下面参考附图描述根据本专利技术实施例的语音信号的处理方法和装置。一种语音信号的处理方法,包括以下步骤:a、采集噪声样本信号;b、根据噪声样本信号对预存的纯净语音样本信号进行处理,得到具有噪声的噪声语音样本信号;C、根据噪声语音样本信号和纯净语音样本信号训练语音模型。图1是本专利技术一个实施例的语音信号的处理方法的流程图。如图1所示,语音信号的处理方法包括以下步骤:SlOl,采集噪声样本信号。具体地,采集在语音识别过程中可能出现的场景噪声以作为噪声样本信号,其中,场景噪声可以是在多个不同场景下采集得到,例如,采集汽车行驶过程中的车载噪声、采集在餐厅产生的人群噪声、或者采集其他人群密集的地方产生的人群噪声等作为噪声样本信号。进而,采集的噪声样本信号越多,在不同环境下对采集的语音信号进行处理的精确度就越高,语音识别的准确率就越高。S102,根据噪声样本信号对预存的纯净语音样本信号进行处理,得到具有噪声的噪声语音样本信号。其中,纯净语音样本信号为安静环境下的语音样本信号,即不包含噪声信号的语音信号。也就是说,通过采集的噪声样本信号对安静环境下的语音样本信号进行加噪处理,以得到噪声环境下的语音样本信号,即噪声语音样本信号。应当理解的是,对纯净语音样本信号进行加噪处理可以采用现有的处理方法,为了避免冗余,此处不再复赘。S103,根据噪声语音样本信号和纯净语音样本信号训练语音模型。在本专利技术的一个实施例中,根据噪声语音样本信号和纯净语音信号训练语音模型还包括:提取噪声语音样本信号和纯净语音样本信号的声学特征,并建立噪声语音样本信号的声学特征与纯净语音样本信号的声学特征的映射关系。具体地,可以通过提取噪声语音样本信号和纯净语音样本信号的声学特征,并通过回归神经网络建立噪声语音样本信号的声学特征到纯净语音样本信号的声学特征的映射,以得到语音模型。在语音识别过程中,由于语音模型是基于噪声语音样本信号获得,因此能够将噪声环境下的语音信号映射成安静环境下的语音信号,从而准确识别出噪声环境下的语音信号,提高了语音识别当前第1页1 2 3 4 本文档来自技高网
...

【技术保护点】
一种语音信号的处理方法,其特征在于,包括以下步骤:采集噪声样本信号;根据所述噪声样本信号对预存的纯净语音样本信号进行处理,得到具有噪声的噪声语音样本信号;根据所述噪声语音样本信号和所述纯净语音样本信号训练语音模型。

【技术特征摘要】

【专利技术属性】
技术研发人员:时雪煜李先刚邹赛赛
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1