语音信号采集方法和移动终端技术

技术编号:9935992 阅读:121 留言:0更新日期:2014-04-18 14:51
一种语音信号采集方法,其特征在于,包括以下步骤:采集用户的语音信号,并根据所述语音信号维护所述用户对应的阀值信息;在进入语音识别模式之后,采集用户输入的语音输入信号;以及根据所述阀值信息判断所述语音输入信号中的采集开始点和采集结束点,以对所述采集开始点和所述采集结束点之间的语音输入信号进行识别。

【技术实现步骤摘要】
语音信号采集方法和移动终端
本专利技术涉及信息处理
,特别涉及一种语音信号采集方法和移动终端。
技术介绍
在语音识别过程中,客户端例如移动终端需要将采集的语音数据上传到服务端,由于传输的语音数据量较大,因此只需选择性地上传用户说话的语音数据即有效语音数据。目前,可以通过设置阈值,并判断语音能量与阈值的大小确定用户说话的开始点和结束点以确定用户说话的语音数据,例如语音能量小于阀值至语音能量大于阀值,可以确定为开始说话,语音能量大于阀值至语音能量小于阀值且持续一段时间状态不变,可以确定为结束说话,开始说话到结束说话之间产生的语音作即为有效语音数据。目前存在的问题是,设置的阀值不通用,容易受到多种因素的影响,不能准确划分有效语音数据,识别结果不精确,导致网络传输量大,用户体验差,例如受到用户群体的影响,有人说话声大,有人说话声小,又受到客户端系统的硬性,不同的硬件导致录音的音量不同,如果阀值设置太小会将背景音认为有效数据,影响识别结果,如果阀值定义太大,开始说话的时间点监测不准确等。
技术实现思路
本专利技术的目的旨在至少解决所述技术缺陷之一。为此,本专利技术的一个目的在于提出一种语音信号采集方法,该方法能够准确划分有效语音数据,提高识别结果准确率,减少网络传输数据量,提升用户体验。本专利技术的另一个目的在于提出一种移动终端。为达到所述目的,本专利技术第一方面的实施例公开了一种语音信号采集方法,包括以下步骤:采集用户的语音信号,并根据所述语音信号维护所述用户对应的阀值信息;在进入语音识别模式之后,采集用户输入的语音输入信号;以及根据所述阀值信息判断所述语音输入信号中的采集开始点和采集结束点,以对所述采集开始点和所述采集结束点之间的语音输入信号进行识别。根据本专利技术实施例的语音信号采集方法,通过用户的语音信号维护对应的阈值信息,使得阈值信息随着用户、环境等因素的不同而不同,根据阈值信息判断确定的语音输入信号中的采集开始点和采集结束点准确,能够准确划分有效语音数据,提高识别结果准确率,减少网络传输数据量,提升用户体验。为达到所述目的,本专利技术第二方面的实施例公开了一种移动终端,包括:维护模块,用于采集用户的语音信号,并根据所述语音信号维护所述用户对应的阀值信息;采集模块,用于进入语音识别模式之后,采集用户输入的语音输入信号;以及判断模块,用于根据所述阀值信息判断所述语音输入信号中的采集开始点和采集结束点,以对所述采集开始点和所述采集结束点之间的语音输入信号进行识别。根据本专利技术实施例的移动终端,通过维护模块根据用户的语音信号维护对应的阈值信息,使得阈值信息随着用户、环境等因素的不同而不同,根据阈值信息判断确定的语音输入信号中的采集开始点和采集结束点准确,能够准确划分有效语音数据,提高识别结果准确率,减少网络传输数据量,提升用户体验。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术所述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1为根据本专利技术一个实施例的语音信号采集方法的流程图;图2为根据本专利技术又一个实施例的信息推送方法的流程图;图3为根据本专利技术一个具体实施例的信息推送方法的流程图;图4为根据本专利技术又一个具体实施例的信息推送方法的流程图;图5为根据本专利技术一个实施例的移动终端的结构示意图;图6为根据本专利技术又一个实施例的移动终端的结构示意图;图7为根据本专利技术一个具体实施例的移动终端的结构示意图;以及图8为根据本专利技术又一个具体实施例的移动终端的结构示意图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能解释为对本专利技术的限制。相反,本专利技术的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。在本专利技术的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本专利技术的描述中,除非另有说明,“多个”的含义是两个或两个以上。流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本专利技术的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本专利技术的实施例所属
的技术人员所理解。下面参考附图描述根据本专利技术实施例的语音信号采集方法和移动终端。由于判断语音输入信号中的采集开始点和采集结束点的所需的阈值因为用户特性、硬件设备以及环境等因素的影响无法唯一确定,因此需要动态调整阈值,为此一种语音信号采集方法,包括以下步骤:采集用户的语音信号,并根据语音信号维护用户对应的阀值信息;在进入语音识别模式之后,采集用户输入的语音输入信号;以及根据阀值信息判断语音输入信号中的采集开始点和采集结束点,以对采集开始点和采集结束点之间的语音输入信号进行识别。图1为根据本专利技术一个实施例的语音信号采集方法的流程图。如图1所示,根据本专利技术实施例的语音信号采集方法包括下述步骤。步骤S101,采集用户的语音信号,并根据语音信号维护用户对应的阀值信息。具体地,首先在初始时设置基本阈值信息,然后采集用户的语音信息对基本阈值信息进行维护,例如,可在用户打电话时采集用户的语音信号,计算所采集的语音信号的平均能量值及背景语音能量值,从而更新基本阈值信息获得具有该用户个性的阀值信息,由此使得不同的用户对应不同的阀值信息。步骤S102,在进入语音识别模式之后,采集用户输入的语音输入信号。步骤S103,根据阀值信息判断语音输入信号中的采集开始点和采集结束点,以对采集开始点和采集结束点之间的语音输入信号进行识别。具体地,首先获取语音输入信号的能量值,能量值反映语音数据的自身特征,如声音大小、高低等,并将能量值与阈值信息进行比较以确定采集开始点和采集结束点。例如,将语音输入信号的能量值由小于阀值状态变为大于阀值状态的点记为采集开始点,语音输入信号的能量值由大于阀值状态变为小于阀值状态的点记为采集结束点。根据本专利技术实施例的语音信号采集方法,通过用户的语音信号维护对应的阈值信息,使得阈值信息随着用户、环境等因素的不同而不同,根据阈值信息判断确定的语音输入信号中的采集开始点和采集结束点准确,能够准确划分有效语音数据,提高识别结果准确率,减少网络传输数据量,提升用户体验。图2为根据本专利技术又一个实施例的语音信号采集方法的流程图。如图2所示,根据本专利技术实施例的语音信号采集方法包括下述步骤。步骤S201,采集用户的语音信号,并根据语音信号维护用户对应的阀值信息。具体地,首先在初始时设置基本阈值信息,然后采集用户的语音信息对基本阈值信息进行维护。步骤S202,对语音信号进行分析以获得用户的声纹信息,并建立声纹信息与阀值信息之间的对应关系。其中,声纹信息具有特定性且相对稳定,每个用户对应的声纹信息是不变的,根据声纹信息与阈值信息建立对应关系,可以区分不同的用户。步骤S203,在进入语音识别模式本文档来自技高网
...
语音信号采集方法和移动终端

【技术保护点】
一种语音信号采集方法,其特征在于,包括以下步骤:采集用户的语音信号,并根据所述语音信号维护所述用户对应的阀值信息;在进入语音识别模式之后,采集用户输入的语音输入信号;以及根据所述阀值信息判断所述语音输入信号中的采集开始点和采集结束点,以对所述采集开始点和所述采集结束点之间的语音输入信号进行识别。

【技术特征摘要】
1.一种语音信号采集方法,其特征在于,包括以下步骤:采集用户的语音信号,对所述语音信号进行分析以获得所述用户的声纹信息,并建立所述声纹信息与阀值信息之间的对应关系;在进入语音识别模式之后,采集用户输入的语音输入信号,并根据所述语音输入信号获得对应的声纹信息;根据所述语音输入信号对应的声纹信息查找对应的阀值信息;以及根据所述阀值信息判断所述语音输入信号中的采集开始点和采集结束点,以对所述采集开始点和所述采集结束点之间的语音输入信号进行识别。2.如权利要求1所述的语音信号采集方法,其特征在于,所述阀值信息为绝对阀值信息,所述绝对阀值信息为所述用户的语音信号的平均能量值。3.如权利要求2所述的语音信号采集方法,其特征在于,所述根据阀值信息判断所述语音输入信号中的采集开始点和采集结束点进一步包括:对所述语音输入信号进行采样,并计算每个采样点的能量值;如果采样点且后续采样点的能量值大于所述绝对阀值信息,且判断所述采样点为采集开始点,并且在所述采集开始点之后如果采样点且后续采样点的能量值小于所述绝对阀值信息,且判断所述采样点为采集结束点。4.如权利要求1所述的语音信号采集方法,其特征在于,所述阀值信息为相对阀值信息,所述相对阀值信息为所述用户的语音信号的平均能量值与背景语音能量值之差。5.如权利要求4所述的语音信号采集方法,其特征在于,所述根据阀值信息判断所述语音输入信号中的采集开始点和采集结束点进一步包括:对所述语音输入信号进行采样,并计算每个采样点的能量值;计算采样点与相邻后续采样点之间的能量值之差;如果相邻采样点与相邻后续采样点之间的能量值之差大于所述相对阀值信息,则判断所述采样点为采集开始点或采集...

【专利技术属性】
技术研发人员:刘俊启
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1