语音信号采集方法和移动终端技术

技术编号：9935992 阅读：121 留言：0更新日期：2014-04-18 14:51

一种语音信号采集方法，其特征在于，包括以下步骤：采集用户的语音信号，并根据所述语音信号维护所述用户对应的阀值信息；在进入语音识别模式之后，采集用户输入的语音输入信号；以及根据所述阀值信息判断所述语音输入信号中的采集开始点和采集结束点，以对所述采集开始点和所述采集结束点之间的语音输入信号进行识别。

全部详细技术资料下载

【技术实现步骤摘要】
语音信号采集方法和移动终端
本专利技术涉及信息处理
，特别涉及一种语音信号采集方法和移动终端。
技术介绍
在语音识别过程中，客户端例如移动终端需要将采集的语音数据上传到服务端，由于传输的语音数据量较大，因此只需选择性地上传用户说话的语音数据即有效语音数据。目前，可以通过设置阈值，并判断语音能量与阈值的大小确定用户说话的开始点和结束点以确定用户说话的语音数据，例如语音能量小于阀值至语音能量大于阀值，可以确定为开始说话，语音能量大于阀值至语音能量小于阀值且持续一段时间状态不变，可以确定为结束说话，开始说话到结束说话之间产生的语音作即为有效语音数据。目前存在的问题是，设置的阀值不通用，容易受到多种因素的影响，不能准确划分有效语音数据，识别结果不精确，导致网络传输量大，用户体验差，例如受到用户群体的影响，有人说话声大，有人说话声小，又受到客户端系统的硬性，不同的硬件导致录音的音量不同，如果阀值设置太小会将背景音认为有效数据，影响识别结果，如果阀值定义太大，开始说话的时间点监测不准确等。
技术实现思路
本专利技术的目的旨在至少解决所述技术缺陷之一。为此，本专利技术的一个目的在于提出一种语音信号采集方法，该方法能够准确划分有效语音数据，提高识别结果准确率，减少网络传输数据量，提升用户体验。本专利技术的另一个目的在于提出一种移动终端。为达到所述目的，本专利技术第一方面的实施例公开了一种语音信号采集方法，包括以下步骤：采集用户的语音信号，并根据所述语音信号维护所述用户对应的阀值信息；在进入语音识别模式之后，采集用户输入的语音输入信号；以及根据所述阀值信息判断所述语音输入...
语音信号采集方法和移动终端

【技术保护点】
一种语音信号采集方法，其特征在于，包括以下步骤：采集用户的语音信号，并根据所述语音信号维护所述用户对应的阀值信息；在进入语音识别模式之后，采集用户输入的语音输入信号；以及根据所述阀值信息判断所述语音输入信号中的采集开始点和采集结束点，以对所述采集开始点和所述采集结束点之间的语音输入信号进行识别。

【技术特征摘要】
1.一种语音信号采集方法，其特征在于，包括以下步骤：采集用户的语音信号，对所述语音信号进行分析以获得所述用户的声纹信息，并建立所述声纹信息与阀值信息之间的对应关系；在进入语音识别模式之后，采集用户输入的语音输入信号，并根据所述语音输入信号获得对应的声纹信息；根据所述语音输入信号对应的声纹信息查找对应的阀值信息；以及根据所述阀值信息判断所述语音输入信号中的采集开始点和采集结束点，以对所述采集开始点和所述采集结束点之间的语音输入信号进行识别。2.如权利要求1所述的语音信号采集方法，其特征在于，所述阀值信息为绝对阀值信息，所述绝对阀值信息为所述用户的语音信号的平均能量值。3.如权利要求2所述的语音信号采集方法，其特征在于，所述根据阀值信息判断所述语音输入信号中的采集开始点和采集结束点进一步包括：对所述语音输入信号进行采样，并计算每个采样点的能量值；如果采样点且后续采样点的能量值大于所述绝对阀值信息，且判断所述采样点为采集开始点，并且在所述采集开始点之后如果采样点且后续采样点的能量值小于所述绝对阀值信息，且判断所述采样点为采集结束点。4.如权利要求1所述的语音信号采集方法，其特征在于，所述阀值信息为相对阀值信息，所述相对阀值信息为所述用户的语音信号的平均能量值与背景语音能量值之差。5.如权利要求4所述的语音信号采集方法，其特征在于，所述根据阀值信息判断所述语音输入信号中的采集开始点和采集结束点进一步包括：对所述语音输入信号进行采样，并计算每个采样点的能量值；计算采样点与相邻后续采样点之间的能量值之差；如果相邻采样点与相邻后续采样点之间的能量值之差大于所述相对阀值信息，则判断所述采样点为采集开始点或采集...

【专利技术属性】
技术研发人员：刘俊启，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人