一种嘈杂环境下特定目标语音端点搜索的方法技术

技术编号:16702052 阅读:47 留言:0更新日期:2017-12-02 14:51
本发明专利技术涉及一种嘈杂环境下特定目标语音端点搜索的方法,包括录制多个连续的语音片;根据能量值计算样本语音中每个语音片的语音平均能量值和所有语音片的平均能量值:从所述各分帧段中获取其能量值超过语音平均能量值和平均能量值的分帧段,以该分帧段为句中间帧进行前后扫描,若前序帧或后序帧的能量阀值小于设定语音平均能量值,则将该帧与所述句中间帧按帧起始顺序合并成为独立句;判断所述独立句的帧长是否为设定的短句帧长范围;将所述音频的各分帧段获得的未标识为噪音句的独立句作为音频的断句。通过以语音片的方式对声音进行录制,对初始的若干时间片进行采样和能量计算,根据能量的计算结果判断。

A method of endpoint search for specific target speech in noisy environment

The invention relates to a method for searching speech in a noisy environment, including recording a plurality of continuous speech; according to the energy value of each voice sample piece speech speech average value of energy and average energy of all speech piece value: get the energy value over the frame section and the average energy value of a speech the average energy from the sub frame section, the frame for sentence intermediate frames before and after scanning, if the pre order and post order frame frame energy threshold is less than the set voice average energy value, the frame and the middle frame by frame sentence initial sequence into independent judgment of the sentence; independent sentence frame length is short frame length range set; does not identify each frame of the audio noise obtained for sentence independent sentence as audio segmentation. The sound is recorded by the voice film, the initial time slices are sampled and the energy is calculated, and the results are judged according to the calculation results of the energy.

【技术实现步骤摘要】
一种嘈杂环境下特定目标语音端点搜索的方法
:本专利技术涉及语音处理领域,尤其涉及一种嘈杂环境下特定目标语音端点搜索的方法。
技术介绍
:随着语音识别技术的出现和日渐成熟,通过预先录入特定目标的声音样本,提取目标人物一无二的语音特征并保存在数据库中,应用时将待验证的声音与数据库中的特征进行匹配,从而决定所寻目标的身份。但是在嘈杂环境下和安静环境下的差异,经常无法判断准确,不能正确的截取有用的语音信息,甚至远远低于各种语音识别应用的最低限度,导致无法使用。
技术实现思路
:本专利技术为克服上述缺陷,提供了一种嘈杂环境下特定目标语音端点搜索的方法,其通过以语音片的方式对声音进行录制,对初始的若干时间片进行采样和能量计算,根据能量的计算结果判断语音的起点和终点,使之适应嘈杂环境和安静环境下的不同参数检测标准,从而自适应环境检测语音的端点。本专利技术采用的技术方案在于:一种嘈杂环境下特定目标语音端点搜索的方法,包括:步骤1:录制多个连续的语音片获取多个分帧段作为样本语音;步骤2:根据各分帧段的能量值计算样本语音中每个语音片的语音平均能量值和所有语音片的平均能量值;步骤3:从所述各分帧段中获取其能量值超过语音平均能量值和平均能量值的分帧段,则以该分帧段为句中间帧对该帧的前序帧或后序帧进行扫描,若前序帧或后序帧的能量阀值小于设定语音平均能量值,则将该帧与所述句中间帧按帧起始顺序合并成为独立句;步骤4:判断所述独立句的帧长是否为设定的短句帧长范围,若是,则将历史存储的短独立句标本与当前独立句进行对比,若匹配度低于设定值,则将独立句标识为噪音句;步骤5:将所述音频的各分帧段获得的未标识为噪音句的独立句作为音频的断句。进一步优选地,所述步骤3还包括:若所述独立句的帧长超出设定独立帧长,则计算该独立局每帧的谱熵比,以最低谱熵比所对应的帧作为分割点,将上述独立局风格为两个独立句。本专利技术的有益效果是:通过以语音片的方式对声音进行录制,对初始的若干时间片进行采样和能量计算,根据能量的计算结果判断语音的起点和终点,使之适应嘈杂环境和安静环境下的不同参数检测标准,从而自适应环境检测语音的端点。具体实施方式:下面将结合本专利技术,对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术的一种嘈杂环境下特定目标语音端点搜索的方法,包括:步骤1:录制多个连续的语音片获取多个分帧段作为样本语音。本专利技术可以安装在服务器上,也可以安装在个人计算机或移动计算设备上。所称的计算终端即可以是服务器,也可以是个人计算机,也可以是移动计算设备。首先,向服务器上传音视频文件,或者在个人计算机或者移动计算设备上打开音视频文件。之后,计算设备提取音视频文件里的音频流,将音频流统一到固定采样频率有符号单通道数据。之后采用预先设定的分帧参数,对数据进行分帧处理。步骤2:根据各分帧段的能量值计算样本语音中每个语音片的语音平均能量值和所有语音片的平均能量值。语音端点的检测基于语音的能量值实现,首先要计算单个语音片的语音平均能量值和所有语音片的平均能量值(每个语音片的语音平均能量值求和后除以语音片的个数)。步骤3:从所述各分帧段中获取其能量值超过语音平均能量值和平均能量值的分帧段,则以该分帧段为句中间帧对该帧的前序帧或后序帧进行扫描,若前序帧或后序帧的能量阀值小于设定语音平均能量值,则将该帧与所述句中间帧按帧起始顺序合并成为独立句;若所述独立句的帧长超出设定独立帧长,则计算该独立局每帧的谱熵比,以最低谱熵比所对应的帧作为分割点,将上述独立局风格为两个独立句。步骤4:判断所述独立句的帧长是否为设定的短句帧长范围,若是,则将历史存储的短独立句标本与当前独立句进行对比,若匹配度低于设定值,则将独立句标识为噪音句。步骤5:将所述音频的各分帧段获得的未标识为噪音句的独立句作为音频的断句。综上所述,上述各单元的协同工作,通过以语音片的方式对声音进行录制,对初始的若干时间片进行采样和能量计算,根据能量的计算结果判断语音的起点和终点,使之适应嘈杂环境和安静环境下的不同参数检测标准,从而自适应环境检测语音的端点。同时,动态修正背景噪音能量值,让背景噪音能量值匹配终端设备所处的真实环境,判断更加精确。以上所述,仅为本专利技术较佳的具体实施方式,这些具体实施方式都是基于本专利技术整体构思下的不同实现方式,而且本专利技术的保护范围并不局限于此,任何熟悉本
的技术人员在本专利技术揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本专利技术的保护范围之内。因此,本专利技术的保护范围应该以权利要求书的保护范围为准。本文档来自技高网
...

【技术保护点】
一种嘈杂环境下特定目标语音端点搜索的方法,其特征在于:包括:步骤1:录制多个连续的语音片获取多个分帧段作为样本语音;步骤2:根据各分帧段的能量值计算样本语音中每个语音片的语音平均能量值和所有语音片的平均能量值;步骤3:从所述各分帧段中获取其能量值超过语音平均能量值和平均能量值的分帧段,则以该分帧段为句中间帧对该帧的前序帧或后序帧进行扫描,若前序帧或后序帧的能量阀值小于设定语音平均能量值,则将该帧与所述句中间帧按帧起始顺序合并成为独立句;步骤4:判断所述独立句的帧长是否为设定的短句帧长范围,若是,则将历史存储的短独立句标本与当前独立句进行对比,若匹配度低于设定值,则将独立句标识为噪音句;步骤5:将所述音频的各分帧段获得的未标识为噪音句的独立句作为音频的断句。

【技术特征摘要】
1.一种嘈杂环境下特定目标语音端点搜索的方法,其特征在于:包括:步骤1:录制多个连续的语音片获取多个分帧段作为样本语音;步骤2:根据各分帧段的能量值计算样本语音中每个语音片的语音平均能量值和所有语音片的平均能量值;步骤3:从所述各分帧段中获取其能量值超过语音平均能量值和平均能量值的分帧段,则以该分帧段为句中间帧对该帧的前序帧或后序帧进行扫描,若前序帧或后序帧的能量阀值小于设定语音平均能量值,则将该帧与所述句中间帧按帧起始顺序合并成为独立句;...

【专利技术属性】
技术研发人员:王贺杨兆鹏李莉
申请(专利权)人:哈尔滨理工大学
类型:发明
国别省市:黑龙江,23

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1