The invention relates to a method for searching speech in a noisy environment, including recording a plurality of continuous speech; according to the energy value of each voice sample piece speech speech average value of energy and average energy of all speech piece value: get the energy value over the frame section and the average energy value of a speech the average energy from the sub frame section, the frame for sentence intermediate frames before and after scanning, if the pre order and post order frame frame energy threshold is less than the set voice average energy value, the frame and the middle frame by frame sentence initial sequence into independent judgment of the sentence; independent sentence frame length is short frame length range set; does not identify each frame of the audio noise obtained for sentence independent sentence as audio segmentation. The sound is recorded by the voice film, the initial time slices are sampled and the energy is calculated, and the results are judged according to the calculation results of the energy.
【技术实现步骤摘要】
一种嘈杂环境下特定目标语音端点搜索的方法
:本专利技术涉及语音处理领域,尤其涉及一种嘈杂环境下特定目标语音端点搜索的方法。
技术介绍
:随着语音识别技术的出现和日渐成熟,通过预先录入特定目标的声音样本,提取目标人物一无二的语音特征并保存在数据库中,应用时将待验证的声音与数据库中的特征进行匹配,从而决定所寻目标的身份。但是在嘈杂环境下和安静环境下的差异,经常无法判断准确,不能正确的截取有用的语音信息,甚至远远低于各种语音识别应用的最低限度,导致无法使用。
技术实现思路
:本专利技术为克服上述缺陷,提供了一种嘈杂环境下特定目标语音端点搜索的方法,其通过以语音片的方式对声音进行录制,对初始的若干时间片进行采样和能量计算,根据能量的计算结果判断语音的起点和终点,使之适应嘈杂环境和安静环境下的不同参数检测标准,从而自适应环境检测语音的端点。本专利技术采用的技术方案在于:一种嘈杂环境下特定目标语音端点搜索的方法,包括:步骤1:录制多个连续的语音片获取多个分帧段作为样本语音;步骤2:根据各分帧段的能量值计算样本语音中每个语音片的语音平均能量值和所有语音片的平均能量值;步骤3:从所述各分帧段中获取其能量值超过语音平均能量值和平均能量值的分帧段,则以该分帧段为句中间帧对该帧的前序帧或后序帧进行扫描,若前序帧或后序帧的能量阀值小于设定语音平均能量值,则将该帧与所述句中间帧按帧起始顺序合并成为独立句;步骤4:判断所述独立句的帧长是否为设定的短句帧长范围,若是,则将历史存储的短独立句标本与当前独立句进行对比,若匹配度低于设定值,则将独立句标识为噪音句;步骤5:将所述音频的各分帧段获得 ...
【技术保护点】
一种嘈杂环境下特定目标语音端点搜索的方法,其特征在于:包括:步骤1:录制多个连续的语音片获取多个分帧段作为样本语音;步骤2:根据各分帧段的能量值计算样本语音中每个语音片的语音平均能量值和所有语音片的平均能量值;步骤3:从所述各分帧段中获取其能量值超过语音平均能量值和平均能量值的分帧段,则以该分帧段为句中间帧对该帧的前序帧或后序帧进行扫描,若前序帧或后序帧的能量阀值小于设定语音平均能量值,则将该帧与所述句中间帧按帧起始顺序合并成为独立句;步骤4:判断所述独立句的帧长是否为设定的短句帧长范围,若是,则将历史存储的短独立句标本与当前独立句进行对比,若匹配度低于设定值,则将独立句标识为噪音句;步骤5:将所述音频的各分帧段获得的未标识为噪音句的独立句作为音频的断句。
【技术特征摘要】
1.一种嘈杂环境下特定目标语音端点搜索的方法,其特征在于:包括:步骤1:录制多个连续的语音片获取多个分帧段作为样本语音;步骤2:根据各分帧段的能量值计算样本语音中每个语音片的语音平均能量值和所有语音片的平均能量值;步骤3:从所述各分帧段中获取其能量值超过语音平均能量值和平均能量值的分帧段,则以该分帧段为句中间帧对该帧的前序帧或后序帧进行扫描,若前序帧或后序帧的能量阀值小于设定语音平均能量值,则将该帧与所述句中间帧按帧起始顺序合并成为独立句;...
【专利技术属性】
技术研发人员:王贺,杨兆鹏,李莉,
申请(专利权)人:哈尔滨理工大学,
类型:发明
国别省市:黑龙江,23
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。