一种语音关键词筛选方法、装置、出行终端、设备及介质制造方法及图纸

技术编号:23788340 阅读:38 留言:0更新日期:2020-04-15 01:12
本发明专利技术涉及一种语音关键词筛选方法、装置、出行终端、设备及存储介质,其中,该语音关键词筛选方法,包括:采集第一预定时间段内的声音;将所述声音识别转换成文本;按照预定的工作分类对语音识别结果分析识别出目标词汇;输出匹配识别的目标词汇。本发明专利技术实施例通过在录音或语音转换过程中,消除不必要的静音部分,降低数据处理的负担,同语音转换可以可有效降低环境噪音带来的干扰,有效提升语音识别效果,使得应用更为广泛。

A voice keyword screening method, device, travel terminal, equipment and media

【技术实现步骤摘要】
一种语音关键词筛选方法、装置、出行终端、设备及介质
本专利技术涉及语音识别
,具体涉及一种语音关键词筛选方法、装置、出行终端、设备及介质。
技术介绍
本部分向读者介绍可能与专利技术实施例的各个方面相关的
技术介绍
,相信能够向读者提供有用的背景信息,从而有助于读者更好地理解本专利技术实施例的各个方面。因此,可以理解,本部分的说明是用于上述目的,而并非构成对现有技术的承认。随着计算机计算能力的逐步提升,深度学习技术的快速发展,语音识别技术在近代飞跃发展,机器语音识别以及与人的交互能力与人与人之间的交流差距慢慢缩小。语音技术(SpeechTechnology)让计算机能听、能看、能说、能感觉,是未来人机交互的发展方向,其中语音成为未来最被看好的人机交互方式之一。随着语音技术的发展和交互体验的提升,用户也越来越乐于通过语音与电子设备进行交互,例如通过语音控制电子设备完成指定工作。语音作为信息传递的重要手段,在智能化时代必将成为人们关注的热点,目前,语音识别技术应用广泛,例如,手机语音服务助手、智能音箱、服务机器人等,虽然这些智能产品为我们的生活带来了便利,但其中也还有很大的提升空间,比如更强的噪声适应性,更多语言或者模式的支持。关键词识别技术是语音技术中的重要分支,用于对连续语音信号进行预定关键词的识别,即识别该连续语音信号中是否存在预定关键词,该技术在电子设备唤醒、对话交互界面初始化、音频索引和检索、以及语音密码验证等方面均有着广泛的应用。语音关键词检测是从音频数据流中识别出特定语音关键词,以及确定该关键词出现的起止时间点的技术。当前主流的解决方案有两种,一类是将音频中的语音识别为文本,再从文本中检索出特定关键词的与语种相关的语音关键词检测;另一类是直接将音频数据逐段与关键词语音样例进行声学特征似然度匹配检索的与语种无关的语音关键词检测。在具备大量语言学先验知识基础的前提下,语种相关关键词检测方案的检测性能明显好于语种无关关键词检测方案,但对于小语种或小范围使用的密语等缺少大量语言学先验知识的场景下,只能选择语种无关关键词检测方案。现有的语音关键词检测由于声源环境复杂多样等特点,而且语音数据又严重受短波、超短波等侦察信道高噪声的干扰。由于传统声学特征对带噪且时长很短的语音不鲁棒,直接通过声学特征似然度匹配进行检测往往效果不理想,降低关键词识别正确率。
技术实现思路
要解决的技术问题是如何提供一种语音关键词筛选方法、装置、出行终端、设备及介质。针对现有技术中的缺陷,本专利技术提供一种语音关键词筛选方法、装置、出行终端、设备及介质,可以有效降低环境噪音带来的干扰,有效提升语音识别效果。第一方面,本专利技术提供了一种语音关键词筛选方法,包括:采集第一预定时间段内的声音;将所述声音识别转换成文本;按照预定的工作分类对语音识别结果分析识别出目标词汇;输出匹配识别的目标词汇。可选地,所述采集第一预定时间段内的声音包括:按预定数量的采样点计算第二预定时间段内的能量根据所述能量确定当前音频信号是语音/噪音还是静音;根据静音持续的时间结束录音。可选地,所述第二预定时间为0.1s。可选地,所述静音持续的时间为0.5s。可选地,所述第一预定时间为1.5s。可选地,所述按照预定的工作分类对语音识别结果分析识别出目标词汇,包括:以不同的目标地点作为不同的模式,对识别结果进行模式分类;判断段音频信号中是否包含目标关键词。可选地,判断段音频信号中是否包含目标关键词,包括:再将文本转换成拼音,判断拼音中是否包含目标词汇的拼音。第二方面,本专利技术实施例还提供一种语音关键词筛选装置,包括:语音采集单元,用于采集第一预定时间段内的声音;语音转换单元,用于将所述声音识别转换成文本;语音分析单元,用于按照预定的工作分类对语音识别结果分析识别出目标词汇;语音输出单元,用于输出匹配识别的目标词汇。可选地,所述语音采集单元包括:语音采样模块,用于按预定数量的采样点计算第二预定时间段内的能量静音识别模块,用于根据所述能量确定当前音频信号是语音/噪音还是静音;录音控制单元,用于根据静音持续的时间结束录音。可选地,所述第二预定时间为0.1s。可选地,所述第一预定时间为1.5s。可选地,所述语音分析单元包括:语音分类模块,用于以不同的目标地点作为不同的模式,对识别结果进行模式分类;语音判断模块,用于判断该段音频信号中是否包含目标关键词。可选地,所述语音判断模块包括:转换模块,用于将文本转换成拼音,判断拼音中是否包含目标词汇的拼音。第三方面,本专利技术实施例还提供一种语音出行装置,其特征在于,所述装置包括上述的关键词筛选装置。第四方面,本专利技术实施例还提供一种电子设备,其特征在于,所述电子设备包括:一个或多个处理器;存储器,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述的一种语音出行方法。第五方面,本专利技术实施例还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现上述的一种语音关键词筛选方法。由上述技术方案可知,本专利技术实施例提供的一种语音关键词筛选方法、装置、出行终端、设备及介质,通过在录音或语音转换过程中,消除不必要的静音部分,降低数据处理的负担,同语音转换可以可有效降低环境噪音带来的干扰,有效提升语音识别效果,使得应用更为广泛。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单的介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术一个实施例中语音关键词筛选方法流程示意图;图2为图1所示的实施例中采集第一预定时间段内的声音流程示意图;图3为图1所示的实施例中按照预定的工作分类对语音识别结果分析识别出目标词汇流程示意图;图4为本专利技术一个实施例中语音关键词筛选装置结构示意图;图5为图4所示的实施例中语音采集单元结构示意图;图6为图4所示的实施例中语音分析单元结构示意图;图7为本专利技术一个实施例中运行本说明书实施例的电子设备一种硬件结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例提供一种语音关键词筛选方法,如图1所示,该方法包括:采集第一预定时间本文档来自技高网
...

【技术保护点】
1.一种语音关键词筛选方法,其特征在于:包括:/n采集第一预定时间段内的声音;/n将所述声音识别转换成文本;/n按照预定的工作分类对语音识别结果分析识别出目标词汇;/n输出匹配识别的目标词汇。/n

【技术特征摘要】
20191206 CN 20191124287471.一种语音关键词筛选方法,其特征在于:包括:
采集第一预定时间段内的声音;
将所述声音识别转换成文本;
按照预定的工作分类对语音识别结果分析识别出目标词汇;
输出匹配识别的目标词汇。


2.根据权利要求1所述的关键词筛选方法,其特征在于,所述采集第一预定时间段内的声音包括:
按预定数量的采样点计算第二预定时间段内的能量;
根据所述能量确定当前音频信号是语音/噪音还是静音;
根据静音持续的时间结束录音。


3.根据权利要求1所述的关键词筛选方法,其特征在于,所述按照预定的工作分类对语音识别结果分析识别出目标词汇,包括:
以不同的目标地点作为不同的模式,对识别结果进行模式分类;
判断段音频信号中是否包含目标关键词。


4.一种语音关键词筛选装置,其特征在于:包括:
语音采集单元,用于采集第一预定时间段内的声音;
语音转换单元,用于将所述声音识别转换成文本;
语音分析单元,用于按照预定的工作分类对语音识别结果分析识别出目标词汇;
语音输出单元,用于输出匹配识别的目标词汇。


5.根据权利要求4所述的关键...

【专利技术属性】
技术研发人员:陈章芳
申请(专利权)人:广州易来特自动驾驶科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1