一种语音即时识别系统技术方案

技术编号:15128068 阅读:110 留言:0更新日期:2017-04-10 07:08
本发明专利技术提供了一种语音即时识别系统,包括语音输入模块,用于接收语音数据,还包括:第一识别模块,用于对接收到的所述语音数据进行第一模式语音识别,所述第一模式语音识别包括识别所述语音数据中是否包含第一语音识别信息;第二识别模块,当所述第一识别模块识别出所述语音数据中包含所述第一语音识别信息时,依据所述语音数据进行第二模式语音识别;响应模块,依据所述第二识别模块进行第二模式语音识别的结果,执行或者拒绝执行所述第一语音识别信息对应的操作。本发明专利技术的优点在于:本发明专利技术能够克服现有技术中语音识别时交互效率低下的缺陷。

【技术实现步骤摘要】

本申请涉及语音识别
,尤其涉及一种语音即时识别系统
技术介绍
随着电子产品的快速发展与普及,对电子产品的智能化应用程度也有了更高的要求。目前,语音识别技术为用户提供了人机语音交互模式来控制电子产品的快捷途径。用户可以通过特定的语音唤醒应用程序,说出设定的语音唤醒短语即可唤醒电子产品,并可根据语音提示的指令方便地进行拨号、浏览网页等进一步操作。另外,声纹识别是一种利用人的声音实现的语音识别技术,由于人在讲话时使用的发声器官存在一定的差异性,任何两个人声音的声纹图谱都有差异,因此,声纹可以作为表征个体差异的生物特征,也即可以通过建立声纹特征模型来表征不同的个体,进而利用该声纹特征模块进行识别不同的个体。本申请的专利技术人在实现本申请的过程中,发现现有技术至少存在如下技术缺陷:当前已实现的语音识别方案中,声纹识别和语音唤醒是分别独立应用的,例如,用户需要启用语音唤醒时,电子产品中的语音唤醒应用程序根据用户输入的语音数据,与预设的唤醒短语如“语音小助手”或者“语音小秘书”等进行匹配,如果用户输入的语音数据能够与预设的唤醒短语相匹配,则执行唤醒功能;否则,拒绝执行唤醒功能;之后,用户需要通过语音控制电子产品实现特定的操作时,需要再次输入相关的语音指令或语音信息,再通过电子产品中的声纹确认应用程序对用户输入的语音数据进行文本相关或者文本无关的声纹确认,如果声纹确认通过,则执行相应的指令操作,如果声纹确认未通过,则拒绝执行相应的指令操作。因此,上述的语音识别方案,存在用户交互效率低下,响应速度慢等缺陷或不足。
技术实现思路
本申请所要解决的技术问题是克服现有技术中语音识别时交互效率低下的缺陷。为了解决上述技术问题,本申请提供了一种语音即时识别系统,所述即时识别系统包括:语音输入模块,用于接收语音数据;第一识别模块,用于对接收到的所述语音数据进行第一模式语音识别,所述第一模式语音识别包括识别所述语音数据中是否包含第一语音识别信息;第二识别模块,当所述第一识别模块识别出所述语音数据中包含所述第一语音识别信息时,依据所述语音数据进行第二模式语音识别;响应模块,依据所述第二识别模块进行第二模式语音识别的结果,执行或者拒绝执行所述第一语音识别信息对应的操作。优化的,所述第二识别模块依据所述第一识别信息对所述语音数据进行的所述第二模式语音识别包括:预设命令相关的声纹确认;所述响应模块依据所述第二模式语音识别的结果,执行或者拒绝执行所述第一语音识别信息对应的操作是指:所述响应模块当所述预设命令相关的声纹的确认结果为通过时,执行所述第一语音识别信息对应的操作;当所述预设命令相关的声纹的确认结果为未通过时,拒绝执行所述第一语音识别信息对应的操作。优化的,所述电子产品还包括第三识别模块,所述第一识别模块还用于当识别出所述语音数据中包含所述第一语音识别信息以外的第二语音识别信息时,将所述第二语音识别信息发送给所述第三识别模块;所述第三识别模块用于依据所述第二语音识别信息进行第三模式语音识别;所述响应模块还用于当执行所述第一语音识别信息对应的操作前,接收所述第三识别模块进行所述第三模式语音识别的结果;依据所述第三模式语音识别的结果,执行或者拒绝执行所述第一语音识别信息对应的操作及所述第二语音识别信息对应的操作。优化的,所述第三识别模块依据所述第二语音识别信息进行的所述第三模式语音识别包括:预设命令无关的声纹确认;所述响应模块依据所述第三模式语音识别的结果,执行或者拒绝执行所述第一语音识别信息对应的操作及所述第二语音识别信息对应的操作是指:所述响应模块当所述预设命令无关的声纹的确认结果为通过时,执行所述第一语音识别信息对应的操作及所述第二语音识别信息对应的操作;当所述预设命令无关的声纹的确认结果为未通过时,拒绝执行所述第一语音识别信息对应的操作及所述第二语音识别信息对应的操作。优化的,所述电子产品还包括与所述第三识别模块相连的预设命令无关声纹确认模型训练模块;所述预设命令无关声纹确认模型训练模块用于依据特定场景的语音数据,对所述第三识别模块进行预设命令无关的声纹确认所采用的模型进行优化训练。优化的,所述的电子产品还包括:设置模块,用于根据第一指令设置或修改所述第一语音识别信息的集合,或者根据所述第一指令设置或修改所述第一语音识别信息与操作之间的对应关系。本专利技术的优点在于:用户可以利用语音识别信息进行预设命令相关的声纹确认和综合声纹确认,以保证只有特定用户的命令得到执行,从而避免独立的声纹确认步骤而产生的冗余交互,提高了交互效率;可以进行声纹确认匹配度的优化训练,提高声纹确认的性能和准确性。附图说明图1是本专利技术语音即时识别系统的组成示意图。图2是基于本专利技术的语音识别方法的示意图;具体实施方式为使本申请的目的、技术方案和优点更加清楚明白,下文中将结合附图对本申请的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。如图1所示,一种语音即时识别系统,包括如下主要功能模块/单元:语音输入模块21,用于接收语音数据;第一识别模块22,用于对接收到的所述语音数据进行第一模式语音识别,所述第一模式语音识别包括识别所述语音数据中是否包含第一语音识别信息;第二识别模块23,当所述第一识别模块识别出所述语音数据中包含所述第一语音识别信息时,依据所述语音数据进行第二模式语音识别;响应模块24,依据所述第二识别模块进行第二模式语音识别的结果,执行或者拒绝执行所述第一语音识别信息对应的操作。本实施例中,当语音输入中包含第一语音识别信息时,通过一次语音输入就可以完成对第一语音识别信息两种模式的语音识别,根据识别结果就能自动进行或拒绝进行第一语音识别信息对应的操作,整个过程无需用户进行冗余的操作,只要进行一次性的语音输入即可,简化了语音识别的过程。本实施例中,所述第一语音识别信息可以包括一个或多个,可以采用第一语音识别信息的集合的形式保存。每个第一语音识别信息可以对应于不同的操作,当然,也不排除几个第一语音识别信息对应于相同的操作的情况。如果所述语音数据的全部或部分与第一语音识别本文档来自技高网
...

【技术保护点】
一种语音即时识别系统,包括语音输入模块,用于接收语音数据,其特征在于,还包括:第一识别模块,用于对接收到的所述语音数据进行第一模式语音识别,所述第一模式语音识别包括识别所述语音数据中是否包含第一语音识别信息;第二识别模块,当所述第一识别模块识别出所述语音数据中包含所述第一语音识别信息时,依据所述语音数据进行第二模式语音识别;响应模块,依据所述第二识别模块进行第二模式语音识别的结果,执行或者拒绝执行所述第一语音识别信息对应的操作。

【技术特征摘要】
1.一种语音即时识别系统,包括语音输入模块,用于接收语音数据,其特
征在于,还包括:第一识别模块,用于对接收到的所述语音数据进行第一模式
语音识别,所述第一模式语音识别包括识别所述语音数据中是否包含第一语音
识别信息;第二识别模块,当所述第一识别模块识别出所述语音数据中包含所
述第一语音识别信息时,依据所述语音数据进行第二模式语音识别;响应模块,
依据所述第二识别模块进行第二模式语音识别的结果,执行或者拒绝执行所述
第一语音识别信息对应的操作。
2.如权利要求1所述的语音即时识别系统,其特征在于,所述第二识别模块
依据所述第一识别信息对所述语音数据进行的所述第二模式语音识别包括:
预设命令相关的声纹确认;
所述响应模块依据所述第二模式语音识别的结果,执行或者拒绝执行所述
第一语音识别信息对应的操作是指:
所述响应模块当所述预设命令相关的声纹的确认结果为通过时,执行所述
第一语音识别信息对应的操作;当所述预设命令相关的声纹的确认结果为未通
过时,拒绝执行所述第一语音识别信息对应的操作。
3.如权利要求2所述的语音即时识别系统,其特征在于,所述电子产品还包
括第三识别模块,所述第一识别模块还用于当识别出所述语音数据中包含所述
第一语音识别信息以外的第二语音识别信息时,将所述第二语音识别信息发送
给所述第三识别模块;
所述第三识别模块用于依据所述第二语音识别信息进行第三模式语音识
别;所述响应模块还用于当执行所述第一...

【专利技术属性】
技术研发人员:陈拥权李建中郑荣稳鲁加旺
申请(专利权)人:合肥寰景信息技术有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1