一种语音命令处理方法以及系统技术方案

技术编号:10911020 阅读:99 留言:0更新日期:2015-01-14 18:15
本发明专利技术实施例公开了一种语音命令处理方法以及系统,用于提高用户语音命令输入的响应效率,改善用户体验。本发明专利技术实施例包括:获取用于业务请求的语音命令;根据语音命令,提取语音特征序列;根据预置的业务类别解码网络对语音命令进行解码,确定当前请求的业务类别;确定与业务类别相对应的业务解码网络;根据确定的业务解码网络对所述语音命令进行二次解码,确定语音命令的完整内容。

【技术实现步骤摘要】
【专利摘要】本专利技术实施例公开了一种语音命令处理方法以及系统,用于提高用户语音命令输入的响应效率,改善用户体验。本专利技术实施例包括:获取用于业务请求的语音命令;根据语音命令,提取语音特征序列;根据预置的业务类别解码网络对语音命令进行解码,确定当前请求的业务类别;确定与业务类别相对应的业务解码网络;根据确定的业务解码网络对所述语音命令进行二次解码,确定语音命令的完整内容。【专利说明】一种语音命令处理方法以及系统
本专利技术涉及通讯和计算机
,尤其是涉及一种语音命令处理方法以及系统。
技术介绍
在现有语音命令控制系统中,系统接收用户输入的语音命令信号并提取相应的声学特征序列;随后系统在预设的命令词解码网络中搜索相应于所述声学特征序列的最优路径,获取用户命令内容。所述预设的命令词解码网络通常由系统支持的所有语音命令及相应的语音命令参数确定。也就是说对用户的语音输入,系统需要在一个完整的命令词解码网络内计算所有可能路径的概率,确定最优的识别结果。显然随着语音命令控制系统支持的语音响应功能日益增多,解码网络规模也日渐扩大,在所述命令词解码网络内解码的运行效率也会受到一定影响。 特别是对用户简单的操作命令,如“打电话给张三”等,由于系统依然需要对所有语音命令及相关参数解码,从而耽误了时间,大大影响了用户体验;可一并参考图1所示的一种现有命令词解码网络的词级示意图,对用户的语音命令输入,系统需要从起始节点开始,逐帧计算所述提取的声学特征序列和所有语音命令及相关参数对应模型的相似度;如对“打电话给张三”的语音命令输入,系统需要在“打电话”命令相关的路径、“导航到”命令相关的路径、“点播”命令相关的路径及其他命令相关的路径构成的空间内计算声学特征序列的相似度。该传统系统在整体网络内解码的方式容易导致系统响应较慢,特别是对具有小规模语音参数的命令输入,其解码时间容易超过用户预期,进而影响用户体验。比如,对于用户语音输入“打电话给张三”的解码,系统分别将其和导航业务相关的命令参数(如一百万兴趣点(POI,Point of Interest)数据)以及电话业务相关的命令参数(如一千个人名参数)以及音乐业务相关的命令参数(如两千首歌)分别进行匹配,其系统的响应时间大约统计为一百万POI词条加一千个人名以及两千首歌的解码时间,影响了对命令的快速响应。此外在这种基于大规模解码网络解码的方式下,由于混淆词汇增多,其识别率可能也会受到一定的影响。
技术实现思路
本专利技术实施例提供了一种语音命令处理方法以及系统,用于提高用户语音命令输入的响应效率,改善用户体验。 本专利技术第一方面提供一种语音命令处理方法,其中,可包括: 获取用于业务请求的语音命令; 根据所述语音命令,提取语音特征序列; 根据预置的业务类别解码网络对所述语音命令进行解码,确定当前请求的业务类别; 确定与所述业务类别相对应的业务解码网络; 根据确定的业务解码网络对所述语音命令进行二次解码,确定所述语音命令的完整内容。 优选地,所述根据预置的业务类别解码网络对所述语音命令进行解码,确定当前请求的业务类别,包括: 在预置的业务类别解码网络内,搜索并确定与所述语音特征序列具有最大相似度的第一解码路径; 根据所述第一解码路径确定当前请求的业务类别。 优选地,所述根据确定的业务解码网络对所述语音命令进行二次解码,确定所述语音命令的完整内容,包括: 在确定的与所述业务类别相对应的业务解码网络内,选择并确定与所述语音特征序列具有最大相似度的第二解码路径; 根据所述第二解码路径确定所述语音命令的完整内容。 优选地,所述在确定的业务解码网络内对语音命令进行二次解码,确定所述语音命令的完整内容,包括: 获取经过预置的业务类别解码网络解码后的语音命令中关键词所对应的语音段信息; 获取与所述语音命令中命令参数部分对应的语音信号; 确定所述业务解码网络对应的业务参数解码网络; 在所述业务参数解码网络内对所述语音信号进行解码,选择并确定与所述语音特征序列具有最大相似度的第三解码路径; 根据所述第三解码路径确定所述语音信号所对应的语音命令参数。 根据所述语音段信息和所述语音命令参数,确定所述语音命令的完整内容。 本专利技术第二方面提供一种语音命令处理系统,其中,包括: 获取模块,用于获取用于业务请求的语音命令; 提取模块,用于根据所述语音命令,提取语音特征序列; 第一解码模块,用于根据预置的业务类别解码网络对所述语音命令进行解码,确定当前请求的业务类别; 确定模块,用于确定与所述业务类别相对应的业务解码网络; 第二解码模块,用于根据确定的业务解码网络对解码后的语音命令进行二次解码,确定所述语音命令的完整内容。 优选地,所述第一解码模块,具体用于在预置的业务类别解码网络内,搜索并确定具有与所述语音特征序列最大相似度的第一解码路径;根据所述第一解码路径确定当前请求的业务类别。 优选地,所述第二解码模块,具体用于在确定的与所述业务类别相对应的业务解码网络内,选择并确定与所述语音特征序列具有最大相似度的第二解码路径,所述业务解码网络为包含业务相关命令关键词和命令参数的解码网络;根据所述第二解码路径确定所述语音命令的完整内容。 优选地,所述第二解码模块,具体用于获取经过预置的业务类别解码网络解码后的语音命令中命令关键词所对应的语音段信息;获取与所述语音命令中命令参数部分对应的语音信号;在所述业务参数解码网络内对所述语音信号进行解码,选择并确定与所述语音特征序列具有最大相似度的第三解码路径;根据所述第三解码路径确定所述语音信号所对应的语音命令参数;根据所述语音段信息和所述语音命令参数,确定所述语音命令的完整内容。 从以上技术方案可以看出,本专利技术实施例提供的一种语音命令处理方法以及系统,具有以下优点:对获取的用于业务请求的语音命令进行首次解码,确定该请求的业务类另IJ,其后根据所述业务类别相对应的业务解码网络对所述语音命令进行二次解码,从而确定语音命令的完整内容;在与业务类别相对应的业务解码网络内进行二次解码,可实现对语音命令的快速响应,特别是提高了用于支持多种参数规模不等语音命令控制系统的实用性,也提高了词汇识别率。 【专利附图】【附图说明】 为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。 图1为本专利技术实施例提供的一种语音命令处理方法的流程示意图; 图2为本专利技术实施例提供的语音命令处理方法的另一流程示意图; 图3为本专利技术实施例提供的语音命令处理方法的另一流程示意图; 图4为本专利技术实施例提供的语音命令处理方法的另一流程示意图; 图5为本专利技术实施例中采用的解码网络搜索示意图; 图6为本专利技术实施例中对一种业务的响应示意图; 图7a为本专利技术实施例中一种业务相关的业务类别网络解码示意图; 图7b为本专利技术实施例中一种业务相关的业务网络解码示意图; 图8为本专利技术实施例中一种业务相关的业务参数解码网络示意图; 图9为本专利技术实施本文档来自技高网
...

【技术保护点】
一种语音命令处理方法,其特征在于,包括:获取用于业务请求的语音命令;根据所述语音命令,提取语音特征序列;根据预置的业务类别解码网络对所述语音命令进行解码,确定当前请求的业务类别;确定与所述业务类别相对应的业务解码网络;根据确定的业务解码网络对所述语音命令进行二次解码,确定所述语音命令的完整内容。

【技术特征摘要】

【专利技术属性】
技术研发人员:陈盛何婷婷刘俊峰马冰
申请(专利权)人:安徽科大讯飞信息科技股份有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1