智能交互系统及方法技术方案

技术编号:11950911 阅读:212 留言:0更新日期:2015-08-26 19:37
本发明专利技术公开了一种智能交互系统及方法,该系统包括:音频接收模块,实时处理模块,执行模块;所述音频接收模块用于接收用户输入的音频信息;所述实时处理模块用于对所述音频信息进行并行在线实时处理,所述并行在线实时处理包括:对所述音频信息进行分类处理及对应不同类型的识别处理,并且如果在音频输入结束之前得到可信的分类类型,则终止对应所述可信的分类类型之外类型的识别处理,获得对应所述可信的分类类型的识别结果,并将该识别结果传送给所述执行模块;所述执行模块用于根据所述实时处理模块传送的识别结果执行对应的操作。利用本发明专利技术,可以使用户方便、快捷地使用音频识别和语音交互功能,提升用户体验。

【技术实现步骤摘要】

本专利技术涉及人工智能
,具体涉及一种智能交互系统及方法
技术介绍
随着移动智能终端和信息网络技术的发展,人们对更方便、快捷、高效的智能人机交互方式的需求越来越强烈。比如人们可以以说话的形式向电子设备查询一些信息,比如天气、股票等;或命令电子设备做一些操作,如打电话、发短信等;又或者人们以哼唱或原声播放的形式,向电子设备查询、获取一些音频相关的信息,如音乐的名字、音乐的演唱者等。为此,一些智能交互产品相继出现,如以说话形式实现查询天气、打电话等交互的语音助手,以哼唱或原声形式实现音乐检索的音乐交互产品等。然而现有的智能交互产品一般只能单独支持以说话形式输入的语音交互,或者以哼唱、原声形式输入的音乐交互。用户在交互前需自行选定满足其需求的语音交互产品,甚至在选定产品后,在交互时,还需根据输入形式选定交互入口,如在一般的音乐查询检索产品中,用户需要首先选定是以哼唱还是原声形式输入的系统入口,然后才能完成人机交互过程。因此,现有的智能交互产品便捷性不强,用户体验不佳,无法满足用户对智能交互体验的追求。
技术实现思路
本专利技术实施例提供一种智能交互系统及方法,以使用户方便、快捷地使用音频识别和语音交互功能,提升用户体验。为此,本专利技术实施例提供如下技术方案:一种智能交互系统,包括:音频接收模块,实时处理模块,执行模块;所述音频接收模块,用于接收用户输入的音频信息;所述实时处理模块,用于对所述音频信息进行并行在线实时处理,所述并行在线实时处理包括:对所述音频信息进行分类处理及对应不同类型的识别处理,并且如果在音频输入结束之前得到可信的分类类型,则终止对应所述可信的分类类型之外类型的识别处理,获得对应所述可信的分类类型的识别结果,并将该识别结果传送给所述执行模块;所述执行模块,用于根据所述实时处理模块传送的识别结果执行对应的操作。优选地,所述实时处理模块包括:分类处理模块,识别模块,检测模块,识别结果输出模块;所述分类处理模块,用于对所述音频信息进行分类处理;所述识别处理模块,用于对所述音频信息进行对应不同类型的识别处理;所述检测模块,用于检测所述分类处理模块是否得到可信的分类类型、所述识别处理模块是否得到对应所述可信的分类类型的识别结果、以及音频输入是否结束;在检测到所述分类处理模块得到可信的分类类型后,通知所述识别处理模块终止对应所述可信的分类类型之外类型的识别处理;所述识别结果输出模块,还用于根据所述检测模块的检测结果从所述识别处理模块获取所述可信的分类类型对应的识别结果,并将该识别结果传送给所述执行模块。优选地,所述检测模块,还用于在检测到所述分类处理模块得到可信的分类类型、并且检测到直到音频输入结束所述分类处理模块仍未得到可信的分类类型后,检测所述识别处理模块是否已得到识别结果,如果是,则通知所述识别结果输出模块输出所述识别结果。优选地,所述识别处理模块包括:语音识别引擎,用于对所述音频信息进行对应语音的语音识别处理;原声识别引擎,用于对所述音频信息进行对应原声的语音识别处理;哼唱识别引擎,用于对所述音频信息进行对应哼唱的语音识别处理。优选地,所述分类处理模块,具体用于判断所述音频信息是否为语音、原声、哼唱;所述识别结果输出模块在所述检测模块检测到所述分类处理模块得到的可信的分类类型为语音,并且在音频输入结束之后所述识别处理模块已得到语音的识别结果时,获取并输出对应语音的识别结果;在所述检测模块检测到所述分类处理模块得到的可信的分类类型为原声或哼唱,并且在音频输入结束之前所述识别处理模块得到原声或哼唱的识别结果时,获取并输出原声或哼唱的识别结果。优选地,所述分类处理模块,具体用于判断所述音频信息是否为语音、哼唱;所述识别结果输出模块在所述检测模块检测到所述分类处理模块得到的可信的分类类型为语音,并且在音频输入结束之后所述识别处理模块已得到语音的识别结果时,获取并输出对应语音的识识别结果;在所述检测模块检测到所述分类处理模块得到的可信的分类类型为哼唱,并且在音频输入结束之前所述识别处理模块得到哼唱的识别结果时,获取并输出所述哼唱的识别结果。优选地,所述检测模块,还用于在检测到所述分类处理模块直到音频输入结束的时间段内未得到可信的分类类型,但在该时间段内所述识别处理模块已得到对应原声或哼唱的识别结果时,触发所述识别结果输出模块输出对应原声或哼唱的识别结果;所述识别结果输出模块,还用于根据所述检测模块的触发获取对应原声或哼唱的识别结果,并将该识别结果传送给所述执行模块。一种智能交互方法,包括:接收用户输入的音频信息;对所述音频信息进行并行在线实时处理,所述并行在线实时处理包括:对所述音频信息进行分类处理及对应不同类型的识别处理;如果在音频输入结束之前得到可信的分类类型,则终止对应所述可信的分类类型之外类型的识别处理,获得对应所述可信的分类类型的识别结果;执行所述识别结果对应的操作。优选地,所述方法还包括:如果直到音频输入结束后仍未得到可信的分类类型,则检测是否已得到识别结果;如果是,则获得所述识别结果,然后执行所述识别结果对应的操作;否则,确定音频输入异常。优选地,所述对所述音频信息进行对应不同类型的语音识别处理包括:对所述音频信息分别进行对应语音、原声、哼唱的识别处理。优选地,所述对所述音频信息进行分类处理包括:判断所述音频信息是否为语音、原声、哼唱;所述获得对应所述可信的分类类型的识别结果包括:如果所述可信的分类类型为语音,则在音频输入结束之后获得对应语音的识别结果;如果所述可信的分类类型为原声或哼唱,并且在音频输入结束之前得到原声或哼唱的识别结果时,获取所述原声或哼唱的识别结果。优选地,所述对所述音频信息进行分类处理包括:判断所述音频信息是否为语音、哼唱;所述获取所述可信的分类类型对应的识别结果包括:如果所述可信的分类类型为语音,则在音频输入结束之后获得对应语音的识别结果;如果所述可信的分类类型为哼唱,并且在音频输入结束之前得到原声的识别结果时,获取所述原声的识别结果。优选地,所述方法还包括:如果在音频输入结束之前未得到可信的分类类型,则检测是否得到对应原声或哼唱的识别结果;如果是,则获取对应原声或哼唱的识别结果,并执行该识别结果对应的操作。本专利技术实施例提供的智能交互系统及方本文档来自技高网...

【技术保护点】
一种智能交互系统,其特征在于,包括:音频接收模块,实时处理模块,执行模块;所述音频接收模块,用于接收用户输入的音频信息;所述实时处理模块,用于对所述音频信息进行并行在线实时处理,所述并行在线实时处理包括:对所述音频信息进行分类处理及对应不同类型的识别处理,并且如果在音频输入结束之前得到可信的分类类型,则终止对应所述可信的分类类型之外类型的识别处理,获得对应所述可信的分类类型的识别结果,并将该识别结果传送给所述执行模块;所述执行模块,用于根据所述实时处理模块传送的识别结果执行对应的操作。

【技术特征摘要】
1.一种智能交互系统,其特征在于,包括:音频接收模块,实时处理模
块,执行模块;
所述音频接收模块,用于接收用户输入的音频信息;
所述实时处理模块,用于对所述音频信息进行并行在线实时处理,所述并
行在线实时处理包括:对所述音频信息进行分类处理及对应不同类型的识别处
理,并且如果在音频输入结束之前得到可信的分类类型,则终止对应所述可信
的分类类型之外类型的识别处理,获得对应所述可信的分类类型的识别结果,
并将该识别结果传送给所述执行模块;
所述执行模块,用于根据所述实时处理模块传送的识别结果执行对应的操
作。
2.根据权利要求1所述的系统,其特征在于,所述实时处理模块包括:
分类处理模块,识别模块,检测模块,识别结果输出模块;
所述分类处理模块,用于对所述音频信息进行分类处理;
所述识别处理模块,用于对所述音频信息进行对应不同类型的识别处理;
所述检测模块,用于检测所述分类处理模块是否得到可信的分类类型、所
述识别处理模块是否得到对应所述可信的分类类型的识别结果、以及音频输入
是否结束;在检测到所述分类处理模块得到可信的分类类型后,通知所述识别
处理模块终止对应所述可信的分类类型之外类型的识别处理;
所述识别结果输出模块,还用于根据所述检测模块的检测结果从所述识别
处理模块获取所述可信的分类类型对应的识别结果,并将该识别结果传送给所
述执行模块。
3.根据权利要求2所述的系统,其特征在于,
所述检测模块,还用于在检测到所述分类处理模块得到可信的分类类型、
并且检测到直到音频输入结束所述分类处理模块仍未得到可信的分类类型后,
检测所述识别处理模块是否已得到识别结果,如果是,则通知所述识别结果输
出模块输出所述识别结果。
4.根据权利要求2所述的系统,其特征在于,所述识别处理模块包括:
语音识别引擎,用于对所述音频信息进行对应语音的语音识别处理;
原声识别引擎,用于对所述音频信息进行对应原声的语音识别处理;
哼唱识别引擎,用于对所述音频信息进行对应哼唱的语音识别处理。
5.根据权利要求3所述的系统,其特征在于,
所述分类处理模块,具体用于判断所述音频信息是否为语音、原声、哼唱;
所述识别结果输出模块在所述检测模块检测到所述分类处理模块得到的
可信的分类类型为语音,并且在音频输入结束之后所述识别处理模块已得到语
音的识别结果时,获取并输出对应语音的识别结果;在所述检测模块检测到所
述分类处理模块得到的可信的分类类型为原声或哼唱,并且在音频输入结束之
前所述识别处理模块得到原声或哼唱的识别结果时,获取并输出原声或哼唱的
识别结果。
6.根据权利要求3所述的系统,其特征在于,
所述分类处理模块,具体用于判断所述音频信息是否为语音、哼唱;
所述识别结果输出模块在所述检测模块检测到所述分类处理模块得到的
可信的分类类型为语...

【专利技术属性】
技术研发人员:吴奎乔玉平胡国平胡郁刘庆峰
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1