一种语音数据的处理方法及装置制造方法及图纸

技术编号:19595599 阅读:33 留言:0更新日期:2018-11-28 05:38
本发明专利技术实施例提供一种语音数据的处理方法及装置,所述方法包括:获得来自第一用户的操作信息;基于所述操作信息,确定第一用户对应的用户意图信息;如果所述用户意图信息用于指示播放来自第二用户的语音留言,基于所述用户意图信息,获取与所述用户意图信息对应的待播放的第一语音留言数据,其中,所述第一语音留言数据由第二用户录制;播放所述第一语音留言数据。如此,通过识别用户意图信息来获取待播放的语音留言数据并进行播放,能够丰富智能音频设备的功能和提高智能音频设备的智能程度。

【技术实现步骤摘要】
一种语音数据的处理方法及装置
本专利技术实施例涉及智能终端应用领域,尤其涉及一种语音数据的处理方法及装置。
技术介绍
随着智能家居、物联网的兴起,智能音箱、可穿戴设备等智能音频设备有了较大的发展,智能音频设备不仅能够与用户进行交互,而且具有语音播放的功能。目前,随着互联网的快速发展,智能音频设备所提供的语音数据播放功能多是采集用户输入的语音数据,从互联网中查找与该语音数据对应的反馈信息,如互联网网页中的音乐、互联网中的天气信息,在获取到反馈信息后,播放该反馈信息。但是,智能音频设备所提供的服务多是用户与互联网的交互服务,这种交互服务较为单一,而不能提供多个智能音频设备之间的留言录制和播放服务,也不能实现单独的留言录制和播放服务。在使用上述智能音频设备的过程中,专利技术人发现现有的智能音频设备没有语音留言信箱的功能,无法播放用户在其它设备或者当前设备上所录制的语音留言,存在功能较为单一、智能程度较低的技术问题。
技术实现思路
有鉴于此,本专利技术实施例提供一种语音数据的处理方法及装置,主要目的在于通过识别用户意图信息来播放其它设备或者当前设备中所录制的语音留言,能够提高音频设备的智能程度,并丰富音频设备的功能。为达到上述目的,本专利技术实施例主要提供如下技术方案:第一方面,本专利技术实施例提供一种语音数据的处理方法,所述方法包括:获得来自第一用户的操作信息;基于所述操作信息,确定第一用户对应的用户意图信息;如果所述用户意图信息用于指示播放来自第二用户的语音留言,基于所述用户意图信息,获取与所述用户意图信息对应的待播放的第一语音留言数据,其中,所述第一语音留言数据由第二用户录制;播放所述第一语音留言数据。第二方面,本专利技术实施例提供一种语音数据的处理装置,所述装置包括:获得单元,用于获得来自第一用户的操作信息;第一确定单元,用于基于所述操作信息,确定第一用户对应的用户意图信息;获取单元,用于如果所述用户意图信息用于指示播放来自第二用户的语音留言,基于所述用户意图信息,获取与所述用户意图信息对应的待播放的第一语音留言数据,其中,所述第一语音留言数据由第二用户录制;播放单元,用于播放所述第一语音留言数据。第三方面,本专利技术实施例提供一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述语音数据的处理方法的步骤。第四方面,本专利技术实施例提供一种智能音频设备,所述智能音频设备包括:至少一个处理器;以及与所述处理器连接的至少一个存储器、总线;其中,所述处理器、存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行上述语音数据的处理方法的步骤。本专利技术实施例提供的语音数据的处理方法及装置,在获得了来自第一用户的操作信息后,会根据该操作信息,来确定出第一用户所对应的用户意图信息;接下来,如果第一用户的用户意图信息是用于指示播放来自第二用户的语音留言的,就会基于该用户意图信息,来获取与所述用户意图信息对应的待播放的第一语音留言数据,其中,所述第一语音留言数据由第二用户录制;最后,会播放该第一语音留言数据。这样,通过识别用户意图信息来播放其它音频设备或者当前音频设备中所录制的语音留言数据,能够实现多个智能音频设备之间的留言录制和播放服务,也能实现单独的留言录制和播放服务,从而,提高音频设备的智能程度,并丰富音频设备的功能。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1为本专利技术实施例一中的语音搜索系统的结构示意图;图2为本专利技术实施例一中的语音数据的处理方法的流程示意图一;图3A为本专利技术实施例一中的语音数据的处理方法的流程示意图二;图3B为本专利技术实施例一中的语音数据的处理方法的流程示意图三;图4为本专利技术实施例二中的语音数据的处理装置的结构示意图;图5为本专利技术实施例三中的智能音频设备的结构示意图。具体实施方式下面将参照附图更详细地描述本专利技术的示例性实施例。虽然附图中显示了本专利技术的示例性实施例,然而应当理解,可以以各种形式实现本专利技术而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本专利技术,并且能够将本专利技术的范围完整的传达给本领域的技术人员。实施例一本专利技术实施例提供一种语音搜索系统,图1为本专利技术实施例一中的语音搜索系统的结构示意图,参见图1所示,该语音搜索系统10包括:总控中心(Controller)101、自动语音识别服务(ASR,AutomaticSpeechRecognition)模块102、问答(QA,QueryAnswer)服务模块103、对话管理(DM,DialogueManagement)模块104、客户端(Client)105和文本转语音(TTS,TexttoSpeech)服务模块106;其中,上述总控中心,用于根据客户端所发送的语音操作信息,通过调用系统中的其它服务模块确定该操作信息对应的用户意图信息,并搜索与该用户意图信息对应的待播放的语音留言数据。上述ASR服务模块,用于对总控中心所发送的语音操作信息进行语音识别,以将语音操作信息转换为文本识别结果,并将该文本识别结果发给总控中心。该ASR服务包括:流媒体服务(streamingserver)模块和recognizerserver(识别服务)模块,其中,streamingserver模块主要是对总控中心发送的语音操作信息做一些音频解码、采样率转换等音频处理,recognizerserver模块主要是将处理后的语音数据转换为文本(text)数据,同时在转换的过程中,向总控中心返回部分结果(partialresult)、短停顿(shortpause)、静音(silence)、最终结果(finalresult)等语音特征参数信息。上述QA服务模块,用于在接收到总控中心所发送的文本识别结果后,通过qa-api来调用DM模块来对文本识别结果进行语义分析,该qa-api是自然语言处理(NLP,NaturalLanguageProcessing)的入口服务。上述DM模块,用于做对话逻辑控制,在获得总控中心所发送的文本识别结果后,对该文本识别结果进行语义分析,确定出用户意图信息。该DM模块由查询分析(query-analysis)服务模块、缓存服务(cache-server)模块和自然语言生成(NLG,NaturalLanguageGeneration)服务模块来实现。其中,query-analysis服务模块主要是用于完成语义理解,包括意图分类和实体词抽取这两个功能,在实际应用中,query-analysis服务模块可以通过自然语言理解(NLU,Naturallaguageunderstanding)技术来实现;cache-server模块用于根据用户意图信息查询所需的语音留言数据,并存储查询结果,以便客户端所在的智能音频设备播放语音留言数据,在实际应用中,cache-server模块一方面可以将一些变动较小的数据预先存储,以提高检索速度,另一方面,还可以通过调用互联网搜索引擎,如onebox,来检索所需的搜索结果;NL本文档来自技高网...

【技术保护点】
1.一种语音数据的处理方法,其特征在于,所述方法包括:获得来自第一用户的操作信息;基于所述操作信息,确定第一用户对应的用户意图信息;如果所述用户意图信息用于指示播放来自第二用户的语音留言,基于所述用户意图信息,获取与所述用户意图信息对应的待播放的第一语音留言数据,其中,所述第一语音留言数据由第二用户录制;播放所述第一语音留言数据。

【技术特征摘要】
1.一种语音数据的处理方法,其特征在于,所述方法包括:获得来自第一用户的操作信息;基于所述操作信息,确定第一用户对应的用户意图信息;如果所述用户意图信息用于指示播放来自第二用户的语音留言,基于所述用户意图信息,获取与所述用户意图信息对应的待播放的第一语音留言数据,其中,所述第一语音留言数据由第二用户录制;播放所述第一语音留言数据。2.根据权利要求1所述的方法,其特征在于,所述基于所述用户意图信息,获取与所述用户意图信息对应的待播放的第一语音留言数据,包括:基于所述用户意图信息,确定所述第一语音留言数据对应的标识信息;从语音留言数据集中,将标签信息与所述标识信息相匹配的语音留言数据确定为所述第一语音留言数据。3.根据权利要求2所述的方法,其特征在于,所述基于所述用户意图信息,确定所述第一语音留言数据对应的标识信息,包括:对所述用户意图信息进行解析,判断所述用户意图信息是否满足预设条件,并生成判断结果;基于所述判断结果,按照预设策略,获取所述第一语音留言数据对应的用户标识信息,其中,所述用户标识信息为第一用户的第一用户标识信息和第二用户的第二用户标识信息中的至少一个;将所述用户标识信息确定为所述标识信息。4.根据权利要求3所述的方法,其特征在于,所述基于所述判断结果,按照预设策略,获取所述第一语音留言数据对应的用户标识信息,包括:如果所述判断结果表明所述用户意图信息满足第一预设条件,从所述用户意图信息中,提取所述第二用户标识信息;如果所述判断结果表明所述用户意图信息满足第二预设条件,从所述用户意图信息中,提取所述第一用户标识信息;如果所述判断结果表明所述用户意图信息满足第三预设条件,向所述第一用户展示与所述用户意图信息对应的预设提示信息,接收来自第一用户的响应信息;基于所述响应信息,获取所述第二用户标识信息和/或第一用户标识信息。5.根据权利要求1所述的方法,其特征在于,所述播放所述第一语音留言数据,包括:当所述操作信息为语音操作信息时,对所述语音操作信息进行声纹识别,获得第一用户的声纹特征;根据用...

【专利技术属性】
技术研发人员:林凤绿张驰叶顺平
申请(专利权)人:出门问问信息科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1