基于语音交互的富媒体展示方法及系统技术方案

技术编号:13883624 阅读:76 留言:0更新日期:2016-10-23 17:28
本发明专利技术公开了一种基于语音交互的富媒体展示方法,包括:获取用户输入的语音数据;对语音数据进行频域变换处理,得到语音数据的频谱特征,根据频谱特征查找预设的用户属性列表,得到用户的属性;将语音数据进行语义识别,获得语音数据的语义信息,根据语义信息查找并获取与语义信息相关的富媒体信息;按照预设的与用户属性对应的展示规则进行富媒体信息的展示。本发明专利技术还公开了一种基于语音交互的富媒体展示系统。所述基于语音交互的富媒体展示方法及系统,通过对语音数据进行频域变换处理,得到用户属性,使得能够根据用户属性实现语音交互的差异化处理,使富媒体的展示更具有针对性。通过获取语音相关的富媒体信息,提高语音交互的效率。

【技术实现步骤摘要】

本专利技术涉及语音处理及富媒体的展示
,特别是指一种基于语音交互的富媒体展示方法及系统
技术介绍
随着信息技术的不断发展,用户交互技术得到了广泛的应用。而语音交互作为继键盘交互、鼠标交互及触摸屏交互后的新一代用户交互模式,以其方便快捷的特点,逐渐被广大用户认可且有被大规模推广的潜在前景,而在这些相关的应用中,智慧语音业务及其相关功能相当具有吸引力。比如,智能移动终端上与语音相关的应用越来越多,而智能电视厂商也通过引用语音交互技术替换掉传统的手持遥控器。现有技术中语音交互基于语音识别技术,也即,语音交互系统在接收到一段语音后,首先对语音数据进行内容识别,得到内容识别结果,并根据该内容识别结果获知用户意图。之后,语音交互系统根据用户意图进行与该语音相对应的操作,或向终端用户返回与该语音相对应的信息。但是,现有的语音交互系统,一方面只能够识别语音数据中包含语义的差别,不能够实现对不同用户的差异化处理,另一方面,现有的语音交互系统其交互显示的效果非常单一,只有语音或者只有文字的交互,这对于那些想要获取更多信息资源的用户来说,功能和效果都不是特别理想。尤其针对于儿童的培养或教育方面,现有的交互系统无法满足儿童用户的使用需求。
技术实现思路
有鉴于此,本专利技术的目的在于提出一种基于语音交互的富媒体展示方法及系统,使富媒体的展示更具有针对性,提高语音交互展示的效果。基于上述目的本专利技术提供的一种基于语音交互的富媒体展示方法,包括:获取用户输入的语音数据;对所述语音数据进行频域变换处理,得到所述语音数据的频谱特征,根据所述频谱特征查找预设的用户属性列表,得到用户的属性;将所述语音数据进行语义识别,获得所述语音数据的语义信息,根据所述语义信息查找并获取与所述语义信息相关的富媒体信息;按照预设的与所述用户属性对应的展示规则进行富媒体信息的展示。优选的,所述获得所述语音数据的语义信息的步骤之后还包括:将所述语音数据转换为文字信息,在预设的时间内,将所述文字信息显示于界面中。优选的,所述对所述语音数据进行频域变换处理,得到所述语音数据的频谱特征的步骤之前还包括:根据所述语音数据判断当前用户是否为系统用户,若为系统用户,则获取与当前用户对应的预设用户信息;将所述语音数据进行语义识别,获得所述语音数据的语义信息,根据所述语义信息查找并获取与所述语义信息相关的富媒体信息;按照预设的与所述用户信息对应的展示规则进行富媒体信息的展示;若当前用户不是系统用户,则执行对所述语音数据进行频域变换处理,得到所述语音数据的频谱特征的步骤。优选的,所述按照预设的与所述用户属性对应的展示规则进行富媒体信息展示的步骤包括:按照富媒体信息中的展示规则进行富媒体文件的展示,其中,所述富媒体信息中包含富媒体文件信息和相应的展示规则信息,所述展示规则包括富媒体文件展示的顺序和展示的方式。优选的,所述按照预设的与所述用户属性对应的展示规则进行富媒体信息的展示的步骤之后还包括:根据所述富媒体信息,播放预设的语音引导信息;获取用户输入的新的语音数据;根据所述新的语音数据,展示所述新的语音数据对应的富媒体信息。优选的,所述根据所述语义信息查找并获取与所述语义信息相关的富媒体信息的步骤还包括:根据查找得到的富媒体信息,获取所述富媒体信息的属性特征;按照富媒体信息的属性特征以及用户的属性,查找并判断所述富媒体是否属于该用户属性下预设的屏蔽信息;若是,则过滤掉所述富媒体信息。本专利技术还提供了一种基于语音交互的富媒体展示系统,包括:数据获取模块,用于获取用户输入的语音数据;将获得得到的语音数据发送给属性查找模块和信息获取模块;属性查找模块,用于接收所述数据获取模块发送的语音数据,对所述语音数据进行频域变换处理,得到所述语音数据的频谱特征,根据所述频谱特征查找预设的用户属性列表,得到用户的属性;将得到的用户属性信息发送给信息展示模块;信息获取模块,用于接收所述数据获取模块发送的语音数据,将所述语音数据进行语义识别,获得所述语音数据的语义信息,根据所述语义信息查找并获取与所述语义信息相关的富媒体信息;将获取的富媒体信息发送给信息展示模块;信息展示模块,用于接收所述属性查找模块发送的用户属性信息以及所述信息获取模块发送的富媒体信息,按照预设的与所述用户属性对应的展示规则进行富媒体信息的展示。优选的,所述系统还包括文字展示模块;所述数据获取模块还用于,将得到的语音数据发送给所述文字展示模块;所述文字展示模块用于,接收所述数据获取模块发送的语音数据并将所述语音数据转换为文字信息,在预设的时间内,将所述文字信息显示于界面中。优选的,还包括:用户判断模块,所述数据获取模块还用于,将得到的语音数据发送给所述用户判断模块;所述用户判断模块用于,接收所述数据获取模块发送的语音数据,根据所述语音数据判断当前用户是否为系统用户,若为系统用户,则获取与当前用户对应的预设用户信息;将所述预设用户信息发送给信息展示模块;若当前用户不是系统用户,则将所述语音数据发送给属性查找模块;所述信息展示模块还用于,接收所述用户判断模块发送的预设用户信息,
按照预设的与所述预设用户信息对应的展示规则进行富媒体信息的展示。优选的,所述信息展示模块还用于,按照富媒体信息中的展示规则进行富媒体文件的展示,其中,所述富媒体信息中包含富媒体文件信息和相应的展示规则信息,所述展示规则包括富媒体文件展示的顺序和展示的方式。优选的,还包括:引导模块;所述信息展示模块还用于,根据所述富媒体信息向引导模块发送引导指令;所述引导模块用于,接收信息展示模块发送的引导指令,播放预设的语音引导信息;所述数据获取模块还用于,获取用户输入的新的语音数据;将所述新的语音数据发送给所述信息展示模块;所述信息展示模块还用于,接收所述数据获取模块发送的新的语音数据,根据所述新的语音数据,展示所述新的语音数据对应的富媒体信息。优选的,所述信息获取模块还用于,根据查找得到的富媒体信息,获取所述富媒体信息的属性特征;按照富媒体信息的属性特征以及用户的属性,查找并判断所述富媒体是否属于该用户属性下预设的屏蔽信息;若是,则过滤掉所述富媒体信息。从上面所述可以看出,本专利技术提供的基于语音交互的富媒体展示方法及系统,通过对语音数据进行频域变换处理,并利用频域变换处理得到的频谱特征获得用户的属性,进而能够根据用户的不同属性,实现语音交互的差异化处理,使富媒体的展示更具有针对性。也即,能够根据用户的不同属性,进而按照不同的展示规则进行富媒体的展示。同时,所述基于语音交互的富媒体展示方法及系统通过语义识别,能够查找并获取得到与语音数据相关的富媒体信息,进而提高了语音交互展示的信息数量和类型,使得语音交互展示的效率和效果大大提高。附图说明图1为本专利技术提供的基于语音交互的富媒体展示方法的一个实施例的流程图;图2为本专利技术提供的基于语音交互的富媒体展示方法的另一个实施例的流程图;图3为本专利技术提供的基于语音交互的富媒体展示系统的一个实施例的流程图;图4为本专利技术提供的基于语音交互的富媒体展示系统的另一个实施例的流程图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本专利技术进一步详细说明。需要说明的是,本专利技术实施例中所有使用“第本文档来自技高网
...

【技术保护点】
一种基于语音交互的富媒体展示方法,其特征在于,包括:获取用户输入的语音数据;对所述语音数据进行频域变换处理,得到所述语音数据的频谱特征,根据所述频谱特征查找预设的用户属性列表,得到用户的属性;将所述语音数据进行语义识别,获得所述语音数据的语义信息,根据所述语义信息查找并获取与所述语义信息相关的富媒体信息;按照预设的与所述用户属性对应的展示规则进行富媒体信息的展示。

【技术特征摘要】
1.一种基于语音交互的富媒体展示方法,其特征在于,包括:获取用户输入的语音数据;对所述语音数据进行频域变换处理,得到所述语音数据的频谱特征,根据所述频谱特征查找预设的用户属性列表,得到用户的属性;将所述语音数据进行语义识别,获得所述语音数据的语义信息,根据所述语义信息查找并获取与所述语义信息相关的富媒体信息;按照预设的与所述用户属性对应的展示规则进行富媒体信息的展示。2.根据权利要求1所述的方法,其特征在于,所述获得所述语音数据的语义信息的步骤之后还包括:将所述语音数据转换为文字信息,在预设的时间内,将所述文字信息显示于界面中。3.根据权利要求1所述的方法,其特征在于,所述对所述语音数据进行频域变换处理,得到所述语音数据的频谱特征的步骤之前还包括:根据所述语音数据判断当前用户是否为系统用户,若为系统用户,则获取与当前用户对应的预设用户信息;将所述语音数据进行语义识别,获得所述语音数据的语义信息,根据所述语义信息查找并获取与所述语义信息相关的富媒体信息;按照预设的与所述用户信息对应的展示规则进行富媒体信息的展示;若当前用户不是系统用户,则执行对所述语音数据进行频域变换处理,得到所述语音数据的频谱特征的步骤。4.根据权利要求1所述的方法,其特征在于,所述按照预设的与所述用户属性对应的展示规则进行富媒体信息展示的步骤包括:按照富媒体信息中的展示规则进行富媒体文件的展示,其中,所述富媒体信息中包含富媒体文件信息和相应的展示规则信息,所述展示规则包括富媒体文件展示的顺序和展示的方式。5.根据权利要求1所述的方法,其特征在于,所述按照预设的与所述用户属性对应的展示规则进行富媒体信息的展示的步骤之后还包括:根据所述富媒体信息,播放预设的语音引导信息;获取用户输入的新的语音数据;根据所述新的语音数据,展示所述新的语音数据对应的富媒体信息。6.根据权利要求1所述的方法,其特征在于,所述根据所述语义信息查找并获取与所述语义信息相关的富媒体信息的步骤还包括:根据查找得到的富媒体信息,获取所述富媒体信息的属性特征;按照富媒体信息的属性特征以及用户的属性,查找并判断所述富媒体是否属于该用户属性下预设的屏蔽信息;若是,则过滤掉所述富媒体信息。7.一种基于语音交互的富媒体展示系统,其特征在于,包括:数据获取模块,用于获取用户输入的语音数据;将获得得到的语音数据发送给属性查找模块和信息获取模块;属性查找模块,用于接收所述数据获取模块发送的语音数据,对所述语音数据进行频域变换处理,得到所述语音数据的频谱特征,根据所述频谱...

【专利技术属性】
技术研发人员:吴建国张珩沈韡刘超华
申请(专利权)人:乐视控股北京有限公司乐意互联智能科技北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1