基于语音交互的富媒体展示方法及系统技术方案

技术编号：13883624 阅读：76 留言：0更新日期：2016-10-23 17:28

本发明专利技术公开了一种基于语音交互的富媒体展示方法，包括：获取用户输入的语音数据；对语音数据进行频域变换处理，得到语音数据的频谱特征，根据频谱特征查找预设的用户属性列表，得到用户的属性；将语音数据进行语义识别，获得语音数据的语义信息，根据语义信息查找并获取与语义信息相关的富媒体信息；按照预设的与用户属性对应的展示规则进行富媒体信息的展示。本发明专利技术还公开了一种基于语音交互的富媒体展示系统。所述基于语音交互的富媒体展示方法及系统，通过对语音数据进行频域变换处理，得到用户属性，使得能够根据用户属性实现语音交互的差异化处理，使富媒体的展示更具有针对性。通过获取语音相关的富媒体信息，提高语音交互的效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音处理及富媒体的展示
，特别是指一种基于语音交互的富媒体展示方法及系统。
技术介绍
随着信息技术的不断发展，用户交互技术得到了广泛的应用。而语音交互作为继键盘交互、鼠标交互及触摸屏交互后的新一代用户交互模式，以其方便快捷的特点，逐渐被广大用户认可且有被大规模推广的潜在前景，而在这些相关的应用中，智慧语音业务及其相关功能相当具有吸引力。比如，智能移动终端上与语音相关的应用越来越多，而智能电视厂商也通过引用语音交互技术替换掉传统的手持遥控器。现有技术中语音交互基于语音识别技术，也即，语音交互系统在接收到一段语音后，首先对语音数据进行内容识别，得到内容识别结果，并根据该内容识别结果获知用户意图。之后，语音交互系统根据用户意图进行与该语音相对应的操作，或向终端用户返回与该语音相对应的信息。但是，现有的语音交互系统，一方面只能够识别语音数据中包含语义的差别，不能够实现对不同用户的差异化处理，另一方面，现有的语音交互系统其交互显示的效果非常单一，只有语音或者只有文字的交互，这对于那些想要获取更多信息资源的用户来说，功能和效果都不是特别理想。尤其针对于儿童的培养或教育方面，现有的交互系统无法满足儿童用户的使用需求。
技术实现思路
有鉴于此，本专利技术的目的在于提出一种基于语音交互的富媒体展示方法及系统，使富媒体的展示更具有针对性，提高语音交互展示的效果。基于上述目的本专利技术提供的一种基于语音交互的富媒体展示方法，包括：获取用户输入的语音数据；对所述语音数据进行频域变换处理，得到所述语音数据的频谱特征，根据所述频谱特征查找预设的用户属性列表，得到用户...

【技术保护点】
一种基于语音交互的富媒体展示方法，其特征在于，包括：获取用户输入的语音数据；对所述语音数据进行频域变换处理，得到所述语音数据的频谱特征，根据所述频谱特征查找预设的用户属性列表，得到用户的属性；将所述语音数据进行语义识别，获得所述语音数据的语义信息，根据所述语义信息查找并获取与所述语义信息相关的富媒体信息；按照预设的与所述用户属性对应的展示规则进行富媒体信息的展示。

【技术特征摘要】
1.一种基于语音交互的富媒体展示方法，其特征在于，包括：获取用户输入的语音数据；对所述语音数据进行频域变换处理，得到所述语音数据的频谱特征，根据所述频谱特征查找预设的用户属性列表，得到用户的属性；将所述语音数据进行语义识别，获得所述语音数据的语义信息，根据所述语义信息查找并获取与所述语义信息相关的富媒体信息；按照预设的与所述用户属性对应的展示规则进行富媒体信息的展示。2.根据权利要求1所述的方法，其特征在于，所述获得所述语音数据的语义信息的步骤之后还包括：将所述语音数据转换为文字信息，在预设的时间内，将所述文字信息显示于界面中。3.根据权利要求1所述的方法，其特征在于，所述对所述语音数据进行频域变换处理，得到所述语音数据的频谱特征的步骤之前还包括：根据所述语音数据判断当前用户是否为系统用户，若为系统用户，则获取与当前用户对应的预设用户信息；将所述语音数据进行语义识别，获得所述语音数据的语义信息，根据所述语义信息查找并获取与所述语义信息相关的富媒体信息；按照预设的与所述用户信息对应的展示规则进行富媒体信息的展示；若当前用户不是系统用户，则执行对所述语音数据进行频域变换处理，得到所述语音数据的频谱特征的步骤。4.根据权利要求1所述的方法，其特征在于，所述按照预设的与所述用户属性对应的展示规则进行富媒体信息展示的步骤包括：按照富媒体信息中的展示规则进行富媒体文件的展示，其中，所述富媒体信息中包含富媒体文件信息和相应的展示规则信息，所述展示规则包括富媒体文件展示的顺序和展示的方式。5.根据权利要求1所述的方法，其特征在于，所述按照预设的与所述用户属性对应的展示规则进行富媒体信息的展示的步骤之后还包括：根据所述富媒体信息，播放预设的语音引导信息；获取用户输入的新的语音数据；根据所述新的语音数据，展示所述新的语音数据对应的富媒体信息。6.根据权利要求1所述的方法，其特征在于，所述根据所述语义信息查找并获取与所述语义信息相关的富媒体信息的步骤还包括：根据查找得到的富媒体信息，获取所述富媒体信息的属性特征；按照富媒体信息的属性特征以及用户的属性，查找并判断所述富媒体是否属于该用户属性下预设的屏蔽信息；若是，则过滤掉所述富媒体信息。7.一种基于语音交互的富媒体展示系统，其特征在于，包括：数据获取模块，用于获取用户输入的语音数据；将获得得到的语音数据发送给属性查找模块和信息获取模块；属性查找模块，用于接收所述数据获取模块发送的语音数据，对所述语音数据进行频域变换处理，得到所述语音数据的频谱特征，根据所述频谱...

【专利技术属性】
技术研发人员：吴建国，张珩，沈韡，刘超华，
申请(专利权)人：乐视控股北京有限公司，乐意互联智能科技北京有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人