The embodiment of the invention provides a voice interaction method, an apparatus, a system, and a mobile terminal. The method includes: setting a corresponding relation between the picture material mobile command and interaction of keywords, the method also includes: a display picture material; recording user voice files, voice files to analyze user interaction analysis keywords; determine the picture material movement commands corresponding to the interactive keyword keyword analysis based on the interaction, and mobile command based on picture material the control of material moving picture. The embodiment of the invention can control the moving mode of the picture material by the user based on the voice, and effectively improve the interactive success rate of the picture material.
【技术实现步骤摘要】
本专利技术实施方式涉及信息处理
,更具体地,涉及一种语音交互方法、装置、系统和移动终端。
技术介绍
随着计算机技术和网络技术的飞速发展,互联网(Internet)和即时通信技术在人们的日常生活、学习和工作中发挥的作用也越来越大。而且,随着移动互联网的发展,互联网也在向移动化发展。当今社会已经进入了高度发达的信息时代,其企业竞争形态也已经由过去主要以产品功能质量为主的单一竞争形态转变为以企业形象、商品、品牌等作为重要手段和主要倾向的复合竞争形态。这种形态的转变与现代画面展示事业的迅速发展是分不开的。在传统的画面展示活动中,画面主、画面内容、画面内容受众、画面表现等基本要素都在一定的区域里反映着各个时期的文明程度。所有的这些图像元素,都在不同程度上作为一种文化反映着社会、经济的时代痕迹。在目前的画面展示方法中,通常由画面提供商自己直接提供画面素材,而且单向在网络上主动展示画面。然而,这种展示方式并没有考虑到画面受众的个人参与程度,因此 ...
【技术保护点】
一种语音交互方法,其特征在于,设置画面素材移动命令与交互关键字的对应关系,该方法还包括:展示画面素材;录制用户语音文件,分析所述用户语音文件以解析出交互关键字;根据解析出的所述交互关键字确定对应于该交互关键字的画面素材移动命令,并基于所确定的画面素材移动命令控制所述画面素材的移动。
【技术特征摘要】
1.一种语音交互方法,其特征在于,设置画面素材移动命令与交互关键字
的对应关系,该方法还包括:
展示画面素材;
录制用户语音文件,分析所述用户语音文件以解析出交互关键字;
根据解析出的所述交互关键字确定对应于该交互关键字的画面素材移动命
令,并基于所确定的画面素材移动命令控制所述画面素材的移动。
2.根据权利要求1所述的语音交互方法,其特征在于,所述分析用户语音
文件以解析出交互关键字包括:
获取语音训练文件和文本训练文件,并利用所述语音训练文件和文本训练
文件,对语音识别器采用语音自适应方式估计语音参数,并利用该已估计语音
参数的语音识别器识别所述用户语音文件,以将该用户语音文件转换为文本文
件;
从所述文本文件中检索交互关键字。
3.根据权利要求1所述的语音交互方法,其特征在于,所述分析用户语音
文件以解析出交互关键字包括:
确定该用户语音文件的语音波形图;
判断该用户语音文件的语音波形图中是否包含与交互关键字的语音波形保
持一致的波形区域,如果是,则基于该所包含的交互关键字的语音波形确定该
交互关键字。
4.根据权利要求1所述的语音交互方法,其特征在于,所述设置画面素材
移动命令与交互关键字的对应关系为:设置画面素材加速命令、画面素材减速
命令、画面素材启动命令、画面素材停止命令、画面素材移动速度保持命令、
或画面素材移动轨迹与交互关键字的对应关系。
5.根据权利要求1所述的语音交互方法,其特征在于,进一步设置画面素
材变更命令与画面素材变更关键字的对应关系;该方法还包括:
录制用户语音文件,分析所述用户语音文件以解析出画面素材变更关键字;
根据解析出的所述画面素材变更关键字确定对应于该画面素材变更关键字
的更新后画面素材,并展示所述更新后画面素材。
6.一种语音交互装置,其特征在于,包括对应关系设置单元、画面素材展
示单元、交互关键字解析单元和画面素材移动单元,其中:
对应关系设置单元,用于设置画面素材移动命令与交互关键字的对应关系;
画面素材展示单元,用于展示画面素材;
交互关键字解析单元,用于录制用户语音文件,分析所述用户语音文件以
解析出交互关键字;
画面素材移动单元,用于根据解析出的所述交互关键字确定对应于该交互
关键字的画面素材移动命令,并基于所确定的画面素材移动命令控制所述画面
素材的移动。
7.根据权利要求6所述的语音交互装置,其特征在于,
交互关键字解析单元,用于获取语音训练文件和文本训练文件,并利用所
述语音训练文件和文本训练文件,对语音识别器采用语音自适应方式估计语音
参数,并利用该已估计语音参数的语音识别器识别所述用户语音文件,以将该
用户语音文件转换为文本文件;从所述文本文件中检索交互关键字。
8.根据权利要求6所述的语音交互装置,其特征在于,
交互关键字解析单元,用于确定该用户语...
【专利技术属性】
技术研发人员:周彬,
申请(专利权)人:腾讯科技北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。