语音操控方法和装置制造方法及图纸

技术编号:9545759 阅读:65 留言:0更新日期:2014-01-08 22:00
本发明专利技术公开了一种语音操控方法和装置,提升了移动互联和三网融合的各类应用的操作便捷度。其技术方案为:对语音进行采样后传输至机顶盒;机顶盒对采样的语音进行识别后转化成文字;机顶盒对转化后的文字进行语义识别,将文字分解成控制命令、应用名称和参数三部分;机顶盒基于分解出的应用名称查询是否已经在激活状态,根据控制命令控制应用的状态,并将参数送入应用进行操作。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种语音操控方法和装置,提升了移动互联和三网融合的各类应用的操作便捷度。其技术方案为:对语音进行采样后传输至机顶盒;机顶盒对采样的语音进行识别后转化成文字;机顶盒对转化后的文字进行语义识别,将文字分解成控制命令、应用名称和参数三部分;机顶盒基于分解出的应用名称查询是否已经在激活状态,根据控制命令控制应用的状态,并将参数送入应用进行操作。【专利说明】语音操控方法和装置
本专利技术涉及语音操控技术,尤其涉及针对移动互联网和三网融合的各类应用的语音操控方法和装置。
技术介绍
移动互联网技术和三网融合技术,使得业务及内容大爆发,这些业务和内容展现在最终用户手中后,用户的操控便利性是一个很大的难题。遥控器、鼠标、手指滑动、重力感应等操控手段层出不穷,但相对最自然的操控,还是语音控制。目前,由于语音识别技术不断成熟,利用语音进行操控的方式在各种终端中也不断出现。如何通过语音有效的操控机顶盒是目前亟待解决的问题。
技术实现思路
本专利技术的目的在于解决上述问题,提供了一种语音操控方法和装置,提升了移动互联和三网融合的各类应用的操作便捷度。本专利技术的技术方案为:本专利技术揭示了一种语音操控方法,包括:对语音进行采样后传输至机顶盒;机顶盒对采样的语音进行识别后转化成文字;机顶盒对转化后的文字进行语义识别,将文字分解成控制命令、应用名称和参数三部分;机顶盒基于分解出的应用名称查询是否已经在激活状态,根据控制命令控制应用的状态,并将参数送入应用进行操作。根据本专利技术的语音操控方法的一实施例,语音识别和语义识别由机顶盒的语音识别层实现。 根据本专利技术的语音操控方法的一实施例,应用的操作由机顶盒的应用管理器调用对应的应用来实现,应用管理器的调用由机顶盒的语音控制层完成。根据本专利技术的语音操控方法的一实施例,控制命令所控制的应用的状态包括打开/激活、关闭、失活、升级、卸载。本专利技术还揭示了一种语音操控装置,包括用户端装置和机顶盒,其中:用户端装置包括采样模块,对语音进行采样后传输至机顶盒;机顶盒包括语音识别模块、语义识别模块和应用调用模块,其中:语音识别模块对采样的语音进行识别后转化成文字;语义识别模块对转化后的文字进行语义识别,将文字分解成控制命令、应用名称和参数三部分;应用调用模块基于分解出的应用名称查询是否已经在激活状态,根据控制命令控制应用的状态,并将参数送入应用进行操作。根据本专利技术的语音操控装置的一实施例,控制命令所控制的应用的状态包括打开/激活、关闭、失活、升级、卸载。本专利技术对比现有技术有如下的有益效果:本专利技术的方案是在语音识别之后进行语义识别,将语音命令分解成控制命令、应用名称和参数,然后调用相应的应用进行处理。相较于传统技术,本专利技术可以推广到接受语音操控的数码终端,包括但不限于机顶盒、0ΤΤ、PAD、车载GPS等可以接受语音输入的用户终端。【专利附图】【附图说明】图1示出了本专利技术的语音操控方法的较佳实施例的流程图。图2示出了本专利技术的语音操控装置的较佳实施例的原理图。【具体实施方式】下面结合附图和实施例对本专利技术作进一步的描述。图1示出了本专利技术的语音操控方法的较佳实施例的流程。请参见图1,本实施例的语音操控方法的实施步骤详述如下。步骤SlO:对语音进行采样后传输至机顶盒。步骤S12:机顶盒的语音识别层对采样的语音进行识别后转化成文字。步骤S14:机顶盒的语音识别层对转化后的文字进行语义识别,将文字分解成控制命令、应用名称和参数三部分。例如,“打开电视到CCTV-1 ”,“打开”为控制,“电视”为电视应用,“CCTV-1 ”为传入电视应用的参数。为可动态增加应用的个数,此过程需要检索应用注册数据库。对于一个应用来说,控制状态有:打开/激活:应用未运行在内存中,打开后变成激活状态,或者应用处于失活挂起状态后,转变成当前应用状态;关闭:将指定应用转为关闭状态,释放资源;失活:从当前运行状态变成非当前状态,但仍然在内存中;升级:应用进行升级操作;卸载:删除应用;挂起;后台。挂起和后台这两种在普通用户看来基本用不上,因此只需要考虑前5种状态。从用户的角度看,用户的控制命令大致有这么几种:“看”电视,“玩”游戏,“查”天气,“查”资料,“打”电话,“发”短信,“输入”姓名,“保存”通信录。这些控制语言是在语音识别并转化成“控制” “应用” “参数”这个过程中需要涉及到的。基本上都是“打开/激活”的意思。应用名称是语音识别的第二部分,比如,“看电视到CCTV1”,其中的“电视”就是应用名称。应用名称在语音控制命令中有可能会被缩略,比如,用户会用“看CCTV1”代替说“看电视到CCTV1”,这时,需要根据控制参数来模糊判断应用名称。有些查不到应用名称的,可以跳出浏览器的搜索引擎来,直接按照查询信息的方式处理。例如“瑞士的首都是什么? ”等命令。参数是针对某一个应用的,传进去的是一个字符串,由特定应用去处理这个字符串,比如“看电视到CCTV1”的“CCTV1”就是应用参数。又比如“发微信给张三”,其中“张三”就是参数。还有一种参数,是在当前应用中的。例如,在当前应用是VOD的时候,用户发指令“找魔戒三”,应用本身则应该在影片搜索中输入“魔戒三”,之后开始搜索。步骤S16:机顶盒基于分解出的应用名称查询是否已经在激活状态,根据控制命令控制应用的状态,并将参数送入应用进行操作。机顶盒的语音控制层获取语音识别层交给的控制命令、应用名称和参数后,调用应用管理器。应用管理器根据应用是否已经在激活状态,控制应用的状态,并将参数送入应用进行操作。应用根据应用参数的处理,由各应用自己响应并展现。图2示出了本专利技术的语音操控装置的较佳实施例的原理,请参见图2,本实施例的语音操控装置包括用户端装置I和机顶盒2。用户端装置I包括采样模块10,对语音进行采样后传输至机顶盒2。机顶盒2包括语音识别模块21、语义识别模块22和应用调用模块23。语音识别模块21对采样的语音进行识别后转化成文字。语义识别模块22对转化后的文字进行语义识别,将文字分解成控制命令、应用名称和参数三部分,其中控制命令所控制的应用的状态包括打开/激活、关闭、失活、升级、卸载。应用调用模块23基于分解出的应用名称查询是否已经在激活状态,根据控制命令控制应用的状态,并将参数送入应用进行操作。上述实施例是提供给本领域普通技术人员来实现和使用本专利技术的,本领域普通技术人员可在不脱离本专利技术的专利技术思想的情况下,对上述实施例做出种种修改或变化,因而本专利技术的保护范围并不被上述实施例所限,而应该是符合权利要求书所提到的创新性特征的最大范围。【权利要求】1.一种语音操控方法,包括: 对语音进行采样后传输至机顶盒; 机顶盒对采样的语音进行识别后转化成文字; 机顶盒对转化后的文字进行语义识别,将文字分解成控制命令、应用名称和参数三部分; 机顶盒基于分解出的应用名称查询是否已经在激活状态,根据控制命令控制应用的状态,并将参数送入应用进行操作。2.根据权利要求1所述的语音操控方法,其特征在于,语音识别和语义识别由机顶盒的语音识别层实现。3.根据权利要求1所述的语音操控方法,其特征在于,应用的操作由机顶盒的应用管理器调用对应的应用来实现,应用管理器的调用由机顶盒的语音控制层完成。4.根据权利本文档来自技高网...

【技术保护点】
一种语音操控方法,包括:对语音进行采样后传输至机顶盒;机顶盒对采样的语音进行识别后转化成文字;机顶盒对转化后的文字进行语义识别,将文字分解成控制命令、应用名称和参数三部分;机顶盒基于分解出的应用名称查询是否已经在激活状态,根据控制命令控制应用的状态,并将参数送入应用进行操作。

【技术特征摘要】

【专利技术属性】
技术研发人员:张毅军徐征
申请(专利权)人:上海云视科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1