当前位置: 首页 > 专利查询>陈曦专利>正文

一种智能设备遥控装置及方法制造方法及图纸

技术编号:23433387 阅读:34 留言:0更新日期:2020-02-25 13:55
本发明专利技术涉及一种智能设备遥控装置及方法,遥控装置至少包括:控制模块,其被配置为根据所述第一目标指令信息与预设语音场景数据确定得到第一触发场景,基于所述第一触发场景启动显示条件关系分析,其中,所述显示条件关系分析至少包括获取在所述第一触发场景下与所述第一目标指令信息和/或第一悬浮窗提示信息相关的至少一个有效次数,并通过判断至少一个所述有效次数和与之相对应的次数阈值之间的逻辑关系生成与所述第一悬浮窗提示消息相关联的当前显示参数,所述当前显示参数用于指示所述控制模块控制智能设备在其预设区域显示所述第一悬浮窗提示消息的显示频率。

A remote control device and method for intelligent equipment

【技术实现步骤摘要】
一种智能设备遥控装置及方法
本专利技术涉及遥控
,尤其涉及一种智能设备遥控装置及方法。
技术介绍
家用电器发展的一个重要方面是让用户界面更加人性化,更加方便自然,做到老年人和残疾人可以无障碍地使用。利用语音识别技术实现语音控制是提高家电产品用户界面质量的一条重要途径。目前,基于深度学习的AI技术推动了各行业智能化的迅速发展。在电视领域,AI技术在智能电视中的作用逐步凸显,其中,远场语音交互就是一个典型应用。如何提升用户的电视场景交互体验,如何为用户提供更加智能便捷的服务,一直都是重点研究的方向。另外,AI服务从云端计算发展到边缘计算、端侧计算。利用电视本身的端侧的AI计算能力进行AI技术开发,又将会进一步提高用户使用的实时性和安全性。将设备连接到互联网的能力,与现代基于云的语音识别服务相结合,实现了强大的新用户界面-语音命令。智能手机、智能电视和机顶盒已经在使用语音命令。通过将低成本的麦克风集成到BLE连接的外围设备中,用户的语音识别体验可以大大增强。从遥控器、智能手表和可穿戴设备收集的命令,通过智能设备传输到云中的语音识别引擎,可以控制智能设备本身以及与智能设备相连的外围设备或由语音助理控制的其他设备。语音是一个非常强大和直观的命令界面,一个简单的短语可以包含足够的信息来描述非常复杂的命令,然而,在嘈杂的环境中捕捉短语并提取有实际意义的信息(通常以字符串的形式),这在技术上是一个挑战。幸运的是,产生这个需求的源头,即智能设备与互联网的连接,也为这一复杂问题提供了解决方案。设备现在可以访问云计算,并且可以受益于最先进的语音到文本识别引擎,如NuanceCommunications、微软、谷歌、亚马逊等公司提供的技术。如今,基于云的语音识别服务足以提供非常好的用户体验。近年来语音识别已取得很大进步,语音识别的领先者包括Nuance、Microsoft、Google、Amazon和其他许多公司。当我们使用Siri、Google、Alexa进行语音控制时,这些应用首先数字化我们的声音,然后发送到互联网上的某个处理中心,最后返回一个响应。通过永远在线的特性,从Google网页或者AndroidOS手机上简单地说“OKGoogle”就能够触发搜索,在搜索中,用户的语音命令被数字化、云处理,然后转换成用于搜索命令的文本。在电视市场中实现语音命令的关键因素是:智能电视已经连接到互联网,并且能够充分利用这一重要的基础设备。已经有了互联网连接的智能电视能够实现直接通过电视说话来控制电视,例如公开号为CN107958668A的专利文件公开的一种智能电视的声控选播方法,包括:S10、智能电视端语音命令提取模块获取特定的语音启动指令,开始降低当前播放节目的第一扬声器音量或调至静音,在预定时间内,智能电视端检测是否有具体的语音命令,如有,则至S20;如无,则调回当前播放节目的扬声器音量;S20、智能电视端获取具体的语音命令,将原始语音信号转换成语音脉冲序列,并通过语音识别提取语音特征矢量,判断该命令的具体类目,其中,所述类目包括操作指令的直接执行和操作指令通过第二扬声器的询问执行;S30、根据语音识别的结果输出相应的控制信号或向操作者进行当前状态的说明和询问。该方法设于智能电视端,通过特定的语音启动指令开启声控命令,语音操作方便、灵活。该专利文件提供的智能电视的声控选播方法基于设置在智能电视两端的扬声器而无需遥控器即可进行语音控制,使操作者在选台操作期间仍可收看当前的播放节目,不影响当前用户观看节目。但诸如上述直接通过电视说话来控制电视的解决方案同时带来了几个问题。首先,对于不通过遥控器而直接识别语音的智能电视来说,智能电视需要持续的监听。当前一些智能电视能够这样做,事实上也是这样做的;然而,这个功能的意想不到的后果是来自于可能泄露隐私的负面压力。当智能电视为获得命令而不断的监听和解码用户会话时,它就必须不断的发送这些谈话到互联网,如果用户语音数据实时上传,会给隐私带来严重挑战。终端用户一般不会注意到这个问题,如果他们注意到了,他们很可能会关闭这个功能,禁用语音控制。因此,拾音设备不能实时将获取的语音数据上传到云端处理,必须要相应的触发来分辨用户语音交互数据,才能将正确的数据进行上传。其次,是有关设备能力的问题,设备是否能够从周围噪声中挑选出命令声音,或者从电视音频或者背景会话中区分出语音命令。常规的现有远场语音交互包含有以下几个过程:1.通过远场拾音设备-阵列麦克风获取用户语音,进行回声消除、降噪、去混响等信号处理;2.判断用户是否有说唤醒词,识别到唤醒词后,设备给出声音、指示灯或界面的反馈,同时降低设备当前播放的声音甚至静音;3.根据VAD(语音端点检测)算法获取用户有效的语音指令的音频数据流,进行语音自动识别处理,实现语音到文本的转换;4.将文本进行自然语言处理,分析出用户指令,给出设备执行所需的意图;5.设备执行意图。因此智能电视的拾音设备中获取拾音设备中获取的语音数据,不仅仅包括用户语音交互数据,还包括电视本身发出的声音、用户可能与家人聊天时的声音,以及其它电视周围环境的声音。而当前的语音自动识别及语义处理都在云端服务器,如果所有语音数据上传到云端服务器之前,不设置限制条件,那么拾音设备获取的所有数据都将上传到云端,不仅会消耗很大的网络流量,也给云端的处理带来巨大的负担。针对诸如上述直接通过电视说话来控制电视的解决方案所带来的问题,相关研究提出了在遥控器上增加声控装置实现智能遥控电视的新解决方案,通过使用遥控器去启动和流化语音命令,用户就可以大大减少对这些问题的担忧,因为用户是主动和有意识地与电视机遥控器进行交互,并且用户手持遥控器,这样能够在近距离接收声音,而不是接收整个房间的声音。但在手持设备上实现语音识别实际上并不像想象的那样简单。执行语音识别所需要的处理能力和数据远超出了大多数遥控器、电视甚至智能手机的能力。事实上,当今智能手机上的语音识别是通过云计算完成的。例如,录制语音命令并链接到一个任务(例如拨打联系人列表中的号码)时,从理论上讲,用户可以说“拨打Ken的电话”,如果运气好,手机会“拨打Ken的电话”,不过,多数情况下,它会告诉用户“正在拨打Ben的电话”。传输语音命令与传输实时音频或人声(如电话交谈)略有不同。目前,在基于遥控器配合智能电视的语音搜索方案中,遥控器上通常都配有支持录音功能的麦克风(MIC,Microphone),由于遥控器中的麦克风不会一直处于录音模式,而需要智能电视,即智能电视端向遥控器下发用于触发打开或关闭MIC的指令。因此,打开或关闭MIC是否及时将决定录音数据的完整性。在已有技术中,控制遥控器中的麦克风(MIC,Microphone)开启或关闭的方式包括:用户按下遥控器语音按键后,遥控器直接控制打开MIC并录音,然后分析识别特定数据后发送给智能电视。用户通常使用遥控器对智能电视进行操作,虽然传统遥控器通过设置对应不同操作指令的多个按键而具有直观可见的优势,但往往由于其结构界面复杂按键功能不明确而不利于大多数用户使用。现有的语音控制遥控器取消了复杂按本文档来自技高网...

【技术保护点】
1.一种智能设备遥控装置,其用于控制至少一个与之关联的智能设备,其特征是,所述遥控装置至少包括:/n采集模块(4),其被配置为用于采集由用户输入的语音输入信号以及与该用户相关的第一用户信息,/n语音识别模块(5),其被配置为:响应于所述采集模块(4)得到用户相关的第一用户信息,启动从所述采集模块(4)获得的语音输入信号识别至少一个针对与所述遥控装置相关联的智能设备的第一目标指令信息;/n控制模块(6),其被配置为根据所述第一目标指令信息与预设语音场景数据确定得到第一触发场景,基于所述第一触发场景启动显示条件关系分析,其中,/n所述显示条件关系分析至少包括获取在所述第一触发场景下与所述第一目标指令信息和/或第一悬浮窗提示信息相关的至少一个有效次数,并通过判断至少一个所述有效次数和与之相对应的次数阈值之间的逻辑关系生成与所述第一悬浮窗提示消息相关联的当前显示参数,所述当前显示参数用于指示所述控制模块(6)控制智能设备(7)在其预设区域显示所述第一悬浮窗提示消息的显示频率。/n

【技术特征摘要】
1.一种智能设备遥控装置,其用于控制至少一个与之关联的智能设备,其特征是,所述遥控装置至少包括:
采集模块(4),其被配置为用于采集由用户输入的语音输入信号以及与该用户相关的第一用户信息,
语音识别模块(5),其被配置为:响应于所述采集模块(4)得到用户相关的第一用户信息,启动从所述采集模块(4)获得的语音输入信号识别至少一个针对与所述遥控装置相关联的智能设备的第一目标指令信息;
控制模块(6),其被配置为根据所述第一目标指令信息与预设语音场景数据确定得到第一触发场景,基于所述第一触发场景启动显示条件关系分析,其中,
所述显示条件关系分析至少包括获取在所述第一触发场景下与所述第一目标指令信息和/或第一悬浮窗提示信息相关的至少一个有效次数,并通过判断至少一个所述有效次数和与之相对应的次数阈值之间的逻辑关系生成与所述第一悬浮窗提示消息相关联的当前显示参数,所述当前显示参数用于指示所述控制模块(6)控制智能设备(7)在其预设区域显示所述第一悬浮窗提示消息的显示频率。


2.根据权利要求1所述的遥控装置,其特征是,所述控制模块(6)还被配置为调取由智能设备(7)所确定的与所述第一用户信息相关联的预设语音场景数据,并根据所述第一目标指令信息与所述预设语音场景数据确定第一触发场景;
根据所述第一触发场景与预设语音指令列表来确定用于提示用户可参考选择的第一有效操作,以此基于所述第一有效操作以及由所述显示条件关系分析所得到的当前显示参数,控制智能设备(7)在该智能设备(7)的预设区域显示与所述第一有效操作相关联的第一悬浮窗提示消息,所述预设区域以不影响用户持续观看所述智能设备(7)上的当前显示界面的方式,在预定时长内动态地显示所述第一悬浮窗提示消息。


3.根据前述权利要求之一所述的遥控装置,其特征是,所述第一目标指令信息至少包括所述语音识别模块(5)通过语音转文字的方式从所述语音输入信号中识别出的第一目标指令信息,所述控制模块(6)在所述语音识别模块(5)从所述语音输入信号中识别出一个或几个第一目标指令信息时,启动所述显示条件关系分析以判断所述第一目标指令信息与所述预设语音指令列表之间的匹配程度,其中,
当所述第一目标指令信息与所述预设语音指令列表中的至少一个有效操作之间的匹配程度满足预设匹配阈值时判断得到匹配成功,而当判断得到匹配失败时,获取该用户输入所述第一目标指令信息且在第二预设时长范围内该用户输入所述第一有效操作的第一次数,并通过判断所述第一次数是否满足第一阈值的方式确定第一关联关系,确定的所述第一关联关系用于指示所述控制模块(6)基于所述第一关联关系与所述第一用户信息,通过将所述第一目标指令信息与所述第一有效操作相绑定的方式,更新所述预设语音指令列表中的至少一个有效操作以及与所述第一悬浮窗提示消息相关联的当前显示参数,以使得所述预设语音指令列表能够在用户输入第一目标指令信息时与所述第一目标指令信息匹配成功。


4.根据前述权利要求之一所述的遥控装置,其特征是,所述采集模块(4)还被配置为用于采集用户按住设于所述遥控装置(1)上的语音输入按键时的接触信息以及与之相关联的第一时刻,所述控制模块(6)将接收到的所述接触信息与所述第一时刻传输至设于所述智能设备(7)上的处理模块(8),其中,
所述处理模块(8)响应于所述接触信息而在所述智能设备(7)的预设区域内显示与所述接触信息相动态关联的输入状态悬浮窗,并同时获取所述智能设备(7)上与所述第一时刻相对应的第一显示状态以及与所述第一时刻相关联的至少一个第二显示状态,基于所述第一显示状态和/或所述第二显示状态和/或所述第一用户信息确定至少一个所述预设语音场景数据,所述预设语音场景数据用于提示用户可参考选择的第二有效操作,并基于所述第二有效操作以及由所述显示条件关系分析所得到的当前显示参数,控制所述智能设备(7)在该智能设备(7)的输入状态悬浮窗周围显示与所述第二有效操作相关联的第二悬浮窗提示信息。


5.根据前述权利要求之一所述的遥控装置,其特征是,所述第一显示状态用于指示所述智能设备(7)在所述第一时刻时的显示界面的视频播放进度、显示界面亮度、视频画质、视频字幕语言、弹幕遮蔽显示界面情况、画面尺寸、广告信息中的一个或几个播放参数,
所述第二显示状态用于指示所述智能设备(7)在所述第一时刻之前的预设时长内至少一个播放参数的变化趋势,以及在所述第一时刻之后的预设时长内至少一个播放参数的变化...

【专利技术属性】
技术研发人员:陈曦惠婷
申请(专利权)人:陈曦
类型:发明
国别省市:贵州;52

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1