一种基于语音识别的场景交互控制方法技术

技术编号:20847139 阅读:27 留言:0更新日期:2019-04-13 09:13
本发明专利技术提供一种基于语音识别的场景交互控制方法,包括:中央控制系统预建立快照库;中央控制系统的语音识别控制程序转变为激活状态后,中央控制系统的语音识别控制程序启动语音录制模块,录制来自于用户的语音命令;语音识别模块对所述语音命令进行意图识别,识别出以下四种类型中的一种:快照类型、选项类型、确认/取消类型和其他类型,并分别执行。优点为:本发明专利技术提供的一种基于语音识别的场景交互控制方法,将中央控制系统和语音识别技术结合,实现了用语言代替传统输入设备控制中央控制系统的功能,具有用户体验好的优点。

【技术实现步骤摘要】
一种基于语音识别的场景交互控制方法
本专利技术属于场景交互控制
,具体涉及一种基于语音识别的场景交互控制方法。
技术介绍
近年来,随着我国经济呈现出快速增长的态势,政府及企业会场的应用需求也逐渐从单一向多样化变化;会场应用涉及会议、调度控制、应急指挥、日常运营、集中监控等各种功能;会场设备种类繁多,例如,包括灯、音箱、拼接屏、电视、摄像机、投影仪、升降显示器、影碟机、矩阵、拼接屏处理器等设备。目前,会场控制主要方法为:根据每一种会场模式,对各类会场设备进行手动控制,例如,在某种会场模式下,分别控制灯的亮度、开启音箱、开启摄像机以及将显示器调节到某一高度,以满足会议需求。在另一种会场模式下,再分别控制灯的亮度、开启影碟机、将显示器调节到另一高度,以满足会议需求。上述会场控制方法具有以下问题:采用手工的方式,对各个被控设备进行控制和调节,具有控制效率低、工人工作量大的不足。
技术实现思路
针对现有技术存在的缺陷,本专利技术提供一种基于语音识别的场景交互控制方法,可有效解决上述问题。本专利技术采用的技术方案如下:本专利技术提供一种基于语音识别的场景交互控制方法,包括以下步骤:步骤1,中央控制系统预建立快照库;所述快照库存储若干条快照名称以及快照场景执行命令的对应关系;通过所述快照场景执行命令,所述中央控制系统对会场设备进行控制;语音识别控制程序为避免误操作,平时处于未被唤醒的休眠状态;此时,唤醒语监听程序持续为打开状态;主语音监听程序持续关闭状态;步骤2,所述唤醒语监听程序实时监听,判断是否监听到唤醒词;如果没有监听到唤醒词,则持续进行监听;如果监听到唤醒词,则执行步骤3;步骤3,中央控制系统关闭所述唤醒语监听程序,开启所述主语音监听程序,进而唤醒所述中央控制系统的语音识别控制程序,此时所述中央控制系统的语音识别控制程序转变为激活状态;步骤4,所述中央控制系统的语音识别控制程序启动语音录制模块,通过所述语音录制模块录制来自于用户的语音命令,并存储录制到的所述语音命令;同时,在所述语音录制模块录制所述语音命令的过程中,通过显示模块显示语音音量波形;步骤5,所述语音录制模块将录制到的所述语音命令传输给语音识别模块;步骤6,所述语音识别模块对所述语音命令进行初步语音有效性识别,如果识别成功,则执行步骤7;如果未识别成功,则向用户反馈识别失败的提示信息;步骤7,所述语音识别模块对所述语音命令进行意图识别,识别出以下四种类型中的一种:快照类型、选项类型、确认/取消类型和其他类型;如果所述语音命令为快照类型,则通过快照类型子模块执行步骤8;如果所述语音命令为选项类型,则通过选项类型子模块执行步骤9;如果所述语音命令为确认/取消类型,则通过确认/取消类型子模块执行步骤10;如果所述语音命令为其他类型,则通过其他类型子模块执行步骤11;步骤8:通过快照类型子模块执行与快照类型对应的语音命令,包括以下步骤:步骤8.1,如果所述语音命令为快照类型,得到所述语音命令的识别度分数,并判断所述识别度分数是否超过阈值,如果没有超过,表明所述语音命令不够明确,则执行步骤8.2;如果超过,表明所述语音命令明确,则执行步骤8.3;步骤8.2,对所述语音命令进行进一步的识别结果唯一性判断,即:判断识别结果是否为多音情况,如果不是,则表明语音命令对应快照库里唯一读音的快照名称,并通过显示模块输出是否执行快照的进一步确认的提示信息,同时,在确认/取消上下文配置表中记录本次确认/取消的对象信息,然后由确认/取消类型子模块执行后续步骤;如果是,则表明语音命令对应快照库里多音的快照名称,并将多音的各个快照名称形成多音快照结果集合,并通过显示模块显示所述多音快照结果集合,同时,在选项上下文配置表中记录本次选项信息,并由所述选项类型子模块执行后续步骤;步骤8.3,对所述语音命令进行进一步的识别结果唯一性判断,即:判断识别结果是否为多音情况,如果不是,则表明语音命令对应快照库里唯一读音的快照名称,并直接执行与所述快照名称对应的快照场景命令;如果是,则表明语音命令对应快照库里多音的快照名称,并将多音的各个快照名称形成多音快照结果集合,并通过显示模块显示所述多音快照结果集合,同时,在选项配置表中记录本次选项信息,并由所述选项类型子模块执行后续步骤;每当所述选项上下文配置表存储选项信息后,当任意下一条来自于用户的语音命令被执行后,即清空所述选项上下文配置表;每当所述确认/取消上下文配置表存储确认/取消的对象信息后,当任意下一条来自于用户的语音命令被执行后,即清空所述确认/取消上下文配置表;步骤9,通过选项类型子模块执行与选项类型对应的语音命令,包括以下步骤:如果所述语音命令为选项类型,首先查找所述选项上下文配置表,判断所述选项上下文配置表是否为空,如果不为空,表明存在与所述语音命令对应的上文信息,则根据所述选项上下文配置表中存储的所述选项信息以及所述语音命令,直接执行对应的快照场景命令;如果所述选项上下文配置表为空,则表明不存在上文信息,则通过显示模块输出语音识别失败的提示信息;步骤10,通过确认/取消类型子模块执行与确认/取消类型对应的语音命令,包括以下步骤:如果所述语音命令为确认/取消类型,首先查找所述确认/取消上下文配置表,判断所述确认/取消上下文配置表是否为空,如果不为空,表明存在与所述语音命令对应的上文信息,则根据所述确认/取消上下文配置表中存储的确认/取消的对象信息以及所述语音命令,直接执行对应的快照场景命令;如果所述确认/取消上下文配置表为空,则表明不存在上文信息,则通过显示模块输出语音识别失败的提示信息;步骤11,通过其他类型子模块执行与其他类型对应的语音命令,包括以下步骤:通过显示模块输出语音识别失败的提示信息。优选的,配置唤醒按钮,当所述唤醒按钮被点击时,手动将所述中央控制系统的语音识别控制程序从休眠状态唤醒为激活状态。优选的,通过显示模块输出语音识别失败的提示信息具体为:播放语音提示道歉语句,同时输出更换语音命令的提示类语句。优选的,步骤1中,所述中央控制系统所建立的快照库实时动态更新。优选的,所述中央控制系统对会场设备的控制方式包括:触摸点击屏幕、遥控笔按键触发和语音识别控制。本专利技术提供的一种基于语音识别的场景交互控制方法具有以下优点:本专利技术提供的一种基于语音识别的场景交互控制方法,将中央控制系统和语音识别技术结合,实现了用语言代替传统输入设备控制中央控制系统的功能,具有用户体验好的优点。附图说明图1为本专利技术提供的一种基于语音识别的场景交互控制方法的流程示意图。具体实施方式为了使本专利技术所解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。关键术语解释:被控设备:支撑现场业务大厅功能的基础设备,如大屏幕系统、中央空调、工作站、扩声系统、灯光管理模块等。场景模式(以下称为快照):为现场各被控设备进行组合控制在业务层面定义的名称,如应急模式、日常监控模式等。中央控制系统:控制系统是指对声、光、电等各种设备进行集中控制的设备。它应用于多媒体教室、多功能会议厅、指挥控制中心、智能化家庭等,用户可用按钮式控制面板、计算机显示器、触摸屏和无本文档来自技高网...

【技术保护点】
1.一种基于语音识别的场景交互控制方法,其特征在于,包括以下步骤:步骤1,中央控制系统预建立快照库;所述快照库存储若干条快照名称以及快照场景执行命令的对应关系;通过所述快照场景执行命令,所述中央控制系统对会场设备进行控制;语音识别控制程序为避免误操作,平时处于未被唤醒的休眠状态;此时,唤醒语监听程序持续为打开状态;主语音监听程序持续关闭状态;步骤2,所述唤醒语监听程序实时监听,判断是否监听到唤醒词;如果没有监听到唤醒词,则持续进行监听;如果监听到唤醒词,则执行步骤3;步骤3,中央控制系统关闭所述唤醒语监听程序,开启所述主语音监听程序,进而唤醒所述中央控制系统的语音识别控制程序,此时所述中央控制系统的语音识别控制程序转变为激活状态;步骤4,所述中央控制系统的语音识别控制程序启动语音录制模块,通过所述语音录制模块录制来自于用户的语音命令,并存储录制到的所述语音命令;同时,在所述语音录制模块录制所述语音命令的过程中,通过显示模块显示语音音量波形;步骤5,所述语音录制模块将录制到的所述语音命令传输给语音识别模块;步骤6,所述语音识别模块对所述语音命令进行初步语音有效性识别,如果识别成功,则执行步骤7;如果未识别成功,则向用户反馈识别失败的提示信息;步骤7,所述语音识别模块对所述语音命令进行意图识别,识别出以下四种类型中的一种:快照类型、选项类型、确认/取消类型和其他类型;如果所述语音命令为快照类型,则通过快照类型子模块执行步骤8;如果所述语音命令为选项类型,则通过选项类型子模块执行步骤9;如果所述语音命令为确认/取消类型,则通过确认/取消类型子模块执行步骤10;如果所述语音命令为其他类型,则通过其他类型子模块执行步骤11;步骤8:通过快照类型子模块执行与快照类型对应的语音命令,包括以下步骤:步骤8.1,如果所述语音命令为快照类型,得到所述语音命令的识别度分数,并判断所述识别度分数是否超过阈值,如果没有超过,表明所述语音命令不够明确,则执行步骤8.2;如果超过,表明所述语音命令明确,则执行步骤8.3;步骤8.2,对所述语音命令进行进一步的识别结果唯一性判断,即:判断识别结果是否为多音情况,如果不是,则表明语音命令对应快照库里唯一读音的快照名称,并通过显示模块输出是否执行快照的进一步确认的提示信息,同时,在确认/取消上下文配置表中记录本次确认/取消的对象信息,然后由确认/取消类型子模块执行后续步骤;如果是,则表明语音命令对应快照库里多音的快照名称,并将多音的各个快照名称形成多音快照结果集合,并通过显示模块显示所述多音快照结果集合,同时,在选项上下文配置表中记录本次选项信息,并由所述选项类型子模块执行后续步骤;步骤8.3,对所述语音命令进行进一步的识别结果唯一性判断,即:判断识别结果是否为多音情况,如果不是,则表明语音命令对应快照库里唯一读音的快照名称,并直接执行与所述快照名称对应的快照场景命令;如果是,则表明语音命令对应快照库里多音的快照名称,并将多音的各个快照名称形成多音快照结果集合,并通过显示模块显示所述多音快照结果集合,同时,在选项配置表中记录本次选项信息,并由所述选项类型子模块执行后续步骤;每当所述选项上下文配置表存储选项信息后,当任意下一条来自于用户的语音命令被执行后,即清空所述选项上下文配置表;每当所述确认/取消上下文配置表存储确认/取消的对象信息后,当任意下一条来自于用户的语音命令被执行后,即清空所述确认/取消上下文配置表;步骤9,通过选项类型子模块执行与选项类型对应的语音命令,包括以下步骤:如果所述语音命令为选项类型,首先查找所述选项上下文配置表,判断所述选项上下文配置表是否为空,如果不为空,表明存在与所述语音命令对应的上文信息,则根据所述选项上下文配置表中存储的所述选项信息以及所述语音命令,直接执行对应的快照场景命令;如果所述选项上下文配置表为空,则表明不存在上文信息,则通过显示模块输出语音识别失败的提示信息;步骤10,通过确认/取消类型子模块执行与确认/取消类型对应的语音命令,包括以下步骤:如果所述语音命令为确认/取消类型,首先查找所述确认/取消上下文配置表,判断所述确认/取消上下文配置表是否为空,如果不为空,表明存在与所述语音命令对应的上文信息,则根据所述确认/取消上下文配置表中存储的确认/取消的对象信息以及所述语音命令,直接执行对应的快照场景命令;如果所述确认/取消上下文配置表为空,则表明不存在上文信息,则通过显示模块输出语音识别失败的提示信息;步骤11,通过其他类型子模块执行与其他类型对应的语音命令,包括以下步骤:通过显示模块输出语音识别失败的提示信息。...

【技术特征摘要】
1.一种基于语音识别的场景交互控制方法,其特征在于,包括以下步骤:步骤1,中央控制系统预建立快照库;所述快照库存储若干条快照名称以及快照场景执行命令的对应关系;通过所述快照场景执行命令,所述中央控制系统对会场设备进行控制;语音识别控制程序为避免误操作,平时处于未被唤醒的休眠状态;此时,唤醒语监听程序持续为打开状态;主语音监听程序持续关闭状态;步骤2,所述唤醒语监听程序实时监听,判断是否监听到唤醒词;如果没有监听到唤醒词,则持续进行监听;如果监听到唤醒词,则执行步骤3;步骤3,中央控制系统关闭所述唤醒语监听程序,开启所述主语音监听程序,进而唤醒所述中央控制系统的语音识别控制程序,此时所述中央控制系统的语音识别控制程序转变为激活状态;步骤4,所述中央控制系统的语音识别控制程序启动语音录制模块,通过所述语音录制模块录制来自于用户的语音命令,并存储录制到的所述语音命令;同时,在所述语音录制模块录制所述语音命令的过程中,通过显示模块显示语音音量波形;步骤5,所述语音录制模块将录制到的所述语音命令传输给语音识别模块;步骤6,所述语音识别模块对所述语音命令进行初步语音有效性识别,如果识别成功,则执行步骤7;如果未识别成功,则向用户反馈识别失败的提示信息;步骤7,所述语音识别模块对所述语音命令进行意图识别,识别出以下四种类型中的一种:快照类型、选项类型、确认/取消类型和其他类型;如果所述语音命令为快照类型,则通过快照类型子模块执行步骤8;如果所述语音命令为选项类型,则通过选项类型子模块执行步骤9;如果所述语音命令为确认/取消类型,则通过确认/取消类型子模块执行步骤10;如果所述语音命令为其他类型,则通过其他类型子模块执行步骤11;步骤8:通过快照类型子模块执行与快照类型对应的语音命令,包括以下步骤:步骤8.1,如果所述语音命令为快照类型,得到所述语音命令的识别度分数,并判断所述识别度分数是否超过阈值,如果没有超过,表明所述语音命令不够明确,则执行步骤8.2;如果超过,表明所述语音命令明确,则执行步骤8.3;步骤8.2,对所述语音命令进行进一步的识别结果唯一性判断,即:判断识别结果是否为多音情况,如果不是,则表明语音命令对应快照库里唯一读音的快照名称,并通过显示模块输出是否执行快照的进一步确认的提示信息,同时,在确认/取消上下文配置表中记录本次确认/取消的对象信息,然后由确认/取消类型子模块执行后续步骤;如果是,则表明语音命令对应快照库里多音的快照名称,并将多音的各个快照名称形成多音快照结果集合,并通过显示模块显示所述多音快照结果集合,同时,在选项上下文配置表中记录本次选项信息,并由所述选项类型子模块执行后续步骤;...

【专利技术属性】
技术研发人员:钱苏晋门涛刘鹏董杰周金涛
申请(专利权)人:北京恒泰实达科技股份有限公司国网冀北电力有限公司智能配电网中心
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1