一种基于语音识别的场景交互控制方法技术

技术编号：20847139 阅读：27 留言：0更新日期：2019-04-13 09:13

本发明专利技术提供一种基于语音识别的场景交互控制方法，包括：中央控制系统预建立快照库；中央控制系统的语音识别控制程序转变为激活状态后，中央控制系统的语音识别控制程序启动语音录制模块，录制来自于用户的语音命令；语音识别模块对所述语音命令进行意图识别，识别出以下四种类型中的一种：快照类型、选项类型、确认/取消类型和其他类型，并分别执行。优点为：本发明专利技术提供的一种基于语音识别的场景交互控制方法，将中央控制系统和语音识别技术结合，实现了用语言代替传统输入设备控制中央控制系统的功能，具有用户体验好的优点。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于语音识别的场景交互控制方法
本专利技术属于场景交互控制
，具体涉及一种基于语音识别的场景交互控制方法。
技术介绍
近年来，随着我国经济呈现出快速增长的态势，政府及企业会场的应用需求也逐渐从单一向多样化变化；会场应用涉及会议、调度控制、应急指挥、日常运营、集中监控等各种功能；会场设备种类繁多，例如，包括灯、音箱、拼接屏、电视、摄像机、投影仪、升降显示器、影碟机、矩阵、拼接屏处理器等设备。目前，会场控制主要方法为：根据每一种会场模式，对各类会场设备进行手动控制，例如，在某种会场模式下，分别控制灯的亮度、开启音箱、开启摄像机以及将显示器调节到某一高度，以满足会议需求。在另一种会场模式下，再分别控制灯的亮度、开启影碟机、将显示器调节到另一高度，以满足会议需求。上述会场控制方法具有以下问题：采用手工的方式，对各个被控设备进行控制和调节，具有控制效率低、工人工作量大的不足。
技术实现思路
针对现有技术存在的缺陷，本专利技术提供一种基于语音识别的场景交互控制方法，可有效解决上述问题。本专利技术采用的技术方案如下：本专利技术提供一种基于语音识别的场景交互控制方法，包括以下步骤：步骤1，中央控制系统预建立快照库；所述快照库存储若干条快照名称以及快照场景执行命令的对应关系；通过所述快照场景执行命令，所述中央控制系统对会场设备进行控制；语音识别控制程序为避免误操作，平时处于未被唤醒的休眠状态；此时，唤醒语监听程序持续为打开状态；主语音监听程序持续关闭状态；步骤2，所述唤醒语监听程序实时监听，判断是否监听到唤醒词；如果没有监听到唤醒词，则持续进行监听；如果监听到唤醒词，...

【技术保护点】
1.一种基于语音识别的场景交互控制方法，其特征在于，包括以下步骤：步骤1，中央控制系统预建立快照库；所述快照库存储若干条快照名称以及快照场景执行命令的对应关系；通过所述快照场景执行命令，所述中央控制系统对会场设备进行控制；语音识别控制程序为避免误操作，平时处于未被唤醒的休眠状态；此时，唤醒语监听程序持续为打开状态；主语音监听程序持续关闭状态；步骤2，所述唤醒语监听程序实时监听，判断是否监听到唤醒词；如果没有监听到唤醒词，则持续进行监听；如果监听到唤醒词，则执行步骤3；步骤3，中央控制系统关闭所述唤醒语监听程序，开启所述主语音监听程序，进而唤醒所述中央控制系统的语音识别控制程序，此时所述中央控制系统的语音识别控制程序转变为激活状态；步骤4，所述中央控制系统的语音识别控制程序启动语音录制模块，通过所述语音录制模块录制来自于用户的语音命令，并存储录制到的所述语音命令；同时，在所述语音录制模块录制所述语音命令的过程中，通过显示模块显示语音音量波形；步骤5，所述语音录制模块将录制到的所述语音命令传输给语音识别模块；步骤6，所述语音识别模块对所述语音命令进行初步语音有效性识别，如果识别成功，则执行...

【技术特征摘要】
1.一种基于语音识别的场景交互控制方法，其特征在于，包括以下步骤：步骤1，中央控制系统预建立快照库；所述快照库存储若干条快照名称以及快照场景执行命令的对应关系；通过所述快照场景执行命令，所述中央控制系统对会场设备进行控制；语音识别控制程序为避免误操作，平时处于未被唤醒的休眠状态；此时，唤醒语监听程序持续为打开状态；主语音监听程序持续关闭状态；步骤2，所述唤醒语监听程序实时监听，判断是否监听到唤醒词；如果没有监听到唤醒词，则持续进行监听；如果监听到唤醒词，则执行步骤3；步骤3，中央控制系统关闭所述唤醒语监听程序，开启所述主语音监听程序，进而唤醒所述中央控制系统的语音识别控制程序，此时所述中央控制系统的语音识别控制程序转变为激活状态；步骤4，所述中央控制系统的语音识别控制程序启动语音录制模块，通过所述语音录制模块录制来自于用户的语音命令，并存储录制到的所述语音命令；同时，在所述语音录制模块录制所述语音命令的过程中，通过显示模块显示语音音量波形；步骤5，所述语音录制模块将录制到的所述语音命令传输给语音识别模块；步骤6，所述语音识别模块对所述语音命令进行初步语音有效性识别，如果识别成功，则执行步骤7；如果未识别成功，则向用户反馈识别失败的提示信息；步骤7，所述语音识别模块对所述语音命令进行意图识别，识别出以下四种类型中的一种：快照类型、选项类型、确认/取消类型和其他类型；如果所述语音命令为快照类型，则通过快照类型子模块执行步骤8；如果所述语音命令为选项类型，则通过选项类型子模块执行步骤9；如果所述语音命令为确认/取消类型，则通过确认/取消类型子模块执行步骤10；如果所述语音命令为其他类型，则通过其他类型子模块执行步骤11；步骤8：通过快照类型子模块执行与快照类型对应的语音命令，包括以下步骤：步骤8.1，如果所述语音命令为快照类型，得到所述语音命令的识别度分数，并判断所述识别度分数是否超过阈值，如果没有超过，表明所述语音命令不够明确，则执行步骤8.2；如果超过，表明所述语音命令明确，则执行步骤8.3；步骤8.2，对所述语音命令进行进一步的识别结果唯一性判断，即：判断识别结果是否为多音情况，如果不是，则表明语音命令对应快照库里唯一读音的快照名称，并通过显示模块输出是否执行快照的进一步确认的提示信息，同时，在确认/取消上下文配置表中记录本次确认/取消的对象信息，然后由确认/取消类型子模块执行后续步骤；如果是，则表明语音命令对应快照库里多音的快照名称，并将多音的各个快照名称形成多音快照结果集合，并通过显示模块显示所述多音快照结果集合，同时，在选项上下文配置表中记录本次选项信息，并由所述选项类型子模块执行后续步骤；...

【专利技术属性】
技术研发人员：钱苏晋，门涛，刘鹏，董杰，周金涛，
申请(专利权)人：北京恒泰实达科技股份有限公司，国网冀北电力有限公司智能配电网中心，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人