本实用新型专利技术涉及一种基于离线语音识别模块的语音控制系统。该基于离线语音识别模块的语音控制系统,该系统包括麦克风组件与模块组件,所述模块组件包括语音转写模块,所述麦克风组件的输出端与语音转写模块的输入端连接,所述语音转写模块的输出端与语音理解模块的输入端连接,所述语音理解模块的输出端连接有视频监控系统,所述视频监控系统包括至少两组摄像头与至少一组显示屏;其中,所述语音转写模块包括离线语音识别模块,所述语音理解模块包括主控模块,所述麦克风组件采集语音信息;该基于离线语音识别模块的语音控制系统,可以满足使用者通过语音控制视频监控系统,并且可以快速的维护、整修该麦克风组件,便于使用者的使用。的使用。的使用。
【技术实现步骤摘要】
一种基于离线语音识别模块的语音控制系统
[0001]本技术属于语音控制
,具体涉及一种基于离线语音识别模块的语音控制系统。
技术介绍
[0002]现有的视频监控系统,一般都是通过计算机进行控制,使用者在使用时,往往需要通过鼠标键盘来寻找关键的监控信息,对于一些区域内的监控系统,如小区或其他特殊场所,在需要使用监控信息时,一般都是比较紧急的情况,因此,提供一种在离线状态下的语音控制系统,该系统模块集成于麦克风组件内,整体可拆卸,便于维护调整使用。
技术实现思路
[0003]本技术的目的就在于为了解决上述问题而提供一种结构简单,设计合理的基于离线语音识别模块的语音控制系统。
[0004]本技术通过以下技术方案来实现上述目的:
[0005]一种基于离线语音识别模块的语音控制系统,该系统包括麦克风组件与模块组件,所述模块组件包括语音转写模块,所述麦克风组件的输出端与语音转写模块的输入端连接,所述语音转写模块的输出端与语音理解模块的输入端连接,所述语音理解模块的输出端连接有视频监控系统,所述视频监控系统包括至少两组摄像头与至少一组显示屏;其中,所述语音转写模块包括离线语音识别模块,所述语音理解模块包括主控模块,所述麦克风组件采集语音信息,将语音信息输出至离线语音识别模块内,通过离线语音识别模块识别为文字信息,所述语音理解模块通过文字信息得到预设指令,通过主控模块识别指令,控制视频监控系统输出相应的视频图像。
[0006]作为本技术的进一步优化方案,所述麦克风组件包括上壳体与下壳体,所述下壳体的上表面边缘对称安装有上板件,所述上板件的数量至少为两组,所述模块组件设置于两组上板件之间,所述上壳体与下壳体可拆卸连接。
[0007]作为本技术的进一步优化方案,所述上壳体的表面连接有固定杆件与弹性杆件,麦克风采集端设置于弹性杆体的顶部,所述固定杆件的表面开设有滑槽体,所述滑槽体内设置有可沿滑槽体上下移动的滑块体,所述滑块体的外表面突出于滑槽体,滑块体的外表面设置有摩擦纹路。
[0008]作为本技术的进一步优化方案,所述滑块体固定连接有拉绳件,所述拉绳件的另一端固定连接有卡块件,所述卡块件与下壳体的上端面成垂直设置,所述上壳体内表面靠近下端的位置开设有内腔体,所述卡块件位于内腔体内滑动,所述卡块件的外表面与内腔体的内壁固定连接有弹簧件,所述卡块件受弹簧件的弹力,与上板件配合,阻止上壳体上下移动,上移所述滑块体,所述滑块体通过拉绳件拉动所述卡块件远离所述上板件移动。
[0009]作为本技术的进一步优化方案,所述卡块件的外表面固定连接有卡柱件,所述上板件的外表面开设有卡槽件,所述卡柱件可插入于卡槽件内。
[0010]作为本技术的进一步优化方案,所述上壳体的内壁固定连接有引导轮组件,所述引导轮组件的数量至少为三组,所述引导轮组件配合所述拉绳件翻折。
[0011]本技术的有益效果在于:本技术可以通过语音来控制视频监控系统的显示端显示相应指令的画面;设置的上壳体与下壳体可拆卸连接,便于后期维护人员维护维修使用;可以通过上移滑块体,带动拉绳件移动,从而拉动卡块件远离上板件,使卡柱件从卡槽件内脱离,从而解除上壳体与下壳体的连接,在此过程中弹簧件被压缩,因此,在安装时,当上壳体与下壳体位置对应后,可以松开滑块体,即可通过弹簧件的弹力,使上壳体与下壳体固定,十分方便;整个系统可以满足使用者通过语音控制视频监控系统,并且可以快速的维护、整修该麦克风组件,便于使用者的使用。
附图说明
[0012]图1是本技术的模块结构示意图;
[0013]图2是本技术的麦克风组件的结构示意图;
[0014]图3是本技术的上壳体与下壳体内的结构示意图;
[0015]图4是本技术的图3中A处的放大示意图;
[0016]图5是本技术的图3中B处的放大示意图;
[0017]图6是本技术的图3中C处的方法示意图。
[0018]图中:1、麦克风组件;2、滑槽体;3、滑块体;4、上壳体;5、下壳体;6、模块组件;7、拉绳件;8、引导轮组件;9、内腔体;10、卡块件;11、卡柱件;12、上板件;13、弹簧件。
具体实施方式
[0019]下面结合附图对本申请作进一步详细描述,有必要在此指出的是,以下具体实施方式只用于对本申请进行进一步的说明,不能理解为对本申请保护范围的限制,该领域的技术人员可以根据上述申请内容对本申请作出一些非本质的改进和调整。
[0020]实施例1
[0021]如图1所示,一种基于离线语音识别模块的语音控制系统,该系统包括麦克风组件1与模块组件6,所述模块组件6包括语音转写模块,所述麦克风组件1的输出端与语音转写模块的输入端连接,所述语音转写模块的输出端与语音理解模块的输入端连接,所述语音理解模块的输出端连接有视频监控系统,所述视频监控系统包括至少两组摄像头与至少一组显示屏;其中,所述语音转写模块包括离线语音识别模块,所述语音理解模块包括主控模块,所述麦克风组件1采集语音信息,将语音信息输出至离线语音识别模块内,通过离线语音识别模块识别为文字信息,所述语音理解模块通过文字信息得到预设指令,通过主控模块识别指令,控制视频监控系统输出相应的视频图像。
[0022]离线语音识别模块,其具体型号选用VDM
‑
10,其优点可常规交互逻辑可配置,适合快速集成,其用于语音识别人机交互,有较高性价比,实现灵活、智慧的语音人机交互体验;
[0023]主控模块,其具体型号选用Nvidia Jetson nano,用于转换文字为命令代码,使程序逻辑可以进行识别并执行对应的功能,其运算能力强,其后续留有拓展空间;Jetson Nano开发套件是一款功能强大的小型人工智能计算机,只需插入带有系统映像的microSD卡即可启动,内置SOC系统级芯片,可并行运行多个神经网络,比如TensorFlow、PyTorch、
Caffe/Caffe2、Keras、MXNet等,这些神经网络可用于实现图像分类、目标检测、语音分割和智能分析等能力,可用于构建自主机器人和复杂人工智能系统。
[0024]接口型号选用Web Socket,其支持全双工通讯,能接入Web应用,选用Web Socket的主要原因是该通讯协议支持服务端主动向客户端发送消息,并且为长连接,主控服务端的命令消息能随时实时的发送到客户端上,并且Web Socket能直接对接Web端,一些网页型应用的场景也能容易进行集成。WebSocket是一种在单个TCP连接上进行全双工通信的协议。WebSocket通信协议于2011年被IETF定为标准RFC 6455,并由RFC7936补充规范。WebSocket API也被W3C定为标准。WebSocket使得客户端和服务器之间的数据交换变得更加简单,允许服务端主动向客户端推送数据。在WebSocket API中,浏览器和服务器只需要完成一次握手本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于离线语音识别模块的语音控制系统,其特征在于,该系统包括麦克风组件与模块组件,所述模块组件包括语音转写模块,所述麦克风组件的输出端与语音转写模块的输入端连接,所述语音转写模块的输出端与语音理解模块的输入端连接,所述语音理解模块的输出端连接有视频监控系统,所述视频监控系统包括至少两组摄像头与至少一组显示屏;其中,所述语音转写模块包括离线语音识别模块,所述语音理解模块包括主控模块,所述麦克风组件采集语音信息,将语音信息输出至离线语音识别模块内,通过离线语音识别模块识别为文字信息,所述语音理解模块通过文字信息得到预设指令,通过主控模块识别指令,控制视频监控系统输出相应的视频图像。2.根据权利要求1所述的一种基于离线语音识别模块的语音控制系统,其特征在于:所述麦克风组件包括上壳体与下壳体,所述下壳体的上表面边缘对称安装有上板件,所述上板件的数量至少为两组,所述模块组件设置于两组上板件之间,所述上壳体与下壳体可拆卸连接。3.根据权利要求2所述的一种基于离线语音识别模块的语音控制系统,其特征在于:所述上壳体的表面连接有固定杆件与弹性杆件,麦克风采集...
【专利技术属性】
技术研发人员:梅子宸,
申请(专利权)人:梅子宸,
类型:新型
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。