一种语音控制的AI摄像头制造技术

技术编号：37822432 阅读：18 留言：0更新日期：2023-06-09 09:59

本发明专利技术公开了一种语音控制的AI摄像头，涉及智能语音控制设备领域，包括摄像头模块，摄像头模块包括全景摄像头以及可转动的特写摄像头；音频输入模块，音频输入模块包括放置于会议桌正中间的全向麦克风；唤醒模块，唤醒模块用于识别唤醒词，并用于计算唤醒词所位于的DOA角度；识别模块，用于在唤醒模块给出唤醒命令后识别后续音频是否包含有效命令词；中央控制模块，用于连接上述所有模块并进行总体控制；输出模块，用于连接于显示器、音频播放设备输出画面和音频；当识别模块识别到预设的有效命令词时，中央控制模块根据有效命令词执行预设操作。本发明专利技术可提升AI摄像头的命令检测、执行的准确性，且具备智能跟踪的功能。且具备智能跟踪的功能。且具备智能跟踪的功能。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音控制的AI摄像头

[0001]本专利技术涉及智能语音控制设备领域，更具体地说，涉及一种语音控制的AI摄像头。

技术介绍

[0002]目前应用在会议场景的语音控制的摄像头，已经比较普遍，但现有的智能跟踪摄像头在实际使用过程中，可能出现如下问题：
[0003]若摄像头安装位置离参会人太远，则语音指令不容易识别，语音控制效果不佳；会议场景人声语音较多，很容易对摄像头造成命令词的误检测，导致摄像头被误操作。

技术实现思路

[0004]本专利技术要解决的技术问题是提供一种语音控制的AI摄像头，以提升命令检测、执行的准确性，且具备智能跟踪的功能。
[0005]为了达到上述目的，本专利技术采取以下技术方案：
[0006]一种语音控制的AI摄像头，包括：
[0007]摄像头模块，所述摄像头模块包括用于实时拍摄会议室全景的全景摄像头，以及用于捕捉特写的可转动的特写摄像头；
[0008]音频输入模块，所述音频输入模块包括放置于会议桌正中间的全向麦克风；
[0009]唤醒模块，所述唤醒模块用于识别唤醒词，并用于计算所述唤醒词所位于的DOA角度；
[0010]识别模块，用于在所述唤醒模块给出唤醒命令后识别后续音频是否包含有效命令词；
[0011]中央控制模块，用于连接上述所有模块并进行总体控制；
[0012]输出模块，用于连接于显示器、音频播放设备输出画面和音频；
[0013]当所述识别模块识别到预设的有效命令词时，所述中央控制模块根据所...

【技术保护点】

【技术特征摘要】
1.一种语音控制的AI摄像头，其特征在于，包括：摄像头模块，所述摄像头模块包括用于实时拍摄会议室全景的全景摄像头，以及用于捕捉特写的可转动的特写摄像头；音频输入模块，所述音频输入模块包括放置于会议桌正中间的全向麦克风；唤醒模块，所述唤醒模块用于识别唤醒词，并用于计算所述唤醒词所位于的DOA角度；识别模块，用于在所述唤醒模块给出唤醒命令后识别后续音频是否包含有效命令词；中央控制模块，用于连接上述所有模块并进行总体控制；输出模块，用于连接于显示器、音频播放设备输出画面和音频；当所述识别模块识别到预设的有效命令词时，所述中央控制模块根据所述有效命令词执行预设操作。2.根据权利要求1所述语音控制的AI摄像头，其特征在于，所述预设操作包括以下任意一个或其组合：进入自动特写模式、退出自动特写模式、控制特写摄像头的指向、控制光学变焦的远近、开关字幕。3.根据权利要求2所述语音控制的AI摄像头，其特征在于，所述有效命令词包括以下任一个或其组合：“进入自动特写模式”、“退出自动特写模式”、“向x方向转动y角度”，其中x方向包括左、右、上、下中的任意一个，y包括0～90
°
、“拉长聚焦长度”、“缩短聚焦长度”、“开启字幕”、“关闭字幕”。4.根据权利要求2或3所述语音控制的AI摄像头，其特征在于，所述自动特...

【专利技术属性】
技术研发人员：宋洪博，王艳龙，陈永波，沈峥嵘，
申请(专利权)人：思必驰科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人