摄像头拍摄控制方法、装置、智能设备及存储介质制造方法及图纸

技术编号:19328030 阅读:21 留言:0更新日期:2018-11-03 14:53
本发明专利技术适用于通信技术领域,提供了一种摄像头拍摄控制方法、装置、智能设备及存储介质,包括:当检测到语音时,识别所述语音中是否存在关键词;若所述语音中存在关键词,则确定发出所述语音的声源对象的声源角度;根据发出所述语音的声源对象的声源角度控制所述摄像头转向,使发出所述语音的声源对象位于所述摄像头拍摄的画面中。通过上述方法能够有效避免在多人同时发言时摄像头频繁转动而导致抖动。

Camera shooting control method, device, intelligent device and storage medium

The invention is applicable to the field of communication technology, and provides a camera shooting control method, device, intelligent device and storage medium, including: recognizing whether there are keywords in the voice when the voice is detected; and determining the sound source angle of the sound source object that emits the voice if there are keywords in the voice; The camera steering is controlled according to the sound source angle of the sound source object that emits the voice, so that the sound source object that emits the voice is located in the picture taken by the camera. The above method can effectively avoid the chattering caused by frequent rotation of cameras when multiple people speak at the same time.

【技术实现步骤摘要】
摄像头拍摄控制方法、装置、智能设备及存储介质
本专利技术属于通信
,尤其涉及一种摄像头拍摄控制方法、装置、智能设备及存储介质。
技术介绍
互联网技术的兴起大大丰富了人们进行沟通的方式,身处不同地域的人之间的沟通变得越来越便捷。其中,远程视频会议系统作为一种重要的远程交流技术,因其便捷高效的优点,大大提高了企业的工作效率。现有技术中,在开视频会议的过程中,存在与会者频繁的讨论情况,当与会者A发表观点时,系统根据检测到的语音计算A的位置并启动摄像头,使得摄像头对准与会者A,但很可能A已经说完,摄像头还未转动对准A,而此时与会者B又开始发表观点,系统通过获检测到的B的语音计算出B的位置,同时控制摄像头朝B所在方向转动,此时C又说话或者存在多个与会者同时说话的情况,这样采用之前简单的摄像头简单跟随,会导致摄像头在不同与会者之间抖动综上所述,现有视频会议技术中存在摄像头跟拍不及时以及多人同时说话时摄像头频繁转向导致抖动,视频拍摄效率低的问题。
技术实现思路
有鉴于此,本专利技术实施例提供了一种摄像头拍摄控制方法、装置、智能设备及存储介质,以解决现有视频会议技术中存在摄像头跟拍不及时以及多人同时说话时摄像头频繁转向导致抖动,视频拍摄效率低的问题。本专利技术第一方面提供了一种摄像头拍摄控制方法,所述摄像头拍摄控制方法包括:当检测到语音时,识别所述语音中是否存在关键词;若所述语音中存在关键词,则确定发出所述语音的声源对象的声源角度;根据发出所述语音的声源对象的声源角度控制所述摄像头转向,使发出所述语音的声源对象位于所述摄像头拍摄的画面中。本专利技术第二方面提供了一种摄像头拍摄控制装置,所述摄像头拍摄控制装置包括:关键词识别单元,用于当检测到语音时,识别所述语音中是否存在关键词;声源定位单元,用于若所述语音中存在关键词,则确定发出所述语音的声源对象的声源角度;第一拍摄控制单元,用于根据发出所述语音的声源对象的声源角度控制所述摄像头转向,使发出所述语音的声源对象位于所述摄像头拍摄的画面中。本专利技术第三方面提供了一种智能设备,包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上第一方面所述摄像头拍摄控制方法的步骤。本专利技术第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上第一方面所述摄像头拍摄控制方法的步骤。本专利技术实施例与现有技术相比存在的有益效果是:本专利技术实施例在当检测到语音时,先识别所述语音中是否存在关键词,若所述语音中存在关键词,则确定发出所述语音的声源对象的声源角度,再根据发出所述语音的声源对象的声源角度控制所述摄像头转向,使发出所述语音的声源对象位于所述摄像头拍摄的画面中,有效旋转摄像头拍摄声源对象,避免在多人同时发言时摄像头频繁转动而导致抖动,进而提高视频拍摄的准确率,增强用户体验。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的摄像头拍摄控制方法的实现流程图;图2是本专利技术实施例提供的包括记录声源对象对应的声源角度的摄像头拍摄控制方法的实现流程图;图3是本专利技术实施例提供的包括再次拍摄声源对象时的摄像头拍摄控制方法的实现流程图;图3A是本专利技术实施例提供的摄像头拍摄控制方法的应用场景示意图;图4是本专利技术另一实施例提供的摄像头拍摄控制方法的实现流程图;图5是本专利技术实施例提供的摄像头拍摄控制装置的结构框图;图6是本专利技术实施例提供的智能设备的示意图。具体实施方式以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本专利技术实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本专利技术。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本专利技术的描述。本专利技术实施例为了能够在多人同时发言的情况下准确确定跟拍对象,避免摄像头频繁转动导致抖动,提供了一种摄像头拍摄控制方法、装置、智能设备及存储介质,其中主要是通过当检测到语音时,识别所述语音中是否存在关键词,若所述语音中存在关键词,则确定发出所述语音的声源对象的声源角度,根据所述声源对象的声源角度控制所述摄像头转向,使得所述声源对象位于所述摄像头拍摄的画面中央。为了具体说明上述摄像头拍摄控制方法、装置、智能设备及存储介质,下面通过具体实施例来进行说明。为了说明本专利技术所述的技术方案,下面通过具体实施例来进行说明。实施例一:图1示出了本专利技术实施例提供的一种摄像头拍摄控制方法的流程图,该方法流程包括步骤S101至S103。各步骤的具体实现原理详述如下:步骤S101,当检测到语音时,识别所述语音中是否存在关键词。在本专利技术实施例中,在需要进行视频通话或者视频会议时,使用智能设备追踪拍摄声源对象。智能设备在启动后开始实时采集当前场景下的语音。具体地,使用麦克风阵列全方向实时拾取语音,接收当前场景下任何人发出的语音。所述智能设备可以为智能机器人,还可以为具有可旋转摄像头的智能音箱,通过智能音箱的麦克风阵列拾取语音,通过可旋转摄像头拍摄视频。当麦克风阵列拾取到语音时,识别语音中是否存在关键词,所述关键词是指用户预先指定的字词或语句,用于触发摄像头旋转,所述关键词可通过用户重置。可选地,在本专利技术实施例中,为准确识别语音中的关键词,所述步骤S101包括:A1、当检测到语音时,将所述语音转换为文本信息。A2、基于所述文本信息进行分词。具体地,按语法格式将文本信息拆成字词。进一步地,将一条语音信息中拆分出来的词作为一组词向量进行存储。所述词向量中还设有标识位,用于标识该词向量对应的语音。A3、将分出的词与预设的关键词进行匹配,确定所述语音中是否存在关键词。具体地,若分出的词与预设的关键词进行比对匹配,在确定所述语音中存在关键词;若分出的词与预设的关键词不匹配,则确定所述语音中没有关键词。在本专利技术实施例中,将语音转换为文本信息并进行分词处理,通过将分出来的词与预设的关键词一一匹配来确定语音中是否存在关键词,可提高关键词识别的准确性。可选地,可通过对检测到的语音进行语义识别,识别语音的含义,若识别的语音的含义与预设的关键词含义相同,则确定所述语音中存在关键词,即可触发摄像头旋转,若所述语音的含义与预设的关键词含义不相同,则确定所述语音中不存在关键词,即无法触发摄像头旋转。步骤S102,若所述语音中存在关键词,则确定发出所述语音的声源对象的声源角度。在本专利技术实施例中,当所述语音中存在指定的关键词时,可通过麦克风阵列算法来获取所述语音的声源方向。单个麦克风只能获取声音信息,而由多个麦克风按照一定几何位置摆放组成的麦克风阵列,不仅能够获取声音信息还能够获取声音的空间信息,例如确定语音的声源角度。麦克风阵列算法是指利用一组按一定几何位置摆放的麦克风组成的麦克风阵列,通过计算某一声源到各麦克风间的相对延迟时间,及声波到达时间差,定位出该声源的声源方向。在本专利技术实施例中,麦克本文档来自技高网...

【技术保护点】
1.一种摄像头拍摄控制方法,其特征在于,所述摄像头拍摄控制方法包括:当检测到语音时,识别所述语音中是否存在关键词;若所述语音中存在关键词,则确定发出所述语音的声源对象的声源角度;根据发出所述语音的声源对象的声源角度控制所述摄像头转向,使发出所述语音的声源对象位于所述摄像头拍摄的画面中。

【技术特征摘要】
1.一种摄像头拍摄控制方法,其特征在于,所述摄像头拍摄控制方法包括:当检测到语音时,识别所述语音中是否存在关键词;若所述语音中存在关键词,则确定发出所述语音的声源对象的声源角度;根据发出所述语音的声源对象的声源角度控制所述摄像头转向,使发出所述语音的声源对象位于所述摄像头拍摄的画面中。2.如权利要求1所述的摄像头拍摄控制方法,其特征在于,所述根据发出所述语音的声源对象的声源角度控制所述摄像头转向,使发出所述语音的声源对象位于所述摄像头拍摄的画面中的步骤,包括:获取所述摄像头的当前角度;计算所述声源角度与所述摄像头的当前角度的角度差;根据所述声源角度与所述摄像头的当前角度的角度差,按预设旋转速度控制所述摄像头转向,使发出所述语音的声源对象位于所述摄像头拍摄的画面中。3.如权利要求2所述的摄像头拍摄控制方法,其特征在于,所述根据所述声源角度与所述摄像头的当前角度的角度差,按预设旋转速度控制所述摄像头转向,使发出所述语音的声源对象位于所述摄像头拍摄的画面中的步骤,包括:根据所述声源角度与所述摄像头的当前角度的角度差,按第一旋转速度控制所述摄像头转向所述声源;进行人脸检测,若检测到人脸,则按第二旋转速度控制所述摄像头转向,使发出所述语音的声源对象位于所述摄像头拍摄的画面中央,其中,所述第一旋转速度大于所述第二旋转速度。4.如权利要求1至3任一项所述的摄像头拍摄控制方法,其特征在于,在所述根据发出所述语音的声源对象的声源角度控制所述摄像头转向,使发出所述语音的声源对象位于所述摄像头拍摄的画面中的步骤之后,还包括:当发出所述语音的声源对象在所述摄像头拍摄的画面中时,记录并关联所述语音的语音特征以及发出所述语音的声源对象的声源角度。5.如权利要求4所述的摄像头拍摄控制方法,其特征在于,所述语音特征包括声音特征,所述摄像头拍摄控制方法还包括:当检测到新的语音时,判断所述新的语音的声音特征与记录的声音特征是否相同;若所述新的语音的声音...

【专利技术属性】
技术研发人员:张忠海吴海全张恩勤曹磊师瑞文
申请(专利权)人:深圳市冠旭电子股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1