一种车载视频通话方法与系统技术方案

技术编号:25806021 阅读:56 留言:0更新日期:2020-09-29 18:40
本发明专利技术提供了一种车载视频通话方法,所述方法包括:若检测到多个声纹特征,进行提示操作,所述提示操作用于提示车内保持说话人的数量为1;若所述声纹特征数量改变为1,确定存在的声纹特征所对应的位置信息;根据所述位置信息控制摄像头的工作位置。利用本发明专利技术,能够在视频通话时保持摄像头正对当前的主讲人而不受其它位置的声源干扰,且在当前主讲人结束说话后,可以重新判定新的主讲人的位置并重新调整摄像头位置,从而达到良好的车内视频通话效果,提升用户在车内视频通话的体验。本发明专利技术还提供了一种车载视频通话系统。

【技术实现步骤摘要】
一种车载视频通话方法与系统
本专利技术涉及视频通话
,尤其涉及一种车载视频通话方法与系统。
技术介绍
目前,汽车的网联化、智能化已经越来越普及,车载信息娱乐系统通过TBOX的4G网络可以使车辆与网络保持连接从而实现车辆之间的网联功能。汽车信息娱乐系统的信息处理能力越来越强大,使得在信息娱乐系统中运行更多的应用成为可能;同时,随着高性能显示屏轻量化技术的发展,使得车内显示系统在汽车的应用上有更加经济的解决方案。以上两个因素结合网络通讯系统,使得视频通话在汽车信息娱乐系统上的实现成为可能。当前,广泛应用车载语音识别、会议系统等领域的麦克风阵列定位系统,可以依靠多个布置在固定位置的麦克风来确定声源的方向。进而根据从该方向收到的声音或其他控制指令使摄像头做出相应的响应动作。由于每一个人的声音都具有独特的特征,通过该特征能将不同人的声音进行有效的识别与区分,可通过声纹识别来辨认已记录的说话人,通过声纹区分,来统计声纹特征的数量进而计算人数。但是当车内有多个乘客同时说话或者车内声音比较嘈杂时,已有麦克风阵列的处理方式会受到不同位置声源的干扰,往往难以判断视频通话主讲人的位置,导致摄像头难以调整到正对当前主讲人的位置,这对用户的视频通话体验有较大的影响。
技术实现思路
为了解决现有技术存在的上述技术问题,本专利技术公开了一种车载视频通话方法与系统,能够在视频通话时保持摄像头正对当前的主讲人而不受其它位置声源的干扰,且在当前主讲人结束说话后,可以重新判定新的主讲人的位置并重新调整摄像头位置,从而达到良好的车内视频通话效果,提升用户在车内视频通话的体验。本专利技术提供了一种车载视频通话方法,所述方法包括:若检测到多个声纹特征,进行提示操作,所述提示操作用于提示车内保持说话人的数量为1;若所述声纹特征数量改变为1,确定存在的声纹特征所对应的位置信息;根据所述位置信息控制摄像头的工作位置。可选的,在检测声纹特征的数量之前,所述摄像头的工作位置为第一声纹特征所对应的位置,且所述存在的声纹特征为第二声纹特征,所述方法还包括:判断预存的位置信息中是否具有所述第二声纹特征对应的位置信息;若否,所述确定存在的声纹特征所对应的位置信息,包括:根据所述第二声纹特征进行声源定位,确定并保存所述第二声纹特征对应的位置信息。可选的,在所述确定存在的声纹特征所对应的位置信息之前,所述方法还包括:保持所述摄像头的工作位置。可选的,在若检测到多个声纹特征,进行提示操作之前,所述摄像头的工作位置不在任一声纹特征所对应的位置。可选的,所述提示操作为以下任意一种:语音提示、屏幕显示提示或指示灯提示。本专利技术实施例还提供了一种车载视频通话系统,所述系统包括:声纹分析模块、声源定位模块和可控摄像模块。所述声纹分析模块,用于若检测到多个声纹特征,进行提示操作,所述提示操作用于提示车内保持说话人的数量为1;所述声源定位模块,用于若所述声纹特征数量改变为1,确定存在的声纹特征所对应的位置信息;所述可控摄像模块,用于根据所述位置信息控制摄像头的工作位置。可选的,在检测声纹特征的数量之前,所述摄像头的工作位置为第一声纹特征所对应的位置,且所述存在的声纹特征为第二声纹特征,还包括:所述声纹分析模块,还用于判断预存的位置信息中是否具有所述第二声纹特征对应的位置信息;若否,所述确定存在的声纹特征所对应的位置信息,包括:所述声源定位模块,还用于根据所述第二声纹特征进行声源定位,确定并保存所述第二声纹特征对应的位置信息。可选的,在所述声源定位模块确定存在的声纹特征所对应的位置信息之前,还包括:所述可控摄像模块,还用于保持所述摄像头的工作位置。可选的,所述声纹分析模块在所述摄像头的工作位置不在任一声纹特征所对应的位置的情况下,还用于在若检测到多个声纹特征,进行提示操作。可选的,所述声纹分析模块进行提示操作为以下任意一种:语音提示、屏幕显示提示或指示灯提示。与现有技术相比,本专利技术至少具有以下优点:本专利技术提供的车载视频通话方法,对麦克风阵列采集的声音的声纹特征的数量进行实时检测,若检测到多个声纹特征,进行提示操作,所述提示操作用于提示车内保持说话人的数量为1,即只保留进行视频通话的主讲人,以使视频通话系统可以排除车内其他人的说话声对确定视频通话主讲人的干扰;在所述声纹特征数量改变为1后,确定存在的声纹特征所对应的位置信息,即确定了视频通话主讲人的位置;根据所述位置信息控制摄像头的工作位置以实现摄像头正对视频通话的主讲人。由此可见,利用本专利技术,能够在视频通话的过程中保持使摄像头正对当前视频通话的主讲人而不受其它位置声源的干扰,从而达到良好的车内视频通话效果,提升用户在车内视频通话的体验。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。图1为本申请实施例一提供的一种车载视频通话方法的流程图;图2为本申请实施例二提供的车内视频通话过程的流程图;图3为本申请实施例三提供的一种车载视频通话系统的示意图;图4为本申请实施例三提供的车载视频通话系统的应用场景示意图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例一:本申请实施例提供了一种车载视频通话方法,下面结合附图具体说明。参见图1,该图为本申请实施例一提供的一种车载视频通话方法的流程图。所述方法包括如下步骤:S101:若检测到多个声纹特征,进行提示操作,所述提示操作用于提示车内保持说话人的数量为1。当车内用户需要使用视频通话功能时,用户唤醒视频通话系统,所述系统可以通过显示系统上的软开关或者语音控制,本申请对此不做具体限定。启动视频通话系统时,通过麦克风阵列开始采集车内说话人的声音,此时采集到的声音除包括有视频通话主讲人的声音外,还可能包括其他车内人员的声音。需要注意的是,所述麦克风阵列在启动视频通话系统至视频通话结束的过程中持续实时采集车内说话人声音。对采集到的声音进行声纹特征提取,并对提取的声纹特征进行声纹区分,以得到当前声纹特征的数量。分析得到的当前声纹特征的数量,若不为1,则表明现在车内有多人进行说话,为了确定视频通话的主讲人的声纹及其位置,此时对车内人员进行提示操作,所述提示操作用于提示车内保持说话人的数量本文档来自技高网
...

【技术保护点】
1.一种车载视频通话方法,其特征在于,所述方法包括:/n若检测到多个声纹特征,进行提示操作,所述提示操作用于提示车内保持说话人的数量为1;/n若所述声纹特征数量改变为1,确定存在的声纹特征所对应的位置信息;/n根据所述位置信息控制摄像头的工作位置。/n

【技术特征摘要】
1.一种车载视频通话方法,其特征在于,所述方法包括:
若检测到多个声纹特征,进行提示操作,所述提示操作用于提示车内保持说话人的数量为1;
若所述声纹特征数量改变为1,确定存在的声纹特征所对应的位置信息;
根据所述位置信息控制摄像头的工作位置。


2.根据权利要求1所述的方法,其特征在于,在检测声纹特征的数量之前,所述摄像头的工作位置为第一声纹特征所对应的位置,且所述存在的声纹特征为第二声纹特征,所述方法还包括:
判断预存的位置信息中是否具有所述第二声纹特征对应的位置信息;
若否,所述确定存在的声纹特征所对应的位置信息,包括:
根据所述第二声纹特征进行声源定位,确定并保存所述第二声纹特征对应的位置信息。


3.根据权利要求2所述的方法,其特征在于,在所述确定存在的声纹特征所对应的位置信息之前,所述方法还包括:
保持所述摄像头的工作位置。


4.根据权利要求1所述的方法,其特征在于,在若检测到多个声纹特征,进行提示操作之前,所述摄像头的工作位置不在任一声纹特征所对应的位置。


5.根据权利要求1所述的方法,其特征在于,所述提示操作为以下任意一种:
语音提示、屏幕显示提示或指示灯提示。


6.一种车载视频通话系统,其特征在于,所述系统包括:声纹分析模块、声源定位模块和可控摄像模块。

【专利技术属性】
技术研发人员:张宏升吕震刘东
申请(专利权)人:上海汽车集团股份有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1