应用于视频的语音处理方法、电子设备以及存储介质技术

技术编号:37423032 阅读:13 留言:0更新日期:2023-04-30 09:45
本申请公开了应用于视频的语音处理方法、电子设备以及存储介质,包括:获取到待处理视频,并确定待处理视频中的遮挡区域;其中,遮挡区域为对视频画面进行遮挡的区域;对待处理视频中出现的每一个目标对象进行检测;响应于检测到至少一个目标对象进入遮挡区域,且采集到目标对象在遮挡区域发出的待处理语音,对待处理语音进行消声处理或变声处理。本申请能够对目标对象在遮挡区域产生的语音进行保护,以提高声音数据的安全性,从而规避语音泄露导致的隐私泄露的风险,继而实现有效保护用户隐私的目的。目的。目的。

【技术实现步骤摘要】
应用于视频的语音处理方法、电子设备以及存储介质


[0001]本申请涉及监控设备
,特别是涉及应用于视频的语音处理方法、电子设备以及存储介质。

技术介绍

[0002]视频监控是安防系统的重要组成部分。在视频监控中,为了遮挡隐私区域,通常在视频图像上设置一个遮挡框,以对视频画面进行遮挡。
[0003]目前,网络摄像机(Internet Protocol Camera,IPC)对隐私区域进行遮挡的方式分为2D(Dimension,维度)遮挡或3D遮挡。其中,2D遮挡指的是用户手动在视频画面中设置一个遮挡框,实况画面将这个遮挡框设置为黑色、白色或者马赛克。3D遮挡指的是网络摄像机的云台位置发生变化时,遮挡框在监控画面上的位置也随之发生变化,以达到始终遮挡视频画面中同一目标对象的目的。
[0004]然而,上述方法仅对遮挡区域内的目标对象进行视频遮挡保护,并未对目标对象在遮挡区域产生的语音进行安全处理,而通过对语音进行辨别,仍然可以获取目标对象的信息,无法有效保护目标对象的隐私。

技术实现思路

[0005]本申请主要解决的技术问题是提供应用于视频的语音处理方法、电子设备以及存储介质,能够解决现有技术无法对视频遮挡区域中目标对象产生的语音进行保护的问题。
[0006]为解决上述技术问题,本申请采用的第一技术方案是提供一种应用于视频的语音处理方法,包括:获取到待处理视频,并确定待处理视频中的遮挡区域;其中,遮挡区域为对视频画面进行遮挡的区域;对待处理视频中出现的每一个目标对象进行检测;响应于检测到至少一个目标对象进入遮挡区域,且采集到目标对象在遮挡区域发出的待处理语音,对待处理语音进行消声处理或变声处理。
[0007]为解决上述技术问题,本申请采用的第二技术方案是提供一种电子设备,包括:存储器,用于存储程序数据,存储程序数据被执行时实现如上述任一项所述的应用于视频的语音处理方法中的步骤;处理器,用于执行存储器存储的程序指令以实现如上述任一项所述的应用于视频的语音处理方法中的步骤。
[0008]为解决上述技术问题,本申请采用的第三技术方案是提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述任一项所述的应用于视频的语音处理方法中的步骤。
[0009]本申请的有益效果是:区别于现有技术,本申请提供应用于视频的语音处理方法、电子设备以及存储介质,通过对待处理视频中出现的每一个目标对象进行检测,并在检测到目标对象进入遮挡区域后,对采集到的目标对象在遮挡区域发出的待处理语音进行消声处理或变声处理,能够对目标对象在遮挡区域产生的语音进行保护,以提高声音数据的安全性,从而规避语音泄露导致的隐私泄露的风险,继而实现有效保护用户隐私的目的。
附图说明
[0010]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0011]图1是本申请应用于视频的语音处理方法第一实施方式的流程示意图;
[0012]图2是本申请应用于视频的语音处理方法第二实施方式的流程示意图;
[0013]图3是本申请应用于视频的语音处理方法第三实施方式的流程示意图;
[0014]图4是本申请应用于视频的语音处理方法第四实施方式的流程示意图;
[0015]图5是本申请应用于视频的语音处理方法第五实施方式的流程示意图;
[0016]图6是多个目标对象在不同的时间节点进入以及离开遮挡区域的示意图;
[0017]图7是本申请应用于视频的语音处理装置一实施方式的结构示意图;
[0018]图8是本申请电子设备一实施方式的结构示意图;
[0019]图9是本申请计算机可读存储介质一实施方式的结构示意图。
具体实施方式
[0020]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,均属于本申请保护的范围。
[0021]在本申请实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上文清楚地表示其他含义,“多种”一般包含至少两种,但是不排除包含至少一种的情况。
[0022]应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
[0023]应当理解,本文中使用的术语“包括”、“包含”或者其他任何变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0024]请参阅图1,图1是本申请应用于视频的语音处理方法第一实施方式的流程示意图。在本实施方式中,该语音处理方法包括:
[0025]S11:获取到待处理视频,并确定待处理视频中的遮挡区域;其中,遮挡区域为对视频画面进行遮挡的区域。
[0026]本实施方式中,待处理视频为通过网络摄像机(IPC)或其余视频监控摄像机拍摄的视频。
[0027]在一个具体的实施场景中,IPC获取到监控视频后,可存储到网络视频录像机
(Network Video Recorder,即NVR)的硬盘或者内存中,用户可从NVR中获取到待处理视频。
[0028]在另一个具体的实施场景中,IPC获取到监控视频后,可上传到云服务器,用户可通过终端应用(Application,APP)从云服务器中获取到待处理视频。
[0029]本实施方式中,遮挡区域为视频画面中遮挡框所处的位置。
[0030]其中,遮挡框可以是用户手动在视频图像的画面中设置的,用于遮挡固定区域。其中,若IPC具有云台,遮挡框在画面中的位置还可以随着云台位置的变化而变化,本申请对此不作限定。
[0031]本实施方式中,遮挡框用于遮挡隐私区域。
[0032]例如,在行车监控场景中,行车记录仪的监控摄像头可以拍摄车内场景,则遮挡区域可以包括车辆后排,以对乘客起到保护作用。
[0033]又例如,在居家监控场景中,监控摄像头设置在客厅或书房,则遮挡区域可以包括沙发区域或电脑区域,以对坐在沙发或电脑椅上的用户起本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种应用于视频的语音处理方法,其特征在于,包括:获取到待处理视频,并确定所述待处理视频中的遮挡区域;其中,所述遮挡区域为对视频画面进行遮挡的区域;对所述待处理视频中出现的每一个目标对象进行检测;响应于检测到至少一个所述目标对象进入所述遮挡区域,且采集到所述目标对象在所述遮挡区域发出的待处理语音,对所述待处理语音进行消声处理或变声处理。2.根据权利要求1所述的语音处理方法,其特征在于,所述响应于检测到至少一个所述目标对象进入所述遮挡区域,且采集到所述目标对象在所述遮挡区域发出的待处理语音,对所述待处理语音进行消声处理或变声处理的步骤,包括:响应于检测到所述目标对象进入所述遮挡区域,且采集到所述目标对象在所述遮挡区域发出的所述待处理语音,利用采集的环境噪音替换所述待处理语音;或,利用预设的音色特征替换所述待处理语音中的音色特征。3.根据权利要求2所述的语音处理方法,其特征在于,所述响应于检测到至少一个所述目标对象进入所述遮挡区域,且采集到所述目标对象在所述遮挡区域发出的所述待处理语音,利用采集的环境噪音替换所述待处理语音的步骤,包括:响应于检测到至少一个所述目标对象进入所述遮挡区域,在当前预设时间段内采集在所述遮挡区域内的任一所述目标对象的所述待处理语音,并记录每段所述待处理语音对应的发声时间段;响应于在所述当前预设时间段内存在无发声时间段,采集所述遮挡区域的所述环境噪音,并记录每段所述环境噪音分别对应的无发声时间段;其中,所述无发声时间段指的是所述遮挡区域内未检测到任一所述目标对象的所述待处理语音的时间段;在所述当前预设时间段内调用每个所述发声时间段之前的所述无发声时间段对应的所述环境噪音,以利用对应的所述环境噪音替换每个所述发声时间段内采集到的所述待处理语音。4.根据权利要求3所述的语音处理方法,其特征在于,所述响应于检测到至少一个所述目标对象进入所述遮挡区域,在当前预设时间段内采集在所述遮挡区域内的任一所述目标对象的所述待处理语音,并记录每段所述待处理语音对应的发声时间段的步骤后,还包括:响应于在所述当前预设时间段内不存在所述无发声时间段,获取到所述当前预设时间段之前的预设时间段;从所述之前的预设时间段内调用最近的无发声时间段对应的所述环境噪音,并利用所述环境噪音替换所述当前预设时间段内采集的每一个所述待处理语音。5.根据权利要求1所述的语音处理方法,其特征在于,所述对所述待处理视频中出现的每一个目标对象进行检测的步骤,包括:响应于在当前预设时间段内采集到所述目标对象的语音,对采集到的语音进行音频特征提取;其中,所述语音包括所述目标对象在非遮挡区域发出的常规语音以及在所述遮挡区域发出的所述待处理语音;
将提取到的音频特征与声音节点列表中存储的声音节点对应的音频特征进行匹配;响应于所述声音节点列表中不存在与所述提取到的音频特征匹配的声音节点,在所述声音节点列表中建立新的声音节点,并将所述采集到的语音以及所述提取到的音频特征保存至所述新的声音节点中。6.根据权利要求5所述的语音处理方法,其特征在于,所述对所述待处理视...

【专利技术属性】
技术研发人员:豆红雷
申请(专利权)人:杭州华橙软件技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1