在视频会议跟踪和检测期间减少假阳性识别制造技术

技术编号:39304259 阅读:7 留言:0更新日期:2023-11-12 15:53
本发明专利技术公开了在视频会议跟踪和检测期间减少假阳性识别。一种方法包括在数字图像中检测匹配所选择的对象类型的一组子图像。该方法还包括生成该组子图像中的第一子图像匹配所选择的对象类型的第一置信度得分。该方法还包括生成该组子图像中的第二子图像匹配所选择的对象类型的第二置信度得分。该方法还包括通过比较第一子图像和第二子图像来生成相似性度量。该方法还包括响应于相似性度量超过相似性阈值并且第一置信度得分超过第二置信度得分,从该组子图像中移除第二子图像。该方法还包括在移除之后,使用该组子图像来处理数字图像。像。像。

【技术实现步骤摘要】
在视频会议跟踪和检测期间减少假阳性识别

技术介绍

[0001]视频会议系统可以使用检测和跟踪以及检测软件来识别图像或视频流中显示的对象的子图像。然而,跟踪和检测以及检测软件可能不期望地将人的反射的子图像检测为真人的子图像。因此,例如,如果相机正在捕捉具有玻璃墙、玻璃窗或任何反射表面的会议室的图像或视频流,则跟踪和检测以及检测软件可能会不期望地将人在玻璃中的反射图像视为真人的图像。

技术实现思路

[0002]一个或多个实施例提供了一种方法。该方法包括在数字图像中检测匹配所选择的对象类型的一组子图像。该方法还包括生成该组子图像中的第一子图像匹配所选择的对象类型的第一置信度得分。该方法还包括生成该组子图像中的第二子图像匹配所选择的对象类型的第二置信度得分。该方法还包括通过比较第一子图像和第二子图像来生成相似性度量。该方法还包括响应于相似性度量超过相似性阈值并且第一置信度得分超过第二置信度得分,从该组子图像中移除第二子图像。该方法还包括在移除之后,使用该组子图像来处理数字图像。
[0003]一个或多个实施例提供了另一种方法。该方法包括在第一时间检测与视频流中的第一数字图像中的对象类型相匹配的对象的子图像。该方法还包括基于检测来确定在视频流中第一数字图像之后的数字图像中是否存在对象的子图像的连续检测。该方法还包括阻止使用对象的子图像来修改视频流,至少直到在第一时间之后第二时间已经过去。
[0004]一个或多个实施例还提供了控制器。控制器包括可由处理器执行的图像处理控制器,以在视频流的数字图像中检测对应于所选择的对象类型的子图像。图像处理控制器也可由处理器执行,以将与子图像相对应的置信度得分分配给子图像。置信度得分包括子图像是所选择的对象类型的度量。控制器还包括可由处理器执行的第一滤波器,以在修改视频流时阻止子图像的第一子组的使用。第一子组包括置信度得分低于置信度阈值的第一多个子图像。控制器还包括可由处理器执行的第二滤波器,以在修改视频流时将子图像的第二子组的使用延迟阈值时间间隔。第二子组包括在阈值时间间隔之前检测到的第二多个子图像。控制器还包括可由处理器执行的第三滤波器,以在修改视频流时阻止使用子图像中的所选择的子图像。所选择的子图像选自第一子图像之一,该第一子图像具有在第二子图像的第二相似性得分的相似性阈值内的第一相似性得分。所选择的子图像包括置信度得分中较低的置信度得分。控制器还包括视频控制器,其被配置为使用第一滤波器、第二滤波器和第三滤波器来修改视频流。
[0005]根据以下描述和所附权利要求,一个或多个实施例的其他方面将变得显而易见。
附图说明
[0006]图1示出了根据一个或多个实施例的计算系统。
[0007]图2和图3示出了说明根据一个或多个实施例的用于滤波视频流的方法的一组步
骤的流程图。
[0008]图4、图5和图6示出了根据一个或多个实施例的滤波视频流的示例。
[0009]图7是根据一个或多个实施例的用于滤波视频流的另一种方法。
[0010]图8和图9示出了根据一个或多个实施例的关于滤波视频流使用的矩阵的示例。
具体实施方式
[0011]一般而言,一个或多个实施例涉及滤波视频流。特别地,一个或多个实施例对于防止视频软件或图像跟踪和检测软件不期望地将人的反射图像检测为自然人的图像是有用的。在一个示例中,在室内视频会议环境中,人们在玻璃墙、窗户或其他反射表面上的反射可能是常见的。反射也可能被放大,这取决于相机的放置和照明条件。这些反射可能导致关于跟踪和检测以及检测软件的技术问题,其用于修改视频流或图像或跟踪视频流中显示的一个或多个对象。
[0012]例如,视频会议系统可以接收视频流作为输入,然后使用视频流中的音频和视频跟踪和检测数据,以便框定(frame)个人组,自动调整视频流的缩放水平,框定视频流中的说话者,识别图像或视频流中的个人,或者执行其他跟踪和检测功能。然而,如果跟踪和检测软件不正确地将人的反射识别为人,则跟踪和检测软件的输出可能是不期望的。不期望的输出的示例包括但不限于,不正确地计算房间中的人数、不正确地识别一个人、两次计算同一个人、不正确地选择期望的缩放水平、不正确地识别说话者、将两个人识别为同时说话,以及可能的其他不期望的输出。虽然跟踪和检测软件可能不会被表征为功能不正确,但是由(一个或多个)反射引起的输入混淆了跟踪和检测软件,从而导致上述各种问题。
[0013]一个或多个实施例为上述技术问题提供了一个或多个技术解决方案。一个或多个实施例使用一个或多个滤波器来自动防止假检测。真实检测是对实际存在的感兴趣的对象类型的检测(例如,对在视频流中捕获的实际出现在房间中的人的头部的检测)。假检测是对感兴趣的对象类型的检测,但是其中检测到的对象实际上不是该对象类型(例如,检测到人的头部从房间中的反射对象的反射)。
[0014]特别地,一个或多个实施例可以包括三种不同的滤波器,它们可以单独使用或组合使用。如果检测到的子图像中示出的检测到的对象未能满足置信度阈值,则第一滤波器从进一步的处理中移除检测到的子图像。例如,匹配软件分配检测到的子图像是对象类型的概率。如果概率未能满足置信度阈值,则在进一步处理视频流或图像之前丢弃检测到的子图像。
[0015]第二滤波器将检测到的子图像相互比较,并且当两个或多个检测到的子图像足够相似时,丢弃一个或多个检测到的子图像。如下面进一步解释的,丢弃的图像具有低置信度得分,而保留的图像具有较高的置信度得分。例如,匹配软件分配对象类型的两个检测到的子图像存在在视频流中的置信度得分。相似性软件将相似性度量分配给彼此比较的两个检测到的子图像。如果相似性度量高于相似性阈值,则在进一步处理视频流或图像之前,移除检测到的具有较低置信度得分的子图像。
[0016]第三滤波器是延迟滤波器。如果新检测到对象类型的新子图像,然后在视频流中持续保持检测,则新检测到的子图像不用于视频流或图像的进一步处理,直到阈值时间段已经过去。延迟滤波器可用于区分从反射对象创建的子图像和从物理对象创建的子图像,
因为反射对象通常在数字图像中显示闪烁,而真人和对象的图像显示一致且稳定的检测和跟踪。例如,如果当自然人的头部在房间中四处移动时最初检测到反射的头部,则反射的头部的图像将不会在视频流中经受进一步的处理,直到阈值时间过去之后。
[0017]现在将注意力转向附图。图1示出了根据一个或多个实施例的计算系统。该计算系统包括数据储存库(100)。在一个或多个实施例中,数据储存库(100)是用于存储数据的储存单元和/或设备(例如,文件系统、数据库、表格集合或任何其他储存机制)。数据储存库(100)可以被表征为非暂时性计算机可读存储介质。此外,数据储存库(100)可以包括多个不同的储存单元和/或设备。多个不同的储存单元和/或设备可以是或可以不是相同的类型,并且可以或可以不位于相同的物理站点。
[0018]数据储存库(100)可以至少临时存储在一个或多个实施例中使用的数据。例如,数据储存库(100)可以存储视频流(1本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种方法,包括:在数字图像中检测匹配所选择的对象类型的一组子图像;生成该组子图像中的第一子图像匹配所选择的对象类型的第一置信度得分;生成该组子图像中的第二子图像匹配所选择的对象类型的第二置信度得分;通过比较第一子图像和第二子图像来生成相似性度量;响应于相似性度量超过相似性阈值并且第一置信度得分超过第二置信度得分,从该组子图像中移除第二子图像;和在移除之后,使用该组子图像来处理数字图像。2.根据权利要求1所述的方法,其中处理包括修改数字图像以生成修改的数字图像。3.根据权利要求2所述的方法,其中,修改还包括对第一子图像上的数字图像进行缩放、框定和跟踪中的至少一项,以形成修改后的数字图像,并且其中修改后的数字图像排除第二子图像。4.根据权利要求1所述的方法,其中生成相似性度量还包括:生成矩阵,其中矩阵中的单元表示多个子图像相对于彼此的相似性,其中多个子图像至少包括第一子图像和第二子图像,并且其中相似性度量包括矩阵中对应于第一子图像和第二子图像的单元。5.根据权利要求1所述的方法,其中所述相似性度量还包括所述第一子图像和所述第二子图像的余弦相似性指数和图像散列值之一。6.根据权利要求1所述的方法,其中:第二子图像包括第一子图像的反射,并且反射是由数字图像中显示的反射对象引起的。7.根据权利要求1所述的方法,进一步包括:从视频会议相机拍摄的视频流中接收数字图像。8.根据权利要求1所述的方法,其中,所选择的对象类型包括头部的图像,并且其中,第二子图像包括在数字图像中头部从反射对象的反射。9.一种方法,包括:在第一时间检测匹配视频流中的第一数字图像中的对象类型的对象的子图像;基于检测,确定在视频流中的第一数字图像之后的数字图像中是否存在对象的子图像的连续检测;和阻止使用对象的子图像来修改视频流,至少直到在第一时间之后第二时间已经过去。10.根据权利要求9所述的方法,其中,阻止包括防止视频流的缩放倍率减小,以包括在第一时间之前检测到的对象的子图像和第二对象的第二子图像。11.根据权利要求10所述的方法,其中所述方法进一步包括:在第二时间内,生成表示对象的子图像和视频流中反射对象的第三子图像之间的相似性的相似性得分;和响应于相似性得分超过相似性阈值,阻止使用反射对象的第三子图像来修改视频流。12.根据权利要求9所述的方法,进一步...

【专利技术属性】
技术研发人员:R
申请(专利权)人:缤特力股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1