用于生成训练数据以及训练用于重识别的机器学习模型的系统及方法技术方案

技术编号:32853037 阅读:15 留言:0更新日期:2022-03-30 19:15
本公开的示例涉及一种用于生成训练数据以及训练用于重识别的机器学习模型的概念。一种为了训练用于重识别的机器学习模型而生成训练数据的计算机系统,该计算机系统包括被配置为获得媒体数据的处理电路,媒体数据包括表示人、动物或物体的多个样本。处理电路被配置为处理媒体数据以识别表示同一人、动物或物体的样本元组。处理电路被配置为基于识别出的表示同一人、动物或物体的样本元组来生成训练数据。据。据。

【技术实现步骤摘要】
用于生成训练数据以及训练用于重识别的机器学习模型的系统及方法


[0001]本专利技术的示例涉及一种用于生成训练数据以及训练用于重识别的机器学习模型的概念。

技术介绍

[0002]与寻求确定人的绝对身份(通常从面部特征确定)的识别系统相比,视觉人员重识别(缩写:re

id)系统的目的是仅从人的外表来对他们进行区分或重识别。人员重识别系统通常使用机器学习模型来实现,该机器学习模型被训练成基于表示不同人员的图像数据来生成重识别代码。当前为训练重识别系统而创建图像的方法通常依赖于大量的手动注释工作。该过程工作量大且缓慢。

技术实现思路

[0003]本公开的各种示例基于以下发现:与重识别系统通常仅使用单个媒体数据样本来生成重识别代码的实时性质相反,用于生成重识别代码的机器学习模型的训练不受这些约束的限制。相反,在各种示例中,可以将附加信息与要用于训练的媒体数据样本一起收集,以允许自动生成用于训练这种机器学习模型的训练数据。附加地或替代地,可以采用允许编译合适的训练数据的其它系统。
[0004]在所提出的概念中,获得将用于训练机器学习模型的多个样本。对这些样本进行处理,并将表示同一人、动物或物体的样本组合在一起。这些组或“元组”继而用于生成所述训练数据。例如,可以使用辅助信息来执行将所述样本分为不同元组的操作,所述辅助信息例如是图像样本在图像样本序列(例如,视频流)中的位置或与相应样本一起记录的无线标识符。或者,可以使用另一系统(例如,另一基本重识别系统)来将所述样本按照元组进行分组。然后,这些元组可以用作例如在机器学习模型的基于三元组损失的训练中的训练数据,其中一个元组中的两个样本用作基线输入和正输入,另一元组中的样本用作所述基于三元组损失的训练的负输入。
[0005]本公开的各种示例涉及一种为了训练用于重识别的机器学习模型而生成训练数据的计算机系统。所述计算机系统包括被配置为获得媒体数据的处理电路。所述媒体数据包括表示人、动物或物体的多个样本。所述处理电路被配置为处理所述媒体数据以识别表示同一人、动物或物体的样本元组。所述处理电路被配置为基于识别出的表示同一人、动物或物体的样本元组来生成所述训练数据。通过以编程方式将样本分为表示同一人、动物或物体的样本元组,可以生成用于训练所述机器学习模型的合适的训练数据。
[0006]在一些示例中,每个样本与表征该样本或由该样本表示的人、动物或物体的辅助信息相关联。所述处理电路可以被配置为基于与相应样本相关联的辅助信息来识别表示同一人、动物或物体的样本元组。例如,所述辅助信息可用于在不依赖于或仅部分依赖于样本的内容的情况下识别属于同一元组的样本。
[0007]一种类型的辅助信息涉及相应样本的相互关系。例如,至少一些样本可以取自视频流,或者更一般而言,取自图像序列。所述视频流的后续图像样本通常示出同一人、动物或物体,并且因此可以被分配给同一元组。换言之,如果所述媒体数据包括图像样本序列,则所述辅助信息可以表征相应样本在所述图像样本序列内的位置。所述处理电路可以被配置为基于相应样本在所述图像样本序列内的位置来识别表示同一人、动物或物体的样本元组。
[0008]另一种类型的辅助信息涉及所述样本的来源。例如,如果所述媒体数据包括两个或更多个摄像头的媒体数据,则所述辅助信息可以表征相应样本关于两个或更多个摄像头的来源以及所述样本的拍摄时间。在本文中,术语“来源”可对应于提供相应样本的摄像头的位置。所述电路可以被配置为基于样本关于两个或更多个摄像头的来源并且基于样本的拍摄时间来识别表示同一人、动物或物体的样本元组。该方法可用于两个摄像头具有部分重叠或几乎重叠的视场的情况,例如以便识别从一个摄像头的视场移动到另一摄像头的视场的人、动物或物体。因此,两个或更多个摄像头的媒体数据可以示出至少部分重叠的视场。
[0009]第三种类型的辅助信息涉及在采集所述样本时收集的附加信息。例如,每个媒体数据生成设备(例如,摄像头)可以连接到无线通信设备,该无线通信设备可用于记录由相应媒体数据生成设备记录的人员的移动设备的无线通信标识符(例如,媒体访问控制地址)。该无线通信标识符随后可用于识别表示同一人(或动物或物体)的样本。换言之,所述辅助信息可以包括关于与所述媒体数据样本一起记录的无线通信标识符的信息。所述处理电路可以被配置为基于与相应样本一起记录的无线通信标识符来识别表示同一人、动物或物体的样本元组。
[0010]所提出的方法的另一应用是在基于重识别的访问控制系统中,其中所提出的方法可用于在即使人的外表逐渐改变(例如由于生长的头发、晒黑或生长的胡子)的长时间跨度内执行基于重识别的访问控制。因此,所述多个样本可以经过多天从基于重识别的访问控制系统获得。所述辅助信息可以包括关于由所述基于重识别的访问控制系统提供的人员的标识符的信息。新获得的样本可以被添加到表示相应人员的样本元组。本公开的各种示例提供了相应的包括所述计算机系统的基于重识别的访问控制系统。所述计算机系统的处理电路可以被配置为基于所生成的训练数据来调整用于基于重识别的访问控制系统中的重识别的机器学习模型。新添加的元组可用于调整相应机器学习模型的训练。
[0011]在一些示例中,可以放弃使用所述辅助信息。例如,处理电路可以被配置为使用第一重识别系统来识别所述样本元组。可以生成所述训练数据,用于训练在第二重识别系统中使用的机器学习模型。换言之,现有的重识别系统(即,所述第一重识别系统)可用于识别样本,该样本用于训练由新训练的重识别系统(即,第二重识别系统)使用的机器学习模型。
[0012]在一些情况下,所述多个样本还可以包含不适于在所述机器学习模型的训练中使用的样本,例如,因为该样本没有示出人、动物或物体,或者示出太少的细节。为了避免将这种样本用于训练,可以丢弃这些样本。例如,所述处理电路可以被配置为确定所述多个样本中的样本中存在人、动物或物体,并且如果对人、动物或物体的存在的确定失败,则丢弃样本。
[0013]附加地或替代地,可以对相应元组内的样本就其质量进行评估,如果质量低于期
望,则丢弃样本。例如,所述处理电路可以被配置为确定元组中的样本的质量,并且如果样本的质量根据预定义的规则而不足,则从元组中移除所述样本。
[0014]在视觉人员重识别系统中,重识别通常基于相应人员的面部。因此,一个预定义的规则可以涉及所述样本中所示人员的面部可见性。换言之,所述媒体数据可以表示人。可以基于相应样本中人员的面部可见性来确定元组中的样本的质量。
[0015]另一预定义的规则可以基于使用现有的重识别系统生成的重识别代码之间的距离。例如,所述处理电路可以被配置为使用重识别系统来生成表示由相应样本表示的人、动物或物体的(几个)重识别代码。元组中的样本的质量可以基于针对所述元组中的所述样本(以这种方式)生成的(几个)重识别代码之间的距离。这使得可以自动评估相应元组中的样本的质量。
[0016]通常,媒体数据可以是图像数据、视频数据、音频数据、物体运动的三维表示以及基于文本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种为了训练用于重识别的机器学习模型而生成训练数据的计算机系统(10),该计算机系统包括处理电路(14),该处理电路(14)被配置为:获得媒体数据,所述媒体数据包括表示人、动物或物体的多个样本;处理所述媒体数据以识别表示同一人、动物或物体的样本元组;并且基于识别出的表示同一人、动物或物体的所述样本元组来生成所述训练数据。2.根据权利要求1所述的计算机系统,其中,每个样本与表征所述样本或表征由所述样本表示的所述人、动物或物体的辅助信息相关联,并且其中,所述处理电路被配置为基于与所述相应样本相关联的所述辅助信息来识别表示同一人、动物或物体的所述样本元组。3.根据权利要求2所述的计算机系统,其中,如果所述媒体数据包括图像样本序列,则所述辅助信息表征所述相应样本在所述图像样本序列内的位置,其中,基于所述相应样本在所述图像样本序列内的位置来识别表示同一人、动物或物体的所述样本元组。4.根据权利要求2或3所述的计算机系统,其中,如果所述媒体数据包括两个或更多个摄像头的媒体数据,则所述辅助信息表征所述相应样本关于所述两个或更多个摄像头的来源以及所述样本的拍摄时间,其中,所述处理电路被配置为基于所述样本关于所述两个或更多个摄像头的来源并基于所述样本的拍摄时间来识别表示同一人、动物或物体的所述样本元组。5.根据权利要求2至4中任一项所述的计算机系统,其中,所述辅助信息包括关于与所述媒体数据的所述样本一起记录的无线通信标识符的信息,其中,所述处理电路被配置为基于与所述相应样本一起记录的所述无线通信标识符识别表示同一人、动物或物体的所述样本元组。6.根据权利要求1所述的计算机系统,其中,所述处理电路被配置为使用第一重识别系统来识别所述样本元组,其中,生成所述训练数据用于训练用于第二重识别系统的机器学习模型。7.根据权利要求1至6中任一项所述的计算机系统,其中,所述处理电路被配置为确定所述多个样本中的样本中存在人、动物或物体,并且如果对所述人、动物或物体的存在的确定失败,则丢弃样本。8.根据权利要求1至7中任一项所述的计算机系统,其中,所述处理电路被配置为确定所述元组中的所述样本的质量,并且如果所述样本的质量根据预定义的规则而不足,则从所述元组中移除所述样本。9.根据权利要求8所述的计算机系统,其中,所述媒体数据表示人,其中,基于...

【专利技术属性】
技术研发人员:ꢀ七四专利代理机构
申请(专利权)人:格雷兹珀技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1