预测模型训练方法、装置、电子设备和计算机可读介质制造方法及图纸

技术编号：38740068 阅读：17 留言：0更新日期：2023-09-08 23:25

本公开的实施例公开了预测模型训练方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括：获取物品流转站点的视频帧序列；确定视频帧序列中每个视频帧中手部和物品之间的空间重叠度，得到重叠度序列；根据重叠度序列，对视频帧序列中的每个视频帧进行标注处理，得到标注信息序列，其中，标注信息序列中的标注信息包括视频帧和标签；利用标注信息序列对预测模型进行训练，得到接触预测模型，以及存储接触预测模型。该实施方式可以确定手物交互动作的开始时间和结束时间，从而提高了动作识别的完整性和动作识别的准确率，进而可以提高稽查的准确性。以提高稽查的准确性。以提高稽查的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
预测模型训练方法、装置、电子设备和计算机可读介质

[0001]本公开的实施例涉及计算机
，具体涉及预测模型训练方法、装置、电子设备和计算机可读介质。

技术介绍

[0002]接触预测模型可以识别手和物品之间的交互动作，从而在无人或少人的物品流转站点实现自助价值交换、稽查和安防任务。目前，在识别手物交互的动作时，通常采用的方式为：采用三维重建技术分析三维空间内手和物品的接触关系。
[0003]然而，当采用上述方式分析手物交互的动作时，经常会存在如下技术问题：
[0004]第一，三维重建技术是基于手和物品已经交互的前提下进行手物交互动作的分析，不能确定手物交互动作的开始时间和结束时间，会降低动作识别的完整性和动作识别的准确率，进而降低稽查的准确性；
[0005]第二，人工标注视频帧会消耗过多时间，降低视频帧的标注效率；
[0006]第三，仅用训练样本来训练预测模型，会造成接触预测模型对错误样本的过拟合，减小接触预测模型的适用范围；
[0007]第四，训练好的接触预测模型从视频帧中提取的特征图过于单一，判别效果较差。

技术实现思路

[0008]本公开的内容部分用于以简要的形式介绍构思，这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征，也不旨在用于限制所要求的保护的技术方案的范围。
[0009]本公开的一些实施例提出了预测模型训练方法、装置、电子设备和计算机可读介质，来解决以上
技术介绍
部分提到的...

【技术保护点】

【技术特征摘要】
1.一种预测模型训练方法，包括：获取物品流转站点的视频帧序列；确定所述视频帧序列中每个视频帧中手部和物品之间的空间重叠度，得到重叠度序列；根据所述重叠度序列，对所述视频帧序列中的每个视频帧进行标注处理，得到标注信息序列，其中，所述标注信息序列中的标注信息包括视频帧和标签；利用所述标注信息序列对预测模型进行训练，得到接触预测模型，以及存储所述接触预测模型。2.根据权利要求1所述的方法，其中，所述确定所述视频帧序列中每个视频帧中手部和物品之间的空间重叠度，得到重叠度序列，包括：将所述视频帧中手部的掩码区域确定为手部掩码区域；将所述视频帧中物品的边框区域确定为物品边框区域；确定所述手部掩码区域和所述物品边框区域之间的空间重叠度。3.根据权利要求2所述的方法，其中，所述根据所述重叠度序列，对所述视频帧序列中的每个视频帧进行标注处理，得到标注信息序列，包括：确定所述视频帧中的前景运动区域；将所述手部掩码区域中所述前景运动区域所占的比值确定为第一目标值；将所述物品边框区域中所述前景运动区域所占的比值确定为第二目标值；将所述视频帧中手部掩码区域和物品边框区域的移动向量之间的余弦相似度确定为第三目标值；响应于确定所述视频帧满足第一预设条件，将所述视频帧对应的标签确定为第一标签，其中，所述第一预设条件为所述视频帧对应的空间重叠度大于零、且所述第一目标值和所述第二目标值均大于等于第一预设阈值、且所述第三目标值大于等于第二预设阈值，所述第一标签表征所述视频中的手部和物品相接触；响应于确定所述视频帧满足第二预设条件，将所述视频帧对应的标签确定为第二标签，其中，所述第二预设条件是所述视频帧对应的空间重叠度等于零、或者所述第一目标值大于所述第一预设阈值且所述第二目标值小于所述第一预设阈值、或者所述第三目标值小于所述第二...

【专利技术属性】
技术研发人员：姜亚东，
申请(专利权)人：多点深圳数字科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人