目标检测方法、装置、设备及介质制造方法及图纸

技术编号：40405049 阅读：13 留言：0更新日期：2024-02-20 22:28

本申请公开了一种目标检测方法、装置、设备及介质，方法包括：获取第一视频数据；在第一视频数据中，确定待检测目标的图像序列、位置序列和时间序列，图像序列包括第一视频数据中位于过去时间的多个历史图像和第一视频数据中位于当前时间的当前图像，位置序列包括待检测目标在历史图像中的图像位置，时间序列包括历史图像的图像时间戳和当前图像的图像时间戳；通过目标模型对图像序列、位置序列、时间序列和延迟时间进行特征处理，确定待检测目标在当前图像中的估计位置和待检测目标在延迟时间后的估计位置。根据本申请实施例，能够确定待检测目标的当前位置和在延迟时间后的预测位置，满足目标检测场景的实时性要求。

全部详细技术资料下载

【技术实现步骤摘要】

本申请属于图像处理，尤其涉及一种目标检测方法、装置、设备及介质。

技术介绍

1、随着人工智能技术的成熟，高精度的目标检测成为可能并在多种领域中得到广泛应用，比如人脸人体检测在安保、自动驾驶等得到广泛应用。

2、相关技术中，通过对单帧图像进行图像特征提取，识别该图像中出现的目标。比如，对单帧图像进行人脸特征提取和/或人体特征提取，基于提取到的人脸特征和/或人体特征，识别单帧图像中出现的人脸和/或人体。

3、然而，在对实时性要求很高的场景中，由于相机可能存在延时，上述方式检测出的目标也存在延时，无法满足实时性要求。

技术实现思路

1、本申请实施例的目的是提供一种目标检测方法、装置、设备及介质，能够解决相关技术中的目标检测方法无法满足实时性要求的问题。

2、第一方面，本申请实施例提供一种目标检测方法，该方法包括：获取第一视频数据；在第一视频数据中，确定待检测目标的图像序列、位置序列和时间序列，图像序列包括第一视频数据中位于过去时间的多个历史图像和第一视频数据中位于当前时间的当前图像，位置序列包括待检测目标在历史图像中的图像位置，时间序列包括历史图像的图像时间戳和当前图像的图像时间戳；通过目标模型对图像序列、位置序列、时间序列和延迟时间进行特征处理，确定待检测目标在当前图像中的估计位置和待检测目标在延迟时间后的估计位置。

3、第二方面，本申请实施例提供一种模型训练方法，该方法包括：获取第二视频数据；在第二视频数据中，确定待检测目标的图像序列、

4、第三方面，本申请实施例提供一种目标检测装置，该装置包括：获取模块，用于获取第一视频数据；确定模块，用于在第一视频数据中，确定待检测目标的图像序列、位置序列和时间序列，图像序列包括第一视频数据中位于过去时间的多个历史图像和第一视频数据中位于当前时间的当前图像，位置序列包括待检测目标在历史图像中的图像位置，时间序列包括历史图像的图像时间戳和当前图像的图像时间戳；处理模块，用于通过目标模型对图像序列、位置序列、时间序列和延迟时间进行特征处理，确定待检测目标在当前图像中的估计位置和待检测目标在延迟时间后的估计位置。

5、第四方面，本申请实施例提供一种模型训练装置，该装置包括：获取模块，用于获取第二视频数据；确定模块，用于在第二视频数据中，确定待检测目标的图像序列、位置序列和时间序列，图像序列包括第二视频数据中位于目标时间之前的多个候选图像和第二视频数据中位于目标时间的目标图像，位置序列包括待检测目标在候选图像中的图像位置，时间序列包括候选图像的图像时间戳和目标时间的图像时间戳；处理模块，用于通过目标模型对图像序列、位置序列、时间序列和延迟时间进行特征处理，确定待检测目标在目标图像中的估计位置和待检测目标在延迟时间之后的估计位置；训练模块，用于根据待检测目标在目标图像中的估计位置、待检测目标在目标图像中的实际位置、待检测目标在延迟时间之后的估计位置和待检测目标在延迟时间之后的实际位置，对目标模型进行模型训练，得到训练后的目标模型。

6、第五方面，本申请实施例提供一种电子设备，包括：处理器以及存储有计算机程序指令的存储器；处理器执行计算机程序指令时实现如第一方面的目标检测方法的步骤，或者，实现如第二方面的模型训练方法的步骤。

7、第六方面，本申请实施例提供一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序指令，计算机程序指令被处理器执行时实现如第一方面的目标检测方法的步骤，或者，实现如第二方面的模型训练方法的步骤。

8、第七方面，本申请实施例提供了一种计算机程序产品，所述计算机程序产品被存储在非易失的存储介质中，所述计算机程序产品被至少一个处理器执行以实现如第一方面的目标检测方法的步骤，或者，实现如第二方面的模型训练方法的步骤。

9、第八方面，本申请实施例提供了一种芯片，该芯片包括处理器和通信接口，通信接口和处理器耦合，处理器用于运行程序或指令，实现如第一方面的目标检测方法的步骤，或者，实现如第二方面的模型训练方法的步骤。

10、本申请提供一种目标检测方法、装置、设备及介质，在第一视频数据中，确定包含多个历史图像和当前图像的图像序列、包含待检测目标在历史图像中的图像位置的位置序列、包含历史图像的图像时间戳和当前图像的图像时间戳的时间序列，通过目标模型对图像序列、位置序列、时间序列和延迟时间进行特征处理，确定待检测目标在当前图像中的估计位置和待检测目标在延迟时间后的估计位置。一方面，利用了多帧视频图像进行目标检测，另一方面，结合了历史信息和当前信息进行目标检测，有效地提高了目标检测的准确性和鲁棒性。针对相机存在延时并且对实时性要求较高的场景，本申请实施例基于视频数据中的历史信息和当前信息，检测待检测目标在当前图像的位置，并预测待检测目标在延迟时间后的位置，弥补了相机延迟导致位置延时的问题，满足了目标检测场景的实时性要求。

本文档来自技高网...

【技术保护点】

1.一种目标检测方法，其特征在于，所述方法包括：

2.根据权利要求1所述的目标检测方法，其特征在于，所述目标模型包括嵌入层和自注意力网络；

3.根据权利要求2所述的目标检测方法，其特征在于，所述将所述图像序列、所述位置序列、所述时间序列和延迟时间输入至所述嵌入层中进行特征编码，得到特征信息，包括：

4.根据权利要求1-3中任一项所述的目标检测方法，其特征在于，所述通过目标模型对所述图像序列、所述位置序列、所述时间序列和延迟时间进行特征处理，确定所述待检测目标在所述当前图像中的估计位置和所述待检测目标在所述延迟时间后的估计位置之前，还包括：

5.根据权利要求4所述的目标检测方法，其特征在于，所述初始关系函数基于所述初始时间与所述位置差异进行拟合得到；

6.根据权利要求5所述的目标检测方法，其特征在于，所述初始关系函数的第N次优化过程，包括：

7.一种模型训练方法，其特征在于，包括：

8.根据权利要求7所述的模型训练方法，其特征在于，所述在所述第二视频数据中，确定图像序列、位置序列和时间序列，包括：</p>

9.根据权利要求7所述的模型训练方法，其特征在于，所述目标模型包括嵌入层和自注意力网络；

10.根据权利要求9所述的模型训练方法，其特征在于，所述将所述图像序列、所述位置序列、所述时间序列和延迟时间输入至所述嵌入层中进行特征编码，得到特征信息，包括：

11.一种目标检测装置，其特征在于，所述装置包括：

12.一种模型训练装置，其特征在于，包括：

13.一种电子设备，其特征在于，包括处理器，存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如权利要求1-6任意一项所述的目标检测方法的步骤，或者，实现如权利要求7-10任意一项所述的模型训练方法的步骤。

14.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序指令，所述计算机程序指令被处理器执行时实现如权利要求1-6任意一项所述的目标检测方法的步骤，或者，实现如权利要求7-10任意一项所述的模型训练方法的步骤。

15.一种计算机程序产品，其特征在于，所述计算机程序产品被存储在非易失的存储介质中，所述计算机程序产品被至少一个处理器执行以实现如权利要求1-6任意一项所述的目标检测方法的步骤，或者，实现如权利要求7-10任意一项所述的模型训练方法的步骤。

...

【技术特征摘要】

1.一种目标检测方法，其特征在于，所述方法包括：

2.根据权利要求1所述的目标检测方法，其特征在于，所述目标模型包括嵌入层和自注意力网络；

5.根据权利要求4所述的目标检测方法，其特征在于，所述初始关系函数基于所述初始时间与所述位置差异进行拟合得到；

6.根据权利要求5所述的目标检测方法，其特征在于，所述初始关系函数的第n次优化过程，包括：

7.一种模型训练方法，其特征在于，包括：

8.根据权利要求7所述的模型训练方法，其特征在于，所述在所述第二视频数据中，确定图像序列、位置序列和时间序列，包括：

9.根据权利要求7所述的模型训练方法，其特征在于，所述目标模型包括嵌入层和...

【专利技术属性】
技术研发人员：胡喆，余金清，冉鹏，罗廷，
申请(专利权)人：成都极米科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人